国产一区二区精品-国产一区二区精品久-国产一区二区精品久久-国产一区二区精品久久91-免费毛片播放-免费毛片基地

<nav id="mffcz"></nav>

<tfoot id="mffcz"></tfoot>

<tfoot id="mffcz"></tfoot>

千鋒教育-做有情懷、有良心、有品質(zhì)的職業(yè)教育機(jī)構(gòu)

手機(jī)站

千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

領(lǐng)取全套視頻

千鋒教育

關(guān)注千鋒學(xué)習(xí)站小程序
隨時隨地免費學(xué)習(xí)課程

行業(yè)頭條

哈爾濱選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

哈密選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼和浩特選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼倫貝爾選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

吳忠選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

呂梁選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

吉安選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

合肥選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

臺州選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

廈門選擇鴻蒙培訓(xùn)機(jī)構(gòu)要注意些什么？選擇千鋒的理由？ 查看詳情>>

400-811-9990 全國咨詢熱線

首頁精品課程

Java

鴻蒙開發(fā)

HTML5

物聯(lián)網(wǎng)

云計算

Python

軟件測試

網(wǎng)絡(luò)安全

大數(shù)據(jù)

Unity

UI/UE設(shè)計

全媒體營銷

影視剪輯

游戲原畫

區(qū)塊鏈

產(chǎn)品經(jīng)理

商業(yè)插畫

PMP認(rèn)證

紅帽RHCE

軟考認(rèn)證

華為認(rèn)證

出國留學(xué)

安全認(rèn)證

更多課程

免費教程
HTML5視頻教程 Java視頻教程 Python視頻教程 UI視頻教程云計算視頻教程軟件測試視頻教程大數(shù)據(jù)視頻教程物聯(lián)網(wǎng)視頻教程 Unity視頻教程網(wǎng)絡(luò)安全視頻教程全媒體視頻教程影視剪輯視頻教程
教研實力
教研院項目庫師資團(tuán)隊項目大賽
校企服務(wù)
企業(yè)內(nèi)訓(xùn) 高校合作學(xué)科共建
就業(yè)服務(wù)
就業(yè)服務(wù) 雙選會上門招聘人才定制促就業(yè)行動
認(rèn)證考試
PMP培訓(xùn) 軟考培訓(xùn) 紅帽RHCE認(rèn)證學(xué)歷提升
千鋒問問行業(yè)資訊技術(shù)干貨熱點話題
零基礎(chǔ)學(xué)IT IT培訓(xùn)機(jī)構(gòu) IT面試題 IT就業(yè)前景
關(guān)于千鋒
千鋒簡介鋒益公益大賽組織品牌活動
聯(lián)系我們

當(dāng)前位置：首頁 > 技術(shù)干貨 > k-Nearest Neighbor在海量數(shù)據(jù)的情況下用什么數(shù)據(jù)結(jié)構(gòu)比較好?

k-Nearest Neighbor在海量數(shù)據(jù)的情況下用什么數(shù)據(jù)結(jié)構(gòu)比較好?

來源：千鋒教育

發(fā)布人：xqq

時間： 2023-10-11 04:15:46 1696968946

一、k-Nearest Neighbor在海量數(shù)據(jù)的情況下用什么數(shù)據(jù)結(jié)構(gòu)比較好

k-Nearest Neighbor在海量數(shù)據(jù)的情況下，寫一條數(shù)據(jù)到flat file，A_id, B_id，就這么存。針對不同的應(yīng)用場景，可以做不同的優(yōu)化。要實時找到有明確距離度量，甚至可以通過分塊劃區(qū)降低待選點的數(shù)量級的應(yīng)用場景。

同時要支持待選點的實時添加和去除。

那我覺得這種情況只有系統(tǒng)運維需要考慮“海量”，光從KNN來說，按層次分塊劃區(qū)以后，直接算都可以。

那運維那邊的“海量”，更是有一大堆可做的優(yōu)化。比如以一個固定點代表來自一塊區(qū)域的請求。全上海幾千萬人一起請求最近出租車，我內(nèi)部只要算幾萬個請求來源就行了。KNN也沒必要非得是最近的，我在一定區(qū)域內(nèi)隨機(jī)挑，期望平均距離和最小平均距離差多少是完全可控的。

KNN算法穩(wěn)定性好、準(zhǔn)確率高、簡單易用，針對大數(shù)據(jù)的分類問題，它存在著如下缺點:a)對每一個待分類的文本都要計算它到全體已知樣本的距離，才能求得它的K個最近鄰點，而大數(shù)據(jù)的典型特點就是數(shù)據(jù)信息海量、價值密度低，這就顯然出現(xiàn)了很大的無效計算量，在決定測試樣本的類別時，該算法只計算最近鄰的樣本【neighbor-weighted K-nearest neighbor for unbalanced text corpus】，而大數(shù)據(jù)的另一個顯著特點是涉及領(lǐng)域繁多、類別界限不明顯，對于此類文本容易使判決結(jié)果產(chǎn)生偏差;c)隨著信息爆炸時代的到來，各種新的事物層出不窮，出現(xiàn)新的類別的概率極大，而KNN算法的鄰居都是已知的類別樣本，也就導(dǎo)致了對新樣本的無知或者誤判。

延伸閱讀：

二、改進(jìn)的KNN算法—差分多層KNN (DM-KNN)算法

針對大數(shù)據(jù)的自身特點以及KNN算法的缺點，算法主要在以下幾個方而進(jìn)行了改進(jìn):a)構(gòu)建樹狀分層結(jié)構(gòu)，針對KNN算法計算量比較大的缺點，本文改進(jìn)后的算法采用構(gòu)建樹狀分層結(jié)構(gòu)首先對高層進(jìn)行比較，然后依據(jù)高層比較結(jié)果的不同，再依次對下一層次進(jìn)行比較，相比直接對所有文本進(jìn)行距離計算，計算量明顯減少，同時提高了運算速度;b)差分比較，由于大數(shù)據(jù)具有類域交叉性的特點，該算法不是在權(quán)重比較結(jié)束后直接進(jìn)行判斷，而是又針對大數(shù)據(jù)的類域交叉性進(jìn)行了一次差分比較，可以有效地防止最近鄰和次近鄰誤判的情況;c)動態(tài)增加類別，由于大數(shù)據(jù)中信息的不可預(yù)知性，該算法針對最終比較結(jié)果不能判斷隸屬于哪個類別的情況，在算法最后可以動態(tài)增加新類別。

tags: it技術(shù)干貨

聲明：本站稿件版權(quán)均屬千鋒教育所有，未經(jīng)許可不得擅自轉(zhuǎn)載。

10年以上業(yè)內(nèi)強(qiáng)師集結(jié)，手把手帶你蛻變精英

請您保持通訊暢通，專屬學(xué)習(xí)老師24小時內(nèi)將與您1V1溝通

免費領(lǐng)取

今日已有369人領(lǐng)取成功

劉同學(xué) 138****2860 剛剛成功領(lǐng)取

王同學(xué) 131****2015 剛剛成功領(lǐng)取

張同學(xué) 133****4652 剛剛成功領(lǐng)取

李同學(xué) 135****8607 剛剛成功領(lǐng)取

楊同學(xué) 132****5667 剛剛成功領(lǐng)取

岳同學(xué) 134****6652 剛剛成功領(lǐng)取

梁同學(xué) 157****2950 剛剛成功領(lǐng)取

劉同學(xué) 189****1015 剛剛成功領(lǐng)取

張同學(xué) 155****4678 剛剛成功領(lǐng)取

鄒同學(xué) 139****2907 剛剛成功領(lǐng)取

董同學(xué) 138****2867 剛剛成功領(lǐng)取

周同學(xué) 136****3602 剛剛成功領(lǐng)取

上一篇

HalfEdge數(shù)據(jù)結(jié)構(gòu)有什么優(yōu)點?

下一篇

安卓代碼中Gravity.LEFTGravity.TOP是什么原理?

免費打包獲取

相關(guān)推薦HOT

功能安全開發(fā)與ASPICE和CMMI之間有什么樣的聯(lián)系?

一、功能安全開發(fā)與ASPICE和CMMI之間的聯(lián)系CMMI是產(chǎn)品和系統(tǒng)開發(fā)的通用模型，ASPICE是針對車這個垂直領(lǐng)域，（軟件）產(chǎn)品和系統(tǒng)開發(fā)的標(biāo)準(zhǔn)。ASPI...詳情>>

2023-10-11 05:59:32

在C語言下數(shù)組array與鏈表linklist各自的優(yōu)點和缺陷是什么?

一、在C語言下數(shù)組array與鏈表linklist各自的優(yōu)點和缺陷數(shù)組可以通過下標(biāo)訪問，隨機(jī)訪問效率高，鏈表需要通過指針遍歷，訪問效率低。數(shù)組在分配...詳情>>

2023-10-11 05:43:25

oa系統(tǒng)一般有哪些模塊?

一、組織架構(gòu)模塊組織架構(gòu)模塊記錄了企業(yè)的組織結(jié)構(gòu)、人員信息、部門職責(zé)、工作流程等基本信息，實現(xiàn)了組織架構(gòu)的可視化和管理。該模塊主要包括...詳情>>

2023-10-11 05:33:42

為什么python沒有大頂堆?

一、python沒有大頂堆的原因Python沒有內(nèi)置大頂堆，是因為在實際使用中，大頂堆并不是那么常用。相比之下，小頂堆和普通的堆操作更具有廣泛的應(yīng)...詳情>>

2023-10-11 05:30:39

什么是crm管理?

一、crm管理概念 CRM管理也叫客戶管理，亦即客戶關(guān)系管理（Customer Relationship Management）的簡稱。CRM管理的主要含義就是通過對客戶詳細(xì)資...詳情>>

2023-10-11 05:28:00

熱門推薦

okr需要哪些功能?

數(shù)據(jù)結(jié)構(gòu)中內(nèi)部排序可能達(dá)到的非常快速度是什么?

在數(shù)據(jù)結(jié)構(gòu)中p->next=head;head->next=p是什么意思?

為什么鏈表讀取慢刪除卻很快?

線索二叉樹為什么使用標(biāo)志域而不直接添加指向前驅(qū)和后繼的指針域?

功能安全開發(fā)與ASPICE和CMMI之間有什么樣的聯(lián)系?

什么是完美散列（perfecthashing）?

okr有什么用?

softmax有哪些作用?

哪些數(shù)據(jù)庫適合聊天記錄的管理，有什么優(yōu)缺點?

技術(shù)干貨更多>>

如何實現(xiàn)服務(wù)器負(fù)載均衡

2023-12-06

linux有哪些優(yōu)勢和劣勢

2023-12-06

linux需要驅(qū)動嗎

2023-12-06

android與linux的區(qū)別

2023-12-06

如何搭建基于容器的深度學(xué)習(xí)環(huán)境

2023-12-06

職場就業(yè) 更多>>

網(wǎng)絡(luò)安全軟件開發(fā)的就業(yè)前景

2023-12-09

學(xué)會python工程師后的就業(yè)前景

2023-12-09

學(xué)會java工程師后的就業(yè)前景

2023-12-09

云計算技術(shù)就業(yè)前景以及發(fā)展方向怎樣？

2023-08-07

快速通道

培訓(xùn)機(jī)構(gòu)
了解培訓(xùn)相關(guān)
就業(yè)前景
查看就業(yè)前景
培訓(xùn)門檻
了解學(xué)習(xí)門檻
應(yīng)聘面試
常見面試考題
就業(yè)服務(wù)
畢業(yè)推薦就業(yè)
師資團(tuán)隊
了解師資團(tuán)隊

千鋒教育

千鋒學(xué)習(xí)站 | 隨時隨地免費學(xué)

千鋒教育

掃一掃進(jìn)入千鋒手機(jī)站

<tfoot id="nkvdh"></tfoot>