国产一区二区精品-国产一区二区精品久-国产一区二区精品久久-国产一区二区精品久久91-免费毛片播放-免费毛片基地

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > 隨機森林如何處理缺失值

隨機森林如何處理缺失值

來源:千鋒教育
發布人:syq
時間: 2022-09-07 17:16:52 1662542212

  根據隨機森林創建和訓練的特點,隨機森林對缺失值的處理還是比較特殊的。

  首先,給缺失值預設一些估計值,比如數值型特征,選擇其余數據的中位數或眾數作為當前的估計值

隨機森林如何處理缺失值

  然后,根據估計的數值,建立隨機森林,把所有的數據放進隨機森林里面跑一遍。記錄每一組數據在決策樹中一步一步分類的路徑。

  判斷哪組數據和缺失數據路徑最相似,引入一個相似度矩陣,來記錄數據之間的相似度,比如有N組數據,相似度矩陣大小就是N*N

  如果缺失值是類別變量,通過權重投票得到新估計值,如果是數值型變量,通過加權平均得到新的估計值,如此迭代,直到得到穩定的估計值。

  其實,該缺失值填補過程類似于推薦系統中采用協同過濾進行評分預測,先計算缺失特征與其他特征的相似度,再加權得到缺失值的估計,而隨機森林中計算相似度的方法(數據在決策樹中一步一步分類的路徑)乃其獨特之處。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT