国产一区二区精品-国产一区二区精品久-国产一区二区精品久久-国产一区二区精品久久91-免费毛片播放-免费毛片基地

<bdo id="wymsy"><small id="wymsy"></small></bdo>

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站

千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻

千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

行業頭條

哈爾濱選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

哈密選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼和浩特選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

呼倫貝爾選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

吳忠選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

呂梁選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

吉安選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

合肥選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

臺州選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

廈門選擇鴻蒙培訓機構要注意些什么？選擇千鋒的理由？ 查看詳情>>

400-811-9990 全國咨詢熱線

首頁精品課程

Java

鴻蒙開發

HTML5

物聯網

云計算

Python

軟件測試

網絡安全

大數據

Unity

UI/UE設計

全媒體營銷

影視剪輯

游戲原畫

區塊鏈

產品經理

商業插畫

PMP認證

紅帽RHCE

軟考認證

華為認證

出國留學

安全認證

更多課程

免費教程
HTML5視頻教程 Java視頻教程 Python視頻教程 UI視頻教程云計算視頻教程軟件測試視頻教程大數據視頻教程物聯網視頻教程 Unity視頻教程網絡安全視頻教程全媒體視頻教程影視剪輯視頻教程
教研實力
教研院項目庫師資團隊項目大賽
校企服務
企業內訓高校合作學科共建
就業服務
就業服務雙選會上門招聘人才定制促就業行動
認證考試
PMP培訓軟考培訓紅帽RHCE認證學歷提升
千鋒問問行業資訊技術干貨熱點話題
零基礎學IT IT培訓機構 IT面試題 IT就業前景
關于千鋒
千鋒簡介鋒益公益大賽組織品牌活動
聯系我們

當前位置：首頁 > 技術干貨 > 按照query的頻度排序文件

按照query的頻度排序文件

來源：千鋒教育

發布人：wjy

時間： 2022-09-14 15:49:35 1663141775

　　有10個文件，每個文件1G，每個文件的每一行存放的都是用戶的query，每個文件的query都可能重復。要求你按照query的頻度排序?

　　方案1:

　　hash映射: 順序讀取10個文件，按照hash(query)%10的結果將query寫入到另外10個文件(記為a0,a1,..a9)中。這樣新生成的文件每個的大小大約也1G(假設hash函數是隨機的)。

　　hash_map統計: 找一臺內存在2G左右的機器，依次對用hash_map(query, query_count)來統計每個query出現的次數。注: hash_map(query,query_count)是用來統計每個query的出現次數，不是存儲他們的值，出現一次，則count+1。

　　堆/快速/歸并排序: 利用快速/堆/歸并排序按照出現次數進行排序，將排序好的query和對應的query_cout輸出到文件中，這樣得到了10個排好序的文件(記為)。最后，對這10個文件進行歸并排序(內排序與外排序相結合)。

　　方案2:

　　一般query的總量是有限的，只是重復的次數比較多而已，可能對于所有的query，一次性就可以加入到內存了。這樣，我們就可以采用trie樹/hash_map等直接來統計每個query出現的次數，然后按出現次數做快速/堆/歸并排序就可以了。

　　方案3:

　　與方案1類似，但在做完hash，分成多個文件后，可以交給多個文件來處理，采用分布式的架構來處理(比如MapReduce)，最后再進行合并。 ¶ 給定a、b兩個文件，各存放50億個u

tags:

聲明：本站稿件版權均屬千鋒教育所有，未經許可不得擅自轉載。

10年以上業內強師集結，手把手帶你蛻變精英

請您保持通訊暢通，專屬學習老師24小時內將與您1V1溝通

免費領取

今日已有369人領取成功

劉同學 138****2860 剛剛成功領取

王同學 131****2015 剛剛成功領取

張同學 133****4652 剛剛成功領取

李同學 135****8607 剛剛成功領取

楊同學 132****5667 剛剛成功領取

岳同學 134****6652 剛剛成功領取

梁同學 157****2950 剛剛成功領取

劉同學 189****1015 剛剛成功領取

張同學 155****4678 剛剛成功領取

鄒同學 139****2907 剛剛成功領取

董同學 138****2867 剛剛成功領取

周同學 136****3602 剛剛成功領取

上一篇

海量數據分布在100臺電腦中，想個辦法高效統計出這批數據的TOP10？

下一篇

有哪些基本的垃圾回收算法？

免費打包獲取

相關推薦HOT

怎樣投抖加不花錢？別人能看出來嗎？

抖音一些視頻為了獲取更多點擊，一些博主機會投抖加。其實抖加的投放沒有絕對正確的方法，而不同賬號和視頻投放的策略都是不一樣的，不過一般情...詳情>>

2023-09-19 08:00:10

抖店入駐收費多少？開抖店費用是多少？

如果要開通抖音小店，需要先把抖音賬號開通商品櫥窗功能。入駐之后，可以選擇頭條賬號、抖音賬號、火山賬號任一類型注冊或登錄。那開個抖店要多...詳情>>

2023-09-19 07:50:26

想做直播帶貨的貨源哪里來？怎么找貨源？

現如今直播推廣的方式是非?；鸬?，有著非常多的賣家都是利用直播推廣店鋪產品，效果也是非常不錯。但很多賣家想要了解現在直播帶貨的話什么產品...詳情>>

2023-09-19 07:47:16

適合三農領域的名字？有何技巧？

現在在抖音上很多博主會選擇直播來賺取更多的流量以及利潤，直播間的東西也有很多讓消費者信任并且喜歡的，而且隨著越來越多人直播，很多農產品...詳情>>

2023-09-19 07:06:05

抖店商品發布違規怎么申訴？有何規則？

抖店服務市場服務商發布違禁信息如何處理?情節嚴重程度判定原則：違規嚴重等級主要通過服務商違規次數、造成后果的嚴重程度、獲利或導致損失的...詳情>>

2023-09-19 06:59:55

快速通道更多>>

課程介紹
點擊獲取大綱
就業前景
查看就業薪資
學習費用
了解課程價格
優惠活動
領取優惠券
學習資源
領3000G教程
師資團隊
了解師資團隊
實戰項目
獲取項目源碼
開班地區
查看來校路線

開班信息

北京校區

北京校區
大連校區
廣州校區
成都校區
杭州校區
長沙校區
合肥校區
南京校區
上海校區
深圳校區
武漢校區
鄭州校區
西安校區
青島校區
重慶校區
太原校區
沈陽校區
南昌校區
哈爾濱校區

熱門推薦

新手直播帶貨怎么做起來？有何技巧？

做視頻創作者怎么賺錢？個人怎么靠流量賺錢？

怎樣投抖加不花錢？別人能看出來嗎？

抖店怎么攔截快遞？線下結算是什么？

抖店平臺商戶被退店還能退貨嗎？如何提高評分？

抖店入駐收費多少？開抖店費用是多少？

想做直播帶貨的貨源哪里來？怎么找貨源？

抖店沒有營業執照怎么辦？類型有哪些？

女孩子拍什么最容易火?拍視頻怎么賺錢的？

怎樣投抖加不花錢，有哪些技巧？

技術干貨更多>>

如何實現服務器負載均衡

2023-12-06

linux有哪些優勢和劣勢

2023-12-06

linux需要驅動嗎

2023-12-06

android與linux的區別

2023-12-06

如何搭建基于容器的深度學習環境

2023-12-06

職場就業更多>>

網絡安全軟件開發的就業前景

2023-12-09

學會python工程師后的就業前景

2023-12-09

學會java工程師后的就業前景

2023-12-09

云計算技術就業前景以及發展方向怎樣？

2023-08-07

千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

<bdo id="oalgk"></bdo>

<span id="oalgk"><i id="oalgk"><noframes id="oalgk"></noframes></i></span>

<span id="oalgk"></span>