堆(Heap)這種數據結構有什么用處?

來源：千鋒教育

發布人：xqq

時間： 2023-10-11 04:09:46 1696968586

一、堆(Heap)數據結構的用處

1、高效定時器

假設我們要設計一個定時器，定時器中維護了很多定時任務，每個任務都設定了一個要觸發執行的時間點。定時器每過一個很小的單位時間（比如 1 秒），就掃描一遍任務，看是否有任務到達設定的執行時間。如果到達了，就拿出來執行。

像這樣每次掃描的時候，把所有任務都掃描一遍，肯定很低效，如果任務比較少還好，任務比較多的話，就比較耗時。那有更高效的辦法呢？答案是有的。

我們可以把每個任務都存儲在優先級隊列中(以觸發時間為優先級的小頂堆)，這樣最先執行的任務就在堆頂。每次掃描的時候只需取出堆頂任務，拿對于任務的定時時間和當前時間比較。

假設任務執行時間與當前時間的差為T。如果T<=0，就從隊列中刪除任務，并執行。否則定時器就可以設定在T秒之后再執行任務。從當前時間到T-1秒的時間內定時器不需要做任何事情。

Ps:假如我們需要為一個任務設定循環定時器，可以在取出堆頂任務后，將下一次任務的觸發執行的時間重新加入到優先級隊列。感興趣的同學可以將上述堆的代碼改造一下，將num位置的參數改造為一個對象。調整堆的時候按照對象的key作為優先級調整堆。

2、合并小文件

假設我們有 100 個小文件，每個文件的大小是 100MB，每個文件中存儲的都是有序的字符串。我們希望將這些 100 個小文件合并成一個有序的大文件。

思路：名列前茅趟從這100個小文件中各取出名列前茅個字符串并加入到小頂堆中，此時堆頂元素是最小的。取出堆頂元素存入合并后的大文件。假如這個最小字符串在10.txt這個小文件中，我們就再從這個小文件取下一個字符串，加入到堆中，重新從堆中取出堆頂元素并放入合并后的大文件。依此類推，直到所有文件中的數據都放入到大文件為止。

3、較好熱門關鍵詞

有一個包含 10 億個搜索關鍵詞的日志文件，如何快速獲取到前二0 最熱門的搜索關鍵詞呢？

Ps:假設10億條數據不重復的有1億條，每個關鍵詞占有50個字節，不重復關鍵詞的總大小約為4.6G。如果計算機內存限定為1G，如何處理呢？

思路：將10億個關鍵詞按hash算法放到到10個文件中，重復的關鍵字會被放到同一個文件中。分別計算每個文件的前二0,然后把10個前二0 放在一起，然后取出100個關鍵詞中，出現次數非常多的10個關鍵詞，就是最終求得多前二0。

到這里堆的相關應用內容就介紹完了，堆是一種很好的數據結構，能解決很多實用問題，希望作者的博文能幫助您更好的學習理解堆。本文中的代碼都是作者親自實踐的，可以直接拷貝下來學習參考。

延伸閱讀：

二、堆是什么

堆是一種完全二叉樹，復習一下完全二叉樹的定義，完全二叉樹的形式是指除了最后一層之外，其他所有層的結點都是滿的，而最后一層的所有結點都靠左邊。若設二叉樹的深度為h，除第 h 層外，其它各層 (1～h-1) 的結點數都達到最大個數，第 h 層所有的結點都連續集中在最左邊，這就是完全二叉樹。而最小堆要求，對于任意一個父結點來說，其子結點的值都大于這個父節點,同理，最大堆就是說，其子節點的值都小于這個父節點。

tags: it技術干貨