有哪些數據結構可以可持久化?

來源：千鋒教育

發布人：xqq

時間： 2023-10-11 08:01:27 1696982487

一、可持久化的數據結構

1.可持久化線段樹

對于實現可持久化的方法，我們最容易想到的就是開一個 O(N2) 的空間，把所有版本都存儲下來。但這樣顯然會有很多空間是浪費的，因為相較于被修改的部分來說，兩個版本之間完全相同的部分顯然會更多。與線性結構相比，樹型結構更擅長幫助我們分清楚這兩個部分，而樹形結構中最擅長處理這種修改查詢問題的就是線段樹。所以我們先介紹一下利用可持久化線段樹實現可持久化數組。

2.可持久化塊狀數組

回憶線段樹的修改流程，我們會發現所有的操作都只跟一條鏈有關 (下放lazytag是個例外，但也跟一條鏈差不多) ，因此我們在生成新版本的時候，對于未修改的點可以直接使用舊版本的節點，只有發生修改的點才需要新建一個新節點來代替舊節點，這樣空間復雜度就可以降到 O(NlogN) ，而修改查詢這些都不會收到影響。

3. 可持久化并查集

寫作并查集，前置知識卻是利用可持久化線段樹實現可持久化數組，過分！回顧并查集，其實不過是一個 fa[a] = b，為了可持久化，我們就用可持久化數組來維護 fa[i]。注意這里不能再使用路徑壓縮了，道理很簡單，可持久化要盡可能減少修改的次數。但是我們依然保留了一種優化方式：在維護 fa[i] 的同時維護一個 dep[i] ，表示這個節點的深度，保證在合并時是深度較小的點向深度較大的點合并即可。

4.可持久化字典樹

依舊與可持久化線段樹的思想類似，這里的可持久化主要體現在插入新串，這個插入過程影響的節點數量也是O(logN)的，因此插入時像線段樹一樣生成一個新的鏈即可。

5.可持久化分塊

利用和可持久化線段樹相似的思想，將每塊都編好序號，用一個 O(√n) 的數組來記錄一個版本的所有塊。當一個塊要被修改時，新建一個值為修改后的塊的新塊，用一個新數組保存新版本所有的塊編號即可。

延伸閱讀：

二、可持久化數據結構原理

可持久化：將數據結構的所有歷史版本記錄下來，稱為可持久化。

不是所有的數據結構都是可以持久化的，可持久化的數據結構要求其結構穩定，比如堆（是一顆滿二叉樹，結構穩定）、樹狀數組、trie（字典樹）、線段樹等。平衡樹就不可以進行持久化操作，因為其存在左旋、右旋的操作。

存下來所有的歷史版本有兩種方式，一種是每改動一次則全部備份下來；另一種是增量備份。名列前茅種方式時空復雜度都比較高，不使用這種方式，我們這里只講解增量備份的方式（類似于git）。

增量備份的核心思想是：只記錄每個版本與前一個版本不同的部分。

tags: it技術干貨