一、可持久化的數據結構
1.可持久化線段樹
對于實現可持久化的方法,我們最容易想到的就是開一個 O(N2) 的空間,把所有版本都存儲下來。但這樣顯然會有很多空間是浪費的,因為相較于被修改的部分來說,兩個版本之間完全相同的部分顯然會更多。與線性結構相比,樹型結構更擅長幫助我們分清楚這兩個部分,而樹形結構中最擅長處理這種修改查詢問題的就是線段樹。所以我們先介紹一下利用可持久化線段樹實現可持久化數組。
2.可持久化塊狀數組
回憶線段樹的修改流程,我們會發現所有的操作都只跟一條鏈有關 (下放lazytag是個例外,但也跟一條鏈差不多) ,因此我們在生成新版本的時候,對于未修改的點可以直接使用舊版本的節點,只有發生修改的點才需要新建一個新節點來代替舊節點,這樣空間復雜度就可以降到 O(NlogN) ,而修改查詢這些都不會收到影響。
3. 可持久化并查集
寫作并查集,前置知識卻是利用可持久化線段樹實現可持久化數組,過分!回顧并查集,其實不過是一個 fa[a] = b,為了可持久化,我們就用可持久化數組來維護 fa[i]。注意這里不能再使用路徑壓縮了,道理很簡單,可持久化要盡可能減少修改的次數。但是我們依然保留了一種優化方式:在維護 fa[i] 的同時維護一個 dep[i] ,表示這個節點的深度,保證在合并時是深度較小的點向深度較大的點合并即可。
4.可持久化字典樹
依舊與可持久化線段樹的思想類似,這里的可持久化主要體現在插入新串,這個插入過程影響的節點數量也是O(logN)的,因此插入時像線段樹一樣生成一個新的鏈即可。
5.可持久化分塊
利用和可持久化線段樹相似的思想,將每塊都編好序號,用一個 O(√n) 的數組來記錄一個版本的所有塊。當一個塊要被修改時,新建一個值為修改后的塊的新塊,用一個新數組保存新版本所有的塊編號即可。
延伸閱讀:
二、可持久化數據結構原理
可持久化:將數據結構的所有歷史版本記錄下來,稱為可持久化。
不是所有的數據結構都是可以持久化的,可持久化的數據結構要求其結構穩定,比如堆(是一顆滿二叉樹,結構穩定)、樹狀數組、trie(字典樹)、線段樹等。平衡樹就不可以進行持久化操作,因為其存在左旋、右旋的操作。
存下來所有的歷史版本有兩種方式,一種是每改動一次則全部備份下來;另一種是增量備份。名列前茅種方式時空復雜度都比較高,不使用這種方式,我們這里只講解增量備份的方式(類似于git)。
增量備份的核心思想是:只記錄每個版本與前一個版本不同的部分。