一、如何克服字典樹(TrieTree)的缺點
對于字典樹(TrieTree)的缺點,為了減少空間浪費,有人提出了一些壓縮算法。比如基數 Trie( radix tries),又稱緊湊前綴樹。基本思想是通過減少樹的節點,從而減少空指針。
解決方法是在樹的路徑上下功夫,如果某個樹的路徑(包含多個節點)沒有分叉,就將其壓縮為一個節點,即允許一個節點存儲多個字符。
這個壓縮方法的代價是,在插入或者刪除 key 時,需要處理節點的展開與合并。但,等等,你說我都懂,這和**基數(Radix)**有毛線關系?答案是,Radix Trie 會將所有的 Key 進行二進制展開,以二進制的每個位作為單個字符作為 Trie 樹中的字符,進行插入。想想這么做有什么好處?
減少了分叉數(每個節點只有兩個分叉 0 和 1),從而減少了無用指針浪費。增大了共同前綴的概率,被拉長的路徑,正好可以用路徑壓縮來縮短。而 ART(Adaptive Radix Tree) 走的是另外一條路,不是在垂直方向(樹的縱深方向)下功夫,而是在水平方向(每個節點的扇出,fan-out)做文章。經典 Trie 需要為字符集中的每個字符保留一個指針,不管其是否真的會存在。ART 正是抓住這一點,提出了一種自適應的 Trie 結構,首先來看看其核心數據結構——Trie 樹節點:
union Node {
??? Node4* n4;
??? Node16* n16;
??? Node48* n48;
??? Node256* n256;
}
看到該數據結構,我們就大概猜出他要干什么了,即在分叉較少時,用小分叉節點;在分叉較大時,使用較大分叉節點。換個角度想,這就類似將經典的 Trie 樹種指針從固定數組,換到了可變數組()。當然,每個節點的查找時間,也從 O(1) 換到了 O(lgn),不過考慮到 n 一般比較小,也可近似認為 O(1) == O(lgn)。此外,還可以控制可變的檔位,可以針對性的對 cache 進行優化
延伸閱讀:
二、八叉樹(octree)是什么
八叉樹(octree)是三維空間劃分的數據結構之一,它用于加速空間查詢,例如在游戲中:
加速用于可見性判斷的視錐裁剪(view frustum culling)。
加速射線投射(ray casting) ,如用作視線判斷或槍擊判定。
鄰近查詢(proximity query),如查詢玩家角色某半徑范圍內的敵方NPC。