一、什么是持久化數(shù)據(jù)結(jié)構(gòu)
持久化存儲(chǔ),其實(shí)主要是針對(duì)內(nèi)存數(shù)據(jù)的,以典型的Redis來(lái)說(shuō),持久化存儲(chǔ)主要有三種方式:
1、RDB
RDB: 保存某個(gè)時(shí)間點(diǎn)的全量數(shù)據(jù)快照
觸發(fā)方式
1. save: 阻塞Redis的服務(wù)器進(jìn)程,直到RDB文件被創(chuàng)建完畢
2. bgsave: fork出子進(jìn)程來(lái)創(chuàng)建RDB文件,不阻塞服務(wù)器進(jìn)程, lastsave 指令可以查看最近的備份時(shí)間
3. 根據(jù)redis.conf里的save m n配置定時(shí)觸發(fā)(用的是BGSAVE)
4. 主從復(fù)制時(shí),主節(jié)點(diǎn)自動(dòng)觸發(fā)
5. 執(zhí)行debug relaod命令
6. 執(zhí)行shutdown且沒(méi)有開(kāi)啟AOF持久化
2、AOF
AOF: 增量存儲(chǔ)命令
觸發(fā)方式
1. BGREWRITEAOF: 增量追加命令
2. 根據(jù)redis.conf里的appendfsync配置定時(shí)觸發(fā)
3. AOF文件重寫(xiě)
3、混合持久化
為解決AOF文件啟動(dòng)加載慢,不利于快速恢復(fù)的缺點(diǎn),RedisV4.0提供了新的持久化方式——混合持久化。
混合持久化的文件內(nèi)容: [RDB file][AOF tail]
持久化過(guò)程:
1. 將重寫(xiě)(rewrite)這一刻之前的數(shù)據(jù)做RDB快照處理
2. 將RDB快照內(nèi)容和AOF增量命令先后寫(xiě)入新的AOF臨時(shí)文件
3. 重寫(xiě)完成后,對(duì)AOF臨時(shí)文件改名,并覆蓋舊的AOF文件
在redis重啟的時(shí)候,可以先加載RDB文件,然后再重放增量的AOF日志就可以完全替代之前的AOF全量文件重放,因此能大幅提高重啟效率提高。
延伸閱讀:
二、可持久化實(shí)際應(yīng)用
1.幾何計(jì)算
在幾何計(jì)算中有許多離線算法,例如懸線掃描法,其基本策略是一次掃描后給出所有詢問(wèn)的回答,在時(shí)間復(fù)雜度分析相當(dāng)優(yōu)異。但在強(qiáng)迫在線的情況下,每次都要進(jìn)行一次懸線掃描,詢問(wèn)操作的時(shí)間復(fù)雜度就從對(duì)數(shù)時(shí)間降為線性。
為了解決時(shí)間復(fù)雜度上的問(wèn)題,在這里可以引入可持久化的思維。我們將掃描線的時(shí)間軸作為一個(gè)變動(dòng)依據(jù),持久化相關(guān)的結(jié)構(gòu),只要我們能將詢問(wèn)在對(duì)數(shù)時(shí)間內(nèi)穿梭于這個(gè)時(shí)間軸,必能動(dòng)態(tài)解決先前的問(wèn)題。
2.字串處理
為了達(dá)到非常高效率的合并操作,防止大量重復(fù)性字串的生成伴隨的效能退化,使得各方面的操作都能遠(yuǎn)低于線性操作。如C++中的rope就是一個(gè)可持久化的數(shù)據(jù)結(jié)構(gòu)。不只是字串操作。若處理類型有大量重復(fù)操作,均可以考慮將數(shù)據(jù)結(jié)構(gòu)進(jìn)行可持久化處理,以達(dá)到壓縮時(shí)間開(kāi)支的效果。
3.版本回溯
實(shí)際上就是對(duì)應(yīng)大部分的應(yīng)用軟體中的redo/undo。如果資料庫(kù)/操作變動(dòng)為了高效率操作而會(huì)配上復(fù)雜的結(jié)構(gòu)(并不像 hash, set 反轉(zhuǎn)操作只需要常數(shù)或?qū)?shù)時(shí)間),那么為了快速回推變動(dòng)結(jié)果,持久化結(jié)構(gòu)就是要減少 redo/undo 的花費(fèi)。
資料庫(kù)本身可以常數(shù)回推,紀(jì)錄變動(dòng)的部分情況即可。而應(yīng)用層的計(jì)算,大部分實(shí)作都是砍掉快取,并且重新計(jì)算出一份新的結(jié)構(gòu),有時(shí)候回推的變動(dòng)大小為 m,為了重新計(jì)算結(jié)構(gòu)而消耗了 n + m n+mn+m,如果 n nn 和 m mm 的差距非常大,那連續(xù)回推的體感就很糟糕。