一、哈希樹hashtree常應用現(xiàn)實場景
1、場景一:安全加密
日常用戶密碼加密通常使用的都是 md5、sha等哈希函數(shù),因為不可逆,而且微小的區(qū)別加密之后的結(jié)果差距很大,所以安全性更好。
2、場景二:少數(shù)標識
比如 URL 字段或者圖片字段要求不能重復,這個時候就可以通過對相應字段值做 md5 處理,將數(shù)據(jù)統(tǒng)一為 32 位長度從數(shù)據(jù)庫索引構(gòu)建和查詢角度效果更好,此外,還可以對文件之類的二進制數(shù)據(jù)做 md5 處理,作為少數(shù)標識,這樣判定重復文件的時候更快捷。
3、場景三:數(shù)據(jù)校驗
比如從網(wǎng)上下載的很多文件(尤其是P2P站點資源),都會包含一個 MD5 值,用于校驗下載數(shù)據(jù)的完整性,避免數(shù)據(jù)在中途被劫持篡改。
4、場景五:散列函數(shù)
前面已經(jīng)提到,PHP 中的 md5、sha1、hash 等函數(shù)都是基于哈希算法計算散列值
5、場景五:負載均衡
對于同一個客戶端上的請求,尤其是已登錄用戶的請求,需要將其會話請求都路由到同一臺機器,以保證數(shù)據(jù)的一致性,這可以借助哈希算法來實現(xiàn),通過用戶 ID 尾號對總機器數(shù)取模(取多少位可以根據(jù)機器數(shù)定),將結(jié)果值作為機器編號。
6、場景六:分布式緩存
分布式緩存和其他機器或數(shù)據(jù)庫的分布式不一樣,因為每臺機器存放的緩存數(shù)據(jù)不一致,每當緩存機器擴容時,需要對緩存存放機器進行重新索引(或者部分重新索引),這里應用到的也是哈希算法的思想。
延伸閱讀:
二、哈希算法的一般特性
從哈希值不能反向推導出原始數(shù)據(jù)(所以哈希算法也叫單向算法,不可逆);對輸入數(shù)據(jù)非常敏感,哪怕原始數(shù)據(jù)只修改了一個比特,最后得到的哈希值也大不相同;散列沖突的概率要很小,對于不同的原始數(shù)據(jù),哈希值相同的概率非常小;哈希算法的執(zhí)行效率要盡量高效,針對較長的文本,也能快速地計算出哈希值。