国产一区二区精品-国产一区二区精品久-国产一区二区精品久久-国产一区二区精品久久91-免费毛片播放-免费毛片基地

千鋒教育-做有情懷、有良心、有品質的職業教育機構

手機站
千鋒教育

千鋒學習站 | 隨時隨地免費學

千鋒教育

掃一掃進入千鋒手機站

領取全套視頻
千鋒教育

關注千鋒學習站小程序
隨時隨地免費學習課程

當前位置:首頁  >  技術干貨  > HBase系列常見面試題匯總---HBase如何保證讀的高效以及數據的強一致性

HBase系列常見面試題匯總---HBase如何保證讀的高效以及數據的強一致性

來源:千鋒教育
發布人:syq
時間: 2022-08-12 11:15:16 1660274116

  1.HBase如何保證讀的高效?

  緩存

  * HBase 有兩塊主要的內存緩存,MemStore 和 BlockCache。 * 一個查詢過來 RegionServer 后,首先用 MemStoreScanner 搜索 MemStore 里是否有所查的 rowKey ,這一步在內存中,所以是很快的。 * 如果不在 memstore 中,會經過一系列的索引尋址定位到 Block 的位置。如果 Block 在 BlockCache 緩存中則可以直接在內存中操作,速度很快,不需要再進行一次 IO 將整個 Block 讀取到內存中。

HBase如何保證讀的高效

  過濾

  * RegionServer 啟動的時候就會把每個 HFile 的起止 Rowkey 加載到內存中,在定位 HFile 的時候可以過濾掉大部分 HFile * 加載到內存中的Bloom Block也會通過BloomFilte也會過濾掉大部分一定不包含所查RowKey的HFile。

  索引

  * 經過了上面的過濾,其實只剩下很少一部分的 HFile 需要去檢索了,HBase 有三級索引,第一級索引會常駐內存,二三級的索引會以 Block 的形式存在 HFile 中。 * 另外因為 HBase 是多版本共存的,所以結果可能是會有多個的,因此檢索的過程不是找到一個就返回了,而是要找到所有的,然后將結果合并。

  2.HBase 如何保證數據的強一致性?

  HBase 是犧牲了數據的部分可用性來保證它的數據強一致性的,即CAP原理中舍棄了一部分的可用性,HBase 是個 CP系統。

  * HBase 中每一條數據只會出現在一個 Region,它的數據冗余備份不是在 Region 這個層面做的,還是依賴 HDFS 來做的冗余。而且同一時間一個 Region 只會被分配給一個 RegionServer,這就保證了系統中只會有一條可以使用的數據。HBase 支持行級事物,即一個 put 操作要么成功,要么失敗。

  * 另外當有 RegionServer 宕機的時候,Region 會被分配到其他的 RegionServer 上,同時重寫 WAL Log,這個過程中整個 Region 中的數據是不可用的,因為它是缺失的。如果可用性強的話那么必定會有數據不一致的問題(即寫入過的數據查詢不到),所以這里用可用性來換取了強一致性,等到 WAL 寫完,保證了數據完整性之后,才可重新訪問。

  更多關于“大數據培訓”的問題,歡迎咨詢千鋒教育在線名師。千鋒教育多年辦學,課程大綱緊跟企業需求,更科學更嚴謹,每年培養泛IT人才近2萬人。不論你是零基礎還是想提升,都可以找到適合的班型,千鋒教育隨時歡迎你來試聽。

tags:
聲明:本站稿件版權均屬千鋒教育所有,未經許可不得擅自轉載。
10年以上業內強師集結,手把手帶你蛻變精英
請您保持通訊暢通,專屬學習老師24小時內將與您1V1溝通
免費領取
今日已有369人領取成功
劉同學 138****2860 剛剛成功領取
王同學 131****2015 剛剛成功領取
張同學 133****4652 剛剛成功領取
李同學 135****8607 剛剛成功領取
楊同學 132****5667 剛剛成功領取
岳同學 134****6652 剛剛成功領取
梁同學 157****2950 剛剛成功領取
劉同學 189****1015 剛剛成功領取
張同學 155****4678 剛剛成功領取
鄒同學 139****2907 剛剛成功領取
董同學 138****2867 剛剛成功領取
周同學 136****3602 剛剛成功領取
相關推薦HOT