教育行業(yè)A股IPO第一股(股票代碼 003032)

全國咨詢/投訴熱線:400-618-4000

HBase數據庫是怎樣存儲數據的?

更新時間:2020年12月17日10時40分 來源:傳智教育 瀏覽次數:

好口碑IT培訓

  HBase分布式數據庫最重要的就是存儲數據,下面,從四個方面詳細介紹HBase的物理存儲。

  1.HBase表的數據按照行鍵RowKey的字典序進行排列,并且切分多個HRegion存儲,存儲方式如圖1所示。

  ? 圖1 Region在行方向上的存儲

  2.每個Region存儲的數據是有限的,如果當Region增大到一個閥值(128)時,會被等分切成兩個新的Region,切分方式如圖2所示。

  ? 圖2 HRegion的切分

  3.一個HRegion Server上可以存儲多個Region,但是每個Region只能被分布到一個HRegion Server上,分布方式如圖3所示。

  圖3 HRegion的分布

  4.MemStore中存儲的是用戶寫入的數據,一旦MemStore存儲達到閾值時,里面存儲的數據就會被刷新到新生成的StoreFile中(底層是HFile),該文件是以HFile的格式存儲到HDFS上,具體如圖4所示。

  ? 圖4 HBase表的存儲

猜你喜歡:

怎樣使用Linux和HDFS創(chuàng)建RDD?

HBase表常見Shell命令及具體語法操作講解【大數據文章】?

黑馬程序員大數據培訓課程 

傳智播客大數據培訓課程 

0 分享到:
和我們在線交談!