教育行業(yè)A股IPO第一股(股票代碼 003032)

全國(guó)咨詢/投訴熱線:400-618-4000

Hive的工作原理是什么?Hive和Hadoop執(zhí)行任務(wù)的流程

更新時(shí)間:2022年11月08日10時(shí)32分 來(lái)源:傳智教育 瀏覽次數(shù):

Hive是基于Hadoop的一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具,主要用來(lái)對(duì)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、加載操作。HiveQL可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)表,允許熟悉SQL的用戶查詢數(shù)據(jù),也允許熟悉MapReduce的開(kāi)發(fā)者開(kāi)發(fā)自定義的mapper和reducer來(lái)處理內(nèi)建的mapper和 reducer無(wú)法完成的復(fù)雜的分析工作,相對(duì)于Java代碼編寫(xiě)的MapReduce來(lái)說(shuō),Hive的優(yōu)勢(shì)更加明顯。Hive利用Hadoop的HDFS存儲(chǔ)數(shù)據(jù),利用Hadoop的MapReduce執(zhí)行查詢。

Hadoop的MapReduce執(zhí)行查詢的工作原理

Hive和Hadoop協(xié)作執(zhí)行任務(wù)的工作原理

(1)  用戶通過(guò)用戶接口向Driver提交executeQuery。

(2)  Driver向Compiler發(fā)送獲取計(jì)劃的請(qǐng)求。

(3)  Compiler根據(jù)用戶提交的executeQuery去MetaStore獲取需要的元數(shù)據(jù)信息。

(4)  MetaStore向Compiler發(fā)送元數(shù)據(jù)信息。

(5)  Compiler得到元數(shù)據(jù)信息,并向Driver發(fā)送計(jì)劃。

(6)  Driver 向EXECUTION ENGINE提交executePlan。

(7)  用戶接口向Driver發(fā)起獲取結(jié)果集(fetchResults)的請(qǐng)求。

(8)Driver向EXECUTION ENGINE發(fā)起獲取結(jié)果集的請(qǐng)求。

(9)EXECUTION ENGINE向Driver發(fā)送結(jié)果集,Driver獲取到結(jié)果集后返回用戶接口。

0 分享到:
和我們?cè)诰€交談!