Hive數(shù)據(jù)倉庫介紹
技術(shù)開發(fā) 編程 技術(shù)框架 技術(shù)發(fā)展
Hive是基于Hadoop的一個數(shù)據(jù)倉庫工具,可以將結(jié)構(gòu)化的數(shù)據(jù)文件映射為一張數(shù)據(jù)庫表,并提供簡單的SQL查詢功能,可以將SQL語句轉(zhuǎn)換為MapReduce任務(wù)進行運行。其優(yōu)點是學(xué)習(xí)成本低,可以通過類SQL語句快速實現(xiàn)簡單的MapReduce統(tǒng)計,不必開發(fā)專門的MapReduce應(yīng)用程序,十分適合數(shù)據(jù)倉庫的統(tǒng)計分析。Hive的核心架構(gòu)主要由以下四個組件組成:用戶接口:包括CLI、Client API(Java API、Thrift/RE···
