Obsah:
Definícia - Čo znamená SQL na Hadoope?
SQL on Hadoop je typ analytického aplikačného nástroja - implementácia SQL na platforme Hadoop, ktorá kombinuje štandardné dotazovanie štruktúrovaných údajov v štýle SQL s dátovým rámcom Hadoop. Hadoop je relatívne nová platforma, rovnako ako samotné veľké dáta, a nie je v nej veľa odborníkov, ale SQL na Hadoop zjednodušuje prístup do rámca Hadoop a uľahčuje implementáciu do súčasných podnikových systémov.
Techopedia vysvetľuje SQL na Hadoop
SQL na Hadoop odkazuje na rôzne implementácie SQL pre platformu Hadoop. MapReduce, ktorý je klastrovým mapovačom úloh a organizátorom výsledkov Hadoop, podporuje SQL ako hlavný prípad použitia, ako aj ďalšie metódy spracovania. Preto má zmysel vytvárať výkonné nástroje na povolenie jazyka SQL, ktorý je jedným z najpoužívanejších jazykov na databázové dotazy a manipuláciu. Pretože Hadoop získava popularitu v architektúre podnikových údajov, SQL je kľúčom k správnemu prijatiu voľne štruktúrovaných údajov aj štruktúrovaných údajov používaných v Hadoope.
Kľúčové ovládače SQL na kľúčoch Hadoop zahŕňajú:
- Využitie existujúcich zručností v oblasti SQL prítomných vo väčšine organizácií
- Opätovné použitie extrakčného transformačného zaťaženia (ETL), business intelligence (BI) a investícií do analytickej infraštruktúry v Hadoop
Niektoré implementácie SQL na Hadoop zahŕňajú:
- Apache Spark SQL
- Úľ Apache
- Apache Tajo
- Vŕtačka Apache
- HP Vertica na MapR
- Ovládače ODBC
- Presto
- žralok