Domov audio Čo je hadoopový ekosystém? - definícia z technológie

Čo je hadoopový ekosystém? - definícia z technológie

Obsah:

Anonim

Definícia - Čo znamená ekosystém Hadoop?

Ekosystém Hadoop sa odvoláva na rôzne komponenty softvérovej knižnice Apache Hadoop, ako aj na doplnky a nástroje poskytované Apache Software Foundation pre tieto typy softvérových projektov a na spôsoby, ako spolupracujú.

Hadoop je framework založený na Java, ktorý je mimoriadne populárny pri spracovaní a analýze veľkých súborov údajov.

Techopedia vysvetľuje ekosystém Hadoop

Základný balík Hadoop a jeho príslušenstvo sú väčšinou projekty s otvoreným zdrojovým kódom licencované spoločnosťou Apache. Myšlienka ekosystému Hadoop zahŕňa použitie rôznych častí základnej sady Hadoop, ako je napríklad MapReduce, rámec pre spracovanie obrovského množstva údajov, a sofistikovaný systém spracovania súborov Hadoop Distributed File System (HDFS). Existuje tiež YARN, správca zdrojov Hadoop.

Okrem týchto základných prvkov spoločnosti Hadoop dodala spoločnosť Apache vývojárom aj iné druhy príslušenstva alebo doplnkových nástrojov. Medzi ne patrí Apache Hive, nástroj na analýzu údajov; Apache Spark, všeobecný stroj na spracovanie veľkých dát; Apache Pig, jazyk toku údajov; HBase, databázový nástroj; a tiež Ambarl, ktorý možno považovať za manažéra ekosystému Hadoop, pretože pomáha spoločne spravovať používanie týchto rôznych zdrojov Apache. Keďže sa Hadoop stal de facto štandardom pre zber údajov a stal sa všadeprítomným v mnohých organizáciách, manažéri a vedúci vývoja sa učia všetko o ekosystéme Hadoop a o tom, aké veci sa podieľajú na všeobecnom nastavení Hadoop.

Čo je hadoopový ekosystém? - definícia z technológie