Domov audio Čo je open-source analýza veľkých dát? - definícia z technológie

Čo je open-source analýza veľkých dát? - definícia z technológie

Obsah:

Anonim

Definícia - Čo znamená Open-Source Big Data Analytics?

Open-source analýza veľkých dát sa týka použitia open-source softvéru a nástrojov na analýzu veľkého množstva údajov s cieľom zhromaždiť relevantné a uskutočniteľné informácie, ktoré organizácia môže použiť na podporu svojich obchodných cieľov. Najväčším hráčom v oblasti open-source analýzy veľkých dát je Hadoop spoločnosti Apache - je to najpoužívanejšia softvérová knižnica na spracovanie obrovských množín údajov v klastri počítačov pomocou distribuovaného procesu pre paralelizmus.

Techopedia vysvetľuje open-source analýzu veľkých dát

Open-source analýza veľkých dát využíva open-source softvér a nástroje na vykonávanie analýzy veľkých dát pomocou celej softvérovej platformy alebo rôznych open-source nástrojov pre rôzne úlohy v procese analýzy dát. Apache Hadoop je najznámejší systém pre analýzu veľkých dát, ale pred zostavením skutočného analytického systému sú potrebné ďalšie komponenty.

Hadoop je open-source implementácia algoritmu MapReduce priekopníkom spoločností Google a Yahoo, takže je základom väčšiny analytických systémov dnes. Mnoho veľkých nástrojov na analýzu údajov využíva otvorený zdroj vrátane robustných databázových systémov, ako je napríklad otvorený zdroj MongoDB, sofistikovaná a škálovateľná databáza NoSQL, ktorá sa veľmi dobre hodí pre veľké dátové aplikácie, ako aj iné.

Služby analýzy veľkých dát s otvoreným zdrojom zahŕňajú:

  • Systém zberu údajov
  • Riadiace stredisko pre správu a monitorovanie klastrov
  • Knižnica strojového učenia a získavania údajov
  • Koordinačná služba aplikácií
  • Vypočítajte motor
  • Vykonávací rámec
Čo je open-source analýza veľkých dát? - definícia z technológie