Obsah:
- Definícia - Čo znamená Open-Source Big Data Analytics?
- Techopedia vysvetľuje open-source analýzu veľkých dát
Definícia - Čo znamená Open-Source Big Data Analytics?
Open-source analýza veľkých dát sa týka použitia open-source softvéru a nástrojov na analýzu veľkého množstva údajov s cieľom zhromaždiť relevantné a uskutočniteľné informácie, ktoré organizácia môže použiť na podporu svojich obchodných cieľov. Najväčším hráčom v oblasti open-source analýzy veľkých dát je Hadoop spoločnosti Apache - je to najpoužívanejšia softvérová knižnica na spracovanie obrovských množín údajov v klastri počítačov pomocou distribuovaného procesu pre paralelizmus.
Techopedia vysvetľuje open-source analýzu veľkých dát
Open-source analýza veľkých dát využíva open-source softvér a nástroje na vykonávanie analýzy veľkých dát pomocou celej softvérovej platformy alebo rôznych open-source nástrojov pre rôzne úlohy v procese analýzy dát. Apache Hadoop je najznámejší systém pre analýzu veľkých dát, ale pred zostavením skutočného analytického systému sú potrebné ďalšie komponenty.
Hadoop je open-source implementácia algoritmu MapReduce priekopníkom spoločností Google a Yahoo, takže je základom väčšiny analytických systémov dnes. Mnoho veľkých nástrojov na analýzu údajov využíva otvorený zdroj vrátane robustných databázových systémov, ako je napríklad otvorený zdroj MongoDB, sofistikovaná a škálovateľná databáza NoSQL, ktorá sa veľmi dobre hodí pre veľké dátové aplikácie, ako aj iné.
Služby analýzy veľkých dát s otvoreným zdrojom zahŕňajú:
- Systém zberu údajov
- Riadiace stredisko pre správu a monitorovanie klastrov
- Knižnica strojového učenia a získavania údajov
- Koordinačná služba aplikácií
- Vypočítajte motor
- Vykonávací rámec