Obsah:
Veľké údaje, chytľavý názov pre veľké objemy štruktúrovaných, neštruktúrovaných alebo pološtrukturovaných údajov, je notoricky ťažké zachytiť, uložiť, spravovať, zdieľať, analyzovať a vizualizovať, aspoň pomocou tradičných databázových a softvérových aplikácií. Preto majú veľké dátové technológie potenciál na efektívne a efektívne spravovanie a spracovanie veľkého množstva údajov. A je to Apache Hadoop, ktorý poskytuje rámec a súvisiace technológie na distribúciu veľkého množstva súborov v klastroch počítačov. Takže, aby ste skutočne porozumeli veľkým údajom, musíte niečo o Hadoop pochopiť. Tu sa pozrieme na tie najlepšie výrazy, ktoré budete počuť v súvislosti s Hadoopom - a čo znamenajú.
Webinár: Big Iron, Zoznámte sa s veľkými údajmi: Oslobodenie údajov z mainframu pomocou Hadoop & Spark Zaregistrujte sa tu |
Najprv sa však pozrieme na to, ako funguje Hadoop
Pred vstupom do eko-systému Hadoop musíte jasne porozumieť dvom základným veciam. Prvým je spôsob uloženia súboru v Hadoop; Druhým je spôsob spracovania uložených údajov. Všetky technológie súvisiace s Hadoopom pracujú hlavne v týchto dvoch oblastiach a sú užívateľsky príjemnejšie. (Získajte základné informácie o tom, ako Hadoop pracuje v časti Ako Hadoop pomáha vyriešiť problém veľkých dát.)
Teraz, podľa podmienok.