Kombinovanie zdrojov údajov v spoločnosti Hadoop je komplexná záležitosť. Niektoré z dôvodov sú:
- Vlastné skripty špecifické pre zdroj, ktoré kombinujú zdroje údajov, sú problematické.
- Používanie nástrojov na integráciu údajov alebo nástrojov pre vedu o údajoch prináša príliš veľa neistoty.
- Pridávanie údajov z externých zdrojov je takmer nemožné.
Dnes sa chystám diskutovať o tom, ako je analytika Hadoop vylepšená pomocou technológií zameraných na zdroje, ktoré uľahčujú kombináciu interných a externých zdrojov údajov. Okrem popisu toho, ako fungujú analytické metódy založené na zdrojoch, sa budem venovať aj tomu, prečo analytici spoločnosti Hadoop potrebujú zabudované schopnosti prenosu inteligencie a vedomostí, porozumenie vzťahom a charakteristikám údajov a škálovateľnú a vysoko výkonnú architektúru.
Webový seminár: Matice významov: Spájanie bodiek v hadoope - Zaregistrujte sa tu |