Obsah:
Definícia - Čo znamená extrakcia údajov?
Extrakcia údajov je miesto, kde sa údaje analyzujú a prehľadávajú, aby sa získali príslušné informácie zo zdrojov údajov (napríklad z databázy) v konkrétnom vzore. Uskutočňuje sa ďalšie spracovanie údajov, ktoré zahŕňa pridanie metaúdajov a integráciu ďalších údajov; ďalší proces v dátovom pracovnom toku.
Väčšina extrakcie údajov pochádza z neštruktúrovaných zdrojov údajov a rôznych formátov údajov. Tieto neštruktúrované údaje môžu byť v akejkoľvek forme, ako sú tabuľky, indexy a analytika.
Techopedia vysvetľuje extrakciu dát
Dáta v sklade môžu pochádzať z rôznych zdrojov, dátový sklad vyžaduje tri rôzne metódy na využitie prichádzajúcich údajov. Tieto procesy sú známe ako extrakcia, transformácia a načítanie (ETL).
Proces získavania údajov zahŕňa získavanie údajov z rôznych zdrojov údajov. Extrakty údajov sa potom načítajú do pracovnej oblasti relačnej databázy. Tu sa používa logika extrakcie a zdrojový systém sa spýta na dáta pomocou aplikačných programovacích rozhraní. Po tomto procese sú teraz údaje pripravené na prechod cez fázu transformácie procesu ETL.
