Obsah:
Definícia - Čo znamená extrakcia?
Extrakcia je proces získavania relevantných informácií zo zdrojov údajov špecifickým vzorom na použitie v prostredí skladovania údajov. Extrakcia dodáva údajom zmysel a je prvým krokom procesu transformácie údajov. Extrakcia vyberie iba určité údaje, ktoré zodpovedajú určitému stavu alebo kategórii z obrovskej zbierky údajov pochádzajúcich z rôznych zdrojov.
Techopedia vysvetľuje extrakciu
V prostredí skladovania údajov sa musí spracovávať, transformovať a ukladať obrovská zbierka údajov pochádzajúcich z rôznych štruktúr a neštruktúrovaných zdrojov, aby sa získali zmysluplné závery a predpovede. Údaje pochádzajúce z primárnych zdrojov sa musia do systému skladovania údajov importovať systematickým spôsobom, ktorý uľahčuje vykonávanie rôznych operácií s údajmi. Tento proces sa nazýva extrakcia. Extrakcia dodáva štruktúru iným neštruktúrovaným údajom podľa určitých pravidiel. Nasleduje niekoľko techník používaných pri extrakcii údajov:
- Zhoda vzorov
- Stolový prístup
- Textová analýza