Obsah:
- Definícia - Čo znamená neštruktúrovaná ťažba údajov?
- Techopedia vysvetľuje neštruktúrovanú ťažbu údajov
Definícia - Čo znamená neštruktúrovaná ťažba údajov?
Neštruktúrovaná ťažba údajov je prax, pri ktorej sa skúmajú relatívne neštruktúrované údaje a snaží sa z nich získať podrobnejšie súbory údajov. Často pozostáva z extrahovania údajov zo zdrojov, ktoré sa tradične nepoužívajú na činnosti v oblasti získavania údajov.Techopedia vysvetľuje neštruktúrovanú ťažbu údajov
Vo všeobecnosti je ťažba údajov praxou česania sa cez súbory údajov a snaženia sa získať len tie najcennejšie informácie do konkrétneho formátu. To je zvyčajne ťažšie pri relatívne neštruktúrovaných údajoch. Odborníci v oblasti IT definujú neštruktúrované údaje ako údaje, ktoré nie sú v špecifickom formáte, údaje, ktoré sú „textovo ťažké“ alebo údaje, ktoré sú „skryté“ v nepresných dokumentoch, ktoré nie sú formálne objednané na poskytnutie technických informácií.
Príkladom neštruktúrovaného dokumentu by mohol byť list alebo korešpondencia medzi dvoma alebo viacerými stranami. V prípade neštruktúrovanej ťažby údajov by technológie rozobrali tento list, pričom by hľadali konkrétne identifikátory a kúsky informácií, ako sú mená prepojených strán, dátumy zaslania listov, názvy zúčastnených podnikov, sumy meny alebo iné vyčíslenie. kúsky údajov alebo kódy priradené konkrétnym výrobkom, službám alebo obchodom. Tieto druhy údajov sa ťažia a potom ukladajú do formátu, ktorý môžu podniky alebo iné strany použiť na rýchlu referenciu alebo na vyvinuté aplikácie business intelligence.