Obsah:
Definícia - Čo znamenajú neštruktúrované údaje?
Neštruktúrované údaje predstavujú akékoľvek údaje, ktoré nemajú rozpoznateľnú štruktúru. Je neorganizovaný a surový a môže byť netextový alebo textový. Napríklad e-mail je dobrým príkladom neštruktúrovaných textových údajov. Zahŕňa čas, dátum, podrobnosti o príjemcovi a odosielateľovi, predmet, atď., Ale telo e-mailu zostáva neštruktúrované. Neštruktúrované údaje sa môžu tiež identifikovať ako voľne štruktúrované údaje, pričom zdroje údajov obsahujú štruktúru, ale nie všetky údaje v množine údajov majú rovnakú štruktúru.
V podnikoch zameraných na zákazníka môžu byť údaje nájdené v neštruktúrovanej forme preskúmané, aby sa zlepšil vzťahový marketing a riadenie vzťahov so zákazníkmi (CRM). Keďže aplikácie sociálnych médií, ako sú Facebook a Twitter, idú do hlavného prúdu, vývoj štruktúrovaných údajov pravdepodobne predbehne vývoj štruktúrovaných údajov.
Techopedia vysvetľuje neštruktúrované údaje
Neštruktúrované údaje sa týkajú údajov, ktoré nasledujú po formulári, ktorý je menej usporiadaný ako položky, ako sú tabuľky, tabuľky databázy alebo iné lineárne alebo usporiadané súbory údajov. Termín „súbor údajov“ je v skutočnosti užitočný, pretože je spojený s údajmi v úhľadných, prístupných poliach bez dodatočného obsahu, ktoré sú prepojené alebo označené konkrétnou štruktúrou.
Medzi ďalšie príklady neštruktúrovaných textových údajov patria dokumenty programu Word, prezentácie programu PowerPoint, okamžité správy, softvér na spoluprácu, dokumenty, knihy, príspevky v sociálnych médiách a lekárske záznamy. Netexturované neštruktúrované údaje sa zvyčajne vytvárajú v médiách, ako sú zvukové súbory MP3, obrázky JPEG a videosúbory Flash atď.
Neštruktúrované údaje obvykle neobsahujú preddefinovaný dátový model a nemusia sa dobre zhodovať s relačnými tabuľkami. Neštruktúrované údaje sú zvyčajne náročné na text. Môže však obsahovať čísla a dátumy, ako aj fakty. To vedie k nejasnostiam, ktoré je ťažké identifikovať pomocou konvenčných softvérových programov.
Ukladanie obrovského množstva neštruktúrovaných údajov generovaných v podniku, ak je zle spravované, môže viesť k vyšším nákladom. Údaje v tlačených dokumentoch alebo v elektronickom formáte sa musia skenovať, aby vyhľadávacia aplikácia mohla analyzovať nápady, v závislosti od slov použitých v určitých kontextoch. Toto je známe ako podnikové alebo sémantické vyhľadávanie.
