Obsah:
Definícia - Čo znamená Variety?
Variety je komponent rámca 3 V, ktorý sa používa na definovanie rôznych typov údajov, kategórií a súvisiaceho riadenia veľkého úložiska údajov. Odroda poskytuje pohľad na jedinečnosť rôznych tried veľkých údajov a na to, ako sa porovnávajú s inými druhmi údajov.
Techopedia vysvetľuje Variety
Odroda definuje povahu údajov, ktoré existujú vo veľkých údajoch. To zahŕňa rôzne formáty údajov, sémantiku údajov a typy dátových štruktúr.
Variety sú zamerané na poskytovanie rôznych techník na riešenie a správu rozmanitosti údajov v rámci veľkých dát, ako napríklad:
- Techniky indexovania na porovnávanie údajov s rôznymi a nekompatibilnými typmi
- Profilovanie údajov s cieľom nájsť vzájomné vzťahy a abnormality medzi zdrojmi údajov
- Import údajov do všeobecne akceptovaných a použiteľných formátov, ako je napríklad XML (Extensible Markup Language)
- Správa metadát na dosiahnutie konzistentnosti kontextových údajov
