Obsah:
Podľa Doug Laney, viceprezidenta pre výskum v spoločnosti Gartner, výzva spravovania a využívania veľkých údajov vyplýva z troch prvkov. Laney prvýkrát poznamenal pred viac ako desiatimi rokmi, že veľké údaje predstavujú taký problém pre podnik, pretože zavádza ťažko spravovateľný objem, rýchlosť a rozmanitosť. Problém spočíva v tom, že príliš veľa IT oddelení vrhá všetko, čo majú na problémy s objemom a rýchlosťou údajov, zabudnutím riešiť základnú otázku rozmanitosti údajov.
V roku 2001 Laney napísala, že „vedúce podniky budú čoraz viac používať centralizovaný dátový sklad na definovanie spoločného obchodného slovníka, ktorý zlepšuje internú a externú spoluprácu.“ Otázka tohto slovníka - a variabilita, ktorá bráni spoločnostiam v jeho vytváraní - zostáva dnes najmenej osloveným aspektom veľkých dátových hlavolamov. (Pozrite sa, čo hovoria iní odborníci. Pozrite sa na odborníkov na veľké dáta, ktorých sa chcete riadiť na Twitteri.)
Tri Vs veľkých dát
Mnohé podniky našli metódy na využitie zvýšeného objemu a rýchlosti údajov. Facebook môže napríklad analyzovať obrovské objemy údajov. Tieto údaje sa, samozrejme, často predkladajú znovu a znovu v rámci rovnakých parametrov. To viedlo k technologickým inováciám, ako sú napríklad stĺpcové databázy, ktoré v súčasnosti vo veľkej miere využívajú iné spoločnosti, ktoré čelia rovnako veľkým úložiskám podobných dátových položiek.