Obsah:
Definícia - Čo znamená Big Data?
Veľké údaje sa týkajú procesu, ktorý sa používa, keď tradičné techniky získavania a spracovania údajov nemôžu odhaliť poznatky a význam základných údajov. Údaje, ktoré nie sú štruktúrované alebo sú časovo citlivé alebo jednoducho veľmi veľké, nemožno spracovať pomocou relačných databázových nástrojov. Tento typ údajov vyžaduje odlišný prístup k spracovaniu nazývaný veľké údaje, ktorý využíva masívny paralelizmus na ľahko dostupnom hardvéri.
Techopedia vysvetľuje veľké dáta
Zjednodušene povedané, veľké údaje odrážajú meniaci sa svet, v ktorom žijeme. Čím viac vecí sa mení, tým viac zmien sú zachytené a zaznamenané ako údaje. Ako príklad si vezmite počasie. V prípade predpovede počasia je množstvo údajov o miestnych podmienkach zhromaždených po celom svete značné. Logicky by malo zmysel, že miestne prostredie diktuje regionálne účinky a regionálne účinky diktujú globálne účinky, ale mohlo by to byť naopak. Tak či onak, tieto údaje o počasí odrážajú atribúty veľkých údajov, kde je potrebné veľké množstvo údajov spracovať v reálnom čase a kde je možné generovať veľké množstvo vstupov strojom, osobné pozorovania alebo vonkajšie sily, napríklad slnečné škvrny.
Spracovanie informácií, ako je tento, ilustruje, prečo sa veľké údaje stali tak dôležitými:
- Väčšina údajov, ktoré sa teraz zbierajú, je neštruktúrovaná a vyžaduje odlišné ukladanie a spracovanie, ako sa nachádza v tradičných relačných databázach.
- Dostupná výpočtová sila je prudko rastúca, čo znamená, že existuje viac príležitostí na spracovanie veľkých údajov.
- Internet demokratizoval údaje, neustále zvyšoval dostupné údaje a produkoval čoraz viac nespracovaných údajov.
Údaje v surovej podobe nemajú žiadnu hodnotu. Údaje musia byť spracované, aby boli hodnotné. Tu však leží hlavný problém veľkých údajov. Stojí spracovanie údajov z formátu natívnych objektov do použiteľného prehľadu za obrovské investičné náklady? Alebo existuje príliš veľa údajov s neznámymi hodnotami, ktoré by ospravedlňovali hazard so spracovaním pomocou nástrojov veľkých dát? Väčšina z nás by súhlasila s tým, že schopnosť predvídať počasie bude mať hodnotu, otázkou je, či by táto hodnota mohla prevážiť náklady spojené s rozdrobením všetkých údajov v reálnom čase do správy o počasí, na ktorú by bolo možné počítať.
