Domov trendy 6 Veľké mýty o správe veľkých dát

6 Veľké mýty o správe veľkých dát

Obsah:

Anonim

V máji 2014 spoločnosť Forrester Research vydala dve správy, v ktorých vyvodila určité závery o humbuk okolo veľkých údajov. Výskumná spoločnosť uskutočnila prieskum s viac ako 250 vedúcimi pracovníkmi v oblasti marketingu a rozvoja podnikania. Podľa autorov správy je rétorika veľkých dát na historicky vysokej úrovni a predajcovia technológií ponúkajú produkty, ktoré sa zdajú byť neuveriteľnými tvrdeniami.


Gartner súhlasí so spoločnosťou Forrester Research; veľké humbuk obklopuje veľké dáta. V správe zo septembra 2014 spoločnosť Gartner odhalila päť z najväčších mýtov o údajoch a analytici spoločnosti Gartner ponúkajú svoje názory na to, čo sa stalo s nepochopením veľkých údajov a ich manipuláciou. Aké sú teda najväčšie mýty o veľkých údajoch? Pozrime sa na to.

Mýtus: Každý je pred nami pri prijímaní veľkých údajov.

Gartner tvrdí, že záujem o veľké dáta je stále vysoký. Napriek tomu má 13% opýtaných opýtaných pracovné systémy. Dôvod: väčšina spoločností musí ešte prísť na to, ako ťažiť akúkoľvek hodnotu z veľkých úložísk údajov. Tu je prieskum spoločnosti Gartner optimistickejší ako v správe spoločnosti Forrester, ktorá zistila, že iba 9 percent účastníkov prieskumu uviedlo, že plánuje implementovať veľké dátové technológie v budúcom roku. (Veľké dáta má čo ponúknuť. Viac informácií nájdete v 5 problémoch reálneho sveta, ktoré môžu veľké dáta vyriešiť.)

Mýtus: Máme toľko údajov; nemusíme sa starať o každú malú chybu v údajoch.

Gartner sa obáva, že ľudia majú reálnu podobu: „Máme toľko, že na tom zlomku nebude záležať.“ Ted Friedman, viceprezident a významný analytik spoločnosti Gartner je presvedčený, že toto je nesprávny spôsob, ako sa pozrieť na situáciu.


„V skutočnosti, hoci každá jednotlivá chyba má oveľa menší dopad na celý súbor údajov ako v prípade menšieho množstva údajov, existuje viac nedostatkov ako predtým, pretože existuje viac údajov, “ uviedol Friedman. „Preto je celkový vplyv zlých údajov na celý súbor údajov rovnaký.“


Friedman dodáva ďalší dôvod na obavy. Zachytávanie veľkých údajov často zahŕňa údaje mimo podniku, čo má preto neznámu štruktúru a pôvod. Tým sa zvyšuje pravdepodobnosť chýb.

Mýtus: Technológia veľkých dát eliminuje potrebu integrácie údajov.

Na veľké údaje sa môžu vzťahovať dve kľúčové stratégie analýzy údajov: „schema on write“ alebo „schema on read“. Až donedávna bola jedinou použitou metódou schéma na zápis. Schéma pri čítaní je súčasná šialenstvo v správe databáz. Na rozdiel od schémy pri zápise, ktorá vyžaduje štruktúrovaný formát, sa údaje načítajú do databáz schémy na čítanie v surovom formáte. Potom vývojári - pomocou neštruktúrovaných databázových platforiem ako Hadoop - ohýbajú rozdielne údaje do použiteľného formátu. Schéma čítania má zrejmé výhody, ale ako uvádza Gartner, v určitom okamihu musí dôjsť k integrácii údajov.

Mýtus: Použitie dátového skladu pre pokročilú analytiku je zbytočné.

Trávenie času na vytvorenie dátového skladu sa zdá byť zbytočným pre mnohých manažérov informácií, najmä ak sa novo zachytené údaje líšia od údajov v dátovom sklade. Gartner však opäť varuje, že aj pokročilá analytika údajov bude využívať sklady údajov a nové údaje, čo znamená, že integrátori údajov musia:

  • Upravte nové typy údajov tak, aby boli vhodné na analýzu
  • Rozhodnite sa, ktoré údaje sú relevantné a úroveň potrebnej kvality údajov
  • Určite, ako agregovať údaje
  • Pochopte, že k vylepšeniu údajov môže dôjsť aj na iných miestach, ako je dátový sklad

Mýtus: Dátové jazerá nahradia dátový sklad.

Dátové jazerá sú úložiská rôznych údajov, na rozdiel od dátových skladov, v ktorých sú údaje v štruktúrovanom formáte. Vytvorenie dátového jazera si vyžaduje malé počiatočné úsilie (nie je potrebné údaje formátovať) v porovnaní s dátovými skladmi, a preto sú zaujímavé údajové jazerá.


Gartner zdôrazňuje, že mať údaje nie je zmysluplné - zmysluplné je manipulovať so získanými údajmi pre informované rozhodovanie. Okrem toho je použitie (trochu nepreukázaných) dátových jazier na uľahčenie rozhodovania problematické.


„Dátové sklady už majú schopnosti podporovať širokú škálu používateľov v celej organizácii, “ uviedol Nick Heudecker, riaditeľ výskumu spoločnosti Gartner. „Lídri v oblasti správy informácií nemusia čakať, kým sa dobijú dátové jazerá.“ (Viac informácií o prijímaní veľkých údajov v 7 veciach, ktoré musíte vedieť o veľkých údajoch pred prijatím.)

Big Data Works - Nové metódy manipulácie s údajmi nemusia

Dôvod, prečo Gartner uviedol „najväčšie mýty s údajmi“ namiesto „veľkých mýtov“, je zrejmý po prečítaní správy. Gartner nie je štekotom veľkých dát. Gartner je smiešny z tých, ktorí cítia, že novšie metódy manipulácie s veľkými dátami sú pripravené na „hlavný čas“.

6 Veľké mýty o správe veľkých dát