Q:
Viac nie je vždy lepšie. Ako môžu organizácie znížiť hluk vo svojich údajoch, aby dosiahli cielenú a presnú analýzu?
A:V prípade veľkých dátových systémov je jednou z veľkých otázok pre spoločnosti to, ako udržať tieto projekty dobre zacielené a efektívne. Mnohé z nástrojov a zdrojov vytvorených pre veľké dáta sú navrhnuté tak, aby nasávali obrovské množstvo informácií v širokej sieti. Nie vždy sú takí pozorní pri zdokonaľovaní týchto údajov a ich udržiavaní jednoduchosti. V priemysle sa však objavujú osvedčené postupy s cieľom vytvoriť cielenejšie a užitočnejšie veľké dátové projekty.
Jedným z pilierov cieleného prístupu k veľkým údajom je použitie správnych softvérových nástrojov a zdrojov. Nie všetky analytické systémy a veľké dátové systémy sú rovnaké. Niektoré môžu efektívnejšie odfiltrovať nadmerné alebo irelevantné údaje a umožňujú podnikom zamerať sa len na základné fakty, ktoré určia ich základné procesy a činnosti.
Ďalšou významnou časťou tohto procesu sú ľudia. Pred zapojením sa do veľkého dátového projektu a pri získavaní softvéru dodávateľa, implementácii a zaškolení iných musí byť proces zodpovedný za centrálnu skupinu ľudí a delegovať aj výskumné a brainstormingové úlohy. To môže viesť k veľkým dátovým prístupom k presnej chirurgickej metóde, ktorá zlepší podnikanie bez toho, aby sa stala príliš ťažkou a narušovala každodenné operácie.
Napríklad pracovné skupiny alebo iné základné skupiny sa môžu posadiť a podrobne sa pozrieť na spôsoby vykonávania, ako podnik začne vyhodnocovať súbory údajov, ako budú krížovo indexovať účty, aký druh papiera alebo digitálne prezentácie, ktoré budú používať na šírenie týchto informácií, ako budú vytvárať užitočné správy, atď. Tieto údaje budú chrániť podnik pred nadúvaním veľkých dát.
Keď spoločnosti začnú získavať viac služieb dodávateľom, robiť väčšie dáta a robiť zložitejšie architektúry IT, naučili sa oddeľovať najcitlivejšie údaje od všetkého ostatného.
Jedným zo spôsobov, ako to dosiahnuť, je vytvoriť odstupňovaný systém. Napríklad súbor základných údajov o ID a histórii zákazníka sa môže uchovávať v osobitne udržiavanej databáze na základe konkrétnej zmluvy o zabezpečení cloudu alebo na mieste. Ostatné súbory údajov sa môžu nachádzať v menej špecializovaných dátových prostrediach, buď preto, že sú menej citlivé z hľadiska porušenia údajov, alebo preto, že sú menej priamo relevantné pre analytické činnosti, ktoré podnik podniká. Vrstvené alebo viacúrovňové systémy umožňujú nákladovo efektívnu implementáciu veľkých dát.
Toto sú niektoré zo spôsobov, ako podniky získavajú informácie o tom, ako získať veľké dáta správnym spôsobom. Namiesto toho, aby iba vysávali akékoľvek údaje, ktoré môžu chytiť, považujú určité súbory údajov za najdôležitejšie, aby získali čo najviac obchodných informácií s najmenším úsilím.