Q:
Aké sú kľúčové problémy, ktoré treba zvážiť pri stratégii ukladania veľkých dát?
A:Jedným z najväčších problémov, ktorý sa pri ukladaní veľkých dát ignoruje, je dostupnosť tímov, ktoré to potrebujú. Údaje sa pravidelne ukladajú bez dokumentácie, na miestach, kde je ťažké získať prístup alebo kde príslušné tímy nevedia, že vôbec existujú. V konečnom dôsledku by veľké ukladanie údajov malo mať prvú otvorenú stratégiu, v rámci ktorej sú tímy informované o svojej existencii, o čom údaje pozostávajú a ako k nim získať prístup, aby ich tímy mohli v softvéri v prípade potreby využiť.
Ďalším kritickým problémom, ktorý nájdem, je kvalita ukladaných údajov. Údaje by sa mali uchovávať v tej najkvalitnejšej forme, v akej môžu existovať v mieste konečného uloženia. Ukladanie údajov nízkej kvality v dátovom jazere je zvyčajne v poriadku, ale keďže pokračuje v dátovom potrubí, každá fáza by mala zvyšovať kvalitu údajov tak, aby boli uložené v najvyššej kvalite v systéme, ako je dátový sklad alebo analytická databáza. Zvýši sa tým kvalita systémov, ktoré spotrebúvajú miesto odpočinku údajov.