Domov trendy Ako môžu existujúce prostredia dátového skladu najlepšie škálovať, aby vyhovovali potrebám analýzy veľkých dát?

Ako môžu existujúce prostredia dátového skladu najlepšie škálovať, aby vyhovovali potrebám analýzy veľkých dát?

Anonim

Q:

Ako môžu existujúce prostredia dátového skladu najlepšie škálovať, aby vyhovovali potrebám analýzy veľkých dát?

A:

Projekty individuálneho skladu údajov sa musia posudzovať od prípadu k prípadu. Všeobecne platí, že pri pokuse o natiahnutie existujúceho dizajnu dátového skladu, aby lepšie zvládli analýzu veľkých dát, existuje základný proces na zistenie, čo je potrebné urobiť. IT odborníci to môžu nazývať „zväčšovanie“ alebo „rozširovanie“.

Webinár: Big Iron, Zoznámte sa s veľkými údajmi: Oslobodenie údajov z mainframu pomocou Hadoop & Spark

Zaregistrujte sa tu

Rozšírenie vo všeobecnosti zahŕňa skúmanie získania dostatočného výpočtového výkonu, získanie dostatočného množstva pamäte a prispôsobenie výkonnejších serverových aktivít na zvládnutie všetkých väčších množín údajov, ktoré podnik spracuje. Naproti tomu škálovanie môže znamenať zhromažďovanie klastrov serverového hardvéru a ich vzájomné prepojenie na vytváranie veľkých dát.

Niektorí odborníci v oblasti IT navrhli, že najbežnejšou metódou v prípade Apache Hadoop a ďalších populárnych veľkých dátových nástrojov a platforiem je škálovanie a klastrovanie hardvéru na dosiahnutie požadovaných účinkov. Iní však poukazujú na to, že s dnešnou technológiou sa dátový sklad môže rozšíriť pomocou stratégie obstarávania, ktorá pridáva prostriedky na server, napríklad získavaním väčšieho počtu jadier spracovania spolu s väčším množstvom pamäte RAM.

Či už ide o zväčšenie alebo zväčšenie, dátové sklady potrebujú ďalšie fyzické hardvérové ​​prostriedky, aby dokázali zvládnuť väčšie zaťaženie údajov. Potrebujú tiež ďalšiu ľudskú správu, čo znamená viac odbornej prípravy pre interné tímy. Do projektu je potrebné veľa plánovania, aby sa zistilo, aký stres a tlak bude mať väčšie pracovné zaťaženie údajov na existujúci starý systém, aby ho bolo možné vybaviť pre nový veľký dátový ekosystém. Jedným z veľkých problémov sú úzke miesta pre ukladanie dát, ktoré si vyžadujú upgrade na úložné strediská, a ďalšie druhy obmedzení výkonu, ktoré môžu poškodiť rodiaci sa systém, ak nie sú riešené.

Ako môžu existujúce prostredia dátového skladu najlepšie škálovať, aby vyhovovali potrebám analýzy veľkých dát?