Obsah:
Definícia - Čo znamená analýza paralelných údajov?
Paralelná analýza údajov je metóda na analýzu údajov pomocou paralelných procesov, ktoré bežia súčasne na viacerých počítačoch.
Tento proces sa používa pri analýze veľkých súborov údajov, ako sú veľké záznamy telefónnych hovorov, sieťové protokoly a webové úložiská, pre textové dokumenty, ktoré môžu byť príliš veľké na to, aby sa dali umiestniť do jedinej relačnej databázy. Táto metóda sa často používa pri analýze veľkých dát a všeobecnej analýze údajov.
Techopedia vysvetľuje analýzu paralelných údajov
Primárnou koncepciou paralelnej analýzy údajov je paralelizmus, ktorý je v počítačoch definovaný ako simultánne vykonávanie procesov.
Toto sa často dosahuje použitím viacerých procesorov alebo dokonca viacerých počítačov a je to bežná prax v distribuovaných výpočtoch. V paralelnej analýze údajov rôzne počítače vykonávajúce rôzne aspekty analýzy údajov súčasne vykonávajú tieto procesy a potom výsledky konsolidujú do jednej veľkej správy.
Dôvodom tohto paralelizmu je najmä zrýchlenie analýzy, ale aj to, že niektoré súbory údajov môžu byť príliš dynamické, príliš veľké alebo jednoducho príliš nepraktické na to, aby sa dali efektívne umiestniť do jedinej relačnej databázy. Výsledkom by bolo, že tieto súbory údajov sú umiestnené v rôznych databázach optimalizovaných pre tento druh údajov av rôznych strojoch, takže lineárna analýza jednoducho nebude účinnou možnosťou.
