Obsah:
Definícia - Čo znamená deduplikácia údajov?
Deduplikácia údajov je technika kompresie údajov, pri ktorej sa zo systému odstránia nadbytočné alebo opakované kópie údajov. Je implementovaný v mechanizmoch zálohovania údajov a sieťových údajov a umožňuje ukladanie jednej jedinečnej inštancie údajov v databáze alebo informačnom systéme (IS).
Deduplikácia údajov je známa aj ako inteligentná kompresia, ukladanie v jednej inštancii, faktoring zhody alebo redukcia údajov.
Techopedia vysvetľuje deduplikáciu údajov
Deduplikácia údajov funguje pomocou analýzy a porovnávania prichádzajúcich segmentov údajov s predtým uloženými údajmi. Ak už údaje existujú, algoritmy deduplikácie údajov zahodia nové údaje a vytvoria referenciu. Napríklad, ak je súbor dokumentu zálohovaný zmenami, predchádzajúci súbor a použité zmeny sa pridajú do segmentu údajov. Ak však nie je rozdiel, novší dátový súbor sa zahodí a vytvorí sa odkaz. Podobne algoritmus deduplikácie údajov skenuje odchádzajúce údaje v sieťovom pripojení, aby skontroloval duplikáty, ktoré sa odstránia, aby sa zvýšila rýchlosť prenosu dát.
