Q:
Prečo by sa manažéri mali chrániť pred redundanciou databázy?
A:Správcovia databáz a ďalší odborníci v oblasti IT by sa mali chrániť pred „redundanciou databázy“ alebo „redundanciou údajov“ kvôli všetkým negatívnym vplyvom, ktoré môže mať redundancia v databázovom systéme alebo prostredí. Kdekoľvek je určitá časť údajov duplikovaná, či už v dvoch poliach v databáze alebo v dvoch rôznych databázových prostrediach, môže to mať následky na získanie údajov.
Jedným z prvých dôvodov, ako sa vyhnúť nadbytočnosti údajov, je to, že môže byť zbytočné alebo nadmerné.
Je dôležité zdôrazniť, že niektoré druhy redundancie údajov sú plánované, aby sa zabezpečili a zálohovali údaje. Iné však vyplývajú z nesprávneho alebo neefektívneho kódovania alebo z nedostatku pozornosti na osvedčené postupy. V mnohých prípadoch spôsobuje veľké množstvo redundancie údajov, že databáza rýchlo rastie nad primeranú veľkosť. S týmto vedomím sa vynakladá veľké úsilie v boji proti redundancii údajov, aby sa ušetrilo miesto v databáze a následne aby sa znížili náklady a úsilie na údržbu. Musí sa to však urobiť s ohľadom na praktickosť - inžinieri môžu praktizovať niečo, čo sa nazýva deduplikácia údajov, ale musí sa to robiť efektívnym spôsobom.
Správcovia databáz môžu napríklad preskúmať niečo ako odobratie reťazca z opakovaného poľa, napríklad zdieľaného zákazníka alebo názvu spoločnosti, a jeho nahradenie jednoduchým odkazom na premennú, kde sa reťazec nachádza niekde inde. To môže ušetriť miesto v databáze - ale môže tiež vyžadovať viac činnosti servera na vykonanie daného dotazu, takže nemusí byť taký efektívny, ako sa zdá.
Ďalším veľkým dôvodom deduplikácie údajov alebo zabránenia redundancie údajov je zmätok, ktorý môže vyplynúť. Nadbytočné údaje v databáze môžu spôsobiť rôzne typy anomálií. Jeden z nich sa nazýva aktualizačná anomália - aktualizované anomálie sa vyskytujú, keď je záznam znovu vložený s aktualizovanými informáciami, ale aktualizácia ho nezmení späť na pôvodný záznam. V takejto situácii môžu existovať tri rôzne záznamy o konkrétnom zamestnancovi spoločnosti s tromi rôznymi názvami pracovných miest a tromi rôznymi adresami, pretože informácie o osobe sa neaktualizovali v celej databáze, ale iba v poslednom vloženom zázname.
Ako navrhli odborníci, správcovia databáz sa môžu vyhnúť redundancii údajov už od návrhu. Môžu sa tiež zapojiť do postupov normalizácie údajov, ktoré môžu opraviť anomálie aktualizácie a iné druhy anomálií štandardizáciou spôsobu, akým sa uchovávajú záznamy databázových tabuliek. Správcovia databáz môžu tiež vykonávať snahy o deduplikáciu údajov, ktoré vyčistia a štandardizujú údaje iným spôsobom. To všetko slúži na vytvorenie čistejších databázových tabuliek, na dosiahnutie konzistentnejších záznamov v databáze a na zabránenie všetkým bolestiam hlavy a zložitým problémom spojeným s neplánovanou redundanciou údajov.