Obsah:
- Definícia - Čo znamená extrakčné transformačné zaťaženie (ETL)?
- Techopedia vysvetľuje extrakčné transformačné zaťaženie (ETL)
Definícia - Čo znamená extrakčné transformačné zaťaženie (ETL)?
Extrakčné transformačné zaťaženie (ETL) je proces extrakcie, transformácie a načítania počas používania databázy, ale najmä počas používania ukladania údajov. Zahŕňa tieto čiastkové procesy:
- Načítanie údajov z externých zdrojov údajov na ukladanie alebo prenos údajov
- Transformácia údajov do zrozumiteľného formátu, kde sa údaje zvyčajne ukladajú spolu s kódom detekcie a korekcie chýb, aby vyhovovali prevádzkovým potrebám
- Prenos a načítanie údajov do prijímacieho konca
Techopedia vysvetľuje extrakčné transformačné zaťaženie (ETL)
Prvá fáza procesu ETL sa zameriava na získavanie údajov zo zdroja úložiska. Väčšina projektov na ukladanie údajov integruje údaje získané z rôznych zdrojových systémov. Každý jednotlivý systém môže využívať samostatnú organizáciu údajov alebo formát. Bežné štruktúry zdrojov údajov sú relačné databázy a čisté dátové súbory. Môžu tiež obsahovať nerelačné databázové vzorce, ako sú systémy správy informácií alebo iné dátové štruktúry, ako je metóda prístupu k virtuálnemu úložisku (VSAM) alebo metóda indexovaného sekvenčného prístupu (ISAM). Zdroje údajov môžu obsahovať aj externé zdroje, ako napríklad údaje pochádzajúce z internetu alebo zo skenovacieho systému.
Transformačná fáza používa rad pravidiel alebo operácií na získanie čistých údajov zo zdroja na dodanie údajov v konečnej podobe na manipuláciu na prijímajúcom konci. Niektoré zdroje údajov potrebujú veľmi malé alebo dokonca žiadne spracovanie údajov. Niekedy môže byť kritická jedna alebo viac transformácií, aby zodpovedali obchodným a technickým požiadavkám cieľovej databázy.
Cieľom fázy načítania alebo prenosu je odosielanie údajov na prijímajúci koniec, čo je pravdepodobne ukladanie údajov. Podľa potreby aplikácie môže byť tento proces veľmi jednoduchý alebo veľmi komplikovaný. Niektoré metódy ukladania údajov môžu nahradiť staré údaje kumulatívnymi údajmi. Aktualizácia extrahovaných údajov sa zvyčajne vykonáva pravidelne.