Obsah:
Definícia - Čo znamená schéma na čítanie?
Schéma čítania sa týka inovatívnej stratégie analýzy údajov v nových nástrojoch na spracovanie údajov, ako je Hadoop a ďalšie zapojené databázové technológie. V schéme pri čítaní sa údaje aplikujú skôr na plán alebo schému, ako sa vyťahujú z uloženého umiestnenia, a nie na vstup.
Techopedia vysvetľuje schému pri čítaní
Staršie databázové technológie mali stratégiu presadzovania písania schémy - inými slovami, údaje sa museli aplikovať na plán alebo schému, keď smerovali do databázy. Toto sa uskutočnilo čiastočne, aby sa vynútila konzistentnosť údajov, a to je jedna z hlavných výhod schémy pri písaní. Pri čítaní schémy môžu osoby manipulujúce s údajmi potrebovať viac práce na identifikácii každého údajového kusu, ale existuje oveľa viac univerzálnosti.
Návrh schémy na čítanie zásadným spôsobom dopĺňa hlavné použitia nástroja Hadoop a súvisiace nástroje. Spoločnosti chcú efektívne zhromažďovať veľa údajov a ukladať ich na konkrétne použitie. To znamená, že môžu hodnotiť zhromažďovanie nečistých alebo nekonzistentných údajov viac, ako si cenia prísny režim presadzovania údajov. Inými slovami, spoločnosť Hadoop sa môže postarať o získanie širokého rozsahu rôznych malých kúskov údajov, ktoré nemusia byť úplne usporiadané. Keď sa tieto informácie použijú, usporiadajú sa. Aplikácia starého systému na zapisovanie do databázy by znamenala, že menej usporiadané údaje by pravdepodobne boli vyhodené.
Ďalším spôsobom, ako to dosiahnuť, je, že schéma pri zápise je lepšia na získanie veľmi čistých a konzistentných súborov údajov, ale tieto súbory údajov môžu byť obmedzenejšie. Schéma na čítanie vytvára širšiu sieť a umožňuje univerzálnejšiu organizáciu údajov. Odborníci tiež zdôrazňujú, že je jednoduchšie vytvoriť dva rôzne pohľady na rovnaké údaje so schémou čítania.
Táto stratégia čítania schém je jednou z podstatných súčastí toho, prečo sú technológie Hadoop a súvisiace technológie v dnešnej podnikovej technológii tak populárne. Podniky využívajú veľké množstvo nespracovaných údajov na napájanie najrôznejších podnikových procesov uplatňovaním fuzzy logiky a iných systémov triedenia a filtrovania zahŕňajúcich podnikové dátové sklady a ďalšie veľké dátové aktíva.
