Obsah:
Definícia - Čo znamená Job Chaining?
Reťazenie úloh je výraz v MapReduce, ktorý sa týka spustenia niekoľkých krokov v rovnakej úlohe MapReduce. Pri reťazení úloh prvá úloha odošle výstup do jednej úlohy, ktorá odošle výstup na ďalšiu úlohu v reťazci atď., Až kým sa úloha nedokončí. Je to forma prepojenia úloh MapReduce, aby boli spravovateľné.
Techopedia vysvetľuje reťazenie úloh
Reťazenie úloh v MapReduce sa týka spustenia viacerých úloh v jednej úlohe MapReduce.
Napríklad pracovný reťazec môže pozostávať z:
Map1> Reduce1> Map2> Reduce2
Výhodou reťazenia úloh je, že eliminuje potrebu prechodných údajov medzi všetkými krokmi v potrubí. V tomto zmysle je reťazenie úloh podobné presmerovaniu vstupu / výstupu v prostredí systému Unix. Výstup z jedného článku v reťazci tečie na vstup v ďalšej úlohe v reťazci. MapReduce umožňuje vývojárom určiť závislosti alebo ktoré úlohy sa musia dokončiť pred spracovaním ďalších úloh v reťazci pomocou volania metódy addDependingJob ().
Vývojárovi to uľahčí písanie programu MapReduce, ktorý dokáže spracovať veľké množstvo údajov.