Q:
Ako môžu inžinieri použiť zosilnenie gradientu na zlepšenie systémov strojového učenia?
A:Rovnako ako iné druhy zosilnenia, aj zosilňovanie gradientu sa snaží zmeniť niekoľko slabých študentov na jedného silného študenta, čo je druh digitálneho „crowdsourcingu“ vzdelávacieho potenciálu. Ďalším spôsobom, ako niektorí vysvetľujú zosilnenie gradientu, je to, že inžinieri pridávajú premenné, aby doladili neurčitú rovnicu, aby dosiahli presnejšie výsledky.
Posilnenie prechodu je tiež opísané ako „iteračný“ prístup, pričom iterácie možno charakterizovať ako pridanie jednotlivých slabých študentov k jedinému silnému modelu študentov.
Zdarma na stiahnutie: Strojové učenie a prečo na tom záleží |
Tu je presvedčivý popis toho, ako sa pozerať na typ implementácie zvyšujúceho gradient, ktorý zlepší výsledky strojového učenia:
Správcovia systému najprv nastavili skupinu slabých študentov. Predstavte si ich napríklad ako skupinu entít AF, každý sedel okolo virtuálnej tabuľky a pracoval na probléme, napríklad na klasifikácii binárnych obrazov.
Vo vyššie uvedenom príklade inžinieri najskôr pomôžu každému slabému žiakovi, prípadne svojvoľne, priradia úroveň vplyvu A, B, C atď.
Ďalej program spustí danú množinu tréningových obrázkov. Potom, vzhľadom na výsledky, zváži skupinu slabých študentov. Ak bude A hádať oveľa lepšie ako B a C, vplyv A sa zodpovedajúcim spôsobom zvýši.
V tomto zjednodušenom popise vylepšenia algoritmu na vylepšenie je relatívne ľahké pochopiť, ako komplexnejší prístup prinesie vylepšené výsledky. Slabí študenti sa „myslia spolu“ a následne optimalizujú problém s ML.
Výsledkom je, že inžinieri môžu používať „kompletný“ prístup zvyšujúci gradient v takmer akomkoľvek type projektu ML, od rozpoznávania obrázkov po klasifikáciu odporúčaní používateľov alebo analýzy prirodzeného jazyka. Je to v podstate „tímový duch“ prístup k ML a ten, ktorý získava veľkú pozornosť od niektorých mocných hráčov.
Najmä zosilnenie gradientu často pracuje s funkciou diferencovateľnej straty.
V inom modeli používanom na vysvetlenie zosilnenia gradientu je ďalšou funkciou tohto druhu zosilnenia schopnosť izolovať klasifikácie alebo premenné, ktoré sú na väčšom obrázku iba šumom. Oddelením regresného stromu každej premennej alebo dátovej štruktúry do domény jedného slabého žiaka môžu inžinieri zostaviť modely, ktoré presnejšie „ozvučia“ hlukové signifikanty. Inými slovami, významnosť, ktorú pokrýva nešťastný slabý žiak, bude odsunutá na okraj spoločnosti, pretože tento slabý žiak je vyvážený smerom nadol a má menší vplyv.