Obsah:
Definícia - Čo znamená Výučba posilnenia?
Výučba posilnenia v kontexte umelej inteligencie je typ dynamického programovania, ktorý vycvičuje algoritmy pomocou systému odmeňovania a trestania.
Algoritmus zosilnenia učenia alebo agent sa učí interakciou s prostredím. Agent dostane odmenu za správne vykonávanie a pokuty za nesprávne vykonanie. Agent sa učí bez zásahu človeka maximalizáciou jeho odmeny a minimalizáciou jeho trestu.
Techopedia vysvetľuje zosilňovanie výučby
Posilnenie učenia je prístup k strojovému učeniu, ktorý je inšpirovaný behavioristickou psychológiou. Je to podobné tomu, ako sa dieťa učí vykonávať novú úlohu. Výučba zosilnenia je v kontraste s inými prístupmi strojového učenia v tom, že algoritmu nie je výslovne povedané, ako vykonať úlohu, ale problém sám rieši.
Ako agent, ktorým môže byť auto s vlastným riadením alebo program, ktorý hrá šach, interaguje so svojím prostredím, dostáva stav odmeňovania v závislosti od toho, ako sa správa, napríklad za bezpečnú jazdu do cieľa alebo vyhrať hru. Naopak, agent dostane pokutu za nesprávny výkon, napríklad pri odchode z cesty alebo pri kontrole.
Agent v priebehu času sa rozhoduje maximalizovať svoju odmenu a minimalizovať svoju pokutu pomocou dynamického programovania. Výhodou tohto prístupu k umelej inteligencii je, že umožňuje AI programu učiť sa bez toho, aby programátor uviedol, ako by mal agent úlohu vykonávať.