Domov vývoj Čo je to posilnenie učenia? - definícia z technológie

Čo je to posilnenie učenia? - definícia z technológie

Obsah:

Anonim

Definícia - Čo znamená Výučba posilnenia?

Výučba posilnenia v kontexte umelej inteligencie je typ dynamického programovania, ktorý vycvičuje algoritmy pomocou systému odmeňovania a trestania.

Algoritmus zosilnenia učenia alebo agent sa učí interakciou s prostredím. Agent dostane odmenu za správne vykonávanie a pokuty za nesprávne vykonanie. Agent sa učí bez zásahu človeka maximalizáciou jeho odmeny a minimalizáciou jeho trestu.

Techopedia vysvetľuje zosilňovanie výučby

Posilnenie učenia je prístup k strojovému učeniu, ktorý je inšpirovaný behavioristickou psychológiou. Je to podobné tomu, ako sa dieťa učí vykonávať novú úlohu. Výučba zosilnenia je v kontraste s inými prístupmi strojového učenia v tom, že algoritmu nie je výslovne povedané, ako vykonať úlohu, ale problém sám rieši.

Ako agent, ktorým môže byť auto s vlastným riadením alebo program, ktorý hrá šach, interaguje so svojím prostredím, dostáva stav odmeňovania v závislosti od toho, ako sa správa, napríklad za bezpečnú jazdu do cieľa alebo vyhrať hru. Naopak, agent dostane pokutu za nesprávny výkon, napríklad pri odchode z cesty alebo pri kontrole.

Agent v priebehu času sa rozhoduje maximalizovať svoju odmenu a minimalizovať svoju pokutu pomocou dynamického programovania. Výhodou tohto prístupu k umelej inteligencii je, že umožňuje AI programu učiť sa bez toho, aby programátor uviedol, ako by mal agent úlohu vykonávať.

Čo je to posilnenie učenia? - definícia z technológie