Domov trendy Čo je to q-learning? - definícia z technológie

Čo je to q-learning? - definícia z technológie

Obsah:

Anonim

Definícia - Čo znamená Q-learning?

Q-learning je termín pre štruktúru algoritmu predstavujúci zosilnenie učenia bez modelu. Vyhodnotením politiky a použitím stochastického modelovania Q-learning nájde najlepšiu cestu vpred v procese rozhodovania v Markove.

Techopedia vysvetľuje Q-learning

Technické zloženie algoritmu Q-learning zahŕňa agenta, množinu stavov a množinu akcií na stav.

Funkcia Q používa váhy pre rôzne kroky v spojení s diskontným faktorom, aby ocenila výhody.

Aj keď sa to môže zdať ako jednoduchý nápad, Q-vzdelávanie má rozhodujúci význam v mnohých typoch posilňovaného učenia a hlbokého učenia sa. Jedným z najlepších príkladov je to, kde sa hlboké Q-vzdelávanie používa na pomoc programom strojového učenia sa pri učení stratégií hrania hier v rôznych typoch videohier, napríklad v hrách Atari z 80. rokov. Tu konvolučná neurónová sieť odoberá vzorky hry, aby sa vytvoril stochastický model, ktorý pomôže počítaču vedieť, ako hru hrať v priebehu času lepšie.

Q-learning má veľký potenciál na podporu rozvoja umelej inteligencie a strojového učenia.

Čo je to q-learning? - definícia z technológie