Obsah:
Definícia - Čo znamená Q-learning?
Q-learning je termín pre štruktúru algoritmu predstavujúci zosilnenie učenia bez modelu. Vyhodnotením politiky a použitím stochastického modelovania Q-learning nájde najlepšiu cestu vpred v procese rozhodovania v Markove.
Techopedia vysvetľuje Q-learning
Technické zloženie algoritmu Q-learning zahŕňa agenta, množinu stavov a množinu akcií na stav.
Funkcia Q používa váhy pre rôzne kroky v spojení s diskontným faktorom, aby ocenila výhody.
Aj keď sa to môže zdať ako jednoduchý nápad, Q-vzdelávanie má rozhodujúci význam v mnohých typoch posilňovaného učenia a hlbokého učenia sa. Jedným z najlepších príkladov je to, kde sa hlboké Q-vzdelávanie používa na pomoc programom strojového učenia sa pri učení stratégií hrania hier v rôznych typoch videohier, napríklad v hrách Atari z 80. rokov. Tu konvolučná neurónová sieť odoberá vzorky hry, aby sa vytvoril stochastický model, ktorý pomôže počítaču vedieť, ako hru hrať v priebehu času lepšie.
Q-learning má veľký potenciál na podporu rozvoja umelej inteligencie a strojového učenia.