Obsah:
- Definícia - Čo znamená Markovov rozhodovací proces (MDP)?
- Techopedia vysvetľuje Markovský rozhodovací proces (MDP)
Definícia - Čo znamená Markovov rozhodovací proces (MDP)?
Markovský rozhodovací proces (MDP) je niečo, čo odborníci označujú ako „diskrétny časový proces stochastickej kontroly“. Je založený na matematike propagovanej ruskou akademikom Andrejom Markovom koncom 19. a začiatkom 20. storočia.
Techopedia vysvetľuje Markovský rozhodovací proces (MDP)
Jedným zo spôsobov, ako vysvetliť Markovov rozhodovací proces a súvisiace Markovove reťazce, je to, že ide o prvky modernej teórie hier, ktoré ruský vedec pred sto rokmi predpovedal jednoduchšiemu matematickému výskumu. Opis procesu rozhodovania v Markove spočíva v tom, že študuje scenár, v ktorom je systém v určitom danom štáte, a na základe rozhodnutí tvorcu rozhodnutí sa posúva ďalej do iného štátu.
Markovov reťazec ako model ukazuje postupnosť udalostí, kde pravdepodobnosť danej udalosti závisí od predtým dosiahnutého stavu. Odborníci môžu pri popisovaní Markovovho rozhodovacieho procesu hovoriť o „spočítateľnom stave priestoru“ - niektorí spájajú myšlienku Markovského rozhodovacieho modelu s „náhodným krokom“ alebo iným stochastickým modelom založeným na pravdepodobnosti (model náhodného prechodu, často citovaný na Stene). Street, modeluje pohyb kapitálu nahor alebo nadol v kontexte pravdepodobnosti trhu).
Vo všeobecnosti sa Markovove rozhodovacie procesy často používajú na niektoré zo sofistikovanejších technológií, na ktorých odborníci dnes pracujú, napríklad v robotike, automatizácii a výskumných modeloch.
