Markovin päätösprosessi ( MDP) on peräkkäisen päätösongelman määrittely täysin havaittavassa ympäristössä Markovin siirtymämallilla ja lisäpalkkioilla. Sana Markov nimessä kuvastaa Markovin ominaisuuden täyttymistä tällaisissa prosesseissa. Tällainen prosessi toimii matemaattisena pohjana peräkkäisen päätöksenteon mallintamiseen tilanteissa, joissa tulokset ovat osittain satunnaisia ja osittain päätöksentekijän hallinnassa. Nykyään tätä määritystä käytetään useilla aloilla, mukaan lukien robotiikka , automaattinen ohjaus , taloustiede ja valmistus .
Markovin päätösprosessin määrittelemiseksi meidän on määritettävä 4 - monikko missä