Dynamic policy programming

From MaRDI portal

Jump to:navigation, search

MaRDI QIDQ5405224zbMATH OpenFDO

Authors Mohammad Gheshlaghi Azar, Vicenç Gómez, Hilbert J. Kappen

Publication date 1 April 2014

Full work available at URL http://www.jmlr.org/papers/v13/azar12a.html

zbMATH Keywords

Markov decision processes approximate dynamic programming reinforcement learning function approximation Monte-Carlo methods

Mathematics Subject Classification ID

Dynamic programming (90C39) Markov and semi-Markov decision processes (90C40)

Recommendations

Cited in

(12)

This page was built for publication: Dynamic policy programming

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q5405224)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Dynamic_policy_programming&oldid=75720847"