Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming

From MaRDI portal

Publication:1785275

Jump to:navigation, search

DOI10.1016/j.orl.2014.07.006zbMath1408.90308OpenAlexW2088147131WikidataQ115038539 ScholiaQ115038539MaRDI QIDQ1785275

Bruno Scherrer, Eugene A. Feinberg, Jefferson Huang

Publication date: 28 September 2018

Published in: Operations Research Letters (Search for Journal in Brave)

Full work available at URL: https://hal.inria.fr/hal-01091370/file/Feinberg_Huang_Scherrer.pdf

zbMATH Keywords

algorithm Markov decision process policy modified policy iteration strongly polynomial

Mathematics Subject Classification ID

Dynamic programming (90C39) Markov and semi-Markov decision processes (90C40)

Related Items (3)

Complexity bounds for approximately solving discounted MDPs by value iterations ⋮ Improved bound on the worst case complexity of policy iteration ⋮ On the reduction of total‐cost and average‐cost MDPs to discounted MDPs

Cites Work

This page was built for publication: Modified policy iteration algorithms are not strongly polynomial for discounted dynamic programming

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1785275&oldid=14144022"