Uniform convergence of value iteration policies for discounted Markov decision processes

From MaRDI portal

Publication:2467010

Jump to:navigation, search

zbMATH Open1136.90042MaRDI QIDQ2467010FDOQ2467010

Authors: Daniel Cruz-Suárez, Raúl Montes-de-Oca

Publication date: 18 January 2008

Published in: Boletín de la Sociedad Matemática Mexicana. Third Series (Search for Journal in Brave)

Recommendations

The convergence of value iteration in discounted Markov decision processes
On the Convergence of Policy Iteration in Finite State Undiscounted Markov Decision Processes: The Unichain Case
On convergence of value iteration for a class of total cost Markov decision processes
Pointwise approximations of discounted Markov decision processes to optimal policies
The value iteration method for countable state Markov decision processes

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40) Optimal stochastic control (93E20)

Cited In (18)

This page was built for publication: Uniform convergence of value iteration policies for discounted Markov decision processes

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q2467010)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2467010&oldid=15153217"