A Mixed Value and Policy Iteration Method for Stochastic Control with Universally Measurable Policies

From MaRDI portal

Publication:3465941

Jump to:navigation, search

DOI10.1287/moor.2014.0704zbMath1329.90157arXiv1308.3814OpenAlexW2126905415MaRDI QIDQ3465941

Huizhen Yu, Dimitri P. Bertsekas

Publication date: 29 January 2016

Published in: Mathematics of Operations Research (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1308.3814

zbMATH Keywords

convergence measurability policy iteration value iteration discrete-time stochastic control Borel spaces Markov decision process total cost criteria

Mathematics Subject Classification ID

Dynamic programming (90C39) Optimal stochastic control (93E20) Markov and semi-Markov decision processes (90C40)

Related Items

Regular Policies in Abstract Dynamic Programming ⋮ Average Cost Optimality Inequality for Markov Decision Processes with Borel Spaces and Universally Measurable Policies ⋮ On the Minimum Pair Approach for Average Cost Markov Decision Processes with Countable Discrete Action Spaces and Strictly Unbounded Costs ⋮ On Convergence of Value Iteration for a Class of Total Cost Markov Decision Processes ⋮ Robust shortest path planning and semicontractive dynamic programming

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3465941&oldid=16791731"