A New Value Iteration method for the Average Cost Dynamic Programming Problem

From MaRDI portal

Publication:4388932

Jump to:navigation, search

DOI10.1137/S0363012995291609zbMATH Open0909.90269OpenAlexW2103406407MaRDI QIDQ4388932FDOQ4388932

Authors: Dimitri P. Bertsekas

Publication date: 10 May 1998

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1137/s0363012995291609

Recommendations

Policy iteration and Newton-Raphson methods for Markov decision processes under average cost criterion
Value iteration for average cost Markov decision processes in Borel spaces
Value iteration in countable state average cost Markov decision processes with unbounded costs
The value iteration method for countable state Markov decision processes
Value Iteration in a Class of Communicating Markov Decision Chains with the Average Cost Criterion

zbMATH Keywords

dynamic programming value iteration average cost

Mathematics Subject Classification ID

Programming involving graphs or networks (90C35) Dynamic programming in optimal control and differential games (49L20) Markov and semi-Markov decision processes (90C40)

Cited In (10)

This page was built for publication: A New Value Iteration method for the Average Cost Dynamic Programming Problem

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q4388932)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4388932&oldid=18398450"