Improved iterative computation of the expected discounted return in Markov and semi-Markov chains

From MaRDI portal

Publication:3885559

Jump to:navigation, search

DOI10.1007/BF01919243zbMath0442.90104MaRDI QIDQ3885559

Evan L. Porteus

Publication date: 1980

Published in: Zeitschrift für Operations Research (Search for Journal in Brave)

zbMATH Keywords

convergence; test problems; finite Markov chains; computational experience; semi-Markov chains; iterative computation; expected discounted return; norm reducing extrapolations

Mathematics Subject Classification ID

65K05: Numerical mathematical programming methods

60K15: Markov renewal processes, semi-Markov processes

90C40: Markov and semi-Markov decision processes

Related Items

Computational comparison of policy iteration algorithms for discounted Markov decision processes, On efficiency of linear programming applied to discounted Markovian decision problems, Conditions for characterizing the structure of optimal strategies in infinite-horizon dynamic programs, Second order bounds for Markov decision processes, Generic rank-one corrections for value iteration in Markovian decision problems, Serial and parallel value iteration algorithms for discounted Markov decision processes

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3885559&oldid=17520357"