An empirical study of policy convergence in Markov decision process value iteration

From MaRDI portal

Revision as of 13:07, 1 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:1886733

Jump to:navigation, search

DOI10.1016/S0305-0548(03)00207-7zbMath1076.90066OpenAlexW2094964720MaRDI QIDQ1886733

William T. Scherer, Christopher W. Zobel

Publication date: 19 November 2004

Published in: Computers \& Operations Research (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/s0305-0548(03)00207-7

zbMATH Keywords

Markov decision processes Dynamic programming Convergence results

Mathematics Subject Classification ID

Dynamic programming (90C39) Markov and semi-Markov decision processes (90C40)

Related Items

Approximate dynamic programming via direct search in the space of value function approximations

Cites Work

This page was built for publication: An empirical study of policy convergence in Markov decision process value iteration

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1886733&oldid=14289160"