Computational comparison of policy iteration algorithms for discounted Markov decision processes

From MaRDI portal

Publication:1088914

Jump to:navigation, search

DOI10.1016/0305-0548(86)90028-6zbMath0617.90086OpenAlexW2087482191WikidataQ115104694 ScholiaQ115104694MaRDI QIDQ1088914

A. C. Lavercombe, Lyn C. Thomas, Roger T. Hartley

Publication date: 1986

Published in: Computers \& Operations Research (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/0305-0548(86)90028-6

zbMATH Keywords

computational comparison policy iteration algorithms discounted Markov decision processes

Mathematics Subject Classification ID

Numerical mathematical programming methods (65K05) Markov and semi-Markov decision processes (90C40)

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1088914&oldid=13114635"