Comparing Policies in Markov Decision Processes: Mandl's Lemma Revisited

From MaRDI portal

Publication:3200907

Jump to:navigation, search

DOI10.1287/MOOR.15.1.155MaRDI QIDQ3200907zbMATH OpenOpenAlexWikidataFDO

Authors Adam Shwartz, Armand M. Makowski

Publication date 1990

Published in Mathematics of Operations Research (Search for Journal in Brave)

Full work available at URL https://doi.org/10.1287/moor.15.1.155

zbMATH Keywords

convergence conditions Polish state space average costs Markov decision chain

Mathematics Subject Classification ID

Minimax problems in mathematical programming (90C47) Markov and semi-Markov decision processes (90C40) Adaptive control/observation systems (93C40)

Recommendations

Cited in

(3)

This page was built for publication: Comparing Policies in Markov Decision Processes: Mandl's Lemma Revisited

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q3200907)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3200907&oldid=16368605"