Fast convergence to state-action frequency polytopes for MDPs

From MaRDI portal

Jump to:navigation, search

DOI10.1016/J.ORL.2008.12.003MaRDI QIDQ1015315zbMATH OpenOpenAlexFDO

Authors Mathieu Tracol

Publication date 7 May 2009

Published in Operations Research Letters (Search for Journal in Brave)

Full work available at URL https://doi.org/10.1016/j.orl.2008.12.003

zbMATH Keywords

Markov decision processes polytopes deviation bounds state-action frequencies

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Recommendations

Cites work

Cited in

(3)

This page was built for publication: Fast convergence to state-action frequency polytopes for MDPs

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q1015315)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Fast_convergence_to_state-action_frequency_polytopes_for_MDPs&oldid=69821526"