On ordinal comparison of policies in Markov reward processes

From MaRDI portal

(Redirected from Publication:852153)

Jump to:navigation, search

DOI10.1023/B:JOTA.0000041736.82051.F1MaRDI QIDQ852153zbMATH OpenFDO

Authors N. E. Zubov

Publication date 27 November 2006

Published in Journal of Optimization Theory and Applications (Search for Journal in Brave)

zbMATH Keywords

large deviations stochastic simulations Markov reward processes ordinal comparisons

Mathematics Subject Classification ID

Large deviations (60F10) Discrete event control/observation systems (93C65) Stochastic stability in control theory (93E15) Optimal stochastic control (93E20)

Recommendations

Cites work

Cited in

(1)

On convergence rate of the Shannon entropy rate of ergodic Markov chains via sample-path simulation

This page was built for publication: On ordinal comparison of policies in Markov reward processes

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q852153)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=On_ordinal_comparison_of_policies_in_Markov_reward_processes&oldid=64870224"