Bias optimality and strong \(n\) \((n= -1,0)\) discount optimality for Markov decision processes

From MaRDI portal

Publication:2371871

Jump to:navigation, search

DOI10.1016/j.jmaa.2007.01.002zbMath1194.93226OpenAlexW2062820819MaRDI QIDQ2371871

Quanxin Zhu

Publication date: 9 July 2007

Published in: Journal of Mathematical Analysis and Applications (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.jmaa.2007.01.002

zbMATH Keywords

optimal stationary policy bias optimality average reward discrete-time Markov decision process strong 0-discount optimality

Mathematics Subject Classification ID

Optimal stochastic control (93E20) Markov and semi-Markov decision processes (90C40) Transition functions, generators and resolvents (60J35)

Related Items

Policy iteration algorithms for zero-sum stochastic differential games with long-run average payoff criteria ⋮ Average optimality for continuous-time Markov decision processes with a policy iteration approach ⋮ Discount-sensitive equilibria in zero-sum stochastic differential games

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2371871&oldid=14996478"