A pause control approach to the value iteration scheme in average Markov decision processes

From MaRDI portal

Publication:1128694

Jump to:navigation, search

DOI10.1016/S0167-6911(97)00096-0zbMath0902.93069OpenAlexW2069182906MaRDI QIDQ1128694

Rolando Cavazos-Cadena

Publication date: 13 August 1998

Published in: Systems \& Control Letters (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/s0167-6911(97)00096-0

zbMATH Keywords

long-run average cost criterion Lyapunov function condition value iteration scheme controlled Markov chains artificial action convergent approximations to the solution of the optimality equation

Mathematics Subject Classification ID

Optimal stochastic control (93E20)

Related Items

Successive approximations in partially observable controlled Markov chains with risk-sensitive average criterion

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1128694&oldid=13178759"