A sensitivity formula for risk-sensitive cost and the actor-critic algorithm

From MaRDI portal

Publication:5958425

Jump to:navigation, search

DOI10.1016/S0167-6911(01)00152-9zbMath0987.93080OpenAlexW1990437501WikidataQ127227136 ScholiaQ127227136MaRDI QIDQ5958425

Vivek S. Borkar

Publication date: 3 March 2002

Published in: Systems \& Control Letters (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/s0167-6911(01)00152-9

zbMATH Keywords

Markov decision processes stochastic approximation reinforcement learning actor-critic algorithms parametric sensitivity risk sensitive control

Mathematics Subject Classification ID

Optimal stochastic control (93E20) Stochastic approximation (62L20) Markov and semi-Markov decision processes (90C40)

Related Items

Oja's algorithm for graph clustering, Markov spectral decomposition, and risk sensitive control, Risk-Sensitive Reinforcement Learning via Policy Gradient Search, Variance-constrained actor-critic algorithms for discounted and average reward MDPs, Unnamed Item, On tight bounds for function approximation error in risk-sensitive reinforcement learning, Risk-Constrained Reinforcement Learning with Percentile Risk Criteria

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5958425&oldid=12126570"