Optimization of Markov decision processes under the variance criterion

From MaRDI portal

Publication:2409311

Jump to:navigation, search

DOI10.1016/j.automatica.2016.06.018zbMath1371.93221OpenAlexW2519236774MaRDI QIDQ2409311

Publication date: 11 October 2017

Published in: Automatica (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.automatica.2016.06.018

zbMATH Keywords

Markov decision process policy iteration variance criterion sensitivity-based optimization policy gradient

Mathematics Subject Classification ID

Markov chains (discrete-time Markov processes on discrete state spaces) (60J10) Optimal stochastic control (93E20) Markov and semi-Markov decision processes (90C40)

Related Items (8)

Finite horizon continuous-time Markov decision processes with mean and variance criteria ⋮ A unified algorithm framework for mean-variance optimization in discounted Markov decision processes ⋮ Mean-variance optimization of discrete time discounted Markov decision processes ⋮ An average-value-at-risk criterion for Markov decision processes with unbounded costs ⋮ Variance minimization of parameterized Markov decision processes ⋮ Optimization in curbing risk contagion among financial institutes ⋮ A Sensitivity‐Based Construction Approach to Variance Minimization of Markov Decision Processes ⋮ Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning

Cites Work

This page was built for publication: Optimization of Markov decision processes under the variance criterion

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2409311&oldid=15054194"