Variance-Penalized Markov Decision Processes

From MaRDI portal

Publication:3832356

Jump to:navigation, search

DOI10.1287/moor.14.1.147zbMath0676.90096OpenAlexW2057510529MaRDI QIDQ3832356

Huey-Miin Lee, Lodewijk C. M. Kallenberg, Jerzy A. Filar

Publication date: 1989

Published in: Mathematics of Operations Research (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1287/moor.14.1.147

zbMATH Keywords

average reward discounted reward finite state finite action discrete time Markov decision process infinite horizon processes

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Related Items (43)

Risk measurement and risk-averse control of partially observable discrete-time Markov systems ⋮ Markov Decision Processes with Variance Minimization: A New Condition and Approach ⋮ A price-setting newsvendor problem under mean-variance criteria ⋮ Analyzing operational risk-reward trade-offs for start-ups ⋮ Augmenting Markov Cohort Analysis to Compute (Co)Variances: Implications for Strength of Cost-Effectiveness ⋮ Trading performance for stability in Markov decision processes ⋮ Markov Decision Problems Where Means Bound Variances ⋮ Finite-horizon variance penalised Markov decision processes ⋮ Multi-objective discounted Markov decision processes with expectation and variance criteria ⋮ Non-homogeneous Markov decision processes with a constraint ⋮ Survey of linear programming for standard and nonstandard Markovian control problems. Part I: Theory ⋮ Mean-variance problems for finite horizon semi-Markov decision processes ⋮ Risk-Sensitive Reinforcement Learning via Policy Gradient Search ⋮ Variance-constrained actor-critic algorithms for discounted and average reward MDPs ⋮ A unified algorithm framework for mean-variance optimization in discounted Markov decision processes ⋮ Approximate solutions to constrained risk-sensitive Markov decision processes ⋮ Unnamed Item ⋮ Variance-penalized response-adaptive randomization with mismeasurement ⋮ Notes on variance in randomized reward Markov decision processes ⋮ Computational approaches to variance-penalised Markov decision processes ⋮ Risk-Constrained Reinforcement Learning with Percentile Risk Criteria ⋮ Variance-penalized Markov decision processes: dynamic programming and reinforcement learning techniques ⋮ Time consistent dynamic risk measures ⋮ On the total reward variance for continuous-time Markov reward chains ⋮ Unnamed Item ⋮ A risk-sensitive approach to total productive maintenance ⋮ A Sensitivity‐Based Construction Approach to Variance Minimization of Markov Decision Processes ⋮ Mean-Variance Analysis in Infinite Horizon Non-Discounted Markov Decision Processes: Technical Note ⋮ Efficient algorithms for risk-sensitive Markov decision processes with limited budget ⋮ Stochastic optimization of forward recursive functions ⋮ Optimal policy for minimizing risk models in Markov decision processes ⋮ A Convex Analytic Approach to Risk-Aware Markov Decision Processes ⋮ Semi-Markov decision processes with variance minimization criterion ⋮ Mean-variance criteria in an undiscounted Markov decision process ⋮ A mathematical programming approach to a problem in variance penalised Markov decision processes ⋮ Mean-Semivariance Policy Optimization via Risk-Averse Reinforcement Learning ⋮ Solution strategies for variance minimization problems ⋮ Variance-minimization of Markov control processes with pathwise constraints ⋮ On mean reward variance in semi-Markov processes ⋮ Computational Methods for Risk-Averse Undiscounted Transient Markov Models ⋮ Algorithmic aspects of mean-variance optimization in Markov decision processes ⋮ Process-based risk measures and risk-averse control of discrete-time systems ⋮ Notes on average Markov decision processes with a minimum-variance criterion

This page was built for publication: Variance-Penalized Markov Decision Processes

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3832356&oldid=17430130"