Utility, probabilistic constraints, mean and variance of discounted rewards in Markov decision processes

From MaRDI portal

Publication:1091281

Jump to:navigation, search

DOI10.1007/BF01720793zbMath0622.90090MaRDI QIDQ1091281

Douglas J. White

Publication date: 1987

Published in: OR Spektrum (Search for Journal in Brave)

zbMATH Keywords

discounted rewards discounted Markov decision processes augmented state-spaces finite state-space

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Related Items (6)

Value iteration methods in risk minimizing stopping problems ⋮ Experiments with dynamic programming algorithms for nonseparable problems ⋮ Finding Optimal Survey Policies via Adaptive Markov Decision Processes ⋮ Non-homogeneous Markov decision processes with a constraint ⋮ Expected utility maximization of optimal stopping problems ⋮ Optimal policy for minimizing risk models in Markov decision processes

Cites Work

This page was built for publication: Utility, probabilistic constraints, mean and variance of discounted rewards in Markov decision processes

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1091281&oldid=13122571"