Discounted Markov decision processes with utility constraints

From MaRDI portal

Revision as of 03:00, 3 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:2494787

Jump to:navigation, search

DOI10.1016/j.camwa.2005.11.013zbMath1120.90066MaRDI QIDQ2494787

Masami Kurano, Masami Yasuda, Yoshinobu Kadota

Publication date: 30 June 2006

Published in: Computers \& Mathematics with Applications (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.camwa.2005.11.013

zbMATH Keywords

Markov decision processes; Lagrange technique; Saddle-point; Constrained optimal policy; Constrained optimal policy Markov decision processes; Discount criterion; Utility constraints

Mathematics Subject Classification ID

90C40: Markov and semi-Markov decision processes

Related Items

Smoothing policies and safe policy gradients, An exact iterative search algorithm for constrained Markov decision processes, Discounted continuous-time constrained Markov decision processes in Polish spaces, A consumption and investment problem via a Markov decision processes approach with random horizon

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2494787&oldid=15198915"