A Convex Programming Approach for Discrete-Time Markov Decision Processes under the Expected Total Reward Criterion

From MaRDI portal

Publication:5130923

Jump to:navigation, search

DOI10.1137/19M1255811zbMath1452.90316arXiv1903.08853OpenAlexW2924486842MaRDI QIDQ5130923

Alexandre Genadot, François Dufour

Publication date: 30 October 2020

Published in: SIAM Journal on Control and Optimization (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1903.08853

zbMATH Keywords

occupation measure Markov decision process constraints convex program expected total reward criterion

Mathematics Subject Classification ID

Convex programming (90C25) Markov chains (discrete-time Markov processes on discrete state spaces) (60J10) Markov and semi-Markov decision processes (90C40)

Related Items

Extreme Occupation Measures in Markov Decision Processes with an Absorbing State, On Reducing a Constrained Gradual-Impulsive Control Problem for a Jump Markov Model to a Model with Gradual Control Only

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5130923&oldid=19665791"