Average Reward Markov Decision Processes with Multiple Cost Constraints

From MaRDI portal

Publication:4718597

Jump to:navigation, search

DOI10.1080/02522667.1995.10699238zbMath0862.90128OpenAlexW2318172716MaRDI QIDQ4718597

Youqiang Huang, Masami Kurano

Publication date: 25 May 1997

Published in: Journal of Information and Optimization Sciences (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1080/02522667.1995.10699238

zbMATH Keywords

occupation measures stationary policy constrained Markov decision processes compact state and action spaces long-run average reward state-wise mixed stationary policy

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4718597&oldid=18960364"