Constrained denumerable state non-stationary MDPs with expected total reward criterion

From MaRDI portal

Publication:1568256

Jump to:navigation, search

DOI10.1007/BF02677681zbMath0971.90102MaRDI QIDQ1568256

Xianping Guo

Publication date: 21 June 2000

Published in: Acta Mathematicae Applicatae Sinica. English Series (Search for Journal in Brave)

zbMATH Keywords

non-stationary Markov decision processes; expected total reward criterion; Markov policy; constrained optimal policies

Mathematics Subject Classification ID

90C40: Markov and semi-Markov decision processes

Related Items

Constrained Markov decision processes with first passage criteria

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1568256&oldid=13849984"