A unified approach to adaptive control of average reward Markov decision processes

From MaRDI portal

Publication:1095048

Jump to:navigation, search

DOI10.1007/BF01740510zbMath0631.90084OpenAlexW2319020649MaRDI QIDQ1095048

Gerhard Hübner

Publication date: 1988

Published in: OR Spektrum (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1007/bf01740510

zbMATH Keywords

adaptive control policy improvement nonstationary value iteration adaptive average reward Markov decision

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40)

Related Items (2)

Adaptive policy-iteration and policy-value-iteration for discounted Markov decision processes ⋮ Estimation and control in multichain processes

Cites Work

This page was built for publication: A unified approach to adaptive control of average reward Markov decision processes

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1095048&oldid=13129781"