Computationally efficient algorithms for on-line optimization of Markov decision processes

From MaRDI portal

Revision as of 06:25, 31 January 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:1190506

Jump to:navigation, search

DOI10.1016/0005-1098(92)90011-4zbMath0751.90083MaRDI QIDQ1190506

Publication date: 26 September 1992

Published in: Automatica (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/0005-1098(92)90011-4

zbMATH Keywords

estimation; long-run average cost; distributed algorithms; asynchronous algorithms; on-line optimization of finite state Markov decision processes

Mathematics Subject Classification ID

90C39: Dynamic programming

90C40: Markov and semi-Markov decision processes

90-08: Computational methods for problems pertaining to operations research and mathematical programming

Related Items

Model-based average reward reinforcement learning

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1190506&oldid=13247139"