An Evolutionary Random Policy Search Algorithm for Solving Markov Decision Processes

From MaRDI portal

Revision as of 20:33, 3 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:2892321

Jump to:navigation, search

DOI10.1287/ijoc.1050.0155zbMath1241.90173WikidataQ114967841 ScholiaQ114967841MaRDI QIDQ2892321

Jiaqiao Hu, Steven I. Marcus, Vahid Reza Ramezani, Michael C. Fu

Publication date: 18 June 2012

Published in: INFORMS Journal on Computing (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1287/ijoc.1050.0155

zbMATH Keywords

dynamic programming; Markov finite state; nonlinear queues

Mathematics Subject Classification ID

90C59: Approximation methods and heuristics in mathematical programming

90C39: Dynamic programming

90C40: Markov and semi-Markov decision processes

Related Items

Optimal Online Learning for Nonlinear Belief Models Using Discrete Priors, A variable neighborhood search based algorithm for finite-horizon Markov decision processes

Uses Software

simannf90

Cites Work

simannf90

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2892321&oldid=15847026"