(Approximate) iterated successive approximations algorithm for sequential decision processes

From MaRDI portal

Publication:378751

Jump to:navigation, search

DOI10.1007/s10479-012-1073-xzbMath1274.90469OpenAlexW2014981566MaRDI QIDQ378751

Uriel G. Rothblum, Pelin G. Canbolat

Publication date: 12 November 2013

Published in: Annals of Operations Research (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1007/s10479-012-1073-x

zbMATH Keywords

successive approximations Markov decision chains modified policy iteration sequential decision processes

Mathematics Subject Classification ID

Approximation methods and heuristics in mathematical programming (90C59) Markov and semi-Markov decision processes (90C40)

Related Items (2)

Discounted Markov decision processes with fuzzy costs ⋮ Q-learning and policy iteration algorithms for stochastic shortest path problems

Cites Work

This page was built for publication: (Approximate) iterated successive approximations algorithm for sequential decision processes

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:378751&oldid=12251190"