Approximate dynamic programming via direct search in the space of value function approximations

From MaRDI portal

Publication:713118

Jump to:navigation, search

DOI10.1016/j.ejor.2010.11.019zbMath1250.90105OpenAlexW2079830915MaRDI QIDQ713118

João B. R. do Val, Edilson F. Arruda, Marcelo Dutra Fragoso

Publication date: 26 October 2012

Published in: European Journal of Operational Research (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.ejor.2010.11.019

zbMATH Keywords

direct search methods convex optimization dynamic programming Markov decision processes

Mathematics Subject Classification ID

Dynamic programming (90C39) Markov and semi-Markov decision processes (90C40)

Related Items (4)

Solving average cost Markov decision processes by means of a two-phase time aggregation algorithm ⋮ A perturbation approach to a class of discounted approximate value iteration algorithms with Borel spaces ⋮ Modified iterative aggregation procedure for maintenance optimisation of multi-component systems with failure interaction ⋮ Accelerating the convergence of value iteration by using partial transition functions

Cites Work

This page was built for publication: Approximate dynamic programming via direct search in the space of value function approximations

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:713118&oldid=12620531"