Feature-based methods for large scale dynamic programming

From MaRDI portal

Publication:1911341

Jump to:navigation, search

DOI10.1007/BF00114724zbMath0843.68092MaRDI QIDQ1911341

John N. Tsitsiklis, Benjamin van Roy

Publication date: 21 April 1996

Published in: Machine Learning (Search for Journal in Brave)

zbMATH Keywords

dynamic programming

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Related Items

Approximate policy iteration: a survey and some new methods ⋮ A review of stochastic algorithms with continuous value function approximation and some new approximate policy iteration algorithms for multidimensional continuous applications ⋮ Dynamic programming approximation algorithms for the capacitated lot-sizing problem ⋮ Approximate dynamic programming for stochastic \(N\)-stage optimization with application to optimal consumption under uncertainty ⋮ Shape constraints in economics and operations research ⋮ The actor-critic algorithm as multi-time-scale stochastic approximation. ⋮ Data-driven models for capacity allocation of inpatient beds in a Chinese public hospital ⋮ The Benefits of State Aggregation with Extreme-Point Weighting for Assemble-to-Order Systems ⋮ Single sample path-based optimization of Markov chains

Cites Work

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1911341&oldid=14330002"