scientific article; zbMATH DE number 2087264

From MaRDI portal

Revision as of 21:50, 7 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:4737965

Jump to:navigation, search

zbMath1065.68608MaRDI QIDQ4737965

Ronald Parr, Michail G. Lagoudakis, Michael L. Littman

Publication date: 11 August 2004

Full work available at URL: http://link.springer.de/link/service/series/0558/bibs/2308/23080249.htm

Title: zbMATH Open Web Interface contents unavailable due to conflicting licenses.

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Related Items (5)

Reinforcement learning for a biped robot based on a CPG-actor-critic method ⋮ Restricted gradient-descent algorithm for value-function approximation in reinforcement learning ⋮ Dynamic portfolio choice: a simulation-and-regression approach ⋮ Hybrid least-squares algorithms for approximate policy evaluation ⋮ Bayesian Exploration for Approximate Dynamic Programming

This page was built for publication:

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4737965&oldid=18995059"