Reward-weighted regression with sample reuse for direct policy search in reinforcement learning

From MaRDI portal

Publication:2887009

Jump to:navigation, search

DOI10.1162/NECO_A_00199zbMATH Open1237.68147OpenAlexW1971492381WikidataQ51539172 ScholiaQ51539172MaRDI QIDQ2887009FDOQ2887009

Authors: Hirotaka Hachiya, Jan Peters, Masashi Sugiyama

Publication date: 15 May 2012

Published in: Neural Computation (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1162/neco_a_00199

Recommendations

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Cites Work

Cited In (10)

Uses Software

Open Dynamics Engine

This page was built for publication: Reward-weighted regression with sample reuse for direct policy search in reinforcement learning

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q2887009)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2887009&oldid=15838427"