scientific article; zbMATH DE number 6982305

From MaRDI portal

Publication:4558153

Jump to:navigation, search

MaRDI QIDQ4558153zbMATH OpenFDO

Authors Riad Akrour, A. Abdolmaleki, Hany Abdulsamad, Jan Peters, Gerhard Neumann

Publication date 21 November 2018

Full work available at URL https://arxiv.org/abs/1606.09197, http://jmlr.csail.mit.edu/papers/v19/17-329.html

zbMATH Keywords

reinforcement learning robotics trajectory optimization policy optimization

Mathematics Subject Classification ID

Statistical aspects of information-theoretic topics (62B10) Learning and adaptive systems in artificial intelligence (68T05) Markov and semi-Markov decision processes (90C40)

Recommendations

Cites work

Cited in

(7)

Describes a project that uses

Uses Software

This page was built for publication:

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q4558153)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4558153&oldid=18688343"