Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent

From MaRDI portal

Publication:5026254

Jump to:navigation, search

DOI10.1613/jair.1.13350OpenAlexW3200083785WikidataQ113424375 ScholiaQ113424375MaRDI QIDQ5026254

Damien Ernst, Adrien Bolland, Ioannis Boukas, Mathias Berger

Publication date: 7 February 2022

Published in: Journal of Artificial Intelligence Research (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2006.01738

zbMATH Keywords

neural networks reinforcement learning machine learning

Mathematics Subject Classification ID

Artificial intelligence (68Txx)

This page was built for publication: Jointly Learning Environments and Control Policies with Projected Stochastic Gradient Ascent

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:5026254&oldid=19490618"