Policy-based optimization: single-step policy gradient method seen as an evolution strategy

From MaRDI portal

Publication:6365194

Jump to:navigation, search

arXiv2104.06175MaRDI QIDQ6365194

Jonathan Viquerat, Régis Duvigneau, Elie Hachem, Alexander Kuhnle, Philippe Meliga

Publication date: 13 April 2021

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:6365194&oldid=35996187"