scientific article; zbMATH DE number 7370594

From MaRDI portal

Publication:4998982

Jump to:navigation, search

MaRDI QIDQ4998982zbMATH OpenFDO

Authors Yasuhiro Fujita, Prabhat Nagarajan, Toshiki Kataoka, Takahiro Ishikawa

Publication date 9 July 2021

Full work available at URL https://arxiv.org/abs/1912.03905, https://jmlr.csail.mit.edu/papers/v22/20-376.html

zbMATH Keywords

reproducibility reinforcement learning open source software deep reinforcement learning Chainer

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Cites work

Cited in

(2)

Describes a project that uses

Uses Software

This page was built for publication:

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q4998982)

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:4998982&oldid=19452525"