An information-theoretic analysis of return maximization in reinforcement learning

From MaRDI portal

Revision as of 18:32, 2 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:2375396

Jump to:navigation, search

DOI10.1016/j.neunet.2011.05.002zbMath1266.68156OpenAlexW2034994237WikidataQ51559078 ScholiaQ51559078MaRDI QIDQ2375396

Kazunori Iwata

Publication date: 14 June 2013

Published in: Neural Networks (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.neunet.2011.05.002

zbMATH Keywords

information theory reinforcement learning asymptotic equipartition property stochastic sequential decision process

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Cites Work

This page was built for publication: An information-theoretic analysis of return maximization in reinforcement learning

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2375396&oldid=14999106"