scientific article

From MaRDI portal

Revision as of 06:11, 4 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:3174169

Jump to:navigation, search

zbMath1222.68202MaRDI QIDQ3174169

Mohammad Ghavamzadeh, Sridhar Mahadevan

Publication date: 12 October 2011

Full work available at URL: http://www.jmlr.org/papers/v8/ghavamzadeh07a.html

Title: zbMATH Open Web Interface contents unavailable due to conflicting licenses.

zbMATH Keywords

semi-Markov decision processes hierarchical reinforcement learning average reward reinforcement learning hierarchical and recursive optimality

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Related Items (3)

Probabilistic inference for determining options in reinforcement learning ⋮ Exact decomposition approaches for Markov decision processes: a survey ⋮ Reinforcement learning algorithms with function approximation: recent advances and applications

This page was built for publication:

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:3174169&oldid=16413465"