Bayesian policy reuse

From MaRDI portal

Revision as of 05:35, 1 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:1689554

Jump to:navigation, search

DOI10.1007/S10994-016-5547-YzbMath1454.68129arXiv1505.00284OpenAlexW778742492MaRDI QIDQ1689554

Majd Hawasly, Benjamin Rosman, Subramanian Ramamoorthy

Publication date: 12 January 2018

Published in: Machine Learning (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/1505.00284

zbMATH Keywords

online learning reinforcement learning Bayesian decision theory transfer learning Bayesian optimisation online bandits policy reuse

Mathematics Subject Classification ID

Bayesian problems; characterization of Bayes procedures (62C10) Learning and adaptive systems in artificial intelligence (68T05) Online algorithms; streaming algorithms (68W27)

Related Items (1)

A Survey of Opponent Modeling in Adversarial Domains

Cites Work

This page was built for publication: Bayesian policy reuse

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1689554&oldid=14004828"