Reinforcement learning with limited reinforcement: using Bayes risk for active learning in POMDPs

From MaRDI portal

Publication:1761294

Jump to:navigation, search

DOI10.1016/j.artint.2012.04.006zbMath1251.68177OpenAlexW1973749650MaRDI QIDQ1761294

Nicholas Roy, Joelle Pineau, Finale Doshi-Velez

Publication date: 15 November 2012

Published in: Artificial Intelligence (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.artint.2012.04.006

zbMATH Keywords

reinforcement learning Bayesian methods partially observable Markov decision process

Mathematics Subject Classification ID

Learning and adaptive systems in artificial intelligence (68T05)

Related Items (3)

POMDP controllers with optimal budget ⋮ Reinforcement learning with limited reinforcement: using Bayes risk for active learning in POMDPs ⋮ A Bayesian learning model for estimating unknown demand parameter in revenue management

Cites Work

This page was built for publication: Reinforcement learning with limited reinforcement: using Bayes risk for active learning in POMDPs

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1761294&oldid=14108860"