PAC-Bayesian lifelong learning for multi-armed bandits

From MaRDI portal

Publication:2134066

Jump to:navigation, search

DOI10.1007/s10618-022-00825-4zbMath1494.68214arXiv2203.03303OpenAlexW4220868778MaRDI QIDQ2134066

Melih Kandemir, Hamish Flynn, David Reeb, Jan Peters

Publication date: 5 May 2022

Published in: Data Mining and Knowledge Discovery (Search for Journal in Brave)

Full work available at URL: https://arxiv.org/abs/2203.03303

zbMATH Keywords

lifelong learning multi-armed bandits PAC-Bayesian

Mathematics Subject Classification ID

Bayesian inference (62F15) Learning and adaptive systems in artificial intelligence (68T05) Sequential statistical analysis (62L10) Optimal stopping in statistics (62L15)

Uses Software

Adam

Cites Work

This page was built for publication: PAC-Bayesian lifelong learning for multi-armed bandits

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2134066&oldid=14630827"