Mechanisms with learning for stochastic multi-armed bandit problems

From MaRDI portal

Publication:2520139

Jump to:navigation, search

DOI10.1007/s13226-016-0186-3zbMath1384.90118OpenAlexW2460608695MaRDI QIDQ2520139

Ganesh Ghalme, Satyanath Bhat, Divya Padmanabhan, Shweta Jain, Yadati Narahari

Publication date: 13 December 2016

Published in: Indian Journal of Pure \& Applied Mathematics (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1007/s13226-016-0186-3

zbMATH Keywords

learning algorithms mechanism design multi-armed bandit

Mathematics Subject Classification ID

Markov and semi-Markov decision processes (90C40) Probabilistic games; gambling (91A60)

Related Items (1)

A quality assuring, cost optimal multi-armed bandit mechanism for expertsourcing

Cites Work

This page was built for publication: Mechanisms with learning for stochastic multi-armed bandit problems

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2520139&oldid=15241401"