The \(K\)-armed dueling bandits problem

From MaRDI portal

Revision as of 04:06, 30 January 2024 by Import240129110155 (talk | contribs) (Created automatically from import240129110155)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:440003

Jump to:navigation, search

DOI10.1016/J.JCSS.2011.12.028zbMath1283.68181DBLPjournals/jcss/YueBKJ12OpenAlexW2044493620WikidataQ29300682 ScholiaQ29300682MaRDI QIDQ440003

Thorsten Joachims, Yisong Yue, Josef Broder, Robert D. Kleinberg

Publication date: 17 August 2012

Published in: Journal of Computer and System Sciences (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.jcss.2011.12.028

zbMATH Keywords

online learning multi-armed bandits preference elicitation

Mathematics Subject Classification ID

Computational learning theory (68Q32) Learning and adaptive systems in artificial intelligence (68T05) Probabilistic games; gambling (91A60) Online algorithms; streaming algorithms (68W27)

Related Items (13)

Top-\(\kappa\) selection with pairwise comparisons ⋮ Parallel distributed block coordinate descent methods based on pairwise comparison oracle ⋮ Unnamed Item ⋮ Unnamed Item ⋮ The \(K\)-armed dueling bandits problem ⋮ Lexicographic refinements in stationary possibilistic Markov decision processes ⋮ How good is a two-party election game? ⋮ Active ranking from pairwise comparisons and when parametric assumptions do not help ⋮ Preference-based reinforcement learning: evolutionary direct policy search using a preference-based racing algorithm ⋮ Global optimization based on active preference learning with radial basis functions ⋮ On testing transitivity in online preference learning ⋮ Lexicographic refinements in possibilistic decision trees and finite-horizon Markov decision processes ⋮ Unnamed Item

Cites Work

This page was built for publication: The \(K\)-armed dueling bandits problem

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:440003&oldid=12315688"