Online regret bounds for Markov decision processes with deterministic transitions

From MaRDI portal

Publication:982638

Jump to:navigation, search

DOI10.1016/j.tcs.2010.04.005zbMath1198.90388OpenAlexW2150011303WikidataQ29307615 ScholiaQ29307615MaRDI QIDQ982638

Ronald Ortner

Publication date: 7 July 2010

Published in: Theoretical Computer Science (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.tcs.2010.04.005

zbMATH Keywords

labeled digraph

Mathematics Subject Classification ID

Inequalities; stochastic orderings (60E15) Markov and semi-Markov decision processes (90C40)

Related Items (1)

A perpetual search for talents across overlapping generations: a learning process

Cites Work

This page was built for publication: Online regret bounds for Markov decision processes with deterministic transitions

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:982638&oldid=12974290"