Instance-Dependent ℓ<sub>∞</sub>-Bounds for Policy Evaluation in Tabular Reinforcement Learning (Q5151732)

scientific article; zbMATH DE number 7314046

Language	Label	Description	Also known as
English	Instance-Dependent ℓ<sub>∞</sub>-Bounds for Policy Evaluation in Tabular Reinforcement Learning	scientific article; zbMATH DE number 7314046

Statements

instance of

scholarly article

0 references

title

Instance-Dependent ℓ<sub>∞</sub>-Bounds for Policy Evaluation in Tabular Reinforcement Learning (English)

0 references

0 references

0 references

IEEE Transactions on Information Theory

0 references

publication date

22 February 2021

0 references

full work available at URL

https://arxiv.org/abs/1909.08749

0 references

zbMATH Keywords

Markov reward processes (MRPs)

0 references

stochastic phenomena

0 references

non-asymptotic bounds

0 references

MaRDI profile type

MaRDI publication profile

0 references

Identifiers

zbMATH Open document ID

1473.62082

0 references

DOI

10.1109/TIT.2020.3027316

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:5151732