Adaptive aggregation for reinforcement learning in average reward Markov decision processes (Q378753): Difference between revisions

From MaRDI portal

Jump to:navigation, search

Latest revision as of 15:46, 9 December 2024

scientific article

Language	Label	Description	Also known as
English	Adaptive aggregation for reinforcement learning in average reward Markov decision processes	scientific article

Statements

scholarly article

0 references

Adaptive aggregation for reinforcement learning in average reward Markov decision processes (English)

0 references

0 references

Annals of Operations Research

0 references

publication date

12 November 2013

0 references

zbMATH Keywords

reinforcement learning

0 references

Markov decision process

0 references

bounded parameter MDP

0 references

regret

0 references

MaRDI profile type

0 references

full work available at URL

https://doi.org/10.1007/s10479-012-1064-y

0 references

Finite-time analysis of the multiarmed bandit problem

0 references

Adaptive aggregation methods for infinite horizon dynamic programming

0 references

Optimal adaptive policies for sequential allocation problems

0 references

Optimal Adaptive Policies for Markov Decision Processes

0 references

An Adaptive Sampling Algorithm for Solving Markov Decision Processes

0 references

Simulation-based algorithms for Markov decision processes.

0 references

Learning Theory and Kernel Machines

0 references

Bisimulation Metrics for Continuous Markov Decision Processes

0 references

Equivalence notions and model minimization in Markov decision processes

0 references

Bounded-parameter Markov decision processes

0 references

0 references

Asymptotically efficient adaptive allocation rules

0 references

Knows what it knows: a framework for self-aware learning

0 references

Pseudometrics for State Aggregation in Average Reward Markov Decision Processes

0 references

0 references

Performance Loss Bounds for Approximate Value Iteration with State Aggregation

0 references

An analysis of model-based interval estimation for Markov decision processes

0 references

Bounded Parameter Markov Decision Processes with Average Reward Criterion

0 references

Identifiers

zbMATH Open document ID

0 references

Mathematics Subject Classification ID

0 references

zbMATH DE Number

0 references

0 references

10.1007/S10479-012-1064-Y

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:378753

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q378753&oldid=38324511"