Convergence of Finite Memory Q Learning for POMDPs and Near Optimality of Learned Policies Under Filter Stability (Q6122574)

scientific article; zbMATH DE number 7811853

Language	Label	Description	Also known as
English	Convergence of Finite Memory Q Learning for POMDPs and Near Optimality of Learned Policies Under Filter Stability	scientific article; zbMATH DE number 7811853

Statements

instance of

scholarly article

0 references

title

Convergence of Finite Memory Q Learning for POMDPs and Near Optimality of Learned Policies Under Filter Stability (English)

0 references

0 references

0 references

Mathematics of Operations Research

0 references

publication date

1 March 2024

0 references

full work available at URL

https://arxiv.org/abs/2103.12158

0 references

zbMATH Keywords

reinforcement learning

0 references

partially observed MDP

0 references

reinforcement learning partially observed MDP

0 references

MaRDI profile type

MaRDI publication profile

0 references

Identifiers

arXiv ID

2103.12158

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

0 references

10.1287/MOOR.2022.1331

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6122574