Reinforcement learning based algorithms for average cost Markov decision processes (Q2643632)

scientific article

Language	Label	Description	Also known as
English	Reinforcement learning based algorithms for average cost Markov decision processes	scientific article

Statements

instance of

scholarly article

0 references

title

Reinforcement learning based algorithms for average cost Markov decision processes (English)

0 references

author

Mohammed Shahid Abdulla

0 references

Shalabh Bhatnagar

0 references

published in

Discrete Event Dynamic Systems

0 references

publication date

27 August 2007

0 references

zbMATH Keywords

actor-critic algorithms

0 references

two timescale stochastic approximation

0 references

Markov decision processes

0 references

policy iteration

0 references

simultaneous perturbation stochastic approximation

0 references

normalized Hadamard matrices

0 references

reinforcement learning

0 references

TD-learning

0 references

MaRDI profile type

MaRDI publication profile

0 references

full work available at URL

https://doi.org/10.1007/s10626-006-0003-y

0 references

cites work

Dynamic programming and stochastic control

0 references

A Simultaneous Perturbation Stochastic Approximation-Based Actor–Critic Algorithm for Markov Decision Processes

0 references

Actor-critic algorithms for hierarchical Markov decision processes

0 references

Asynchronous Stochastic Approximations

0 references

The actor-critic algorithm as multi-time-scale stochastic approximation.

0 references

The O.D.E. Method for Convergence of Stochastic Approximation and Reinforcement Learning

0 references

Actor-Critic--Type Learning Algorithms for Markov Decision Processes

0 references

OnActor-Critic Algorithms

0 references

Q4715203

0 references

Q4315289

0 references

An analysis of temporal-difference learning with function approximation

0 references

Average cost temporal-difference learning

0 references

Multivariate stochastic approximation using a simultaneous perturbation gradient approximation

0 references

A one-measurement form of simultaneous perturbation stochastic approximation

0 references

Q4547446

0 references

Identifiers

zbMATH Open document ID

1146.90521

0 references

DOI

10.1007/s10626-006-0003-y

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:2643632