Policy gradient in Lipschitz Markov decision processes (Q747252)

scientific article; zbMATH DE number 6497623

Language	Label	Description	Also known as
default for all languages	No label defined
English	Policy gradient in Lipschitz Markov decision processes	scientific article; zbMATH DE number 6497623

Statements

instance of

scholarly article

0 references

title

Policy gradient in Lipschitz Markov decision processes (English)

0 references

0 references

0 references

0 references

0 references

23 October 2015

0 references

zbMATH Keywords

reinforcement learning

0 references

Markov decision process

0 references

Lipschitz continuity

0 references

policy gradient algorithm

0 references

MaRDI profile type

MaRDI publication profile

0 references

full work available at URL

https://doi.org/10.1007/s10994-015-5484-1

0 references

cites work

Minimization of functions having Lipschitz continuous first partial derivatives

0 references

Q4251245

0 references

Stochastic optimal control. The discrete time case

0 references

Lipschitz continuity of value functions in Markovian decision processes

0 references

Policy search for motor primitives in robotics

0 references

Collective motions of a shell structure

0 references

0 references

0 references

0 references

0 references

A Stochastic Approximation Method

0 references

Multivariate stochastic approximation using a simultaneous perturbation gradient approximation

0 references

Solving connection and linearization problems within the Askey scheme and its \(q\)-analogue via inversion formulas

0 references

Line search algorithms with guaranteed sufficient decrease

0 references

Identifiers

zbMATH Open document ID

1354.90166

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

10.1007/S10994-015-5484-1

0 references

Sitelinks

Mathematics(1 entry)

mardi Policy gradient in Lipschitz Markov decision processes