Policy Gradient for Continuing Tasks in Discounted Markov Decision Processes (Q6075992)

scientific article; zbMATH DE number 7740953

Language	Label	Description	Also known as
English	Policy Gradient for Continuing Tasks in Discounted Markov Decision Processes	scientific article; zbMATH DE number 7740953

Statements

instance of

scholarly article

0 references

title

Policy Gradient for Continuing Tasks in Discounted Markov Decision Processes (English)

0 references

0 references

0 references

0 references

IEEE Transactions on Automatic Control

0 references

publication date

21 September 2023

0 references

zbMATH Keywords

adaptive systems

0 references

gradient methods

0 references

reinforcement learning

0 references

stochastic systems

0 references

MaRDI profile type

MaRDI publication profile

0 references

full work available at URL

https://doi.org/10.1109/tac.2022.3163085

0 references

Identifiers

Mathematics Subject Classification ID

0 references

0 references

0 references

10.1109/TAC.2022.3163085

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6075992