Variational actor-critic algorithms, (Q6102338): Difference between revisions

From MaRDI portal

Jump to:navigation, search

← Older edit Newer edit →

Revision as of 02:02, 1 August 2024

scientific article; zbMATH DE number 7683230

Language	Label	Description	Also known as
English	Variational actor-critic algorithms,	scientific article; zbMATH DE number 7683230

Statements

scholarly article

0 references

Variational actor-critic algorithms, (English)

0 references

0 references

0 references

ESAIM: Control, Optimisation and Calculus of Variations

0 references

publication date

8 May 2023

0 references

full work available at URL

https://arxiv.org/abs/2108.01215

0 references

zbMATH Keywords

Markov decision process

0 references

reinforcement learning

0 references

policy gradient

0 references

optimal control

0 references

MaRDI profile type

0 references

0 references

0 references

0 references

Simple statistical gradient-following algorithms for connectionist reinforcement learning

0 references

Identifiers

zbMATH Open document ID

0 references

0 references

10.1051/cocv/2023007

0 references

Mathematics Subject Classification ID

0 references

0 references

zbMATH DE Number

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6102338

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q6102338&oldid=37514218"