Geometry of policy improvement (Q1689145)

scientific article; zbMATH DE number 6825151

Language	Label	Description	Also known as
default for all languages	No label defined
English	Geometry of policy improvement	scientific article; zbMATH DE number 6825151

Statements

instance of

scholarly article

0 references

title

Geometry of policy improvement (English)

0 references

0 references

0 references

12 January 2018

0 references

full work available at URL

https://arxiv.org/abs/1704.01785

0 references

zbMATH Keywords

partially observable Markov decision process

0 references

reinforcement learning

0 references

memoryless stochastic policy

0 references

policy gradient theorem

0 references

MaRDI profile type

MaRDI publication profile

0 references

Identifiers

zbMATH Open document ID

1426.91076

0 references

DOI

10.1007/978-3-319-68445-1_33

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:1689145