Accelerating actor-critic-based algorithms via pseudo-labels derived from prior knowledge (Q6126872): Difference between revisions

From MaRDI portal

Jump to:navigation, search

← Older edit Newer edit →

Revision as of 21:09, 29 August 2024

scientific article; zbMATH DE number 7829860

Language	Label	Description	Also known as
English	Accelerating actor-critic-based algorithms via pseudo-labels derived from prior knowledge	scientific article; zbMATH DE number 7829860

Statements

scholarly article

0 references

Accelerating actor-critic-based algorithms via pseudo-labels derived from prior knowledge (English)

0 references

Ali Beikmohammadi

0 references

Sindri Magnússon

0 references

Information Sciences

0 references

publication date

10 April 2024

0 references

zbMATH Keywords

reinforcement learning

0 references

deep RL

0 references

actor-critic methods

0 references

policy optimization

0 references

sample efficiency

0 references

exploration

0 references

MaRDI profile type

MaRDI publication profile

0 references

full work available at URL

https://doi.org/10.1016/j.ins.2024.120182

0 references

0 references

MM Optimization Algorithms

0 references

Simple statistical gradient-following algorithms for connectionist reinforcement learning

0 references

Overcoming catastrophic forgetting in neural networks

0 references

0 references

0 references

Identifiers

10.1016/j.ins.2024.120182

0 references

Mathematics Subject Classification ID

0 references

0 references

zbMATH DE Number

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6126872

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q6126872&oldid=37658665"