Accelerating actor-critic-based algorithms via pseudo-labels derived from prior knowledge (Q6126872): Difference between revisions

From MaRDI portal

Jump to:navigation, search

Latest revision as of 18:42, 30 December 2024

scientific article; zbMATH DE number 7829860

Language	Label	Description	Also known as
English	Accelerating actor-critic-based algorithms via pseudo-labels derived from prior knowledge	scientific article; zbMATH DE number 7829860

Statements

scholarly article

0 references

Accelerating actor-critic-based algorithms via pseudo-labels derived from prior knowledge (English)

0 references

Ali Beikmohammadi

0 references

Sindri Magnússon

0 references

Information Sciences

0 references

publication date

10 April 2024

0 references

zbMATH Keywords

reinforcement learning

0 references

deep RL

0 references

actor-critic methods

0 references

policy optimization

0 references

sample efficiency

0 references

exploration

0 references

MaRDI profile type

MaRDI publication profile

0 references

full work available at URL

https://doi.org/10.1016/j.ins.2024.120182

0 references

0 references

MM Optimization Algorithms

0 references

Simple statistical gradient-following algorithms for connectionist reinforcement learning

0 references

Overcoming catastrophic forgetting in neural networks

0 references

0 references

0 references

Identifiers

Mathematics Subject Classification ID

0 references

0 references

zbMATH DE Number

0 references

0 references

0 references

10.1016/J.INS.2024.120182

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6126872

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Item:Q6126872&oldid=39715460"