Reward tampering problems and solutions in reinforcement learning: a causal influence diagram perspective (Q6182771): Difference between revisions

Revision as of 07:02, 10 July 2024

scientific article; zbMATH DE number 7795126

Language	Label	Description	Also known as
English	Reward tampering problems and solutions in reinforcement learning: a causal influence diagram perspective	scientific article; zbMATH DE number 7795126

Statements

instance of

scholarly article

0 references

title

Reward tampering problems and solutions in reinforcement learning: a causal influence diagram perspective (English)

0 references

0 references

0 references

0 references

0 references

0 references

26 January 2024

0 references

full work available at URL

https://arxiv.org/abs/1908.04734

0 references

zbMATH Keywords

AGI safety

0 references

reinforcement learning

0 references

Bayesian learning

0 references

causality

0 references

decision theory

0 references

causal influence diagrams

0 references

MaRDI profile type

MaRDI publication profile

0 references

Identifiers

zbMATH Open document ID

0 references

0 references

10.1007/s11229-021-03141-4

0 references

Mathematics Subject Classification ID

0 references

0 references

0 references

0 references

0 references

Sitelinks

Mathematics(1 entry)

mardi Publication:6182771

Revision as of 08:30, 30 April 2024 Importer (talk \| contribs) Bots 7,049,768 edits ‎Created a new Item	Revision as of 07:02, 10 July 2024 Import240710060729 (talk \| contribs) 725,746 edits Added link to MaRDI item. Newer edit →
links / mardi / name	links / mardi / name
		Publication:6182771