Provably efficient offline reinforcement learning with trajectory-wise reward (Q6670141)

scientific article; zbMATH DE number 7973801

Language	Label	Description	Also known as
default for all languages	No label defined
English	Provably efficient offline reinforcement learning with trajectory-wise reward	scientific article; zbMATH DE number 7973801

Statements

0 references

Provably efficient offline reinforcement learning with trajectory-wise reward (English)

0 references

0 references

0 references

0 references

0 references

0 references

23 January 2025

0 references

0 references

0 references

0 references

0 references