Risk-averse policy optimization via risk-neutral policy optimization

From MaRDI portal

Publication:2082514

Jump to:navigation, search

DOI10.1016/j.artint.2022.103765OpenAlexW4285403797WikidataQ113442972 ScholiaQ113442972MaRDI QIDQ2082514

Lorenzo Bisi, Andrea Tirinzoni, Davide Santambrogio, Federico Sandrelli, Marcello Restelli, Brian D. Ziebart

Publication date: 4 October 2022

Published in: Artificial Intelligence (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1016/j.artint.2022.103765

zbMATH Keywords

reinforcement learning risk-aversion risk-sensitivity

Mathematics Subject Classification ID

Artificial intelligence (68Txx)

Related Items (2)

Deep reinforcement learning for option pricing and hedging under dynamic expectile risk measures ⋮ Risk-averse optimization of reward-based coherent risk measures

Uses Software

Cites Work

This page was built for publication: Risk-averse policy optimization via risk-neutral policy optimization

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:2082514&oldid=14576100"