Computation of weighted sums of rewards for concurrent MDPs

From MaRDI portal

Revision as of 06:42, 1 February 2024 by Import240129110113 (talk | contribs) (Created automatically from import240129110113)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Publication:1731592

Jump to:navigation, search

DOI10.1007/s00186-018-0653-1zbMath1411.90353OpenAlexW2898656812WikidataQ129000532 ScholiaQ129000532MaRDI QIDQ1731592

Peter Buchholz, Dimitri Scheftelowitsch

Publication date: 13 March 2019

Published in: Mathematical Methods of Operations Research (Search for Journal in Brave)

Full work available at URL: https://doi.org/10.1007/s00186-018-0653-1

zbMATH Keywords

optimization multi-objective optimization Markov decision processes nonlinear programming

Mathematics Subject Classification ID

Multi-objective and goal programming (90C29) Optimality conditions and duality in mathematical programming (90C46)

Related Items (5)

State-Variable Modeling for a Class of Two-Stage Stochastic Optimization Problems ⋮ Partially observable multistage stochastic programming ⋮ Light robustness in the optimization of Markov decision processes with uncertain parameters ⋮ Policy-based branch-and-bound for infinite-horizon multi-model Markov decision processes ⋮ Concurrent MDPs with Finite Markovian Policies

Cites Work

This page was built for publication: Computation of weighted sums of rewards for concurrent MDPs

Retrieved from "https://portal.mardi4nfdi.de/w/index.php?title=Publication:1731592&oldid=14060038"