TD3-BC-PPO: twin delayed DDPG-based and behavior cloning-enhanced proximal policy optimization for dynamic optimization affine formation

DOI10.1016/J.JFRANKLIN.2024.107018zbMATH Open1543.93194MaRDI QIDQ6579244FDOQ6579244

Authors: Xinyu Xu, Y. Y. Chen, Tianrun Liu

Publication date: 25 July 2024

Published in: Journal of the Franklin Institute (Search for Journal in Brave)

Recommendations

Optimal robust formation control for heterogeneous multi‐agent systems based on reinforcement learning
Heterogeneous optimal formation control of nonlinear multi-agent systems with unknown dynamics by safe reinforcement learning
Performance‐guaranteed containment control for pure‐feedback multi agent systems via reinforcement learning algorithm
Optimal antisynchronization control for unknown multiagent systems with deep deterministic policy gradient approach

dynamic optimization affine transformation deep reinforcement learning formation shape

Artificial neural networks and deep learning (68T07) Adaptive control/observation systems (93C40) Multi-agent systems (93A16)

Cites Work

This page was built for publication: TD3-BC-PPO: twin delayed DDPG-based and behavior cloning-enhanced proximal policy optimization for dynamic optimization affine formation

Report a bug (only for logged in users!)Click here to report a bug for this page (MaRDI item Q6579244)