强化学习笔记

❯

❯

异策略学习

异策略学习

2024年7月07日1分钟阅读

异策略学习是在线强化学习算法的一类，与同策略学习相对。它们的定义见行为策略与目标策略。

此标签下有3条笔记。

2025年2月09日
Soft Actor-Critic (SAC)
2024年7月28日
对决网络
2024年7月04日
深度 Q 网络 (DQN)

Created with Quartz v4.4.0 © 2025

GitHub