搜索
❯
2024年7月07日1分钟阅读
异策略学习是在线强化学习算法的一类,与同策略学习相对。它们的定义见行为策略与目标策略。
此标签下有3条笔记。
2025年2月09日
2024年7月28日
2024年7月04日