登录免费注册

首页  流程图  详情

传统DQN和竞争DQN网络结构对比

2020-12-02 08:41:16   6  举报





传统DQN和竞争DQN都是用于解决强化学习问题的算法，它们的主要区别在于网络结构。传统DQN使用一个神经网络来估计每个动作的价值函数，而竞争DQN则使用两个神经网络，一个用于估计当前状态的价值函数，另一个用于估计其他状态的价值函数。竞争DQN通过比较这两个价值函数来确定最优的动作。总之，传统DQN和竞争DQN都是有效的强化学习算法，但它们的网络结构不同。传统DQN使用一个神经网络来估计每个动作的价值函数，而竞争DQN则使用两个神经网络来比较不同状态的价值函数。

强化学习

深度学习

作者其他创作

大纲/内容

+

卷积层

输入

输出Q值

全链接层

V(s)

传统DQN和竞争DQN网络结构对比

 收藏

立即使用

传统DQN和竞争DQN网络结构对比

 收藏

立即使用

DQN改进方法分类

 收藏

立即使用

Actor-Critic算法结构图

 收藏

立即使用

Actor-Critic算法结构图

职业：本科













评论

0 条评论

下一页

为你推荐

查看更多



dueling_dqn，doule_dqn,dqn强化学习模型交互

dueling_dqn，doule_dqn,dqn强化学习模型交互

采购合同网络结构

工业网络结构图

Oracle网络结构