传统DQN和竞争DQN网络结构对比
2020-12-02 08:41:16 6 举报
传统DQN和竞争DQN都是用于解决强化学习问题的算法,它们的主要区别在于网络结构。传统DQN使用一个神经网络来估计每个动作的价值函数,而竞争DQN则使用两个神经网络,一个用于估计当前状态的价值函数,另一个用于估计其他状态的价值函数。竞争DQN通过比较这两个价值函数来确定最优的动作。 总之,传统DQN和竞争DQN都是有效的强化学习算法,但它们的网络结构不同。传统DQN使用一个神经网络来估计每个动作的价值函数,而竞争DQN则使用两个神经网络来比较不同状态的价值函数。
作者其他创作
大纲/内容
+
卷积层
输入
输出Q值
全链接层
V(s)
0 条评论
下一页