DQN结构图
2020-11-26 10:42:56 60 举报
DQN(Deep Q-Network)是一种结合深度学习和Q-learning的强化学习算法。其结构主要包括以下几个部分:输入层、隐藏层、输出层和目标网络。输入层接收当前环境的状态,隐藏层负责对状态进行特征提取和转换,输出层输出每个动作的价值估计。目标网络则是用于计算目标Q值的网络,它与主网络共享参数,但在更新过程中保持固定。通过这种双网络结构,DQN能够有效地解决Q-learning在处理连续动作空间时的问题,从而在许多复杂的游戏环境中取得了显著的性能提升。
作者其他创作
大纲/内容
Q prediction
environment
update θ− periodically
update θ
action
ε-greedy
model
agent
DQN algorithm
target Q net
replay memory
Q target
learn
Loss
Q net
0 条评论
下一页