登录免费注册

首页  流程图  详情

DQN流程图

2018-04-09 21:11:39   77  举报





DQN流程图

DQN

作者其他创作

大纲/内容

初始化状态

是

随机概率小于epsilon

初始化容量为N的重现记忆库

否

从记忆库中随机选取一个小batch

在虚拟环境中执行动作at并观察得到的回报rt和下一时刻状态xt+1

储存四元组------------------到memory中

将rj 赋值给yj

将---------------------------------赋值给yj

开始

j+1步是否终止状态

每C步把Q值网络参数赋值到Q^网络

以公式-------------------用随机梯度下降法优化网络参数

结束

选择由Q表给出的当前状态下的最大值动作

初始化赋有随机参数θ的动作值函数Q

初始化目标值函数Q，参数θ-设置为θ

 收藏

立即使用

 收藏

立即使用

职业：暂无













评论

0 条评论

下一页

为你推荐

查看更多



正常结款流程图

金马甲流程图

订货流程图

业务流程图

play()函数流程图

业务流程图