行为决策
2021-03-18 17:35:38 0 举报
AI智能生成
目前所有的自动驾驶决策方法
作者其他创作
大纲/内容
行为决策
概率方法
马尔可夫决策模型
部分可观测马尔可夫决策过程
基于粒子滤波估计智能驾驶员行为参数模型
描述观察数据之间依赖关系并估计其他车辆意图的概率图形模型
基于高斯过程的因素轨迹模型
基于价值的决策模型
该类模型定义了效用(utility)或价值(value)函数,根据某些准则属性定量地评估驾驶策略符合驾驶任务目标的程度,对于无人驾驶任务而言,这些准则属性可以是安全性、舒适度、行车效率等,效用和价值可以是由其中单个属性决定也可以是由多个属性决定。
连续状态层次贝叶斯转换模型嵌入 MDP 模型
基于知识的推理决策模型\t
分类
单步推理
基于规则
基于传统规则的推理
基于本体规则的推理
基于分布式表示
基于转移
TransE\t
缺点
1.处理1-n、n-1、n-n关系效果不明显
2.只考虑了三元组关系,没有考虑层级关系
3.没有考虑丰富的语义信息
4.只能在知识图谱上进行推理
5.参数选取与知识图谱独立,无法反应知识图谱的数据特点
6.没有考虑知识的时间约束
成熟、饱和、发展空间小、但多个实体竞争空间一个点的拥挤问题处于初期阶段
基于张量/矩阵分解
RESCAL
特点
准确率高
内存占用量大
计算速度慢
可解释性强
有一定发展空间,复杂度相对较低的方向
基于空间分布
基于神经网络
主要模型
NTN
ProjE
ConvE
还处于初期,其他领域的NN方法到KG的扩展,基于图结构的算法到LG的扩展
混合推理
混合规则与分布式表示
混合神经网络与分布式表示
方法
利用NN建模外部信息
利用NN建模知识图谱
DKRL
R-GCN/R-GCN+
RTJ
多步推理
基于规则\t
基于全局结构
PRA
时空
OpenKN
TDLP
引入局部结构
神经网络建模多步路径
神经网络模拟计算机或人脑推理
混合PRA与分布式表示\t
PtransE
混合规则与神经网络表示\t
Neural LP
方向
面向多元关系的知识推理
融合多源信息与多种方法的知识推理
基于小样本学习的知识推理
动态知识推理
大规模知识图谱的快速推理
封闭与非封闭
基于仲裁的决策方法
基于学习的决策
基于神经网络参数化的混合高斯模型预测车辆运动
逆强化学习(RL)是一种从专家演示中学习未知奖励函数的方法。
伴随未知知识奖励函数的马尔可夫决策
连续的逆最优控制,处理连续的状态和动作
最大熵深度逆强化学习框架
生成式对抗性模仿学习(直接从数据中提取策略)
状态机
有限状态机
特点:If-else-then 结构 ,简单易实现。但该类模型忽略了环境的动态性和不确定性,此外,当驾驶场景特征较多时,状态的划分和管理比较繁琐,多适用于简单场景下,很难胜任具有丰富结构化特征的城区道路环境下的行为决策任务。
基于规则的决策模型
多属性决策方法增强决策
多属性决策方法
多属性决策方法结合了层次分析法(AHP)及优劣解距离法(TOPSIS)
决策树\t
与状态机类似,通过自顶向下的“轮询”机制进行驾驶策略搜索
该类模型同样无法考虑交通环境中存在的不确定性因素。
0 条评论
回复 删除
下一页