首页  思维导图  详情

行为决策

2021-03-18 17:35:38   0  举报





AI智能生成

目前所有的自动驾驶决策方法

自动驾驶，无人车

规划决策

智能决策

预测决策

知识管理

作者其他创作

大纲/内容

概率方法

马尔可夫决策模型

部分可观测马尔可夫决策过程

基于粒子滤波估计智能驾驶员行为参数模型

描述观察数据之间依赖关系并估计其他车辆意图的概率图形模型

基于高斯过程的因素轨迹模型

基于价值的决策模型

该类模型定义了效用（utility）或价值（value）函数，根据某些准则属性定量地评估驾驶策略符合驾驶任务目标的程度，对于无人驾驶任务而言，这些准则属性可以是安全性、舒适度、行车效率等，效用和价值可以是由其中单个属性决定也可以是由多个属性决定。

连续状态层次贝叶斯转换模型嵌入 MDP 模型

基于知识的推理决策模型

分类

单步推理

基于规则

基于传统规则的推理

基于本体规则的推理

基于分布式表示

基于转移

TransE

缺点

1.处理1-n、n-1、n-n关系效果不明显

2.只考虑了三元组关系，没有考虑层级关系

3.没有考虑丰富的语义信息

4.只能在知识图谱上进行推理

5.参数选取与知识图谱独立，无法反应知识图谱的数据特点

6.没有考虑知识的时间约束

成熟、饱和、发展空间小、但多个实体竞争空间一个点的拥挤问题处于初期阶段

基于张量/矩阵分解

RESCAL

特点

准确率高

内存占用量大

计算速度慢

可解释性强

有一定发展空间，复杂度相对较低的方向

基于空间分布

基于神经网络

主要模型

NTN

ProjE

ConvE

还处于初期，其他领域的NN方法到KG的扩展，基于图结构的算法到LG的扩展

混合推理

混合规则与分布式表示

混合神经网络与分布式表示

方法

利用NN建模外部信息

利用NN建模知识图谱

主要模型

DKRL

R-GCN/R-GCN+

RTJ

多步推理

基于规则

基于全局结构

PRA

时空

OpenKN

TDLP

引入局部结构

基于分布式表示

基于神经网络

神经网络建模多步路径

神经网络模拟计算机或人脑推理

混合推理

混合PRA与分布式表示

PtransE

混合规则与分布式表示

混合规则与神经网络表示

Neural LP

方向

面向多元关系的知识推理

融合多源信息与多种方法的知识推理

基于小样本学习的知识推理

动态知识推理

大规模知识图谱的快速推理

封闭与非封闭

基于仲裁的决策方法

基于学习的决策

基于神经网络参数化的混合高斯模型预测车辆运动

逆强化学习(RL)是一种从专家演示中学习未知奖励函数的方法。

伴随未知知识奖励函数的马尔可夫决策

连续的逆最优控制，处理连续的状态和动作

最大熵深度逆强化学习框架

生成式对抗性模仿学习(直接从数据中提取策略)

状态机

有限状态机

特点：If-else-then 结构，简单易实现。但该类模型忽略了环境的动态性和不确定性，此外，当驾驶场景特征较多时，状态的划分和管理比较繁琐，多适用于简单场景下，很难胜任具有丰富结构化特征的城区道路环境下的行为决策任务。

基于规则的决策模型

多属性决策方法增强决策

多属性决策方法

多属性决策方法结合了层次分析法（AHP）及优劣解距离法(TOPSIS)

决策树

与状态机类似，通过自顶向下的“轮询”机制进行驾驶策略搜索

该类模型同样无法考虑交通环境中存在的不确定性因素。

 收藏

立即使用

行为决策

刘明众Lion

职业：硕士

去主页





0 条评论

下一页

为你推荐

查看更多

