知识图谱(Knowledge Graph)
2024-04-02 16:49:59 57 举报
AI智能生成
知识图谱框架思维导图 知识图谱是一种以图表示的形式,用于描述实体(例如人、地点、事物等)及其关系的数据结构。它以节点(代表实体)和边(代表实体之间的关系)的形式表示信息,使得我们能够更好地理解和探索复杂的数据集。知识图谱的应用广泛,包括搜索引擎、推荐系统、数据分析等领域。例如,在搜索引擎中,知识图谱可以帮助我们理解用户的查询,从而返回更精确的搜索结果。同时,知识图谱还可以通过连接不同领域的数据,提供更全面的视图,有助于深度理解和分析复杂的问题。
作者其他创作
大纲/内容
实体特征
基础搭建
图谱构建Pipeline
评估机制
图存储查询引擎
图学习平台
实体(Entity)
提及(Mention)
知识抽取
命名实体识别(Named Entity Recognition)
基于规则的实体识别
通过规则从文本序列中识别专有名词
通过规则将专有名词分类
预定义的类别
基于机器学习的实体识别
基于监督训练的实体识别
隐马尔科夫模型(HMM)
条件随机场(CRF)
支持向量机(SVM)
最大熵马尔科夫模型(MEMM)
缺点:性能条件
共指消解
基于聚类的实体消歧
基于词袋模型的方法
基于语义特征的方法
基于社交网络的方法
基于维基百科的方法
缺点:歧义实体目标不明
基于实体链接的实体消歧
通过维基百科以及上下文信息发现候选实体
根据指称项和候选实体之间的相似性等特征,确定最后的目标实体
术语抽取
关系抽取
基于监督学习的方法(机器学习方法)
基于特征向量的方法
预先定义好关系的类别
人工标注一些数据
设计特征表示,特征向量的构建
选择分类器(SVM、最大熵NN、朴素贝叶斯)
评估方法
基于核函数方法
基于神经网络的方法
基于卷积神经网络的方法
基于循环神经网络的方法
基于半监督学习的方法
基于模板的bootstrapping方法
根据种子文件来学习模板
对学习出来的模板进行选择
实体抽取
缺点:难以维护、可移植性差、模板有可能需要专家构建
基于依存分析的Pattern
依存分词器分析句子结构
匹配规则,符合规则的依存树子树生成三元组
三元组按规则扩展
三元组评价
基于触发词的Pattern
基于弱监督学习的方法
远程监督学习
从知识库中抽取存在关系的实体对
从非结构化文本中抽取含有实体对的句子作为训练样例
Bootstrapping
从文档中抽取出包含种子实体
将抽取出的Pattern去文档集中匹配
根据Pattern抽取出的新文档如种子库,迭代多轮直到不符合条件
基于无监督学习的方法
聚类
将实体之间的上下文特征抽取出来
计算上下文相似度
基于此对实体对进行聚类以及标记
事件抽取
pipeline方法
联合训练
歧义消除
知识融合
实体对齐(事件抽取?)
基于动态多池化卷积神经网络的事件抽取方法(Dynamic CNN)
词向量学习
词汇级特征抽取
句子级特征抽取
分类输出
Entity Linking(实体链接)
粗排
基于词典
基于模糊匹配
基于词向量
细筛
提取特征
建模
获得最佳实体项
局部实体链接分数
子主题
全局实体链接分数
技术前沿进展
引入词汇/短语的分布式表征
引入更多外部知识
转化为序列标注问题(端到端)
槽填充
实体指称识别
知识更新
知识补全
知识推理
知识表示
表示学习
0 条评论
下一页