关联数据入门小白适用
2022-04-21 17:05:41 0 举报
AI智能生成
关联数据入门知识汇总
作者其他创作
大纲/内容
起源
设想每一个资源都有一个独立的网址,都有一个唯一的标识,所有这些“资源”之间的关系都能从其标识所指引的地址里找到详尽的说明。这将是一个有序的世界
什么是关联数据
它希望在现有的万维网基础上建立一个映射所有自然、社会和精神世界的数据网络。
通过对大千世界万事万物及其相互之间关系进行机器可读的描述,使互联网进化为一个富含语义的、互联互通的知识海洋,从而使任何人都能够在更大范围内、准确、高效、可靠地查找、分享、利用这些相互关联的信息和知识。
通过对大千世界万事万物及其相互之间关系进行机器可读的描述,使互联网进化为一个富含语义的、互联互通的知识海洋,从而使任何人都能够在更大范围内、准确、高效、可靠地查找、分享、利用这些相互关联的信息和知识。
从技术上看
关联数据是在万维网上发布任何“资源”的一种方式。
资源
定义者
语义万维网
定义
任何有URI标识的东西
外延
信息资源
用以表达任何信息,通常以某种编码的文件形式而存在。
非信息资源
用以指代大千世界中的各类实体对象可以是自然界、人类社会以及
人类意识所创造的精神世界(概念、观念、抽象实体
等)的所有对象。
人类意识所创造的精神世界(概念、观念、抽象实体
等)的所有对象。
定义
维基百科
在计算机领域,关联数据描述了一种发布结构化数据的方法,使得数据能够相互连接起来,便于更好的使用。
中文核心期刊
关联数据是国际互联网协会(W3C)推荐的一种规范,用来发布和连接各类数据信息和知识。
W3C
当前的语义网技术(RDF,OWL,SKOS,SPARQL等)使得应用程序能够查询数据。为了是数据网络更加真实,需要将该网络上的巨大数据具有标准的格式,数据可达而且能够被语义网工具管理。更进一步,不仅需要能否获取到这些数据,而且需要知道这些数据之间的关系,创建一个数据网络。这些内部的数据集集合称作关联数据。
个人理解
语义网上的数据具有统一的数据格式(RDF,OWL等),能够被任意计算机获取到;
这些数据具有一定的关系,计算机能够理解并处理这些数据的关系。知道一部分数据就可以访问整个数据。
可以看成是语义万维网的一种简化实现。
创始人
蒂姆.伯纳斯-李(Tim Berners-Lee)
2006年7月提出
创建初衷
将WEB中没有进行关联的数据链接起来,构建可被机器理解的包含语义关系的数据网络。
功能
有助于知识保存、知识共享以及智慧服务。
是数字图书馆进行信息资源发布和服务的核心技术之一。
是互联网发展到语义网时代,对网上资源和数字对象进行"编目"和"规范控制"的基础性技术之一。
用来发布和联接各类数据、信息和知识
从目前研究开发项目看
一、提供“可信网络”的语义要素。
二、作为跨网域数据整合的通用 API。
有效地提高了数据的可查找性和可重用性
目的
构建一个互联的数据网络, 计算机拥有一部分数据即可访问整个网络数据。
基本原则
确定资源
在发布一个领域的数据之前,我们需要确定要发布的资源是什么。
任何事物,只要认为是有意义的,有被引用必要的,都可以称之为资源。
任何事物,只要认为是有意义的,有被引用必要的,都可以称之为资源。
资源标识
任何一个资源都用一个 HTTP URI(Uniform Resource Identifiers)来标识。
之所有要用 HTTP URI 来标识,是希望数据能够通过 HTTP 协议访问,真正实现基于Web的访问。
之所有要用 HTTP URI 来标识,是希望数据能够通过 HTTP 协议访问,真正实现基于Web的访问。
资源描述
资源可以有多种描述,例如 HTML,XML,RDF 以及 JPEG。
文档 Web 主要通过 HTML 格式来表示。
数据 Web 的数据主要通过 RDF格式来表示。
图片主要通过JPG格式来表示。
属性概括
使用 URI 作为任何事物的标识名称,不仅是标识文档;
使用 HTTP URI使任何人都可以参引 (dereference)这一全局唯一的名称;
当有人访问名称时,以 RDF 形式提供有用的信息;
尽可能提供链接,指向其他的 URI以使人们发现更多的相关信息。
主要用户
主要是指图书馆、网站、信息提供商之类的机构组织常被称为“信息中介”。
目前关联数据
应用系统的开发
应用系统的开发
关联数据仓储系统
将数据发布为面向网络的关联数据仓储。
关联数据服务系统
不同仓储的整合应用和互操作
二者兼有的系统
缺点/局限性
无法对封闭系统中的资源进行整合。
如果资源库不提供一定的开放接口,关联数据就无计可施。
实现
建立在 Web 技术之上
HTTP
HTTP 是服务器操作的指令规定了遇到各种请求(如 GET/PUT /POST/DELETE)服务器如
何响应怎么处理;
何响应怎么处理;
URL
本来作为在这个文件宇宙中定位具体的文件而用的,后来演变成兼具名称作用,从而连
同 URN 一起,统一作为 URI 的子类。
同 URN 一起,统一作为 URI 的子类。
HTML
HTML是存储在服务器端的网页文件将根据请求传送给浏览器
示意图
0 条评论
下一页