4.数字出版技术与标准
2017-01-07 16:07:37 0 举报
AI智能生成
数字出版技术与标准
作者其他创作
大纲/内容
信息技术概论
信息技术的定义:信息技术(Information Technology,简称IT),是主要用于管理和处理信息所采用的各种技术的总称,也常被称为信息和通信技术(Information and Communications Technology, ICT)。
信息技术的类型
硬件技术和软件技术
传感器技术、微电子技术、计算机技术、网络与通信技术、应用软件技术
信息采集技术、信息转换技术、信息处理技术、信息传输技术、信息压缩技术、信息存储技术、信息显示技术、信息播放技术等
信息技术的社会功能
信息产业成为带动经济增长的引擎
信息技术推动传统产业的技术升级
将信息技术嵌入到传统的机械、仪表产品中,促进产品智能化
计算机辅助设计技术、网络设计技术可显著提高企业的技术创新能力
利用计算机辅助制造技术或工业过程控制技术实现对产品制造过程的自动控制,可明显提高生产效率、产品质量和成品率
利用信息系统实现企业经营管理的科学化,统一整合调配企业人力物力和资金等资源,实现整体优化
利用互联网开展电子商务
信息技术促进人类文明的进步(文化的继承、传播与交流)
基础信息技术
计算机基础架构
一台完整的计算机由中央处理器(包括运算器和控制器)、存储器、输入设备、输出设备、(辅助设备)等部件构成。
中央处理器,又称中央处理单元,简称CPU。现在通常做在一块超大规模集成电路上,包括运算器和控制器
存储器又分为内存储器(简称内存)和外存储器二类。“内存”一般是由集成电路组成的,它的特点是速度快、存储信息的容量相对外存要小,关机(停电)时里面存储的信息会丢失。“外存”是指磁盘、光盘等设备,它们存储的容量比较大,关机时存储的信息也能保存。
输入设备是指用于输入信息的设备。如键盘、鼠标、扫描仪、手写板、摄像头。
输出设备是指用于输出信息的设备。如显示器、打印机、耳机、投影机。
辅助设备如电源、主板等
信息处理环境
操作系统
三大操作系统
Unix系统
定义:UNIX 是一个强大的多用户、多任务操作系统,支持多种处理器架构,按照操作系统的分类,属于分时操作系统。
特色
技术成熟、可靠性高、网络和数据库功能强、伸缩性突出和开放性好
可满足各行各业的实际需要,特别能满足企业重要业务的需要,已经成为主要的工作站平台和重要的企业操作平台。
Linux系统:Linux是一套免费使用和自由传播的类Unix操作系统,它主要用于基于Intel x86系列CPU的计算机上。这个系统是由世界各地的成千上万的程序员设计和实现的。其目的是建立不受任何商品化软件的版权制约的、全世界都能自由使用的Unix兼容产品。
MAC系统
Mac系统是苹果机专用系统,其架构与Windows不同,很少受到病毒的袭击。
MAC OSX操作系统界面非常独特,突出了形象的图标和人机对话(人机对话界面就是由苹果公司最早开创的,后来才被微软的Windows中广泛应用)。
Windows系统
微软(Microsoft)公司开发的“视窗”操作系统,是目前世界上用户最多、并且兼容性最强的操作系统。
其他操作系统
Google的 Chrome操作系统
基于Google Chrome网络浏览器开发的PC操作系统
Chrome操作系统(Google Chrome OS)是一个开放源代码的、精巧的操作系统,它最初会针对上网本。
快速、简便和安全是Chrome操作系统的核心特质,Google操作系统可运行于 x86 和 ARM 芯片
手机操作系统
Symbian S60操作系统
Windows Mobile
Palm
Android系统:Google于2007年11月5日宣布的基于Linux平台的开源手机操作系统。
iOS:苹果公司开发的操作系统,以Darwin为基础
应用软件
定义:执行高级任务及操作并产生对现实世界有用结果的程序
分类(按办公自动化规范来分)
同步计算:电子表格
存储、查找与检索:数据库
文本的处理:文字处理与排版
非文本处理:图像、设计、图像/声音处理
综合:财务软件包、内容/资产管理以及其他
财务软件
CAD计算机辅助设计
内容/资产管理
信息显示技术
位图
位图是使用像素阵列来表示的图像,每个像素的色彩信息由RGB组合或者灰度值表示。
根据颜色信息所需的数据位分为1、4、8、16、24及32位等,位数越高颜色越丰富,相应的数据量越大。其中使用1位表示一个像素颜色的位图因为一个数据位只能表示两种颜色,所以又称为二值位图。通常使用24位RGB组合数据位表示的的位图称为真彩色位图。
常见的位图文件格式:BMP、JPG、GIF
一个像素所能表达的不同颜色数取决于比特每像素(BPP,bit per pixel)。这个最大数可以通过取2的色彩深度次幂来得到
8 bpp:亦称为“8位色”
16 bpp:65,536色,称为高彩色,亦称为“16位色”
24 bpp:16,777,216色,称为真彩色,通常的记法为“1670万色”,亦称为“24位色”
32 bpp : 计算机领域较常见的32位色是在24位色基础上增加了8位灰度(亦称“灰阶”),因此32位色的色彩总数和24位色是相同的,32位色也称为真彩色
像素
像素由“图形要素”(picture element)的英文缩写而成。图形要素就是构成位图的行列矩阵上的一个点,不管它是显示在屏幕上还是在图形文件中。
每个像素可有各自的颜色值,可由三原色显示,因而又分成红、绿、蓝三中子像素(RGB色域),或者青、品红、黄和黑(CYMK色域,印刷行业以及打印机中常见)
照片是一个个采样点的集合,故而单位面积内的像素越多代表图像解析度越高,所显示的图像就会接近于真实物体。
分辨率
分辨率是度量位图图像内数据量多少的一个参数。通常表示成每英寸像素(Pixel per inch, ppi)和每英寸点(Dot per inch, dpi)。
包含的数据越多,图形文件的长度就越大,也能表现更丰富的细节。但更大的文件需要耗用更多的计算机资源,更多的内存,更大的硬盘空间等。
假如图像包含的数据不够充分(图形分辨率较低),就会显得相当粗糙,特别是把图像放大为一个较大尺寸观看的时候。所以在图片创建期间,我们必须根据图像最终的用途决定正确的分辨率。
以分辨率为1024×768的屏幕来说,即每一条水平线上包含有1024个像素点,共有768条线,即扫描列数为1024列,行数为768行。
图象分辨率(PPI)
图像分辨率指图像中存储的信息量
图像分辨率决定了图像输出的质量,图像分辨率和图象尺寸(高宽)的值一起决定了文件的大小,且该值越大图形文件所占用的磁盘空间也就越多。
图像分辨率以比例关系影响着文件的大小, 即文件大小与其图像分辨率的平方成正比。如果保持图像尺寸不变,将图像分辨率提高一倍,则其文件大小增大为原来的四倍。
设备分辨率(DPI)
设备分辨率(Device Resolution)又称输出分辨率,指的是各类输出设备每英寸上可产生的点数,如显示器、喷墨打印机、激光打印机、绘图仪的分辨率。
这种分辨率通过DPI来衡量,目前,PC显示器的设备分辨率在60至120DPI之间,打印设备的分辨率在360至2400DPI之间。某台打印机分辨率为360DPI,是指在用该打印机输出图像时,在每英寸打印纸上可以打印出360个表征图像输出效果的色点。
打印机分辨率的这个数越大,表明图像输出的色点越小,输出的图像效果就越精细。打印机色点的大小只同打印机的硬件工艺有关,与要输出图像的分辨率无关。
单色、灰度与彩色
灰度数字图像是每个像素只有一个采样颜色的图像。这类图像通常显示为从最暗黑色到最亮的白色的灰度,尽管理论上这个采样可以任何颜色的不同深浅,甚至可以是不同亮度上的不同颜色。
灰度图像与黑白图像不同,在计算机图像领域中黑白图像只有黑色与白色两种颜色;灰度图像在黑色与白色之间还有许多级的颜色深度。但是,在数字图像领域之外,“黑白图像”也表示“灰度图像”,例如灰度的照片通常叫做“黑白照片”。在一些关于数字图像的文章中单色图像等同于灰度图像,在另外一些文章中又等同于黑白图像。
电子显示技术
CRT阴极射线管
液晶显示器,LCD
触摸显示屏(Touch panel ,Touchscreens)
电子墨水(El-Ink)
电子墨水其实是一种新型材料,它是化学、物理学和电子学多学科发展的产物,这种材料可被印刷到任何材料的表面来显示文字或图像信息。
目前实现电子纸技术的途径主要包括有胆固醇液晶显示技术、电泳显示技术(EPD)以及电润湿显示技术等。其中以电泳显示技术为最有前途的技术途径。
数据存储技术
存储介质
磁介质
光介质
混合介质
磁盘存储
固定磁盘
可移动硬盘
U盘
光盘存储
只读型光盘
可记录型光盘
磁带存储
磁带是一种用于记录声音、图像、数字或其他信号的载有磁层的带状材料,是产量最大和用途最广的一种磁记录材料。
磁带按用途可大致分成录音带、录像带、计算机带和仪表磁带四种。
信息通信技术
本地设备通信
通信信道:串行通道;并行通道
通信标准:RS-232,主要用于打印机/USB,通用串行总线/SCSI,用于磁盘/FiveWire,用于苹果机
网络通信
局域网(Local Area Network),简称LAN,是指在某一区域内由多台计算机互联成的计算机组。
广域网(Wide Area Network),简称WAN,是一种跨越大的、地域性的计算机网络的集合。
网络拓扑:网络中多台计算机和网络设备相互连接的总体布局方式。
互联网(Internet)又称因特网和英特网,是网络与网络之间所串连成的庞大网络,这些网络以一组通用的协定相连,形成逻辑上的单一巨大国际网络。
万维网(WWW、World Wide Web)
WWW是一个资料空间。在这个空间中所有资源由一个全域“统一资源标识符”(URL)标识。这些资源通过超文本传输协议(Hypertext Transfer Protocol:HTTP)传送给使用者,使用者通过点击链接来获得资源。
互联网并不等同万维网(World Wide Web),万维网只是一建基于超文本相互链接而成的全球性系统,且是互联网所能提供的服务其中之一。其他服务还包括文件传输(FTP)、电子邮件(E-mail)、远程登录(Telnet)等.
网络通信原理
客户机/服务器工作模式:用于本地处理机与远程资源之间的信息交换。
网络通信协议——TCP/IP协议
TCP/IP是Transmission Control Protocol/Internet Protocol的简写,中文译名为传输控制协议/网际协议,又叫网络通讯协议,这个协议是Internet最基本的协议。TCP/IP 定义了电子设备(比如计算机)如何连入因特网,以及数据如何在它们之间传输的标准。
IP地址是是一种逻辑的地址结构。IP地址用于确定网络中的主机,每台主机在网络中都有唯一的IP地址。
网络接入技术(Internet接入技术)
是用户与互联网间连接方式和结构的总称。
根据接入后数据传输的速度,Internet的接入方式可分为宽带接入和窄频接入。
数字出版专用技术
页面描述语言PDF
PostScript
PostScript的优点
PostScript可以描述文本、图形和整个页面,当时大部分电脑图形语言都只能描述文本、图形或页面的几何排列。
PostScript不依赖于特定的设备,它可以在很多设备上工作。
Adobe公司公开了PostScript语言的规范,并依靠授权费获得高额收益。
PostScript被很多优秀的排版软件支持,如PageMaker、QuarkXPress等,并且拥有能够控制高质量打印的能力。
PDF
定义:便携式文件格式(Portable Document Format),是由Adobe 公司在1993年发展出的用于文件交换的一种文件格式。
优点:跨平台、能保留文件原有格式、开放标准、自由开发
技术组成
衍生自PostScript
字型嵌入系统,可使字型随文件一起传输
资料压缩及传输系统
PDF与Postscript的异同
相同点:PDF和PostScript有相同的成像模式,也是一种页面描述语言,可以与PostScript自由转换。打印时,两者的输出效果相同。
不同点
PostScript包括PDF没有的通用编程语言框架。
PDF有PostScript不具备的特色,如注释、转换和导航
PostScript文件必须作为一个整体进行处理,如第五页信息可能嵌与第一页中,而PDF文件的页面是独立的,任何一页都可以独立操作,不需要参考其他页面
PDF支持“重排”功能,这使得使用PDA浏览 PDF文档时,十分方便。
PDF最初被设计为适用于文档电子版,所以支持超链接、附件、声音和视频
PDF还支持用户自定义的动作
标准通用标记语言SGML
定义:标准通用标记语言SGML是一种定义电子文档结构和描述其内容的国际标准语言; SGML是所有电子文档标记语言的起源,早在万维网发明之前“SGML”就已存在。
特点
正式的,能允许验证文档的正确性
结构化的,能够处理复杂的文档
可扩充的,能够支持大型信息存储的管理
标记的类型
“程序性的标记”,用来描述文档显示的样式
“描述性标记”,用来描述文档中的文字的用途
优缺点
优点
高稳定性
高可携性(SGML文件可以跨平台使用)
高完整性
文档可以更合理地使用,从而导致一种改进的生命周期
出版成本减少
信息可以很容易地重用
缺点
高复杂性
费用昂贵
标准体系
第一层次是元语言标准SGML
第二层次是基础标准,如:文档样式语义与规范语言标准(外语首字母缩写词:DSSSL)等,是该体系的基本标准
第三层次是具体应用标准,如:HTML等标准。也就是说,在XML标准出现之前,SGML标准已经形成了完善的体系,并有许多建立于其上的应用系统与应用标准。
超文本标记HTML
超文本的定义:超文本(Hypertext)是用超链结的方法,将各种不同空间的文字信息组织在一起的网状文本。
超文本的格式:目前最常使用的是超文本标记语言(Hyper Text Markup Language,HTML)及富文本格式 (Rich Text Format,RTF)。
HTML 4.0倡导的两个理念将HTML语言推向新高度
将文档结构和显示样式分离
更广泛的文档兼容性
HTML文档的组成部分
HTML 文档由标签和元素组成
HTML 标签是用来标记 HTML 元素的
HTML 标签被 < 和 > 符号包围。
HTML 标签是成对出现的。例如 <b> 和 </b>。
位于起始标签和终止标签之间的文本是元素的内容。
HTML 标签对大小写不敏感,<b> 和 <B> 的作用的相同的。
HTML文本编辑器
基本编辑软件:WINDOWS自带的记事本或写字版,以及WPS
半所见即所得软件:如HOTDOG和国产的软件网页作坊
所见即所得软件:如FRONTPAGE98,DREAMWEAVER
CSS(Cascading Style Sheets)层叠样式表
定义:CSS语言也是一种标记语言,它不需要编译,可以直接由浏览器解释执行(属于浏览器解释型语言).在标准网页设计中CSS负责网页内容(XHTML)的表现.
采用CSS+DIV进行网页重构相对与传统的TABLE网页布局而具有以下4个显著优势
表现和内容相分离
提高页面浏览速度
易于维护和改版
使用div+css更符合现在的W3C国际标准
HTML的缺陷
HTML将数据与表现格式集中在一起而且侧重于数据表现形式的描述,表现过于简单,无法处理很多科技符号和公式
对信息语义及其内部结构的描述偏弱,HTML仅仅描述浏览器如何在页面上布置文字、图片等内容,但不揭示这些信息的具体含义,所以不适合网络资源的整合和机器自动化识别
扩展性差,HTML的标签是有限的,不允许用户自定义标签。
链接容易断,链宿地址改变后,链源不能自动纠正
可扩展标记语言XML
定义:XML(Extensible Markup Language)与HTML一样,都是SGML(Standard Generalized Markup Language,标准通用标记语言)。是Internet环境中跨平台的,依赖于内容的技术,是当前处理结构化文档信息的有力工具,也是数字出版的基础技术。
XML会取代HTML吗?
XML是数字出版和网络出版最基本的技术之一。它超越了HTML,但不能取代HTML
实际上XML最普遍的使用就是转化为HTML,以便在网上发布。这意味XML是一个数据封装、传输和交换标准,而非一个良好的数据展示标准。
XML并不会取代HTML,两者的应用目的并不相同。HTML主要用于网页显示,而XML主要用于数据包装和定义。
将XML转换为HTML也是一种常见的操作。在日常应用过程中,我们通常将XML文件转换为HTML以便于显示在客户端
今后很长一段时间内,HTML都会与XML同时存在,各司其职。
XML与SGML
XML和SGML是两种独立的标准。
SGML是ISO的标准,XML不是ISO的标准。
如何理解XML?
XML是一种元语言
XML不是一个标签集合或“标记词汇表”,而是定义和使用标签集的方式,是创造和执行各种标记表的方式。
XML为创建标记方案提供了定义恰当、广为接受的语法,以满足不同情景的需要。
XML作为一种非专有标准,它使得按照方案标记的内容不需要任何专门的工具或软件就可以被解译
XML是一个标准家族
XML既指可扩展标记语言,也指围绕它开发的整个相关标准家族。
可扩展样式语言XSL包括:XSLT和XSL-FO。XML路径语言XPath,XML指向语言XPoint,XML链接语言XLink。
XML的优点
XML文档的内容和结构完全分离
互操作性强。纯文本文件可以方便地穿越防火墙,在不同操作系统上的不同系统之间通信。
规范统一。XML具有统一的标准语法,可跨平台跨系统。
支持多种编码。方便了多语言系统对数据的处理
可扩展性。可以根据XML的基本语法来进一步限定使用范围和文档格式,从而定义一种新的语言。
XML在出版领域中的应用
开放电子书出版结构(OeBPS):XML在出版领域最广泛的应用,是一种基于XML的用来在电子书中标记和组织文件的标准
CrossRef:科技出版中的一个应用,是一种出版商交互链接服务标准。
ONIX是一种销售书籍的元数据标准,正在使用XML实现。
MathML是一种标记数学的基于XML的方法
SVG(可缩放矢量图形),SOAP(简单对象访问协议)等多种标准都是基于XML的。
XML系统的基本组成
一个基本的XML系统由XML文档编辑器、XML文档、文档类型定义(DTD或XML schema)、XML解析器和XML应用程序组成。
在XML基本系统中,文档类型定义DTD用于描述XML文档中的数据组织存放格式,包括文档结构和数据结构,使用者应根据DTD的规定编辑XML文档;
而XML解析器根据DTD对XML文档进行解析成层次型的逻辑数据,这时所有的元素、属性、实体和注释都被看做对象,即以文档对象模型DOM的方式给应用程序提供访问接口,把相应的对象传给处理、引用或显示这些对象的应用程序。
XML文档的结构
逻辑结构
一个XML文档在逻辑结构上由声明、元素、注释、字符引用以及处理指令组成。
XML文档通常以一个XML声明开始,通过其元素来组织数据。
元素包括标记和字符数据。
为了更加方便、清晰地组织数据,在字符数据中可引入CDATA数据块,用于文档的注释。
另外,XML文档中可以包含处理指令,用于对XML处理程序提供指示信息。
物理结构
从物理结构上讲,XML文档是由一个或多个存储单元构成的,这些存储单元成为实体。
一个实体由实体名称和相应的内容构成。
所有的XML文档都包含一个“文档实体”,指的是整个文档的内容,是XML语法分析器处理的起点。
其他实体都用名称来标识,在文件类型定义DTD中给出定义。
DTD (Document Type Definition)文档类型定义
DTD 是一套关于标记符的语法规则。它是XML1.0版规格的一部分,是XML文件的验证机制,属于XML文件组成的一部分。
DTD 是一种保证XML文档格式正确的有效方法,可以通过比较XML文档和DTD文件来看文档是否符合规范,元素和标签使用是否正确。一个DTD文档包含:元素的定义规则,元素间关系的定义规则,元素可使用的属性,可使用的实体或符号规则。
XML文件提供应用程序一个数据交换的格式,DTD正是让XML文件能够成为数据交换的标准,因为不同的公司只需定义好标准的DTD,各公司都能够依照DTD建立XML文件,并且进行验证,如此就可以轻易的建立标准和交换数据,这样满足了网络共享和数据交互。
DTD文件是一个ASCII的文本文件,后缀名为.dtd。
每一个XML文档都可携带一个DTD,用来对该文档格式进行描述,测试该文档是否为有效的XML文档。既然DTD有外部和内部之分,当然就可以为某个独立的团体定义一个公用的外部DTD,那么多个XML文档就都可以共享使用该DTD,使得数据交换更为有效。甚至在某些文档中还可以使内部DTD和外部DTD相结合。在应用程序中也可以用某个DTD来检测接收到的数据是否符合某个标准。
对于XML文档而言,虽然DTD不是必须的,但它为文档的编制带来了方便。加强了文档标记内参数的一致性,使XML语法分析器能够确认文档。如果不使用DTD来对XML文档进行定义,那么XML语法分析器将无法对该文档进行确认。
XML Schema
定义:XML Schema 是基于 XML 的 DTD 替代者。XML Schema 可描述 XML 文档的结构。XML Schema 语言也可作为 XSD(XML Schema Definition)来引用。
功能
定义可出现在文档中的元素
定义可出现在文档中的属性
定义哪个元素是子元素
定义子元素的次序
定义子元素的数目
定义元素是否为空,或者是否可包含文本
定义元素和属性的数据类型
定义元素和属性的默认值以及固定值
XML文档的外观定义方式有三种
将XML转换成HTML。通过Script将XML转换成HTML,适应不同的出版要求。
使用CSS。CSS是专门为HTML设计的样式表语言,但也可以定义XML的展示格式。
使用XSL。XSL是专门为XML设计样式表语言,有更强的能力和通用性
XSL 指扩展样式表语言(EXtensible Stylesheet Language)。它不仅仅是样式表语言,它包括三部分:
XSLT——一种用于转换 XML 文档的语言。
XPath——一种用于在 XML 文档中导航的语言。
XSL-FO——一种用于格式化 XML 文档的语言。
CSS与XSL的区别
字符与编码
ASCII是“美国信息交换标准编码”的英文字头缩写,可称之为“美标”。美标规定了用从0到127的128个数字来代表信息的规范编码,其中包括33个控制码,一个空格码,和94个形象码。
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。XML是以Unicode为基础的。
转换XML文件
使用文字编辑器的人工转换。为了实现特定的出版目的,编辑可以使用多种XML编辑器对XML文档进行二次排版编辑。
使用脚本转换。人工大量转换固定格式的XML文档费时费力,为了加快转换速度,用户可以利用VBscript、Javascript、Perl和Python等语言编写小型脚本程序处理XML文档,进行批量转换。
使用XSLT,XSL转换。XSL 指扩展样式表语言,XSLT 指 XSL 转换。XSLT 用于将一种 XML 文档转换为另外一种 XML 文档,或者可被浏览器识别的其他类型的文档,比如 HTML 和 XHTML。通常,XSLT 是通过把每个 XML 元素转换为 (X)HTML 元素来完成这项工作的。通过 XSLT,你可以向或者从输出文件添加或移除元素和属性。您也可重新排列元素,执行测试并决定隐藏或显示哪个元素等等。
示例
数字出版专用标准
类型
一、结构与标记标准(JATS、BITS)
二、标识符标准(DOI、ISBN、ISNI、ORCID、I2、RFID、ISSN、ISLI)
三、资源描述与分类标准(MARC、ONIX、THEMA)
四、内容表示标准(ePub 、DAISY )
五、参考与链接标准(CrossRef、OpenURL)
六、保存标准(PREMIS)
七、多媒体内容标准(MPEG7、MPEG21)
DOI(数字对象标识符)
定义:DOI是网络文件的一个永久性识别符,用来标识在数字环境中的内容对象。DOI可以用来揭示有关该数字对象的一些信息,包括从Internet哪里可以找到它。随着时间推移,数字对象的某些有关信息可能会有变化(包括从哪里可以找到它),但是DOI不会改变。
交叉引用链接(CrossRef)
定义:CrossRef是一个基于DOI(Digital Object Identifier)实现文献引文跨出版社服务平台链接的参考链接服务系统。
CrossRef 提供了一个链接的商业基础——一旦和CrossRef签订协议,就意味着和CrossRef所有的会员签订协议,CrossRef提供了一个统一的平台,使得最小的出版社也能够轻易的链接至最大的出版社,从而提升在线阅读的体验。
CrossRef使用权益
链接持久性:与URL链接不同,即使在内容迁移或所有权变更的情况下,DOI仍能继续保持链接。
内容可见性:CrossRef通过提高目标链接能力及链接的便捷性,将流量导向目标内容。
集中化链接协议:只需与CrossRef签订单独协议,无需与所有出版商一一签订协议
OpenURL集成:CrossRef 会员出版物通过DOI标识自动启用OpenURL。
附加值:网络链接丰富了终端用户经验、丰富了学术研究过程及出版资源的利用。
内部及外部链接:用户一旦将内容注册到CrossRef,就可以使用DOI标识进行用户平台内部链接。
CrossRef的工作方式
目前,CrossRef提供的链接服务包括从文献的参考文献链接到摘要或者全文。
一篇文献的引文(或参考文献)原文如果有网络版并注册了DOI,用户就可以利用引文中设置的CrossRef链接按钮直接链接到引文所在的出版社网页,获得引文文摘信息,如果图书馆从出版社订购了该网络版期刊,读者将可以由此打开引文全文。
CrossRef的工作原理
CrossRef如何建立链接
首先要加入CrossRef。会员出版社必须为每篇在线出版的文章指定一个DOI,然后所有会员社把文章的元数据与他们的DOIs一起呈交给中央CrossRef数据库。一旦提交了元数据,每个会员社就可以对他们出版物中的被引用文献提出交叉引用链接的要求了。
CrossRef包含所有会员社的元数据,当CrossRef的一个条目与被请求的引文匹配时,一个DOI就会被返回来与之建立链接。
CrossRef的链接要求
首先,保证把所有出版的文章的元数据提交给CrossRef,对于杂志文章,元数据包括:文章标题、作者、杂志名称、杂志字体、电子书号、发行日期、发行量、期刊号、页数。
其次,出版社应详尽标识引文,以便在被请求交叉链接的时候,能够从数据库中找到该引文。通常作者的名字、杂志名称、发行年份等信息应该在引文的XML版本里标出。
CrossRef的工作过程
用户使用CrossRef功能
用户点击文章参考文献上的CrossRef按钮或标识,将该引文的DOI发送给CrossRef数据库,从中找到该DOI对应的文章的最新的URL,并转向到该URL地址,如果用户拥有该文章的全文索取权,就可以在浏览器上看到该文章的全文,否则只能浏览到该引文的摘要。
OpenUrl
简介:OpenURL定义了一种在WEB服务之间传递信息的机制,是一套应用于WEB上超链接的标准陈述语法,由一组已定义好的标识组成。网络上的各个数据库出版商只要遵照此机制,就可以解析信息提供源(Source)所传送的要求,而信息提供者(Target)也可经由此规范,对服务提供者送出深度链接服务的要求。
OpenUrl与传统链接的区别
(1)上下文相关性
传统链接:传统的链接目标是预先定义好的、静态的、直接指向目标,因此是上下无关的。
OpenURL:OpenURL链接是一个挂接点,将当前的上下文环境提交给链接服务器,由链接服务器动态计算出目标链接、与使用者的需求是相关的,因此是上下文相关的。
(2)灵活性
传统链接:传统链接描述的是具体目标,往往是一对一,其结果受链接源限制,不能实现一次性对多个数据源的统一检索。
OpenURL:在OpenURL方式中,通过链接服务器可将服务类型进行扩展、可实现一次性对多个数据源的统一检索。
(3)可维护性
传统链接:传统链接方式中,一旦目标发生变化,每个链接点都要进行更新维护,若维护人员未能及时更新,往往造成许多失效链接,因此传统的链接方式维护工作量比较大。
OpenURL:OpenURL方式中由于链接服务器是根据元数据动态产生目标链接的,只要目标的基本URL不发生改变,内部数据的变动不会影响链接的准确性,因此,大大减少了维护的工作量。
OpenURL举例
例 A.1. 针对期刊论文
要向链接服务器地址为http://www.wanfangdata.com.cn/OpenUrl/Periodical.aspx提出论文题名为“Chemistry”,日期为“1975”的查询,其OpenURL为:http://www.wanfangdata.com.cn/OpenUrl/Periodical.aspx?title=Chemistry&date=1975。其中:
BASE-URL(基础URL):http://www.wanfangdata.com.cn/OpenUrl/Periodical.aspx。
QUERY(查询):title=Chemistry&date=1975。
例 A.2. 针对学位论文
要向链接服务器地址为http://www.wanfangdata.com.cn/OpenUrl/cddb.aspx提出论文题名为“Feminist”的查询,其OpenURL为:http://www.wanfangdata.com.cn/OpenUrl/cddb.aspx?title=Feminist。其中:
BASE-URL(基础URL):http://www.wanfangdata.com.cn/OpenUrl/cddb.aspx。
QUERY(查询):title=Feminist。
0 条评论
下一页