DOI:国际化的数字对象标识符

ISO近期以100%的赞成率投票通过了一项新的国际标准ISO 26324:数字对象唯一标识符(Digital Object Unique Identifier),简称DOI标识。DOI由统一资源定位符URL演变而来,为网络环境下的信息资源实体确定唯一的标识规则。

ISO国际标准化组织是成立于1947年2月的全球性非政府组织,总部设在瑞士日内瓦。ISO标准的制修订工作由各技术委员会负责,ISO/TC46第46技术委员会是信息与文献技术委员会,负责制定和推广与信息和文献工作相关的国际标准,DOI标准由ISO/ TC46的分技术委员会SC9(标识与描述)归口管理。除DOI标准外,技术委员会还负责国际标准书号ISBN、国际连续出版物号ISSN和国际标准音像号ISAN等标准的制修订工作。

在信息化时代,数据和信息本身的价值往往比作为载体的管理信息系统更重要。在DOI出现前,大量有价值的数据因知识产权得不到保护而不愿共享。此外,很多具有研究和使用价值的数据由于缺乏统一标识规范,常会造成无序的引用和歧义。针对上述问题,数字对象唯一标识DOI通过构建数据资源标识方法,为数据提供注册、解析和查询途径,在推动数据资源共享的同时为数据的网络传播提供版权信息。

DOI标识编码由前缀和后缀两部分组成,中间用/分割。为满足可扩展的数据资源编码需求,DOI没有限制前缀和后缀的字符长度。DOI前缀由目录代码和登记机构代码两部分组成,所有DOI代码目录定义为10.,即DOI 代码均以10.开头。登记机构代码通过向国际DOI基金会(IDF)申请获得。登记机构代码的分配根据信息资源编码需求制定,如出版商可为其所有数字出版物申请统一前缀,也可以为数字图书、音像制品等各类出版物申请不同前缀。DOI 后缀是在特定前缀下的唯一标识,由登记机构分配并确保其唯一性。后缀可以是任何字母或数字编码,如机器码、ISBN 或ISSN等已有规范码,具体编码方案由登记机构设定。根据编码规则,DOI数据资源命名规范通常定义为:统一前缀/类型标识.机构名.内部标识码.扩展码的形式。

目前国外ElsevierBlackwellSpringerJohn Wiley等大型数字资源提供商已开始使用DOI对其出版的电子文献和数字内容进行标引,帮助基础性数据资源的快捷获取和灵活引用,同时为了便于数字资源的共享与交换,DOI登记机构还会在唯一编码基础上提供数据资源的命名、注册、解析、查询和变更等管理功能。DOI能够实现资源实体的永久性标识,便于数字资源的归档与检索。目前专业的DOI检索站点 CrossRef已与Google搜索技术结合,在DOI检索过程中提供数字文档的全文检索,为用户建立检索结果到数字文献全文间的获取通道。

由于DOI标识的唯一性、持久性、兼容性、互操作性、动态更新等特点,在正式成为ISO标准后,必将会在信息资源标识引用过程中起到越来越重要的基础性作用。

本文曾发表于《程序员》杂志-2011年01期”程序天下事”栏目。