科研人员需要了解的DataCite

公告事项,期刊投稿

随着数字出版和在线期刊的发展,为了摆脱URL(Uniform Resource Locator,统一资源定位符,又称网页网址)频繁出现的失效死链缺点,出版业推出了DOI(digital object identifier,数字对象标识符)集中注册管理技术。全球有两家最大的DOI代理注册机构,即Crossref(过去记为CrossRef)和DataCite。它们的共同功能是在不同的出版商网站之间实现参考文献引文链接,以及数据的跨数据库共享。关于DOI和Crossref,过去有专文介绍。

本文简介DataCite的起源和功能,以及它与Crossref在科学数据管理等方面的不同之处。
 
chuttersnap-Zf64Osndqvc-unsplash
 

DataCite的起源

DataCite是一家于2009年在英国成立的国际非盈利组织,由多家机构联合发起,包括英国大英图书馆、丹麦技术信息中心、荷兰代尔夫特理工大学图书馆、加拿大国家研究委员会科学技术信息研究所、美国加利福尼亚数字图书馆、美国普渡大学、德国国家科学技术图书馆等。DataCite的服务目的包括:为科学数据创建元数据(metadata)集,为用户分配DOI,增强数据搜索能力,与会员共同建立共享数据库和高效引用机制。

 

DataCite的会员单位和用户单位

DataCite不同于Crossref的一个重要方面是加盟成员分为会员(member)和用户(user)两个级别。DataCite的会员目前包括来自四十多个国家的250多家单位,包括数据中心、图书馆、政府机构、研究型大学、大型出版商等。DataCite的功能运作是依靠这些会员的管理职能来实现的。DataCite的重要决策由会员共同投票决定。DataCite的会员申请对所有愿意分享数据的组织开放。在吸纳新的会员机构时,需要通过DataCite会员委员会的投票同意。会员职责包括为其用户的数据分配DOI、存储和交换元数据、解析DOI返回引文网页网址等。因此,DataCite的会员实际是它旗下的一个代理管理机构。与之不同的是,Crossref的会员(member)就是用户(user),不予区分,例如小型期刊出版商。小型期刊出版商在DataCite里一般是用户,而不是比用户高一级的会员。

在DataCite官网公布的会员网页上能够看到,Crossref是DataCite的一个会员。还可以看到Clarivate Analytics、F1000 Research Ltd.、Elsevier(Mendeley Data)、SAGE Publishing、IEEE、ORCID、ResearchGate、世界银行(World Bank)等数据库、出版商和学术服务机构也是DataCite的会员。DataCite目前在中国有四家会员,包括北京大学、清华大学、中国国家基因库(China National GeneBank)、中国散裂中子源(China Spallation Neutron Source, IHEP)。

DataCite的会员所管理的用户包括出版商、数据中心、图书馆、政府机构、档案馆、大学、研究机构等。这些用户有注册DOI和分享数据的需求。DOI的号码前缀由DataCite分配给会员机构,然后由会员机构授权给用户使用。DOI的号码后缀由用户自行制定,或者由会员提供自动分配服务,并保证唯一性。

 

DataCite的元数据搜索功能

DataCite为用户的数据资源(例如期刊论文)分配DOI号码,存储管理元数据(metadata),解析DOI号码以提供引文的网页网址。其中,元数据搜索(DataCite Metadata Search)是一个重要的数据检索工具,用户能够通过搜索数据集在DataCite上注册的关键词、日期、位置等元数据查找数据集。元数据搜索提供简单检索和高级检索两种检索方式。在简单检索方式中,用户只需输入DOI或相关元数据,如题名或主题作为检索词。在高级检索方式中,用户可以从DOI、标题、创建者、出版者、贡献者、格式、主题、日期等13个字段中选择一个或几个进行检索,同时还能够根据数据中心、资源类型和语言等进行检索过滤。

 

DataCiteCrossref的区别

有些用户可能会疑惑,在DataCite和Crossref这两家机构中,应该加入哪一家?Crossref的很多成员的重点是出版业务。DataCite的很多成员的重点是管理数据存储库。另外,除了上述在会员和用户级别方面的区别,这两家机构在服务内容方面也存在一些区别。

Crossref提供以下服务:

  • DOI注册。
  • 参考文献链接(Reference Linking):这项服务能够使读者从参考文献的DOI链接点击跳往引文的全文网页。
  • 被引统计(Cited-by):这项服务显示论文的被引用次数和引用它的文献的链接网页。
  • 查重(Similarity Check):这项服务能够帮助编辑检查剽窃问题。

DataCite提供以下服务:

  • DOI注册(DOI Fabrica):这个功能与Crossref的类似。
  • 链接检查(Link checker):自动检查注册的DOI号码,确保链接正确。
  • 数据引用指标(Data metrics badge):在成员网站针对每个ROI提供嵌入式引用指标。

一般来讲,Crossref更偏重出版流程方面的需求,而DataCite更偏重数据存储和分享方面的需求。确实有一些单位同时加入了这两个机构,来满足它们在出版和数据存储方面的需求。在跨平台数据共享范围方面,由于这两个组织所拥有的会员和用户有所不同,因此会有一些差别,在数据范围方面的对比性研究还未见发布,具体可以咨询在DataCite官网的会员网页上公布的会员机构。

 

标签