国家基础学科公共科学数据中心数据汇交新模式论文在《中国科技资源导刊》上发表

2025-02-04 16:00 胡良霖等

近期,国家基础学科公共科学数据中心研究成果《融合数据出版的科学数据汇交新模式探索》发表在《中国科技资源导刊》2024年6期。以下是论文简要版。

论文详情

2020年,科技部正式启动“十三五”国家重点研发计划项目科学数据汇交工作,由20个国家科学数据中心开展数据汇交与共享服务。但是,科学数据汇交在实践过程中存在一些问题,如科研工作者积极性不高、汇交数据质量难以保证等。而科学数据出版在长期的实践过程中形成了较为成熟的工作模式,因其能够有效保障数据质量、提高数据发表者或发表机构在科研领域的知名度和影响力等优势被科研工作者广泛接受,这些正是数据汇交的不足之处。基于此,本文提出了融合数据出版的数据汇交新模式,并进行了实践探索。

一、科学数据汇交与科学数据出版内容及对比分析

(1)科学数据汇交内容

根据《科学数据管理办法》,可将科学数据汇交分为科技计划项目数据汇交、学术论文数据汇交及重点部门、领域数据汇交三种。目前,我国的科学数据汇交以科技计划项目数据为主,根据国家标准GB/T 39912-2021《科技计划形成的科学数据汇交技术与管理规范》科技计划项目科学数据汇交的内容包括科学数据实体、科学数据描述信息、科学数据辅助工具软件。科学数据实体是指在科技计划项目中形成的原始数据以及由原始数据或研究分析数据形成的数据库或数据文件。科学数据描述信息可以分为三类:第一类是为帮助用户能够在互联网上发现数据的元数据;第二类是比摘要更为丰富的描述信息,这类信息多来自于汇交计划的介绍、数据质量报告的相关内容;第三类为用户使用数据的说明性文档。第二类和第三类即为科学数据详细描述信息。项目中使用到专有科学数据辅助工具软件时则需汇交,否则不用汇交。

(2)科学数据出版内容

数据出版的三种模式中,模式一“作为论文辅助资料的数据发布”出版内容为科学数据实体;模式二“数据仓储库”出版内容为科学数据实体及其元数据描述信息;模式三“数据论文”出版内容为科学数据实体和数据论文。

(3)二者对比分析

科学数据汇交的元数据信息包括数据集基本信息、数据集发布信息、数据集服务信息,而数据仓储库的科学数据元数据信息包括数据集基本信息、数据集出版信息、数据集服务信息。根据内容判断,数据集发布信息即为数据集出版信息。因此,二者的科学数据元数据信息基本一致。

数据论文一般包括科学数据集和数据论文,科学数据集一般发布在数据仓储库中,根据GB/T 42813-2023《数据论文出版元数据》,数据论文包括内容信息、出版信息和服务信息。数据论文的内容信息包括科学数据的描述、数据的采集和处理过程、数据质量控制和评估、数据的使用说明等,基本涵盖了数据汇交科学数据详细描述信息的内容。

图1 数据汇交与数据出版内容对比图

二、融合数据出版的科学数据汇交新模式探索

数据论文与数据仓储库的关联出版使科学数据及其描述信息的发布、访问和共享更加便捷。论文借鉴此模式提出数据汇交的新模式。

新模式中,数据汇交时数据提交方仅需提交科学数据和一篇数据论文,用数据论文代替对应的数据汇交描述性文件。科学数据提交至数据仓储库,数据论文提交至数据论文库。数据管理方将分别对数据论文和数据集进行审核。审核完成后,分别将数据论文和科学数据在数据论文库和数据仓储库中发布。数据论文库与数据仓储库间需进行关联,可互相访问。

图2 融合数据出版的数据汇交新模式

三、数据汇交新模式的优势

(1)采用数据论文形式代替传统的数据说明材料提交,能够优化数据汇交的流程,缩短数据发布周期,减轻科研人员的数据汇交工作负担。

(2)将数据汇交的科学数据及其描述成果化,有助于保护数据拥有者的权益,激发研究人员共享数据的积极性。

(3)丰富了原有汇交模式中科学数据的描述信息,更加有利于科学数据的理解和利用。

(4)通过署名机制,科研人员成为科学数据的第一负责人,在提交数据论文时,作者需首先对数据质量进行严格把关,从而保障数据的质量水平。

本文引用格式:胡良霖,马晓萌,高瑜蔚,等.融合数据出版的科学数据汇交新模式探索[J].中国科技资源导刊,2024,56(06):19-30.

相关新闻
热点新闻
投票
查看结果
Tags

站点地图 在线访客: 今日访问量: 昨日访问量: 总访问量:

© 2025 中国科学院计算机网络信息中心 版权所有 Powered by UJCMS

京ICP备05002857号-1