为响应全球科研数据管理的最新趋势,提升我国科研人员在科学数据管理方面的专业能力,2024年7月18日,由中国科学院科学数据总中心主办的“科学数据FAIR化管理工具与实践”专题培训会成功举办。此次培训旨在深入推动和落实科学数据的可查找性(Findable)、可访问性(Accessible)、可互操作性(Interoperable)和可重用性(Reusable),即FAIR原则,以促进科研数据的开放共享和高效利用。
中国科学院心理研究所科学数据中心办公室负责人张晶介绍了其数据中心依托科学数据中心软件栈(FairStack)旗下工具快速形成数据服务能力,支持研究所论文数据汇交,服务研究所科研诚信工作。
中国科学院计算机网络信息中心科学数据中心软件栈产品经理李家增作题为《科学数据的归档和管理》的报告,通过数据协同管理工具DataSpace面向科研团队提供安全、便捷的科学数据空间管理服务,形成范围可控、多人协作的数据管理工作台,支撑团队内部的项目数据汇聚、日常科研数据归档和管理工作。
中国科学院计算机网络信息中心研发工程师王栋栋,分享了《科学数据如何共享再利用》,通过机构存储库(InstDB)支撑科学数据中心或机构科研团队快速搭建数据资源网站,向公众提供服务。在实际应用中,机构存储库(InstDB)支撑数据中心项目数据DMP汇交;支持数据集作者直接对已发布的数据提交数据知识产权登记申请,并获取数据知识产权证书,助力院科学数据总中心知识产权登记服务的对接。他们也将紧跟技术发展步伐,持续完善共享机制,更好的推动科学数据的共享再利用。
中国科学院过程工程研究所化学化工科学数据中心常务副主任赵月红副研究员介绍了《FAIR工具在化学化工科学数据中心的应用及思考》,重点介绍化学化工科学数据中心(chemdc)的背景、建设过程遇到的难题和挑战,以及利用科学数据软件栈(FairStack)旗下工具对于数据中心的建设和运维情况。基于科学数据FAIR化管理工具,成功实现化学化工领域重大科研项目数据的汇、管、存等学科数据中心的核心功能,支撑数据中心的可持续发展。
中国科学院计算机网络信息中心工程师韩芳做题为《科学数据智能产品服务》的报告。科学数据智能产品服务,是科学数据管理和智能支撑工具数据关联网络OpenCSDB是一个基础数据服务平台,支持对多领域数据获取和整合、语义关联、跨中心数据融合等;跨域融合发现服务作,则主要利用数据关联网络的语义网数据,结合大模型技术,提供科研内容检索、复杂问题解决等,提供跨中心数据发现与知识化服务,助力科研;数据智能助手Dr.DI是数据知识智能服务产品,集智能问答、图文检索、智能写作等服务为一体,致力于协助各领域的科研或工程专业人员以更高效的方式进行数据资源深度检索和文献挖掘等服务。
中国科学院计算机网络信息中心研发工程师吴兆晨介绍了《领域定制化科学数据分析工具》,datalab是面向算法工程师、数据分析师以及科研人员,从底层资源管理与算法编程调试到上层分析应用的一套数据分析框架。以跨学科分析环境适配技术与方法即服务(Function as a Service)相结合具备领域分析组件可持续集成扩展能力,且内置JupyterLab与众多通用分析组件。简化科研人员操作复杂度,低门槛步进式上手数据分析工作。
中国科学院计算机网络信息中心研发工程师张鑫鹏,详细介绍了数据门户安全防护工具DPGuard如何保障科学数据中心的安全稳定运行,为科学数据中心提供全方位、自动化的安全监测扫描、安全防护服务。
培训结束后,学员围绕“科学数据FAIR化管理工具与实践”开展了深入的交流。科学数据中心软件栈(FairStack)在64家科研单位广泛应用,累计安装部署79套。本次培训不仅是帮助学员掌握科学数据管理工具的使用,更着重于提升科研机构及数据中心对科学数据生命周期管理的理解和实践能力,不断学习,提升自身的科研数据管理水平,促进了不同学科和领域之间的合作与知识传播。
科学数据中心软件栈(FairStack)会继续致力于推动科学数据的FAIR化管理,助力科研人员更好地应对数据密集型科学研究中的挑战,也将持续关注国际上最新的FAIR化动态,为科研数据的开放共享和可持续发展贡献力量,共同推进科学数据的FAIR化进程。