近期,国家青藏高原科学数据中心发布共享了本中心和清华大学、电子科技大学联合研发的“中国区域地面气象要素驱动数据集 v2.0(1951 – 2020)”,用户可开放获取。
中国区域地面气象要素驱动数据集(China Meteorological Forcing Data,以下简称 CMFD)是为支撑中国区域陆面、水文、生态等领域研究而研发的一套高精度、高分辨率、长时间序列数据产品。本次发布的 CMFD 2.0 包含了近地面气温、气压、比湿、全风速、向下短波辐射通量、向下长波辐射通量、降水率等气象要素,时间分辨率为 3 小时,水平空间分辨率为 0.1°,时间长度为 70 年(1951~2020 年),覆盖了 70°E~140°E,15°N~55°N 空间范围内的陆地区域(图1)。CMFD 2.0 融合了欧洲中期天气预报中心 ERA5 再分析数据与气象台站观测数据,并在辐射、降水数据产品中集成了采用人工智能技术制作的 ISCCP-ITP-CNN 和 TPHiPr 数据产品(图2),其数据精度较 CMFD 的上一代产品有显著提升。
图1 根据 CMFD 2.0 数据绘制的 2001 年 01 月 01 日世界时 00 时的近地面气温分布,图中可见 CMFD 2.0 能够清晰呈现近地面气温随地形高程变化的规律,变量空间分布细节丰富,且有效数据空间范围已扩展到了中国周边陆地区域
2019 年发布的CMFD 1.6得到了广泛引用,支持了上千篇论著的发表,成为国家青藏高原科学数据中心最有影响力的数据之一。CMFD1.6采用传统数据融合技术制作,而本次发布的 CMFD 2.0 则部分使用了人工智能技术,实现了诸多改进。除集成了采用人工智能技术制作的辐射和降水数据外,在制作 CMFD 2.0 的过程中,研发团队尽可能采用单一来源的再分析数据作为输入并引入气象台站迁址信息,缓解了 CMFD 1.6 中因多源数据拼接和气象台站迁址而产生的虚假气候突变(图3)。同时,CMFD 2.0 数据的时间长度从 CMFD 1.6 的 40 年大幅扩展到了 70 年,并将继续随时间向后延伸。CMFD 2.0 的网格空间范围虽然与 CMFD 1.6 相同,但其有效数据扩展到了中国之外(图1),能够更好地支持跨境区域研究。为方便用户使用,CMFD 2.0 还在基础变量集之外提供了若干衍生变量,包括近地面相对湿度、雨雪分离降水产品等。此外,CMFD 2.0 摒弃了 CMFD 1.6 中通过 scale_factor 和 add_offset 参数将实型数据化为整型数据的压缩技术,转而直接将实型数据压缩存储于 NetCDF4 格式文件中,从而消除了用户使用数据时进行解压换算的困扰。
图2 制作CMFD 2.0 所采用的数据及其时间长度,其中下方的三套数据是进行站点–再分析数据融合所用到的输入数据,而右上方的两套数据是直接集成到 CMFD 2.0 中的辐射和降水数据产品
图3 CMFD 考虑台站迁址信息前后邻近五台山站格点(113.55°E,38.95°N)的年平均气温时间序列对比,可见 CMFD 2.0 已修正了五台山气象台站迁址所导致的虚假气候突变问题
CMFD 2.0 由中国科学院青藏高原研究所国家青藏高原科学数据中心数据部和清华大学地球系统科学系阳坤教授团队联合牵头研制。何杰博士、阳坤教授和李新研究员全面负责 CMFD 2.0的规划、算法制定、数据制作和发布工作。唐文君研究员和邵长坤博士研究生研制了向下短波辐射通量数据 ISCCP-ITP-CNN,姜尧志博士研制了青藏高原降水数据 TPHiPr,丁宝弘博士发展了 CMFD 2.0 的雨雪分离算法。在数据核心研发团队之外,CMFD 2.0 的研制还得到了国内诸多研究单位和学者的大力支持,中国气象局乌鲁木齐沙漠气象研究所买买提艾力•买买提依明研究员、青海省气象科学研究所周秉荣正高级工程师和权晨高级工程师、中国科学院大气物理研究所孔祥慧副研究员、中国气象局干部培训学院马婷婷副研究员、重庆市气象台吴胜刚高级工程师均为 CMFD 2.0 的研制提供了帮助,国家青藏高原科学数据中心服务部为数据发布提供了全方位支持,还有许多数据用户为 CMFD 的改进提供了宝贵的反馈和建议,限于篇幅无法逐一列举,在此特别感谢。
CMFD 数据将持续更新,一如既往地服务广大用户。
文章信息:
1. He, J., Yang, K., Tang, W. Lu, H., Qin, J., Chen, Y.Y., & Li, X.
(2020). The first high-resolution meteorological forcing dataset for land
process studies over China. Scientific Data, 7, 25,https://doi.org/10.1038/s41597-020-0369-y.
2. Tang, W., Yang, K., Qin, J., Li, X., & Niu, X. (2019). A 16-year
dataset (2000–2015) of high-resolution (3 h, 10 km) global surface solar
radiation. Earth Syst. Sci. Data, 11, 1905–1915, https://doi.org/10.5194/essd-11-1905-2019.
3. Jiang, Y., Yang, K., Qi, Y., Zhou, X., He, J., Lu, H., Li, X., Chen, Y.,
Li, X.D., Zhou, B., Mamtimin, A., Shao, C., Ma, X., Tian, J., & Zhou, J.
(2023). TPHiPr: a long-term (1979–2020) high-accuracy precipitation dataset
(1/30◦, daily) for the Third Pole region based on high-resolution atmospheric
modeling and dense observations. Earth Syst. Sci. Data 15, 621–638.https://doi.org/10.5194/essd-15-621-2023.
4. Shao, C., Yang, K., Tang, W., He, Y., Jiang, Y., Lu, H., Fu, H., &
Zheng, J. (2022). Convolutional neural network-based homogenization for
constructing a long-term global surface solar radiation dataset. Renewable and
Sustainable Energy Reviews, 169(September), 112952. DOI:10.1016/j.rser.2022.112952.
数据信息:
何杰, 阳坤, 李新, 唐文君, 邵长坤, 姜尧志, 丁宝弘. (2024). 中国区域地面气象要素驱动数据集 v2.0(1951-2020). 国家青藏高原数据中心. https://doi.org/10.11888/Atmos.tpdc.302088.https://cstr.cn/18406.11.Atmos.tpdc.302088.
He, J., Yang, K., Li, X., Tang, W., Shao, C., Jiang, Y., Ding, B. (2024).
China meteorological forcing dataset v2.0 (1951-2020). National Tibetan Plateau
/ Third Pole Environment Data Center.https://doi.org/10.11888/Atmos.tpdc.302088.https://cstr.cn/18406.11.Atmos.tpdc.302088.