资源环境动态监测快报

2022年第15期

科学家首次发布全球水库和湖泊数据集

2022年8月3日,由美国国家科学基金会(NSF)资助,明尼苏达大学双城分校(University of Minnesota Twin Cities)的科学家团队首次发布了全球湖泊与水库数据集,该数据集叫做水库与湖泊表面积时间序列数据集(Reservoir and Lake Surface Area Timeseries,ReaLSAT)。该数据集收集了全球从1984年到2015年全球大于0.1平方公里的湖泊和水库的位置和表面积的历史变化数据,这些数据将为环境研究人员提供有关土地和淡水利用以及湖泊和水库如何受到人类和气候变化影响的新信息。这项研究也是该领域机器学习技术的重大进步。该研究成果发表在最新期的《科学数据》(Scientific Data)。

水库与湖泊表面积时间序列数据集(ReaLSAT),收集了全球范围内1984年至2015年的681137个内陆湖泊和水库的地理位置和水体表面历史演变范围数据。该数据集是通过将新型机器学习技术应用于地球观测(EO)数据来生成的,以实现内陆水域的位置和表面范围的动态变化的全面更新。该数据集重点收集了温带和热带纬度地区面积大于0.1平方公里的湖泊和水库。

该领域的科学家以前主要利用Landsat 影像来识别水体的位置,并且确定水体的大小和动态变化,主要基于两方面的研究,一是基于矢量的映射,提供了世界湖泊的静态多边形,缺乏任何水体的时间动力学研究。二是基于栅格的映射,它将地球表面划分为像素,并记录这些像素中水随时间的变化分析。这两类方法都提供了世界湖泊的不完整视图,因为前者不指示地表水的动态性质,后者在像素水平上跟踪水体的动态变化,由于云层和标记错误,像素地图往往会丢失大量数据,因此很难准确地聚合湖泊中的像素来构建湖泊中表面积变化的数据集。

迄今为止,全球有关水库与湖泊的数据集主要是HydroLakes数据集和全球地表水(GSW)数据集。这两个数据集主要基于像素的地表水随时间变化映射技术的数据集。HydroLakes是多个数据集的聚合,包含140万个水体。ReaLSAT数据集覆盖的空间区域内一部分与HydroLakes数据集有交叉。GSW数据集由欧洲航天局联合研究中心(JRC)和谷歌合作提供,它提供每月可用的30米分辨率的水体的像素图。GSW数据集的主要局限性在于它没有在单个像素和实际水体之间提供实时分析,具有一定滞后性。虽然GSW数据集被认为是最先进的网格化产品,但它需要大量的后处理操作来分析湖泊动态。首先,必须从基于像素的陆地/水面罩构造面才能为不同的湖泊提取范围。其次,这些扩展数据块不能直接使用,需要详细甄别分类边界。这些问题使得从GSW数据集中提取年内和年际尺度上单个湖泊的稳健地表范围动态变得具有挑战性。

ReaLSAT数据集是建立在GSW数据集的陆地/水分类地图的基础上,并使用新颖的物理引导机器学习方法(基于排序的信息传输技术(ORBIT)),利用湖泊动力学的物理特性来弥补数据的缺失,同时以动态湖泊面积而不是像素的形式提供信息。

(李恒吉 编译)