今天,中国科学院在京召开新闻发布会,正式发布了A类战略性先导科技专项“地球大数据科学工程”2018年度成果——地球大数据共享服务平台。
地球大数据共享服务平台是集成多领域海量数据,服务数据驱动的科学发现与决策支持的科学平台。中科院副院长张亚平介绍,科学数据的积累、开放、共享,已经成为世界科技发展的重要资源和推动力。中国科学院作为国家战略科技力量,高度重视科学数据共享在科研和信息化建设中的创新与应用。
2018年1月1日,中国科学院正式启动实施“地球大数据科学工程”A类战略性先导专项,执行期为五年。该专项致力于推动地球大数据实现从被动共享到主动共享的转变,力争在科学数据共享及其体制机制若干关键问题上取得实质性突破。
该专项由中国科学院遥感与数字地球研究所(现空天信息研究院)牵头,研发队伍来自国内外多个学科领域的129家科研单位的1200余名研究人员,学科领域涵盖高性能计算、大数据技术、遥感科学、大气科学、海洋科学、生物科学、生态环境科学等,具有很强的学科交叉融合优势。
专项致力于构建包含资源、环境、生物、生态等多个领域的大数据与云服务共享平台,重点开展数字一带一路、全景美丽中国、生物多样性与生态安全、三维信息海洋和时空三极环境等方面的基础与应用研究。专项的最终目标是建成国际地球大数据科学中心。
目前,该平台共享数据的总量约5PB,其中对地观测数据1.8PB,生物生态数据2.6PB,大气海洋数据0.4PB,基础地理数据及地面观测数据0.2PB;地层学与古生物数据库 49万条数据记录、中国生物物种名录 360万条、微生物资源数据库42万条、组学数据目前在线10亿条。现在,用户能够在线检索到40%数据。随着硬件条件不断完善,平台数据将陆续上线,并且每年将以3PB的数据量进行更新。
此次重点发布的是地球大数据共享服务平台的两个核心系统——数据共享服务系统、CASEarth Databank系统,以及一个区域系统——数字丝路地球大数据系统。
数据共享服务系统是地球大数据专项数据资源发布及共享服务的门户窗口,是地球大数据共享服务平台核心系统之一。该系统采用全球唯一标识,随时随地精准定位与解析,是国内首次遵照国家标准《信息技术科学数据引用》(GB/T 35294-2017)在国家重大项目数据共享平台发布数据引用,为数据有序化关联及全生命周期管理提供保障。
CASEarth Databank系统提供长时序的多源对地观测数据即得即用产品集,包括1986年中国遥感卫星地面站建设以来20万景(每景12种产品,共计240万个产品)的长时序陆地卫星数据产品,基于高分卫星1/2、资源3号卫星等国产高分辨率遥感卫星数据制作的2米分辨率动态全国一张图,利用高分卫星、陆地卫星等国内外卫星数据制作的30米分辨率动态全球一张图,以及重点区域的亚米级即得即用产品集等。
该系统制定全球遥感数据产格网规范,自主研发了高效的对地观测数据引擎Databox,引入人工智能等先进技术,提供不同层次的对地观测数据分析与信息挖掘服务。未来,用户可结合系统资源来完成特定的专题信息挖掘、知识发现和融合决策。
数字丝路地球大数据系统,包括“一带一路”区域资源、环境、气候、灾害、遗产等专题数据集94套、自主知识产权数据产品57类,共享数据超过120万亿字节。目前,该系统在国际上率先研发了通用大数据平台下地球大数据提取、转换与加载工具集,实现了6大类数据的检索、共享、产品可视化展现,并通过中、英、法等多语言版本在国际相关单位实施共享。
地球大数据专项负责人郭华东院士指出,地球大数据专项通过集成中科院资源环境生物生态等领域基础数据和科研成果,构建基于地球大数据的信息共享平台,将为驱动原创性科学发现和促进国家经济社会发展提供技术支撑和决策依据。
作者:许琦敏
编辑:顾军
责任编辑:张鹏
*文汇独家稿件,转载请注明出处。