未来5年的产生数据,将是过去所有产生数据的2倍以上。不久前,亚马逊云科技2022 re:Invent全球大会上公布了这一趋势,并引发更多人的深思——如何管理好海量数据,进而挖掘数据的潜在价值。“对市场主体来说,一方面是巨大的挑战,另一方面也蕴含无限机遇。”亚马逊云科技大中华区产品部总经理陈晓建这样注解。
海量数据的定义是什么?他以全球旅游服务供应商Expedia举例说明。该公司拥有超70个PB的数据,每年进行6000亿次AI预测。再如三星,在全球拥有超11亿终端客户,这些客户源源不断地向后台申请服务,每秒钟有8万次请求。作为视频图片网站的服务供应商,Pinterest在云端上存储的图片数据超1个EB,相当于1000个PB、100万个TB。
毋庸置疑的是,越来越多人正意识到数据存在的重要价值。陈晓建认为,数据是应用程序业务逻辑的核心,几乎是每个组织数字化转型的基石。
一边是数据在企业发展中的重要角色,另一边,处理数据非常棘手。从存储到AI预测,数据生产流转的全生命周期,如何实现效益最大化,考验着数据使用者的挖掘能力。
陈晓建表示,亚马逊云科技一直专注于数据存储和分析、机器学习等领域的创新。譬如,人们去亚马逊购书,不仅可以看到书籍,还能获得相关推荐。“这些推荐是根据个人的喜好进行的相应推荐。”
此外,在云计算领域,其也发布了第一个云原生的数仓Amazon Redshift,包括首个专门构建的数据库服务Amazon DynamoDB。“从数据的摄入、存储、查询、分析到可视化的展现、人工智能,在各方面通过安全、合规的方式帮助实现数据的共享和输出。”
陈晓建认为,构建云原生的数据战略十分重要。其中关键在于三个方面。第一,建立一个面向未来的数据底层基础设施。第二,实现一个跨组织的数据一体化融合。由此,数据不再是一个个烟囱式的孤岛,而是一个完整共享的大数据库。第三,通过教育和工具实现数据的普惠化,降低数据使用的门槛,让更多人可从浩瀚的数据中获益。
对于面向未来的数据底层基础设施,他进一步阐释,应当包括四方面内容。具体包括具备适用于所有适合工作负载和任何数据类型的合适工具;根据业务发展、规模持续保持高性能;能面对日益复杂的业务逻辑提供尽可能多的工具,帮助降低数据使用门槛、提升效率;具备最高级别的可靠性。
作者:王嘉旖
编辑:周辰
责任编辑:刘力源
*文汇独家稿件,转载请注明出处。