新药研发投资大、周期长、风险高,其中一项关键堵点就是对庞大数据的解析。《自然》杂志的一项预估数据显示,到2025年,全球将有6000万人以上采用基因测序诊断疾病。而一个人的全基因组数据量通常超50个GB。这也意味着,单是2025年一年的基因数据的增长就会超过40EB(百亿亿字节)。
如何更好应对即将到来的生命健康数据爆炸式增长?在昨天举行的亚马逊云科技医疗与生命科学行业峰会上,这一问题成为与会业界专家、企业代表们的聚焦点。
事实上,作为全球医疗及生命科学行业云计算的“领头羊”,亚马逊云科技已先行探索。比如,围绕数据、算力和行业用户体验三大需求发力,通过持续构建行业专属解决方案,进一步赋能生物制药、基因测序和医疗保健等细分领域的数字化创新,加速推进创新成果落地。
“云计算、大数据和人工智能等技术是加速医疗与生命科学行业实现数字化转型和发展的重要途径。”亚马逊云科技大中华区战略业务发展部总经理顾凡认为,唯有深刻了解行业需求,不断地丰富和拓展行业数字化创新生态链,并围绕数据、算力和体验等需求与生物医药企业等深度合作,才能推出更多顺应行业发展趋势的、端到端的解决方案。据透露,在医疗资源密集的徐汇区,上海亚马逊云科技生命健康数字化赋能中心已于去年10月投用,为区域内乃至全国生命健康行业的高质量发展贡献力量。
全生命周期管理方案,应对海量数据挑战
亚马逊云科技在医疗生命健康领域的试水最早可以追溯到2013年。
彼时,亚马逊云科技组建了全球范围的医疗和生命科学专业团队,并联合数百家合作伙伴,服务辉瑞、拜尔、罗氏、默沙东、飞利浦等4200多家行业客户。目前,全球前十大药企中,九家都与其有合作关系。在中国,亚马逊云科技也和数十家本地合作伙伴一起,共同服务于超过400家客户。
随着测序技术的发展,基因测序的数据量迅速增加。一台测序仪的下机数据往往超过100GB, 而在分析过程中,中间数据还会翻倍地增加。为此,亚马逊云科技提供了基因测序领域的数据全生命周期管理解决方案, 能够为基因分析不同阶段的生物信息学数据的存储、调用和分析提供更好的性价比和更高可用性。该解决方案包括数据上传、数据分析、数据共享和数据备份及存档全生命周期。
云赋能,加速人工智能辅助新药研发
一款新药从发现到上市往往需要超过十年的时间并花费数十亿美元的研发成本,而人工智能辅助药物研发是突破这一反摩尔定律的利器。
亚马逊云科技提供基于高性能计算(HPC)的人工智能新药研发服务解决方案使研究人员能够在亚马逊云科技上组建数百万个vCPU的高性能计算平台,以开展数十亿蛋白质分子规模的药物发现研究。以十亿个分子的化合物分析为例,单核服务器需要475年,而亚马逊云科技将其缩至1天。
亚马逊云科技还推出了“量子计算探索之药物发现方案”,该方案提供了一键部署的量子计算/经典计算混合架构,为量子计算在药物发现方面的应用探索新思路。
以英矽智能为例,这是一家由生成式人工智能驱动的临床阶段生物医药公司。他们利用相关工具构建了靶点识别、分子设计平台、和临床试验结果预测平台,使其以数百万美元的成本,在不到18个月的时间内找到一种治疗纤维化的候选药物,完成了从靶点发现到化合物验证的临床前药物研发过程。
创新平台“扶小帮早”,加快推动精准医疗
眼下,更讲求个性化的精准医疗成为新趋势。然而,在一片火热与之余,产业发展不免面临诸多挑战。比如,医疗数据庞大且分散,数据聚合、分析难度提升;医疗数据孤岛未获得突破性解决等。
在与企业的沟通中,亚马逊云科技的团队捕捉到了这一需求。他们发现,不少医疗领域行业企业希望能快速构建轻松易用的创新应用,覆盖研究设计、临床实验、生产制造、上市推广、上市后监控与支持等各个环节,以向医疗人员提供更多好用、实用的新功能,并最终为患者提供精准、个性化的医疗方案。
为此,其深入探索行业应用场景,结合丰富的云上应用开发实践,加速构建众多解决方案,满足医疗保健和医疗设备企业的数字化创新需求。
比如,为进一步提升诊断效果,益体康(智慧远程心电平台及专业会诊服务提供商)在亚马逊云科技上利用GPU实例大幅提升心电辅助诊断模型的训练效率,由此提升了AI模型训练和推理效率,大幅缩短了产品上市时间。原本需要半年才能推出的AI 模型,目前仅需 约3 个月,便可完成从训练到部署上线全过程,还能轻松支持十倍以上数据规模的模型训练场景。
面向医疗和生命健康行业的初创企业,亚马逊云科技还推出了“云创计划”,为他们提供起步云资源和技术服务,以加速扶持行业初创公司在云上开启数字化创新之旅,实现高速成长。目前,亚马逊云科技累计支持的来自医疗和生命科学行业的初创企业数量已超300家。
作者:王嘉旖
编辑:占悦
责任编辑:祝越
*文汇独家稿件,转载请注明出处。