经过人工智能(AI)大模型的设计优化,疫苗序列的两个体现保护力的最重要指标分别比传统基准序列提升了128倍和20倍!5月3日,国际顶级学术期刊《自然》以少有的“预览版快车道”,上线了上海生物医药企业斯微生物与百度美国研究院等机构合作的论文。他们首次将AI用于mRNA疫苗开发,并通过生物实验验证了优化序列的效果。此前,只有“阿尔法狗”“阿尔法折叠2”等少数论文获得了《自然》的快车道上线。
据悉,该论文将在本月底的《自然》杂志纸质版出版。在AI应用于mRNA领域,这是首篇登上《细胞》《自然》《科学》(CNS)三大主刊的论文。而这也是中国科技企业首次以第一完成单位的身份在《自然》杂志发表论文。这一跨界合作的重要进展将进一步促进AI与生命科学的深度融合,缩短新药研发周期、降低新药研发成本,提高医疗诊断的准确性和效率。
设计更稳定高效的疫苗“分子机器”
“mRNA就好像一部生产蛋白质的分子机器,稳定性、翻译效率是这台机器两个重要的性能指标。”论文共同通讯作者、斯微(上海)生物科技股份有限公司创始人、董事长兼CEO李航文博士解释,mRNA疫苗就是将能够编码抗原分子的mRNA注射进人体,让它不断刺激免疫系统产生抵御病原体的抗体。然而,目前研发的mRNA疫苗分子非常“脆弱”,稳定性低,很容易在细胞内降解,不能持续编码抗原。
在生命体内,mRNA分子由DNA转录而来,似乎没有优劣之分。然而在不同物种之间,产生同一种蛋白质的mRNA却有着不同的蛋白编码效率。李航文说,这提示科学家,mRNA的序列是可以被设计与优化的。
在传统mRNA疫苗设计中,研究者往往仅从密码子偏好进行mRNA序列优化,忽略了其稳定性。但实际上,最终的蛋白翻译量受到两者的协同影响。如果能够在维持mRNA序列高翻译效率的前提下,提升其稳定性,就能得到更加有效的mRNA疫苗或药物。
此次发表于《自然》杂志的实验结果显示,通过AI设计优化的mRNA序列在稳定性、蛋白表达和免疫原性等方面,明显优于传统方法设计的基准序列。
11分钟设计最优序列,性能提升百十倍
从最基本的排列组合来看,mRNA比蛋白质的变化更多,甚至可以达到10的600次方,优化序列涉及海量计算。因此,利用AI对mRNA进行设计与优化将是大势所趋。
在此次成果中,负责AI算法开发的是百度美国研究院。在与斯微生物的前期探讨中,根据mRNA的生物学特点,李航文团队提出了一个“降维”的设计思路:抓住生物分子稳定性的最根本特征——自由能(自由能越低,分子越稳定),通过计算,设计出稳定的mRNA序列。
根据这一思路,百度美国研究院研发了专门用于设计优化mRNA序列的高效AI算法LinearDesign,首次将自然语言处理领域中的“网格解析”概念拓展到了计算生物学领域,巧妙地将序列设计的海量计算简化成了自然语言处理中的经典问题,让“大海捞针”变成了“按图索骥”——利用这种新算法,在普通电脑上仅需11分钟,就能得到mRNA序列的优化结果。
研究者利用这种高效算法,对新冠病毒mRNA疫苗分子进行了设计优化。经过优化,原先的mRNA分子好像被修剪过的树枝,所有枝蔓碎叶都被“清除”。
斯微生物对优化后的mRNA疫苗分子进行了生物学验证。结果显示,在稳定性、蛋白质表达水平以及免疫原性等多个衡量疫苗的重要指标上,利用该算法设计的新冠疫苗序列优于传统方法设计的基准序列。在疫苗保护力最重要的两个指标——疫苗序列结合抗体滴度和中和抗体滴度上,优化后的mRNA序列分别是传统基准序列的128倍和20倍。
AI赋能mRNA研究还需更强算力支持
除了利用LinearDesign算法对新冠mRNA疫苗进行设计优化外,研究者还将该算法应用于水痘-带状疱疹病毒疫苗管线上进行了验证,同样获得了满意的结果。
“这充分说明,LinearDesign算法适用于编码不同蛋白的mRNA序列设计,为用于传染病、肿瘤和罕见病治疗的各种mRNA疫苗或药物管线的序列优化设计提供了更优思路。”论文共同通讯作者、LinearDesign算法主要发明人黄亮表示,这项研究涉及了AI、计算语言学、计算生物学、分子生物学、合成生物学、免疫学等多个学科,将对整个mRNA治疗领域的发展起到极大推动作用。
为探索AI技术在小分子、蛋白/多肽、mRNA等场景的应用,目前,百度打造了完整的基于飞桨的生物计算平台“螺旋桨PaddleHelix”,其中生物计算等大模型属于百度文心大模型家族的一员。李航文表示,接下来斯微生物将在新的技术平台及管线上更加注重AI应用,加速mRNA疫苗和药物的开发。“这仅仅是迈出了AI赋能mRNA研究的第一步,未来我们还将尝试从更多维度对mRNA进行设计优化,对算力的需求也会呈几何级上升。”他透露,美国同行已经在尝试利用量子计算机的算力来进行mRNA领域的计算研发。
作者:许琦敏
图片:受访者提供
责任编辑:任荃
*文汇独家稿件,转载请注明出处。