新冠病毒是否在人群中持续的进化？院士疾呼：加快相关数据发布及共享_科技

科技 > 科技

推荐文章

排行榜

新冠病毒是否在人群中持续的进化？院士疾呼：加快相关数据发布及共享

日期:2020年02月20日 17:51:22 作者:本站编辑

2020年伊始，由SARS-CoV-2 (原称2019-nCov) 病毒引发的COVID-19 (2019冠状病毒病) 席卷全国。两周前，疫情日益严峻，我们曾呼吁同行，将此病毒的基因组数据尽快公开。因为这些数据对全球公共卫生安全有重大意义，国际学术界也通过不同渠道紧急敦促数据共享[。然而事与愿违，需求越来越迫切，而国内数据的发布却非常缓慢。

现在，我们再次呼吁加快新冠病毒的数据发布速度。基于专家初步分析病毒进化的结果，我们有更充分的理由重复前述倡议（请参阅致谢部分，本文对相关研究结果的引用皆得到许可）。在疫情防控的关键时期，及时发布病毒数据更该是我们的道义和责任。希望学术界能够促进数据的传播与共享，避免不必要的发布延误。

病毒的进化

根据进化的基本原理，病毒感染人群后可能会发生快速演变——这是迅速公布数据的关键科学依据。自然选择偏好高传染力的突变，进而增强了毒株的进化优势。而病毒传染力增强，也有可能伴随着毒力降低。17年前，这样的进化规律已经在SARS的爆发中得到过例证[3]。在2002年至2003年的流行周期中，SARS病毒早期的传播速度较为缓慢（2002年11月24日~2003年1月30日），在流行中期迅速增快（2003年2月）。这一趋势延续了几个月直至疫情晚期。传播加速与病毒DNA序列的改变息息相关；尤其是病毒S蛋白在传播前期快速积累了5个氨基酸突变。这说明SARS病毒从果子狸跃染到人之后，经历了一系列的遗传适应性改变。

本次COVID-19的防控可以借鉴SARS的经验，但也可能有相当的不同。因此，如果快速发布病毒基因组数据，我们通过对比2019-nCoV与SARS-CoV得以尽快了解它们进化动态的差异。目前临床分析已经揭示了两场流行病的特征有诸多不同，基因组的分析迫在眉睫。

2019-nCoV的缓慢进化可望稍慰人心

目前，病毒在人群中进化的初步分析（崔杰、陆剑，未发表的研究）仅能基于有限的公共数据(https://www.gisaid.org/)。截至2020年2月10日，共有55条2019-nCoV的病毒基因组可公开获取。其中，在1月22日以前获取的31份测序数据几乎全部来自于中国（仅有1例来自于美国）。然而1月22日以后，余下的24份数据一律源于境外，包括日本、韩国、新加坡、澳大利亚、美国、法国、英国等。数据背景的断层，使我们很难在时间与地理上找到连续的规律。数据不规范公开的趋势彰显了学术界的矛盾。

目前的分析结果提示了几个重要的科学问题。最关键的是，“2019-nCoV是否在人群中持续的进化？”如果这一问题的答案是否定的，病毒没有快速变异，对于抵抗疫情是个定心丸。从疫情刚开始至2020年2月早期，病毒的变化是相对缓慢的。出现在多例样本中（>=2）的氨基酸突变只有8个。更重要的是，这些突变的分布与 “沉默”突变（没功能效应的突变）非常相似。这说明，2019-nCoV在传播的过程中没有发生剧烈的适应性变化，这与2002 年SARS病毒非常不同。

简单的说，2019-nCoV可能在野生动物与人之间已经“磨牙”好些时候了，现已进入适应性进化的迟缓期了。我们希望这个推测是对的。如果得到证明，也许可以缓解公众的不安。

隐现危机的可能性

虽然看起来病毒似乎进化迟缓，但是有一些信号不能掉以轻心。首先，大部分的氨基酸序列突变都出现在近期国外报道的数据中，隐示病毒也许正进化中。其次，8个氨基酸序列突变是成簇出现的，一个突变似乎促进另一个突变的发生。第三，尤其需要警惕的是位于病毒ORF8基因中28144位点上的突变—— 在1月5日以前于武汉采集的13例样本中只出现了1次（7.8%），但在1月10日之后于武汉之外采集的42例样本中，出现了18次（43%）。这样的跃变看起来很惊人，但样本数量不够大，统计学上未必可靠。我们需要更多的数据来查清楚这个突变是否是个危险讯号。另一个突变，在55例样本中仅出现了五次：橙县（CA2/2020，美国）、巴黎（IDF0373, 0373/2020，法国）、高雄（2/2020，中国）、克莱顿（VIC01/2020，澳大利亚），但全部是在大陆境外。这也是值得密切关注的。

最坏的可能性是，经历了两个月的“慢进化”模式之后，2019-nCoV“摸索”出了进化的途径，开始蠢蠢欲动。SARS病毒进化的第一阶段也恰好是两个月。上面两个推测，不确定性都很高。因为样本数实在不够大。只有完整并及时地发布数据，才有可能尘埃落定。

数据（不）公开的文化根源

数据共享与否背后有科学文化的不良背景。新发布的数据主要来自于国外而不是疫情严重的国内。关于测序数据是否应该公开发布和自由获取，在国内网络上颇有争论。根源在于如何保护研究贡献、影响知识产权。更具体来讲，国内学术界对于所谓“高影响因子期刊”发表文章的强烈需求，远远超乎国际的惯例[4]。扣留数据其实也反映了国内论文发表的评价体系。一篇论文不管是在A期刊还是B期刊上发表，还是同一篇论文。

研究人员对“高分期刊”过度看重的不良风气，在这次疫情里已显示不仅仅是学术圈内的问题了。扣留数据通常不会干扰社会的正常运行，但在当前的危急情形下，影响会是严重而深远的。的确，第一批发布病毒序列的论文阐明病毒有人传人的可能，但是没及时告知社会。未来回顾这次疫情，这几天的延迟可能是关键。

关于科研人员道义责任的几点提议

鉴于当前疫情的严峻形势，选择不公开病毒相关的数据是有悖科研道德的。应对数据发布，国内已经建立了一些开放数据库（例如https://bigd.big.ac.cn/，https://db.cngb.org，或开放数据分析平台（例如https://fight-sars2.genowis.com) 。学术期刊，包括《国家科学评论》(National Science Review)，应该采用“胡萝卜加大棒”的方式促进数据的发表。一方面（胡萝卜），我们建议期刊接收发表初步处理的组学数据[1]。更进一步，基于先期提交的数据完善的分析结果（即便没有新的数据产出），也应该随后继续接收。另一方面（大棒），期刊应当对那些隐瞒公共卫生安全数据的论文严肃对待，拒绝发表这种不道德学术行为的研究。正如不符合动物实验伦理的研究无可转圜地拒稿，隐瞒对公共卫生安全至关重要数据的行为，业内更应该秉持零容忍的态度。，或开放数据分析平台（例如#FormatStrongID_10#) 。学术期刊，包括《国家科学评论》(National Science Review)，应该采用“胡萝卜加大棒”的方式促进数据的发表。一方面（胡萝卜），我们建议期刊接收发表初步处理的组学数据[1]。更进一步，基于先期提交的数据完善的分析结果（即便没有新的数据产出），也应该随后继续接收。另一方面（大棒），期刊应当对那些隐瞒公共卫生安全数据的论文严肃对待，拒绝发表这种不道德学术行为的研究。正如不符合动物实验伦理的研究无可转圜地拒稿，隐瞒对公共卫生安全至关重要数据的行为，业内更应该秉持零容忍的态度。

编辑：王星
责任编辑：许琦敏

来源：中科院之声

声明：转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益，请作者持权属证明与本网联系，我们将及时更正、删除，谢谢。