近日,英国一项新的基因研究发现,2019年年底新冠病毒(SARS-CoV-2)或已在全球迅速传播,并且仍在反复发生突变以不断适应其人类宿主。
这项研究名为“Emergence of genomic diversity and recurrent mutations in SARS-CoV-2”,于当地时间5月5日以预校稿的形式在线发表在国际医学期刊《感染、遗传学和进化》(Infection, Genetics and Evolution)上。研究团队主要来自伦敦大学学院遗传学研究所,通讯作者为该所研究员弗朗索瓦-鲍卢克斯(Franois Balloux)。
近日,鲍卢克斯接受美国有线电视新闻网(CNN)采访时表示,其研究团队对超过7600名全球新冠肺炎患者身上提取的新冠病毒进行基因分析后发现,该病毒从去年年底就已经开始在世界范围内迅速传播。
鲍卢克斯团队针对新冠病毒的突变展开研究并发现了其迅速传播的证据,但目前为止,没有证据表明该病毒变得更容易传播或更可能导致严重疾病。团队研究了病毒全球数据库中在不同时间和不同地点采集的样本,并发现这些病毒样本都显示出多个突变,且这些突变相似。
研究指出,从系统进化估计来看,新冠病毒大流行开始的时间大概在2019年10月6日至2019年12月11日之间,这也大概是其从自然宿主进入人类社会的时间。
“这一研究排除了新冠病毒可能早在被发现很长时间之前就已经在传播、进而已经感染了大部分人口的任何假设。” 鲍卢克斯对CNN说。
研究团队表示,这意味着不存在一部分人已经对病毒形成了某种免疫的情况,全球人口中最多只有10%已经接触过新冠病毒。同时,团队检测到的病毒反复发生的同源性突变可能表明新冠病毒仍在不断适应其新宿主——人类。
研究结果还意味着,该病毒早在第一例官方病例报道之前几周甚至几个月就开始在欧洲、美国和全球其他国家传播了,几乎是同时在所有国家被引入和传播。
鲍卢克斯表示,“所有试图找到‘零号患者’的想法都是没有意义的,因为存在太多的‘零号患者’。”
这一研究从新冠病毒进化和变异的角度探讨了它是如何适应其人类宿主的,将为直接设计相关药物和疫苗提供信息。
新冠病毒基因组多样性分析:最近的共同祖先病毒出现于2019年底
第一个新冠病毒完整的基因组序列于2020年1月5日发布,随后数千个病毒基因被测序并被公布、用于流行病学等研究。
RNA病毒每次复制自身都会犯错,使其产生突变,而这些突变可用作所谓的“分子钟(molecular clock)”,帮助科研人员通过时间和地理位置等信息追踪病毒的传播情况。
研究人员发现,SARS-CoV-2基因组的一部分区域经过多次突变后仍在很大程度上保持不变,而其他区域则已经积累了基因多样性。
研究人员借助“全球流感数据共享计划(GISAID)”的数据库,创建了一个包含7666个新冠病毒公共基因组的数据集,并分析了随时间变化新冠病毒基因组多样性的变化情况。
这7666个 SARS-CoV-2基因组对COVID-19大流行进行了极好的地理和时间覆盖,研究人员将基因组数据的采集时间与其进化过程之间的关系用遗传进化树表达,并进而制作了放射状图和线性布局图。
7666个全球测序的 SARS-CoV-2基因组采样时间与病毒进化的关系,图c为放射状图
研究人员称,在收集数据的时间范围内,如果存在可衡量的进化过程,则采样时间与进化过程之间的正相关关系就会出现。具体而言,与最近的共同祖先病毒相比,越新分离出的病毒株在基因组中积累的变异就越多。
对采样日期与病毒进化过程之间的回归原点分析显示,病毒基因组最近的共同祖先(the Most Recent Common Ancestor,MRCA)大约在2019年底左右出现。
通过进化模型“分子钟”估算软件TreeDater等,研究人员观察到一个病毒基因组最近的共同祖先,其出现时间大概在2019年10月6日至2019年12月11日,这与新冠肺炎流行的开始时间相对应。
研究人员指出,这一时间区间与此前使用各种计算方法在新冠病毒基因组数据的较小子集上进行的估计大致相同,但由于数据集规模庞大、一些更复杂的推理方法无法使用,这一结果仍应谨慎采信。
研究团队还发现,在当前阶段的新冠肺炎大流行中,SARS-CoV-2基因组仅积累了中等程度的遗传多样性,任意两个基因组之间的平均SNP(单核苷酸多态性)成对差异为9.6。这意味着,新冠病毒基因组的共同祖先出现的时间不长、相对较新。
几乎同时在所有国家被引入和传播,在首例感染后快速地扩散
研究人员用“一切无处不在(Everything is everywhere)”来形容在多个国家发现的新冠病毒基因组的特征。
事实上,英国、美国、冰岛、澳大利亚等大多数国家中发现的SARS-CoV-2基因组多样性基本概括了7666个基因组数据集中COVID-19的全球多样性。
英国、美国、冰岛和中国发现的SARS-CoV-2基因组全球遗传多样性的比例
这意味着,新冠病毒在这些国家成为本地流行病都是通过大量独立的病毒基因组进入并传播造成的,几乎是同时在所有国家被引入和传播,且在首例感染后快速地扩散。中国是一个例外,虽然被普遍认为是新冠疫情的最初暴发地,但实际上中国的新冠病毒基因组仅包含全球多样性的一小部分。
通过关注独立多次出现的同源性突变,研究团队确定了SARS-CoV-2基因组中的198个的频发突变(recurrent mutation),这些突变可能标志着基因趋同进化,并且在适应性背景下使SARS-CoV-2特别容易感染人类宿主。近80%的频发突变在蛋白质水平上产生了非同义的变化,研究者们认为,这表明SARS-CoV-2还在持续发生突变以适应人类。
SARS-CoV-2的结构包括分为两部分的、编码非结构蛋白的开放阅读框(ORF);四种结构蛋白:刺突(S)、包膜(E)、膜(M)和核壳(N);以及一组小的附属因子。研究人员发现发生频发突变的上述198个位点(占所有位点的0.67%)与7666个基因组中的290个氨基酸变化相关。在这些氨基酸变化中,232个包含非同义突变,58个包含同义突变。
研究人员进一步观察到,Orf1ab中编码Nsp6、Nsp11、Nsp13的区域中的三个位点,以及刺突蛋白中的一个位点存在特别多的频发突变。
作者们认为,迄今为止,在人类中传播的SARS-CoV-2突变中,绝大多数突变可能是中性的甚至是(对病毒基因)有害的。而突变的同源性,例如本研究中检测到的198个频发突变位点,可能是中性进化的产物或正在进行的选择的结果。
研究人员指出,理想情况下,药物和疫苗的设计应靶向SARS-CoV-2基因组的相对不变的、受强烈限制的区域,以避免耐药性。这些同源性突变位点中,不涉及极性变化的部分可能反映了这些位置的强烈进化限制,进而可能成为药物或疫苗的设计靶标。
研究人员还指出,由于SARS-CoV-2是引发人畜共患病的病毒,它很可能还无法很好地适应其人类宿主。虽然SARS-CoV-2种群有可能演变为毒力不同、传播能力不同的亚型,但必须强调的是,目前尚无证据表明SARS-CoV-2存在独特表型的进化。
随着新冠肺炎疫情在全球的发展,越来越多的病毒基因组数据将被用于监测SARS-CoV-2的演变。研究团队称,不断监测病毒中的基因组变化有助于人们更好地理解宿主与病原体的相互作用,进而为药物和疫苗设计提供信息。
特别声明:本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者在两周内速来电或来函联系。