新冠病毒源自美国?此言虚也

作者:王骏
(基因港香港生物科技有限公司总裁、香港中文大学兼职教授)近日,中科院西双版纳热带植物园、华南农业大学、北京脑科中心连手在中科院论文发布平台ChinaXiv提交了一篇题为「Decoding evolution andtransmissions of novel pneumonia coronavirus using the whole genomic data」的预印版论文(图1),试图解析对四大洲、12个国家的93个新型冠状病毒样本的基因组数据,追溯病毒的传染源及扩散路径。文章一“植”激起千层浪,加上台湾媒体的渲染(图2.),一时之间中国“新冠病毒由外地传入”一说甚嚣尘上,网红专家也因之祸起萧墙,针锋相对,各执一词。

图1.

图2.

本来,假以时日,更多数据问市后,清者自清,真相自会浮现。但眼下消息扑朔迷离,加上禁不住周遭朋友的好奇,不惮扣盘扪烛,一抒己见,与大家探讨其中曲直。

笔者根据多个事实判断认为,中国武汉爆发之新冠状病毒源头来自国外输入一说与流行病学的原理与这次肺炎事实不符,如此说法可谓“语不惊人死不休”,有哗众取宠之嫌。

理由如下:

1. 时间次序“颠倒衣裳”

如文章指出,文章所涉之美国病患(图3)都是在病发前来过中国,其中4例来过武汉,而不是在病发后。他们得病后也没有回过中国。

图3

2. 遗传关系误解

部分媒体将文章中美国病例所携带的病毒简单地叫作“爷爷”或“爸爸”(图4)。这其实是误导,更确切的说法应该是美国病例所携病毒是“长辈”,如”堂爷爷”或“堂叔伯”,虽然辈份高,但文章所指武汉患者并非是这些长辈的直系子孙后代,武汉病毒并非直接来自这些“长辈”。部分媒体将文章中美国病例所携带的病毒简单地叫作“爷爷”或”爸爸”(图4)。这其实是误导,更确切的说法应该是美国病例所携病毒是”长辈”,如”堂爷爷”或”堂叔伯”,虽然辈份高,但文章所指武汉患者并非是这些长辈的直系子孙后代,武汉病毒并非直接来自这些”长辈”。

图4

至于“新冠病毒由外地传入”最硬核的诘问:为何在中国的54样本中没能发现美国发现的病毒长辈?

一个可能的原因是样本误差。我们知道新冠状病毒于2019年12月中旬在中国中部武汉爆发后,截至2020年2月18日,新冠状病毒感染了中国以及五大洲的25个国家的7万多人。而这项研究只使用了93个基因组来进行研究,由于同一个病例同时带有数个病毒基因组,例如美国的1个病例提供了3个基因组(图5),这使得实际分折的病例更为稀少,十分容易造成样本误差,包括取样时间或地点都很容易造成样本偏见(Sample Bias),令结论以偏概全,以管窥天。

图5

然而,我认为更可能的原因在于这些老祖宗级别的病毒被变异后传染力更强的后辈取代/稀释,成为了现有病例中的少数派,在抽样研究难以被抽中。所以美国病毒实为早期病毒的“硕果”残余,并非“来龙”,实为“去脉”。就目前数据而言,如果美国是病毒的起源地,那么很难解释美国11个病人所携病毒株之间的巨大差别(图6),该差别甚至大过他们与武汉病例之间的差距。美国所发现的病毒由不同地方传入岂不更加合

图6

另外,该论文的预印本粗率,不乏低级笔误,如在第10页提及美国病毒样本时,误植样品及单倍型(Haplotype)数目(图7),标记数字应为10及9,而不是3和8

图7。

顺便一提,通过该文章的数据分折,尚未在93个病毒株样本中发现大众最为担心的病毒基因重组洗牌从而演化出毒性更大的病毒的现象,也是不幸中之大幸。

今次全球全民抗疫,学校虽然停课,但整个社会都成了“生物学”的大课堂,也产生了千千万万个生物学的粉丝,对中国民众补了一大堂科普课。但现代生物学一日千里,生物界奥妙无穷,许多知识无法毕其功于一“疫”。大家现在特别要警惕耳食之言,不让似是而非的谬论流传。

我相信,随着更多流行病学与生物学等数据积累,这次新冠病毒的来龙去脉将大白于世。更重要的是全世界科学家、政府和民众一齐努力,尽快扑灭这场威胁现代文明的大火。

题外话,“patient O”的O并不是”奥米迦”之谓,最初是“Out of Califonia”的意思,之后望文生义,当作零(0)了。