資訊中心
作者:香雪精準醫療-鄭紅俊
發(fā)布時(shí)間:2020-03-11
閱讀:11673
一場(chǎng)新肺炎在武漢肆虐,繼而擴展到全國,甚至到了其他國家和地區。科學(xué)家們分析出這是一種新的冠狀病毒在搗鬼。這不禁讓人想起17年前的SARS冠狀病毒,真是不寒而栗。大魔王又來(lái)了嗎?這大過(guò)年的,還讓不讓人過(guò)年了?
很快,新冠病毒的基因組發(fā)表了,不同團隊發(fā)表的序列高度一致,是同一種病毒沒(méi)跑了(序列編號MN908947,NC_045512,MN938384,MN975262等等)。更多新序列可以在GISAID網(wǎng)站索取。
讓我們來(lái)看看這害人的小妖精是何方妖孽。
首先,冠狀病毒長(cháng)這樣,表面很多刺頭被人們美化成皇冠上的明珠,故而得名冠狀病毒,其實(shí)一個(gè)帶刺的大球球,是不是有點(diǎn)像小時(shí)候玩的蒼耳?蒼耳很容易粘到衣服上,靠的就是表面密密麻麻的刺。冠狀病毒也是一樣,圖中紫色的蛋白就是它的刺,特異性識別人體粘膜蛋白ACE2,所以保護好我們口鼻眼的粘膜就很重要了。
圖1: 冠狀病毒(圖片來(lái)自百度)
于是就有科學(xué)家從這根刺上下手,想辦法封閉掉這刺,就避免了感染人體,包括抗體,小RNA,疫苗,細胞免疫等技術(shù)。也有其他科學(xué)家團隊從其他角度入手,此處不一一列舉了。
我們今天主要是來(lái)認識這根刺(英文名SPIKE,縮寫(xiě)S)。
新冠病毒的S蛋白有1273個(gè)氨基酸,有發(fā)表的其他冠狀病毒S蛋白序列稍長(cháng)稍短,不一而足。總體而言,S蛋白是三聚體,俗稱(chēng)三花聚頂。它有一個(gè)長(cháng)長(cháng)的桿,和一個(gè)大大的頭。桿的位置序列保守,如果針對這個(gè)部位用抗體封閉就舉一反三了,但是桿子被大頭擋住了,很難下手。大頭成了繞不過(guò)去的一道坎,但是大頭的序列就不如桿的序列保守了,它多變,像個(gè)傲嬌的小女人。大頭也叫RBD,就是和人體蛋白結合的區域,在不同的冠狀病毒中序列不一樣,也就導致和人體蛋白結合的強弱不一。很明顯,新冠比SARS引起的病癥要弱,毒性低,但是潛伏期長(cháng),傳染更隱秘。這是病毒進(jìn)化的結果,更好地依賴(lài)宿主生存和傳播,而不是一上來(lái)就搞死宿主。
病毒究竟是怎樣進(jìn)化得更聰明的呢? 這是一個(gè)深奧的課題,病毒在地球存在了幾十億年,有150萬(wàn)種之多。人類(lèi)才出現幾十萬(wàn)年,我們認識到的病毒只是其中的冰山一角,所以我們要尊重它們的存在,這個(gè)自然界真正的霸主。
比較已經(jīng)發(fā)布的病毒序列可以看出一點(diǎn)端倪。于是我們把大頭的氨基酸序列丟到數據庫中比對,終于發(fā)現了一點(diǎn)線(xiàn)索。圖2展示的結果顯示出與新冠病毒的大頭最相似的序列是來(lái)自蝙蝠的SARS樣冠狀病毒(AGZ48806,ATO98157)。巧的是,這兩條序列都是武漢病毒所的石正麗的團隊發(fā)表的。所以就有了網(wǎng)上討伐石教授泄露病毒的謠言。序列雖然相似,但是要進(jìn)化到完全一樣,需要幾十年的時(shí)間。幾十年前還沒(méi)這個(gè)團隊呢。
圖2 大頭的序列比對
好了,下面要劃重點(diǎn)了。
當我們把最相似的幾十條序列排好隊仔細查看的時(shí)候,發(fā)現了一些關(guān)鍵氨基酸的區別。
EPI_ISL_410721 LCFTNVYADSFVVRGDEVRQIAPGQTGRIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNY
MN908947 LCFTNVYADSFVIRGDEVRQIAPGQTGKIADYNYKLPDDFTGCVIAWNSNNLDSKVGGNY
ATO98157.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFLGCVLAWNTNSKDSSTSGNY
AGZ48806.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFLGCVLAWNTNSKDSSTSGNY
AGZ48828.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFTGCVLAWNTRNIDATQTGNY
AHX37558.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSSGNF
QDF43825.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
ATO98231.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
ATO98218.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV91631.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAU04662.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAU04649.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAU04646.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
ABF68957.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV97986.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV97989.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV97990.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV49719.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV49723.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAS10463.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV98001.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAU04664.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV97985.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV49722.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAU93319.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV98000.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAU04661.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAV49720.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
AAS00003.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
BAE93401.1 LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
3SCI_E LCFSNVYADSFVVKGDDVRQIAPGQTGVIADYNYKLPDDFMGCVLAWNTRNIDATSTGNY
***:********::**:********** ************ ***:***:.. *:. **
圖3 與大頭最相似的序列的比對
序列相似性從上到下漸行漸遠。最上面的一行序列是來(lái)自穿山甲的(EPI_ISL_410721),是最相似大頭的(MN908947),所以穿山甲有可能是中間宿主。其次相似的是來(lái)自蝙蝠的冠狀病毒樣序列(ATO98157,AGZ48806),標黃的氨基酸N(天冬酰氨)和大頭一致。其他序列均來(lái)自SARS,在這個(gè)關(guān)鍵氨基酸上卻是R(精氨酸)。由此可見(jiàn)新冠與蝙蝠來(lái)源的更接近,而距離SARS遠些。
憑什么說(shuō)這個(gè)標黃的氨基酸N是關(guān)鍵氨基酸呢?
那是在很久很久以前啦,有人發(fā)表了SARS的刺頭與人體蛋白ACE2的復合結構(PDB網(wǎng)站搜索2AJF),這個(gè)結構就展示了刺頭上能結合ACE2的關(guān)鍵氨基酸,如圖4所示。
圖4: SARS的刺頭結合人體ACE2蛋白的結構展示(PDB:2AJF)
圖中綠色的波浪卷是人體ACE2,青色的是SARS刺頭蛋白,二者之間形成氫鍵(黃色虛線(xiàn))的關(guān)鍵氨基酸側鏈都在沒(méi)有固定結構的環(huán)上。
那么新冠的大頭又會(huì )怎樣呢?
通過(guò)軟件SWISS MODEL模擬新冠病毒大頭的RBD結構,發(fā)現它與SARS刺頭結構很相似,而上文提到的標黃的關(guān)鍵氨基酸N在圖5中左邊顯示,明顯比SARS刺頭的R要短,不能與ACE2有效形成氫鍵,其他關(guān)鍵氨基酸不變,故而新冠大頭的親和力弱于SARS刺頭。這也就解釋了新冠毒性弱的根本原因。
圖5 模擬的新冠病毒大頭與人體蛋白ACE2結合的結構
圖中綠色的波浪卷是人體ACE2,青色的是SARS刺頭蛋白,黃色是模擬的新冠的大頭。紅圈顯示關(guān)鍵氨基酸的變化R變成N之后,側鏈變短不能形成氫鍵。而其他氨基酸一致。
大頭RBD中的結合區域的氨基酸序列如下:
大家留意到序列中幾個(gè)氨基酸標紅了,這些就是大頭序列中與人體蛋白ACE2會(huì )結合的關(guān)鍵氨基酸。其中標黃的則是與SARS不一樣的氨基酸,其他標紅的一致。值得一提的是,近期發(fā)表的穿山甲中攜帶的冠狀病毒序列與新冠病毒的關(guān)鍵氨基酸完全一致。
好了,重點(diǎn)講完了。今天介紹了新冠給大家認識,從病毒總體到S蛋白,然后到大頭區域。
從根本上認識病毒,才讓我們不畏懼它,才能找到它的弱點(diǎn)戰勝它。
參考:
2 PLoS Pathog. 2017 Nov 30; 13(11):e1006698. Discovery of a rich gene pool of bat SARS-related coronaviruses provides new insights into the origin of SARS coronavirus.
3 Nature. 2013 Nov 28; 503(7477): 535–538. Isolation and characterization of a bat SARS-like coronavirus that uses the ACE2 receptor.
4 Viruses. 2019 Nov; 11(11): 979. Viral Metagenomics Revealed Sendai Virus and Coronavirus Infection of Malayan Pangolins (Manis javanica)
5 Science. 2005 Sep 16;309(5742):1864-8. Structure of SARS coronavirus spike receptor-binding domain complexed with receptor.