狂犬病毒生物信息学分析文档格式.docx
《狂犬病毒生物信息学分析文档格式.docx》由会员分享,可在线阅读,更多相关《狂犬病毒生物信息学分析文档格式.docx(9页珍藏版)》请在冰豆网上搜索。
生命科学与工程学院
专业:
基础兽医学
摘要:
狂犬病病毒(rabies virus,RV)是引起中枢神经系统感染的急性人畜共患传染病。
狂犬病病毒基因组是由单股负链、不分节段的RNA组成。
基因组编码病毒的核蛋白(N)、磷酸化蛋白(NS)、基质蛋白(M)、糖蛋白(G)和依赖RNA的RNA多聚酶(L)5个主要结构蛋白。
N蛋白是组成病毒粒子的主要核蛋白,是诱导狂犬病细胞免疫的主要成分,常用于狂犬病病毒的诊断、分类和流行病学研究。
本文就核蛋白(N)的理化性质、蛋白质结构、系统进化关系等进行了预测和分析,预测结果表明核蛋白的一级结构稳定,为亲水性蛋白,有两个跨膜区,ABLV病毒与其它6个基因型的病毒亲缘关系较其他病毒近,但之间又有明显的距离。
关键字狂犬病毒;
核蛋白;
理化性质;
蛋白质结构预测;
系统进化分析
狂犬病病毒在野生动物(狼、狐狸、鼬鼠、蝙蝠等)及家养动物(狗、猫、牛等)与人之间构成狂犬病的传播环节。
人主要被病兽或带毒动物咬伤后感染。
一旦受染,如不及时采取有效防治措施,可导致严重的中枢神经系统急性传染病,病死率高。
狂犬病是由狂犬病病毒(rabies virus,RV)引起的中枢神经系统感染的急性人畜共患传染病。
所有温血动物都可感染,狂犬病一旦发病,病死率几乎100%[1],是人类病死率最高的急性传染病之一。
该病流行于100多个国家和地区,中国的狂犬病发病率占世界第二位,仅次于印度[2]。
狂犬病病毒基因组是由11928或11932个核苷酸组成的单股负链、不分节段的RNA,分子量约4.6×
106。
基因组从3′端至5′端的排列依次为N、NS、M、G、L5个结构基因,各基因的序列长度分别为1421、991/804/805、1675/2059、2069、6429/6384个核苷酸,分别编码病毒的核蛋白(N)、磷酸化蛋白(NS)、基质蛋白(M)、糖蛋白(G)和依赖RNA的RNA多聚酶(L)5个主要结构蛋白[3]。
1993年Bourhy[4]等人根据狂犬病毒属N基因的氨基酸和核苷酸相似的百分率,将狂犬病毒属分为6种基因型:
基因型l(CVS原型株)、基因型2(Lagos-bat病毒原型株)、基因型3(Mokola病毒原型株)、基因型4(Duvenhage病毒原型株)、基因型5(EBL1欧洲蝙蝠狂
犬病毒)、基因型6(EBL2)。
1996年7月,澳大利亚首次报道了发现于果蝠体内的Lyssavirus,被定为基因7型,即ABLV[5]。
在中亚吉尔吉斯斯坦的小鼠耳蝠(Myotisblythi)中分离到Aravan病毒,对其N基因及推导的氨基酸序列进行分析,发现它与已知的7个基因型的病毒均有明显区别,MAbs检测其抗原特性与其他类型的病毒也有区别,因此有人认为这是一种新的基因型[4]。
因而本文章对狂犬病毒的7个基因型的毒株做些简单的生物信息学的分析研究,进而推断出其间的联系。
1材料和方法
1.1基因序列的获得
从GeneBank上检索狂犬病病毒基因型l(CVS原型株)、基因型2(Lagos-bat病毒原型株)、基因型3(Mokola病毒原型株)、基因型4(Duvenhage病毒原型株)、基因型5(EBL1欧洲蝙蝠狂犬病毒)、基因型6(EBL2)、基因型7(ABLV)、印第安娜州的水泡性口炎病毒、麻疹病毒、小反刍兽疫病毒、RioMamore病毒、传染性鲑鱼贫血病毒、人类冠状病毒229E、禽传染性支气管炎病毒的编码核蛋白的基因序列和其氨基酸序列。
1.2ABLV核蛋白的理化性质、跨膜区、结构域及结构预测
对GeneBank上下载狂犬病毒的不同基因型分离毒株核蛋白基因序列及其核蛋白氨基酸序列。
采用在线软件Protparam和Protscal(http:
//www.expasy.ch/tools/protscale.html)对其蛋白质的理化性质和疏水性进行分析。
核蛋白跨膜区分析用工具TMpred;
蛋白质二级结构的预测采用CFSSP工具分析(http:
//www.biogem.org/tool/chou-fasman/);
结构域采用InterPro工具分析;
蛋白质三级结构预测采用SWISS-MODEL/Phyre。
1.3ABLV与其它基因型的狂犬病毒系统进化分析比较
对已经提交GeneBank的狂犬病毒7个不同基因型的病毒ABLV、cvs、Duvenhage、EBL1、EBL2、Lagos-bat、Mokola的核蛋白基因进行系统进化分析。
通过CLUSTALX对序列进行比对,然后采用MEGA5.10软件基于NJ(neighbor-joining)法构建系统进化树,自举分析通过1000次循环实现。
2结果
2.1ABLV核蛋白的理化性质及结构预测
2.1.1ABLV核蛋白理化性质
核蛋白包含1353个核苷酸,编码450个氨基酸,氨基酸组成见图1,分子量为50.6763kDa,理论等电点为6.04,氨基酸组成为Ala(A)33、Arg(R)23、Asn(N)20、Asp(D)26、Cys(C)6、Gln(Q)11、Glu(E)30、Gly(G)29、His(H)11、Ile(I)29、Leu(L)33、Lys(K)26、Met(M)12、Phe(F)26、Pro(P)16、Ser(S)38、Thr(T)29、Trp(W)3、Tyr(Y)21、Val(V)26,蓝色区为可能的起始密码子,即为ATG,红色为终止密码子即为ATT,含强酸性氨基酸(Asp,Glu)56个,强碱性氨基酸(Arg,Lys)49个,消光系数在体外哺乳动物的红细胞的半衰期为30小时,在酵母中的半衰期大于20分钟,在细菌中的半衰期大于10小时。
蛋白质的不稳定指数为35.51,表明蛋白质的一级结构稳定。
脂肪指数为77.82。
总平均亲水性值为-0.297,核蛋白为亲水性蛋白,核蛋白含有较多的亲水性区域,分布较为均匀,其中25-50,150-175,260-280,350-400区段亲水性较高,表明这几个区域作为抗原表位的可能性较大。
结果见图2。
图1ABLV核蛋白基因序列及对应的氨基酸序列
Fig.1AnimoacidsequenceandgenesequenceoftheNofABLV
图2ABLV核蛋白的疏水性分析
Fig.2ThehydrophobicityanalysisoftheNofABLV
2.1.2跨膜区分析
利用TMpred工具,得出的结果,如图3,可以分析到ABLV基因型的狂犬病毒核蛋白的氨基酸从343-365之间可能有跨膜螺旋。
图4,表明其跨膜区可能在350-400之间。
而利用TMHMM工具,如图5,可能存在的跨膜区为200-250和300-350。
图3ABLV核蛋白中可能存在的跨膜区分析
Fig.3theanalysisofthetransmembraneofABLVnucleoprotein
图4ABLV核蛋白中可能存在的跨膜区分析
Fig.4theanalysisofthetransmembraneofABLVnucleoprotein
图5ABLV核蛋白可能存在的跨膜区分析
Fig.5theanalysisofthetransmembraneofABLVnucleoprotein
2.1.2结构域分析
所有的单股负链RNA病毒都包含完全由核蛋白包裹病毒基因组成的核糖核
蛋白复合体。
核蛋白和单链RNA的复合体结构包括水泡性口炎病毒(VSV)和狂犬病病毒(RABV)两种弹状病毒家族成员。
N-端的结构域为45-230,N-端结构域的羟基末端存在一个RNA结合域,即N-端延伸到C-端的环状结构是RNA结合域。
C-端的结构域为233-447,具体作用还不清楚。
图6ABLV核蛋白的结构域分析
Fig.6theanalysisofthethestructuraldomainofABLVnucleoprotein
2.1.3ABLV核蛋白的二级及三级结构预测
二级结构在线预测结果表明,核蛋白二级结构中α-螺旋占62.4%、β-折叠占37.6%、无规则卷曲占12.2%,见图7。
利用SWISS-MODEL进行三维结构预测,但是没有与其相似的三级结构。
利用Phyre对氨基酸序列进行三级结构预测,能选出相近的三级结构,如图8和9。
图8中蓝色箭头表示β-折叠;
绿色螺旋表示α-螺旋;
其他氨基酸序列都为无规则卷曲。
图9中枚红色为α-螺旋;
黄色箭头为β-折叠;
其他区域为无规则卷曲。
图7VP1二级结构预测
Fig.7Thesecondarystructureforecast
图8ABLV核蛋白与已知类似序列的比对
Fig.8thealignmentofABLVnucleoproteinwithknownsimilarsequence
图9ABLV核蛋白三级结构预测
Fig.9thetertiarystructurepredictionofABLVnucleoprotein
2.2多序列比对分析及系统进化树
2.2.1病毒核蛋白系统进化树分析
对狂犬病毒ABLV的核蛋白氨基酸序列和其他从GeneBank下载的病毒的核蛋白氨基酸序列进行多个序列比对。
利用MEGA5.10软件构建NJ进化树(图10)。
图上的英文名对应中文名依次为7个基因型的狂犬病毒、印第安娜州的水泡性口炎病毒、麻疹病毒、小反刍兽疫病毒、RioMamore病毒、传染性鲑鱼贫血病毒、人类冠状病毒229E、禽传染性支气管炎病毒。
从图上可以看出7个基因型的狂犬病毒的亲缘关系比其它病毒的关系近;
7个基因型的狂犬病毒、印第安娜州的水泡性口炎病毒、麻疹病毒、小反刍兽疫病毒与RioMamore病毒、传染性鲑鱼贫血病毒、人类冠状病毒229E、禽传染性支气管炎病毒为两大类病毒,即亲缘关系较远,其中印第安娜州的水泡性口炎病毒与7个基因型的狂犬病毒的亲缘关系最近;
麻疹病毒与小反刍兽疫病毒和人类冠状病毒229E、禽传染性支气管炎病毒的亲缘关系比7个基因型的狂犬病毒之间的近,其他的之间较远。
图10病毒核蛋白系统进化树(节点处数字表示重复1000次的Bootstrap值)
Fig.10Phylogenetictreeofthevirusnucleoprotein
3分析讨论
近年来,在我国不同地区出现了狂犬病发病潜伏期变短等新的流行特征,这可能意味着我国流行的街毒的毒力与致病性有增强[6]。
然而,狂犬病毒N基因
相对保守,占病毒总蛋白的36%,常可以用于狂犬病毒的基因分型及分子流行病学研究[6]。
因此,它可作为狂犬病分子生物学诊断和基因工程疫苗研制的靶基因。
Takita等[7]通过应用小鼠免疫实验说明核蛋白和糖蛋白一样也是一种重要的保护性抗原,抗狂犬病毒核衣壳抗体具有抵御狂犬病毒攻击的保护作用,在体内能抵抗狂犬病毒感染。
本文对狂犬病毒ABLV核蛋白氨基酸序列的理论等电点为6.04、总平均亲水性值为-0.297,表明此蛋白亲水性好。
α-螺旋、β-折叠等二级结构的化学键(氢键)键能