1、/genetics.bwh.harvard.edu/pph2/SIFT:/sift.jcvi.org/以上两个在线应用的软件,主要对以上两个在线应用的软件,主要对以上两个在线应用的软件,主要对以上两个在线应用的软件,主要对SNPSNPSNPSNP以及点突以及点突以及点突以及点突变进行功能预测,但预测限于错义突变,其他无变进行功能预测,但预测限于错义突变,其他无变进行功能预测,但预测限于错义突变,其他无变进行功能预测,但预测限于错义突变,其他无义突变(突变为终止密码)、碱基缺失、插入所义突变(突变为终止密码)、碱基缺失、插入所义突变(突变为终止密码)、碱基缺失、插入所义突变(突变为终止密码)、碱
2、基缺失、插入所造成的框移突变,以及起始密码子的突变均不可造成的框移突变,以及起始密码子的突变均不可造成的框移突变,以及起始密码子的突变均不可造成的框移突变,以及起始密码子的突变均不可以预测!以预测!Uniport database:/www.uniprot.org/这个网址用于查找蛋白质序列和获取这个网址用于查找蛋白质序列和获取FASTAFASTA格式格式数据准备数据准备两个网站均为在线提交数据,提交的数据文件格式可有以下两种:第一种为蛋白质的氨基酸序列,按照FASTAFASTAFASTAFASTA格式编写第二种为蛋白质在Uniport database中的ID获取蛋白质序列或获取蛋白质序列或
3、ID可以在NCBI中查找,也可以直接在Uniport database中查找此处填写蛋白质名称此处填写蛋白质名称此处填写蛋白质名称此处填写蛋白质名称查询结果仔细核对以上数据,ID就是所在polyphen2中需要号码,以human DAX-1为例,ID为P51843IDID蛋白质名称蛋白质名称种属种属点击所需要的蛋白质ID链接,在出现的页面中可以详细查看DAX-1的信息,再次核对是否正确,注意右上角的几列标签,如图点击,获取点击,获取FASTAFASTA格式数据,此数据可能会被下载,格式数据,此数据可能会被下载,下载后可以用记事本程序打开,或者有时会在浏览器下载后可以用记事本程序打开,或者有时会
4、在浏览器中直接打开,可以将其中数据全部复制备用,下方即中直接打开,可以将其中数据全部复制备用,下方即是打开的是打开的FASTAFASTA数据,最上面是蛋白质的信息(含数据,最上面是蛋白质的信息(含IDID、名称、种属),下方是氨基酸序列名称、种属),下方是氨基酸序列sp|P51843|NR0B1_HUMAN Nuclear receptor subfamily 0 group B member 1 OS=Homo sapiens GN=NR0B1 PE=1 SV=2MAGENHQWQGSILYNMLMSAKQTRAAPEAPETRLVDQCWGCSCGDEPGVGREGLLGGRNVALLYR
5、CCFCGKDHPRQGSILYSMLTSAKQTYAAPKAPEATLGPCWGCSCGSDPGVGRAGLPGGRPVALLYRCCFCGEDHPRQGSILYSLLTSSKQTHVAPAAPEARPGGAWWDRSYFAQRPGGKEALPGGRATALLYRCCFCGEDHPQQGSTLYCVPTSTNQAQAAPEERPRAPWWDTSSGALRPVALKSPQVVCEAASAGLLKTLRFVKYLPCFQVLPLDQQLVLVRNCWASLLMLELAQDRLQFETVEVSEPSMLQKILTTRRRETGGNEPLPVPTLQHHLAPPAEARKVPSASQVQAIKCFL
6、SKCWSLNISTKEYAYLKGTVLFNPDVPGLQCVKYIQGLQWGTQQILSEHTRMTHQGPHDRFIELNSTLFLLRFINANVIAELFFRPIIGTVSMDDMMLEMLCTKIPolyphen2应用进入网站:/genetics.bwh.harvard.edu/pph2/在这里以我们以前在这里以我们以前发现的发现的DAX-1 DAX-1 L262PL262P这个突变举这个突变举例,在红框出填入例,在红框出填入已经查到的已经查到的IDID,下,下方方FASTAFASTA数据可以数据可以不用输;绿框中输不用输;绿框中输入突变氨基酸位置;入突变氨基酸位置;在在AA1A
7、A1中选择中选择L L,AA2AA2中选择突变后中选择突变后的的P P,最后点,最后点SubmitSubmit运行画面每隔每隔5-105-10秒点秒点refreshrefresh刷新页刷新页面,直至面,直至ResultsResults中出现中出现ViewView,然后点击,然后点击ViewView结果一般突变预测一般突变预测看第二条图看第二条图HumVarHumVar的结果,的结果,分数越接近分数越接近1.01.0,损害可能越,损害可能越大,越接近大,越接近0 0,损害可能性越损害可能性越小:结果分为小:结果分为benignbenign,possibly possibly damagingda
8、maging以及以及probably probably damagingdamaging注:注:possiblypossibly为为有可能,有可能,probablyprobably为很可为很可能能练习小常所发现的SF-1基因一处SNP:G146A,请用Polyphen2 进行预测,蛋白质功能是否受到影响?最后结果SIFT进入网站:/sift.jcvi.org/在single protein tools中找到SIFT sequence,点击打开进入数据提交新页面填入自己填入自己emailemail,SIFTSIFT运算时间在运算时间在20min20min左右,你左右,你可以等,也可以让他把邮件发
9、送过来可以等,也可以让他把邮件发送过来蛋白质蛋白质FASTAFASTA数据,将下载好的蛋白质数据,将下载好的蛋白质FastaFasta数据上传即可数据上传即可或者将用记事本或浏览器打开的或者将用记事本或浏览器打开的FastaFasta数数据据copycopy至此数据框中,蛋白质序列可以至此数据框中,蛋白质序列可以截选,但必须有截选,但必须有第一行的第一行的蛋白质信息数蛋白质信息数据据此处填蛋白质突变或此处填蛋白质突变或SNPSNP位点信息,位点信息,如如S578NS578N,L262PL262P,G146AG146A等等SIFT预测AR S578N功能变化在Uniport中搜索Androgen
10、 Receptor,下载FASTA数据,如下图为浏览器打开后的结果sp|P10275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQQQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQ
11、EAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYNFPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFT
12、APDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGSCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNVNSRMLYFAPDLVFNEYRMHKSRMYSQCVRMRHLSQEFGWL
13、QITPQEFLCMKALLLFSIIPVDGLKNQKFFDELRMNYIKELDRIIACKRKNPTSCSRRFYQLTKLLDSVQPIARELHQFTFDLLIKSHMVSVDFPEMMAEIISVQVPKILSGKVKPIYFHTQ此为第一行蛋白质信息,如果采用此为第一行蛋白质信息,如果采用copycopy至数据输入框,而不是采用文件上传方法,至数据输入框,而不是采用文件上传方法,红框中数据必须黏贴进输入框,而后面的蛋白质序列只需黏贴需要部分红框中数据必须黏贴进输入框,而后面的蛋白质序列只需黏贴需要部分注意:一般来说用文件上传方法注意:一般来说用文件上传方法比较简单,但比较简单,但
14、SIFTSIFT对氨基酸序列对氨基酸序列有要求,大于有要求,大于500500的氨基酸序列的氨基酸序列不能分析,故像不能分析,故像ARAR这种有这种有919919个个AAAA的就不能采用直接上传模式,的就不能采用直接上传模式,而要将氨基酸序列裁剪过后按而要将氨基酸序列裁剪过后按FastaFasta格式黏贴至数据框中格式黏贴至数据框中sp|P10275|ANDR_HUMAN Androgen receptor OS=Homo sapiens GN=AR PE=1 SV=2MEVQLGLGRVYPRPPSKTYRGAFQNLFQSVREVIQNPGPRHPEAASAAPPGASLLLLQQQQQQQ
15、QQQQQQQQQQQQQQETSPRQQQQQQGEDGSPQAHRRGPTGYLVLDEEQQPSQPQSALECHPERGCVPEPGAAVAASKGLPQQLPAPPDEDDSAAPSTLSLLGPTFPGLSSCSADLKDILSEASTMQLLQQQQQEAVSEGSSSGRAREASGAPTSSKDNYLGGTSTISDNAKELCKAVSVSMGLGVEALEHLSPGEQLRGDCMYAPLLGVPPAVRPTPCAPLAECKGSLLDDSAGKSTEDTAEYSPFKGGYTKGLEGESLGCSGSAAAGSSGTLELPSTLSLYKSGALDEAAAYQSRDYYN
16、FPLALAGPPPPPPPPHPHARIKLENPLDYGSAWAAAAAQCRYGDLASLHGAGAAGPGSGSPSAAASSSWHTLFTAEEGQLYGPCGGGGGGGGGGGGGGGGGGGGGGGGEAGAVAPYGYTRPPQGLAGQESDFTAPDVWYPGGMVSRVPYPSPTCVKSEMGPWMDSYSGPYGDMRLETARDHVLPIDYYFPPQKTCLICGDEASGCHYGALTCGS SCKVFFKRAAEGKQKYLCASRNDCTIDKFRRKNCPSCRLRKCYEAGMTLGARKLKKLGNLKLQEEGEASSTTSPTEETTQKLTVSHIEGYECQPIFLNVLEAIEPGVVCAGHDNNQPDSFAALLSSLNELGERQLVHVVKWAKALPGFRNLHVDDQMAVIQYSWMGLMVFAMGWRSFTNV
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1