生物信息学实验报告文档格式.docx
《生物信息学实验报告文档格式.docx》由会员分享,可在线阅读,更多相关《生物信息学实验报告文档格式.docx(31页珍藏版)》请在冰豆网上搜索。
实验目的
了解常用的序列数据库,掌握基本的序列数据信息的查询方法。
教学基本要求
了解和熟悉NCBI核酸和蛋白质序列数据库,可以使用BLAST进行序列搜索,解读BLAST搜索结果,可以利用PHI-BLAST等工具进行蛋白质序列的结构域搜索,解读蛋白质序列信息,可以在蛋白质三维数据库中查询相关结构信息并进行显示。
实验容提要
在序列数据库中查找某条基因序列(BRCA1),通过相关一系列数据库的搜索、比对与结果解释,回答以下问题:
1.该基因的基本功能?
2.编码的蛋白质序列是怎样的?
3.该蛋白质有没有保守的功能结构域(NCBICD-search)?
4.该蛋白质的功能是怎样的?
5.该蛋白质的三级结构是什么?
如果没有的话,和它最相似的同源物的结
构是什么样子的?
给出示意图。
实验结果及结论
Thisgeneencodesanuclearphosphoproteinthatplaysaroleinmaintaininggenomicstability,anditalsoactsasatumorsuppressor.Theencodedproteincombineswithothertumorsuppressors,DNAdamagesensors,andsignaltransducerstoformalargemulti-subunitproteincomplexknownastheBRCA1-associatedgenomesurveillancecomplex(BASC).ThisgeneproductassociateswithRNApolymeraseII,andthroughtheC-terminaldomain,alsointeractswithhistonedeacetylasecomplexes.Thisproteinthusplaysaroleintranscription,DNArepairofdouble-strandedbreaks,andrecombination.Mutationsinthisgeneareresponsibleforapproximately40%ofinheritedbreastcancersandmorethan80%ofinheritedbreastandovariancancers.Alternativesplicingplaysaroleinmodulatingthesubcellularlocalizationandphysiologicalfunctionofthisgene.Manyalternativelysplicedtranscriptvariants,someofwhicharedisease-associatedmutations,havebeendescribedforthisgene,butthefull-lengthnaturesofonlysomeofthesevariantshasbeendescribed.Arelatedpseudogene,whichisalsolocatedonchromosome17,hasbeenidentified.[providedbyRefSeq,May2009]
[Homosapiens]
1mdlsalrveevqnvinamqkilecpiclelikepvstkcdhifckfcmlkllnqkkgpsq
61cplcknditkrslqestrfsqlveellkiicafqldtgleyansynfakkennspehlkd
121evsiiqsmgyrnrakrllqsepenpslqetslsvqlsnlgtvrtlrtkqriqpqktsvyi
181elgsdssedtvnkatycsvgdqellqitpqgtrdeisldsakkaacefsetdvtntehhq
241psnndlnttekraaerhpekyqgssvsnlhvepcgtnthasslqhenssllltkdrmnve
301kaefcnkskqpglarsqhnrwagsketcndrrtpstekkvdlnadplcerkewnkqklpc
361senprdtedvpwitlnssiqkvnewfsrsdellgsddshdgesesnakvadvldvlnevd
421eysgssekidllasdphealickservhsksvesniedkifgktyrkkaslpnlshvten
481liigafvtepqiiqerpltnklkrkrrptsglhpedfikkadlavqktpeminqgtnqte
541qngqvmnitnsghenktkgdsiqneknpnpieslekesafktkaepisssisnmelelni
601hnskapkknrlrrksstrhihalelvvsrnlsppnctelqidscssseeikkkkynqmpv
661rhsrnlqlmegkepatgakksnkpneqtskrhdsdtfpelkltnapgsftkcsntselke
721fvnpslpreekeekletvkvsnnaedpkdlmlsgervlqtersvesssislvpgtdygtq
781esisllevstlgkaktepnkcvsqcaafenpkglihgcskdnrndtegfkyplghevnhs
841retsiemeeseldaqylqntfkvskrqsfapfsnpgnaeeecatfsahsgslkkqspkvt
901feceqkeenqgknesnikpvqtvnitagfpvvgqkdkpvdnakcsikggsrfclssqfrg
961netglitpnkhgllqnpyripplfpiksfvktkckknlleenfeehsmsperemgnenip
1021stvstisrnnirenvfkeasssninevgsstnevgssineigssdeniqaelgrnrgpkl
1081namlrlgvlqpevykqslpgsnckhpeikkqeyeevvqtvntdfspylisdnleqpmgss
1141hasqvcsetpddllddgeikedtsfaendikessavfsksvqkgelsrspspfththlaq
1201gyrrgakklesseenlssedeelpcfqhllfgkvnnipsqstrhstvateclsknteenl
1261lslknslndcsnqvilakasqehhlseetkcsaslfssqcseledltantntqdpfligs
1321skqmrhqsesqgvglsdkelvsddeergtgleennqeeqsmdsnlgeaasgcesetsvse
1381dcsglssqsdilttqqrdtmqhnliklqqemaeleavleqhgsqpsnsypsiisdssale
1441dlrnpeqstsekavltsqksseypisqnpeglsadkfevsadsstsknkepgversspsk
1501cpslddrwymhscsgslqnrnypsqeelikvvdveeqqleesgphdltetsylprqdleg
1561tpylesgislfsddpesdpsedrapesarvgnipsstsalkvpqlkvaesaqspaaahtt
1621dtagynameesvsrekpeltastervnkrmsmvvsgltpeefmlvykfarkhhitltnli
1681teetthvvmktdaefvcertlkyflgiaggkwvvsyfwvtqsikerkmlnehdfevrgdv
1741vngrnhqgpkraresqdrkifrgleiccygpftnmptdqlewmvqlcgasvvkelssftl
1801gtgvhpivvvqpdawtedngfhaigqmceapvvtrewvldsvalyqcqeldtylipqiph
1861shy
有保守的供能结构域。
Mov34/MPN/PAD-1family:
BRCC36,asubunitofBRCA1-Acomplex
同第一题答案。
实验二双序列比对
练习使用动态规划算法进行双序列比对;
理解打分矩阵和参数对双序列比对结果的影响;
理解动态规划算法的原理。
动态规划算法是序列比对最基本的算法,可以确保找到最优比对。
分为全局比对(Needleman-Wunchalgorithm)和局部比对算法(Smith-Watermanalgorithm)。
通过本实验的练习,更好的理解动态规划算法。
对如下的两条序列进行双序列比对分析:
>
DrosophilaSex-lethalprotein
ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAFVDFTSEMDSQRAIKVLNG
MouseHucRBD
MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGFVNYSDPNDADKAINTLNGL
这些蛋白质包含一个RNA识别模体(RNARecognitionMotif,RRM)。
该模体
包含两个高度保守的两个功能区RNP1和RNP2(已用红色标记)。
1.RNP1和RNP2是否得到比对?
选择至少三个(差别大的)空位罚分和延伸值来进行比对,
2a.算法是否找到RNP1和RNP2的正确比对?
b.当空位开启罚分高时,结果发生什么变化?
c.当空位延伸罚分高时,结果发生什么变化?
d.为什么k个连续的空位罚分要小于k个间隔的空位罚分?
使用PAM250矩阵重复上述过程。
3.比对结果是否发生变化?
继续进行这两条序列的局部比对,通过ebi的在线工具完成练习,网址:
(.ebi.ac.uk/Tools/psa/emboss_water/)
4a.RNP1和RNP2是否在局部比对中得到比对?
b.局部比对的生物学意义是什么?
c.为什么在这种比对中我们选择局部比对而不是全局比对?
采用不同的打分参数和其它打分矩阵