ImageVerifierCode 换一换
格式:DOCX , 页数:37 ,大小:1.46MB ,
资源ID:9068109      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/9068109.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(生物信息学实验报告.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

生物信息学实验报告.docx

1、生物信息学实验报告生物信息学实验报告 班级: : 学号: 日期: 实验一 核酸和蛋白质序列数据的使用实验目的了解常用的序列数据库,掌握基本的序列数据信息的查询方法。教学基本要求了解和熟悉NCBI 核酸和蛋白质序列数据库,可以使用BLAST进行序列搜索,解读BLAST 搜索结果,可以利用PHI-BLAST 等工具进行蛋白质序列的结构域搜索,解读蛋白质序列信息,可以在蛋白质三维数据库中查询相关结构信息并进行显示。实验容提要在序列数据库中查找某条基因序列(BRCA1),通过相关一系列数据库的搜索、比对与结果解释,回答以下问题:1. 该基因的基本功能?2. 编码的蛋白质序列是怎样的?3. 该蛋白质有没

2、有保守的功能结构域 (NCBI CD-search)?4. 该蛋白质的功能是怎样的?5. 该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结构是什么样子的?给出示意图。实验结果及结论1. 该基因的基本功能?This gene encodes a nuclear phosphoprotein that plays a role in maintaining genomic stability, and it also acts as a tumor suppressor. The encoded protein combines with other tumor suppressor

3、s, DNA damage sensors, and signal transducers to form a large multi-subunit protein complex known as the BRCA1-associated genome surveillance complex (BASC). This gene product associates with RNA polymerase II, and through the C-terminal domain, also interacts with histone deacetylase complexes. Thi

4、s protein thus plays a role in transcription, DNA repair of double-stranded breaks, and recombination. Mutations in this gene are responsible for approximately 40% of inherited breast cancers and more than 80% of inherited breast and ovarian cancers. Alternative splicing plays a role in modulating t

5、he subcellular localization and physiological function of this gene. Many alternatively spliced transcript variants, some of which are disease-associated mutations, have been described for this gene, but the full-length natures of only some of these variants has been described. A related pseudogene,

6、 which is also located on chromosome 17, has been identified. provided by RefSeq, May 20092. 编码的蛋白质序列是怎样的?Homo sapiens1 mdlsalrvee vqnvinamqk ilecpiclel ikepvstkcd hifckfcmlk llnqkkgpsq 61 cplcknditk rslqestrfs qlveellkii cafqldtgle yansynfakk ennspehlkd 121 evsiiqsmgy rnrakrllqs epenpslqet slsvqlsn

7、lg tvrtlrtkqr iqpqktsvyi 181 elgsdssedt vnkatycsvg dqellqitpq gtrdeislds akkaacefse tdvtntehhq 241 psnndlntte kraaerhpek yqgssvsnlh vepcgtntha sslqhenssl lltkdrmnve 301 kaefcnkskq pglarsqhnr wagsketcnd rrtpstekkv dlnadplcer kewnkqklpc 361 senprdtedv pwitlnssiq kvnewfsrsd ellgsddshd gesesnakva dvldvl

8、nevd 421 eysgssekid llasdpheal ickservhsk svesniedki fgktyrkkas lpnlshvten 481 liigafvtep qiiqerpltn klkrkrrpts glhpedfikk adlavqktpe minqgtnqte 541 qngqvmnitn sghenktkgd siqneknpnp ieslekesaf ktkaepisss isnmelelni 601 hnskapkknr lrrksstrhi halelvvsrn lsppnctelq idscssseei kkkkynqmpv 661 rhsrnlqlme

9、gkepatgakk snkpneqtsk rhdsdtfpel kltnapgsft kcsntselke 721 fvnpslpree keekletvkv snnaedpkdl mlsgervlqt ersvesssis lvpgtdygtq 781 esisllevst lgkaktepnk cvsqcaafen pkglihgcsk dnrndtegfk yplghevnhs 841 retsiemees eldaqylqnt fkvskrqsfa pfsnpgnaee ecatfsahsg slkkqspkvt 901 feceqkeenq gknesnikpv qtvnitagf

10、p vvgqkdkpvd nakcsikggs rfclssqfrg 961 netglitpnk hgllqnpyri pplfpiksfv ktkckknlle enfeehsmsp eremgnenip 1021 stvstisrnn irenvfkeas ssninevgss tnevgssine igssdeniqa elgrnrgpkl 1081 namlrlgvlq pevykqslpg snckhpeikk qeyeevvqtv ntdfspylis dnleqpmgss 1141 hasqvcsetp ddllddgeik edtsfaendi kessavfsks vqkg

11、elsrsp spfththlaq 1201 gyrrgakkle sseenlssed eelpcfqhll fgkvnnipsq strhstvate clsknteenl 1261 lslknslndc snqvilakas qehhlseetk csaslfssqc seledltant ntqdpfligs 1321 skqmrhqses qgvglsdkel vsddeergtg leennqeeqs mdsnlgeaas gcesetsvse 1381 dcsglssqsd ilttqqrdtm qhnliklqqe maeleavleq hgsqpsnsyp siisdssal

12、e 1441 dlrnpeqsts ekavltsqks seypisqnpe glsadkfevs adsstsknke pgversspsk 1501 cpslddrwym hscsgslqnr nypsqeelik vvdveeqqle esgphdltet sylprqdleg 1561 tpylesgisl fsddpesdps edrapesarv gnipsstsal kvpqlkvaes aqspaaahtt 1621 dtagynamee svsrekpelt astervnkrm smvvsgltpe efmlvykfar khhitltnli 1681 teetthvvm

13、k tdaefvcert lkyflgiagg kwvvsyfwvt qsikerkmln ehdfevrgdv 1741 vngrnhqgpk raresqdrki frgleiccyg pftnmptdql ewmvqlcgas vvkelssftl 1801 gtgvhpivvv qpdawtedng fhaigqmcea pvvtrewvld svalyqcqel dtylipqiph 1861 shy3. 该蛋白质有没有保守的功能结构域 (NCBI CD-search)?有保守的供能结构域。Mov34/MPN/PAD-1 family: BRCC36, a subunit of BR

14、CA1-A complex4. 该蛋白质的功能是怎样的?同第一题答案。5. 该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结构是什么样子的?给出示意图。实验二 双序列比对实验目的练习使用动态规划算法进行双序列比对;理解打分矩阵和参数对双序列比对结果的影响;理解动态规划算法的原理。教学基本要求动态规划算法是序列比对最基本的算法,可以确保找到最优比对。分为全局比对( Needleman-Wunch algorithm ) 和局部比对算法(Smith-Waterman algorithm)。通过本实验的练习,更好的理解动态规划算法。实验容提要对如下的两条序列进行双序列比对分析: Dro

15、sophila Sex-lethal proteinASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAFVDFTSEMDSQRAIKVLNG Mouse Huc RBDMDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGFVNYSDPNDADKAINTLNGL这些蛋白质包含一个 RNA 识别模体(RNA Recognition Motif,RRM)。该模体包含两个高度保守的两个功能区RNP1 和RNP2(已用红色标记)。1. RNP1 和RNP2 是否得到比对?选择至少三个(差别大的)空位罚分和延伸值来

16、进行比对,2a. 算法是否找到RNP1 和 RNP2 的正确比对?b. 当空位开启罚分高时,结果发生什么变化?c. 当空位延伸罚分高时,结果发生什么变化?d. 为什么k 个连续的空位罚分要小于k 个间隔的空位罚分?使用PAM250 矩阵重复上述过程。3. 比对结果是否发生变化?继续进行这两条序列的局部比对,通过ebi 的在线工具完成练习,网址:(.ebi.ac.uk/Tools/psa/emboss_water/)4a. RNP1 和RNP2 是否在局部比对中得到比对?b. 局部比对的生物学意义是什么?c. 为什么在这种比对中我们选择局部比对而不是全局比对?采用不同的打分参数和其它打分矩阵。5

17、. 比对结果发生了什么变化?实验结果及结论1. RNP1 和RNP2 是否得到比对?RNP1 和RNP2 得到了比对。Gap open 10Gap extender 0.5 Gap open 20Gap extender 1 Gap open 1Gap extender 5Gap open 100Gap extender 5Gap open 1Gap extender 0.4Gap open 20Gap extender 0.42.a. 算法是否找到RNP1 和 RNP2 的正确比对?算法找到了RNP1 和 RNP2 的正确比对。b. 当空位开启罚分高时,结果发生什么变化?比对结果中空位变少。

18、c. 当空位延伸罚分高时,结果发生什么变化?几乎没有变化。d. 为什么k 个连续的空位罚分要小于k 个间隔的空位罚分?因为间隔的空位每个都是一次改变,连续的空位只是一次改变。3. 比对结果是否发生变化?继续进行这两条序列的局部比对,通过ebi 的在线工具完成练习,网址:(.ebi.ac.uk/Tools/psa/emboss_water/)比对结果没有发生变化。Gap open 10Gap extender 0.5Gap open 100Gap extender 0.5Gap open 1Gap extender 0.5Gap open 1Gap extender 0.0005Gap open

19、 1Gap extender 104a. RNP1 和RNP2 是否在局部比对中得到比对?RNP1 和RNP2 在局部比对中得到了比对。b. 局部比对的生物学意义是什么?更有可能得到序列保守域的比对。c. 为什么在这种比对中我们选择局部比对而不是全局比对?尽可能的减少误差。5.比对结果发生了什么变化?打分矩阵不同,得分不同,blosum数值越小,结果相似度越高,pam矩阵则相反。实验三 序列的点阵分析实验目的点阵分析是双序列分析最直观的工具,通过本实验了解点阵分析的原理和方法。教学基本要求了解和熟悉点阵分析的原理和参数对分析结果的影响,可以对结果进行解读和解释。实验容提要本实验在如下网址完成:

20、myhits.isbsib.ch/cgibin/dotlet首先学习根据dotlet 的在线教程,快速学习其基本使用方法和参数设置。然后进行如下的序列分析。回答问题:点阵分析的基本原理是什么?1. 重复序列通过点阵分析可以很容易的发现序列中的重复,果蝇的一个蛋白质(索引号码:P24014)中具有几个重复片段,请通过dotlet 分析,找到这些序列重复的片段。SLIT_DROME (P24014):MAAPSRTTLMPPPFRLQLRLLILPILLLLRHDAVHAEPYSGGFGSSAVSSGGLGSVGIHIPGGGVGVITEARCPRVCSCTGLNVDCSHRGLTSVPRKISA

21、DVERLELQGNNLTVIYETDFQRLTKLRMLQLTDNQIHTIERNSFQDLVSLERLDISNNVITTVGRRVFKGAQSLRSLQLDNNQITCLDEHAFKGLVELEILTLNNNNLTSLPHNIFGGLGRLRALRLSDNPFACDCHLSWLSRFLRSATRLAPYTRCQSPSQLKGQNVADLHDQEFKCSGLTEHAPMECGAENSCPHPCRCADGIVDCREKSLTSVPVTLPDDTTDVRLEQNFITELPPKSFSSFRRLRRIDLSNNNISRIAHDALSGLKQLTTLVLYGNKIKDLPSGVFKGLGSLRLLL

22、LNANEISCIRKDAFRDLHSLSLLSLYDNNIQSLANGTFDAMKSMKTVHLAKNPFICDCNLRWLADYLHKNPIETSGARCESPKRMHRRRIESLREEKFKCSWGELRMKLSGECRMDSDCPAMCHCEGTTVDCTGRRLKEIPRDIPLHTTELLLNDNELGRISSDGLFGRLPHLVKLELKRNQLTGIEPNAFEGASHIQELQLGENKIKEISNKMFLGLHQLKTLNLYDNQISCVMPGSFEHLNSLTSLNLASNPFNCNCHLAWFAECVRKKSLNGGAARCGAPSKVRDVQIKDLPHSEFK

23、CSSENSEGCLGDGYCPPSCTCTGTVVACSRNQLKEIPRGIPAETSELYLESNEIEQIHYERIRHLRSLTRLDLSNNQITILSNYTFANLTKLSTLIISYNKLQCLQRHALSGLNNLRVVSLHGNRISMLPEGSFEDLKSLTHIALGSNPLYCDCGLKWFSDWIKLDYVEPGIARCAEPEQMKDKLILSTPSSSFVCRGRVRNDILAKCNACFEQPCQNQAQCVALPQREYQCLCQPGYHGKHCEFMIDACYGNPCRNNATCTVLEEGRFSCQCAPGYTGARCETNIDDCLGEIKCQNNAT

24、CIDGVESYKCECQPGFSGEFCDTKIQFCSPEFNPCANGAKCMDHFTHYSCDCQAGFHGTNCTDNIDDCQNHMCQNGGTCVDGINDYQCRCPDDYTGKYCEGHNMISMMYPQTSPCQNHECKHGVCFQPNAQGSDYLCRCHPGYTGKWCEYLTSISFVHNNSFVELEPLRTRPEANVTIVFSSAEQNGILMYDGQDAHLAVELFNGRIRVSYDVGNHPVSTMYSFEMVADGKYHAVELLAIKKNFTLRVDRGLARSIINEGSNDYLKLTTPMFLGGLPVDPAQQAYKNWQIRNLTSFKGCM

25、KEVWINHKLVDFGNAQRQQKITPGCALLEGEQQEEEDDEQDFMDETPHIKEEPVDPCLENKCRRGSRCVPNSNARDGYQCKCKHGQRGRYCDQGEGSTEPPTVTAASTCRKEQVREYYTENDCRSRQPLKYAKCVGGCGNQCCAAKIVRRRKVRMVCSNNRKYIKNLDIVRKCGCTKKCY从uniprot 或者genbank 数据库中的注释信息进行进一步确认你所发现的结果。2. 低复杂度区域恶性疟原虫抗原蛋白前体(索引:P69192)具有一段低复杂度区域的序列,通过点阵分析找到这个特点。SERA_PLAFG (P69192)

26、:MKSYISLFFILCVIFNKNVIKCTGESQTGNTGGGQAGNTVGDQAGSTGGSPQGSTGASQPGSSEPSNPVSSGHSVSTVSVSQTSTSSEKQDTIQVKSALLKDYMGLKVTGPCNENFIMFLVPHIYIDVDTEDTNIELRTTLKETNNAISFESNSGSLEKKKYVKLPSNGTTGEQGSSTGTVRGDTEPISDSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSSESLPANGPDSPTVKPPRNLQNICETGKNFKLVVYIKENTLIIKWKVYGETKDTTENNKVDVRKYLINEKETPFT

27、SILIHAYKEHNGTNLIESKNYALGSDIPEKCDTLASNCFLSGNFNIEKCFQCALLVEKENKNDVCYKYLSEDIVSNFKEIKAETEDDDEDDYTEYKLTESIDNILVKMFKTNENNDKSELIKLEEVDDSLKLELMNYCSLLKDVDTTGTLDNYGMGNEMDIFNNLKRLLIYHSEENINTLKNKFRNAAVCLKNVDDWIVNKRGLVLPELNYDLEYFNEHLYNDKNSPEDKDNKGKGVVHVDTTLEKEDTLSYDNSDNMFCNKEYCNRLKDENNCISNLQVEDQGNCDTSWIFASKYHLET

28、IRCMKGYEPTKISALYVANCYKGEHKDRCDEGSSPMEFLQIIEDYGFLPAESNYPYNYVKVGEQCPKVEDHWMNLWDNGKILHNKNEPNSLDGKGYTAYESERFHDNMDAFVKIIKTEVMNKGSVIAYIKAENVMGYEFSGKKVQNLCGDDTADHAVNIVGYGNYVNSEGEKKSYWIVRNSWGPYWGDEGYFKVDMYGPTHCHFNFIHSVVIFNVDLPMNNKTTKKESKIYDYYLKASPEFYHNLYFKNFNVGKKNLFSEKEDNENNKKLGNNYIIFGQDTAGSGQSGKESNTALESAGT

29、SNEVSERVHVYHILKHIKDGKIRMGMRKYIDTQDVNKKHSCTRSYAFNPENYEKCVNLCNVNWKTCEEKTSPGLCLSKLDTNNECYFCYV实验结果及结论1. 重复序列通过点阵分析可以很容易的发现序列中的重复,果蝇的一个蛋白质(索引号码:P24014)中具有几个重复片段,请通过dotlet 分析,找到这些序列重复的片段。 2. 低复杂度区域恶性疟原虫抗原蛋白前体(索引:P69192)具有一段低复杂度区域的序列,通过点阵分析找到这个特点。 实验四 多序列比对实验目的在序列分析中,多序列比对具有广泛的应用,是许多其他分析的基础和前提,比如进化发生分析、构建位

30、置特异性打分矩阵、找到一致序列等,本实验的目的是熟悉多序列比对相关的操作和编辑方法。教学基本要求了解和熟悉多序列比对的原理和基本方法。实验容提要1. 使用CLUSTALW 算法,比对一组蛋白质序列,该序列属于RAD51RECA,在DNA 的复制阶段起重要作用,这些序列可以从NCBI genbank、Uniprot 等序列服务器获取,序列的索引为:P25454,P25453,P0A7G6,P48295。将这些序列保存在一个文本文件。如果查询到的序列不止一个的话,选择第一个。P25454.1 Full=DNA repair protein RAD51MSQVQEQHISESQLQYGNGSLMST

31、VPADLSQSVVDGNGNGSSEDIEATNGSGDGGGLQEQAEAQGEMEDEAYDEAALGSFVPIEKLQVNGITMADVKKLRESGLHTAEAVAYAPRKDLLEIKGISEAKADKLLNEAARLVPMGFVTAADFHMRRSELICLTTGSKNLDTLLGGGVETGSITELFGEFRTGKSQLCHTLAVTCQIPLDIGGGEGKCLYIDTEGTFRPVRLVSIAQRFGLDPDDALNNVAYARAYNADHQLRLLDAAAQMMSESRFSLIVVDSVMALYRTDFSGRGELSARQMHLAKFMRALQRLADQFGVAVVVTNQVVAQVDGGMAFNPDPKKPIGGNIMAHSSTTRLGFKKGKGCQRLCKVVDSPCLPEAECVFAIYEDGVGDPREEDEP25453.1 Full=Meiotic recombination protein DMC1MSVTGTEIDSDTAKNILSVDELQNYGINASDLQKLKSGGIYTVNTVLSTTRRHL

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1