ImageVerifierCode 换一换
格式:DOCX , 页数:15 ,大小:727.10KB ,
资源ID:26600655      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/26600655.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(西 安 交 通 大 学 实 验 报 告 生物信息学.docx)为本站会员(b****7)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

西 安 交 通 大 学 实 验 报 告 生物信息学.docx

1、西 安 交 通 大 学 实 验 报 告 生物信息学西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实验名称 核酸和蛋白质序列数据的使用系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:了解常用的序列数据库,掌握基本的序列数据信息的查询方法。实验步骤:在序列数据库中查找某条基因序列(insulin人的),通过相关一系列数据库的搜索、比对与结果解释实验结果:1.该基因的功能是?DNA结合、RNA结合、雄激素受体结合、酶结合、蛋白结合、转录激活活性、转录调控区的DNA结合、微管蛋白结合、泛素蛋白与

2、连接酶结合、泛素蛋白连接酶的活性、提高泛素蛋白连接酶的活性、锌离子结合2. 编码的蛋白质序列是怎样的? 10 20 30 40 50 60 MALWMRLLPL LALLALWGPD PAAAFVNQHL CGSHLVEALY LVCGERGFFY TPKTRREAED 70 80 90 100 110 LQVGQVELGG GPGAGSLQPL ALEGSLQKRG IVEQCCTSIC SLYQLENYCN 3. 该蛋白质有没有保守的功能结构域该蛋白质有保守的功能结构域。分别为cd00027(Location:1763 1842 Blast Score: 107) cd00162(Loca

3、tion:23 68 Blast Score: 134) pfam04873(Location:655 978 Blast Score: 1301) pfam12820(Location:344 507 Blast Score: 809)pfam13923(Location:20 65 Blast Score: 135)4. 该蛋白质的功能是怎样的?E3泛素蛋白连接酶,专门介导LYS-6-联泛素链的形成,并通过促胞对DNA损伤的反应,在DNA修复中起着核心的作用;目前还不清楚是否也介导其他类型的泛素链形成。E3泛素蛋白连接酶的活性是其抑癌能必需的。BARD1- BRCA1异源二聚体协调各种不同

4、的细胞通路,如DNA损伤修复,泛素化和转录调控,以维持基因组稳定性。调节中心体微核。从G2到有丝分裂的正常细胞周期进程所必需的。参与转录调控在DNA损伤反应中的P21。为FANCD2靶向DNA损伤位点所需。可以用作转录调控因子。绑定到ACACA和防止其去磷酸化,抑制脂质合成。5. 该蛋白质的三级结构是什么?如果没有的话,和它最相似的同源物的结构是什么样子的?给出示意图。该蛋白有三级结构,如图所示西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 双序列比对系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无

5、教师审批签字: 实验目的:1、练习使用动态规划算法进行双序列比对;2、理解打分矩阵和参数对;3、双序列比对结果的影响;4、理解动态规划算法的原理。实验步骤及结果:1. RNP1和RNP2是否得到比对? 选择至少三个(差别大的)空位罚分和延伸值来进行比对(1)空位开启 1.0 空位延伸:0.5 结果:比对成功# -gapopen 1.0# -gapextend 0.5# Length: 75# Identity: 38/75 (50.7%)# Similarity: 51/75 (68.0%)# Gaps: 14/75 (18.7%)# Score: 203.5EMBOSS_001 1 -ASN

6、TNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY 45 |.|:| | | : :|.:|.|.:|:| | |.|.EMBOSS_001 1 MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL 46EMBOSS_001 46 GYAFVDFTSEM-DSQRAIKVLNG- 67 |.|: |: |:.:|.| EMBOSS_001 47 GYGFVNY-SD-PNDADKAINTLNGL 69(2)空位开启:5.0 空位延伸:0.5 结果:比对成功# -gapopen 5.0# -gapextend

7、 0.5# Length: 69# Identity: 35/69 (50.7%)# Similarity: 47/69 (68.1%)# Gaps: 2/69 ( 2.9%)# Score: 181.0EMBOSS_001 1 -ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYKTGYSYGYAF 49 .|.|:|.|.:|.:|.|.:|:|.|.|.|.|EMBOSS_001 1 MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRDKITGQSLGYGF 50EMBOSS_001 50 VDFTSEMDSQRAIKVLNG- 67

8、 |:.|:.:|.| EMBOSS_001 51 VNYSDPNDADKAINTLNGL 69(3)空位开启:1.0 空位延伸:10.0 结果:比对成功# -gapopen 1.0# -gapextend 10.0# Length: 74# Identity: 38/74 (51.4%)# Similarity: 51/74 (68.9%)# Gaps: 12/74 (16.2%)# Score: 203.0EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFRAIGPINTCRIMRDYK-TGYSY 45 |.|:| | | : :|.:|.|.:|:| |

9、|.|.EMBOSS_001 1 MD-SKTNLIVNYLPQNMTQD-E-FKSLFGSIGDIESCKLVRD-KITGQSL 46EMBOSS_001 46 GYAFVDFTSE-MDSQRAIKVLNG- 67 |.|: |: .|:.:|.| EMBOSS_001 47 GYGFVNY-SDPNDADKAINTLNGL 692a. 算法是否找到RNP1和 RNP2的正确比对?如上图b. 当空位开启罚分高时,结果发生什么变化?对比上图(1)和(2)得知空位开启罚分高时,结果得分变低c. 当空位延伸罚分高时,结果发生什么变化?对比(1)和(3)得知空位延伸罚分高时,结果变低,但不明显

10、 d. 为什么k个连续的空位罚分要小于k个间隔的空位罚分?因为空位开启的罚分影响要高于空位延伸罚分,综合2a和b可知,所以k个连续空位罚分要比k个间隔空位罚分低。使用PAM250矩阵重复上述过程。3. 比对结果是否发生变化?(1)# -gapopen 1.0# -gapextend 0.5# Length: 76# Identity: 38/76 (50.0%)# Similarity: 56/76 (73.7%)# Gaps: 16/76 (21.1%)# Score: 213.5EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDY

11、K-TGY-S 44 .|:|:| | | : :| :|.|:|:| | | |EMBOSS_001 1 MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS 45EMBOSS_001 45 YGYAFVDFTSEM-DSQRAIKVLNG- 67 .|:|: |: |:|:.| EMBOSS_001 46 LGYGFVNY-SD-PNDADKAINTLNGL 69(2)# -gapopen 5.0# -gapextend 0.5# Length: 70# Identity: 36/70 (51.4%)# Similarity: 55/70 (

12、78.6%)# Gaps: 4/70 ( 5.7%)# Score: 191.0EMBOSS_001 1 -ASNTNLIVNYLPQDMTDRELYALFRAIGPINTCRIMRDYK-TGYSYGYA 48 .|:|:|:.|:.:|.:|.|:|:| | |.|.|:EMBOSS_001 1 MDSKTNLIVNYLPQNMTQDEFKSLFGSIGDIESCKLVRD-KITGQSLGYG 49EMBOSS_001 49 FVDFTSEMDSQRAIKVLNG- 67 |:.|:|:.| EMBOSS_001 50 FVNYSDPNDADKAINTLNGL 69(3)# -gapop

13、en 1.0# -gapextend 1.0# Length: 75# Identity: 38/75 (50.7%)# Similarity: 56/75 (74.7%)# Gaps: 14/75 (18.7%)# Score: 213.0EMBOSS_001 1 -ASNTNLIVNYLPQDMT-DRELY-ALFR-AIGPINTCRIMRDYK-TGY-S 44 .|:|:| | | : :| :|.|:|:| | | |EMBOSS_001 1 MDSKTNLIVNYLPQNMTQD-E-FKSLF-GSIGDIESCKLVRD-KITG-QS 45EMBOSS_001 45 YG

14、YAFVDFTSE-MDSQRAIKVLNG- 67 .|:|: |: .|:|:.| EMBOSS_001 46 LGYGFVNY-SDPNDADKAINTLNGL 694a. RNP1 和RNP2 是否在局部比对中得到比对?RNP1 和RNP2 在局部比对中比对成功。b. 局部比对的生物学意义是什么?局部相似性比对的生物学基础是蛋白质功能位点往往是由较短的序列片段组成的,这些部位的序列具有相当大的保守性,尽管在序列的其它部位可能有插入、删除或突变。此时,局部相似性比对往往比整体比对具有更高的灵敏度,其结果更具生物学意义c. 为什么在这种比对中我们选择局部比对而不是全局比对?答:局部相似性比

15、对往往比整体比对具有更高的灵敏度,其结果更具生物学意义。5. 比对结果发生了什么变化?答:从3的图中可以看出,在同一个打分矩阵下,比对结果基本没有差别;在不同的打分矩阵下,比对结果也基本无区别,但得分有所变化。西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 序列的点阵分析系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:点阵分析是双序列分析最直观的工具,通过本实验了解点阵分析的原理和方法。教学基本要求:了解和熟悉点阵分析的原理和参数对分析结果的影响,可以对结果进行解读和解释。

16、回答问题:点阵分析的基本原理是什么? 点阵法是双序列比对的基本方法,比对法的基本思想是:将两条待比较的序列分别放在矩阵的两条轴上,从上往下,当对应的行和列的序列字符匹配时,则在矩阵对应的位置作出点标记,逐个比较所有的字符对,最终形成点阵图。两条完全相同的序列在点阵图中表现为一条连续的对角线,相似性很高却又不完全相同的序列,表现为不连续的对角线,中间断掉的部分表示在那些区域字符不匹配。1. 重复序列通过点阵分析可以很容易的发现序列中的重复,果蝇的一个蛋白质(索引号码:P24014)中具有几个重复片段,请通过dotlet分析,找到这些序列重复的片段。如图所示,除了对角线有8条浅色的线,因为对称可知

17、共四条重复片段。从uniprot注释信息确定有四条重复片段。2. 低复杂度区域恶性疟原虫抗原蛋白前体(索引号码:P69192)具有一段低复杂度区域的序列,通过点阵分析找到这个特点丝氨酸重复域是一个黑色的方形,这是一个低复杂度的地区,其中一个或几个残基表现出或多或少完美的周期性的特点。西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 多序列比对系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字: 实验目的:在序列分析中,多序列比对具有广泛的应用,是许多其他分析的基础和前提,比如进化发生分析、构

18、建位置特异性打分矩阵、找到一致序列等,本实验的目的是熟悉多序列比对相关的操作和编辑方法。1. 使用CLUSTALW 算法,比对一组蛋白质序列,序列的索引号码为:P25454,P25453,P0A7G6,P48295。a. 练习使用EBI CLUSTALWb. 将序列数据拷贝复制到窗口中;c. 采用默认参数进行比对;结果如下图 clustalw算法的基本原理:ClustalW的基本原理是首先做序列的两两比对,根据该两两比对计算两两距离矩阵,然后用NJ或者UPGMA方法构建Binary进化树作为guide tree,最后用progressive的方法根据guide tree逐步添加序列进行比对,一

19、直到所有序列都比对好.2. 在BAliBASE网站查找一组蛋白质:1csy。这些蛋白质的一致性为20-40%,属于BAliBASE参考序列1。Clustalw2muscleT-coffe分别与下图比较,一致得1分,不一致得0分。(1) CLUSTALW2比对得分10分;(2) MUSCLE比对得分13分;(3) T-Coffee比对得分 14分;所以T-coffe结果更好西 安 交 通 大 学 实 验 报 告课 程 生物信息学 实 验 名 称 HIV病毒的进化分析系 别 实 验 日 期 :专业班级 组别 交报告日期 :姓 名 学号 报 告 退 发 :(订正、重做)同 组 人 无 教师审批签字:

20、 实验目的:了解和学习系统发生分析的步骤和基本方法实验步骤:在MEGA5.05中,AlignEdit/Build AlignmentRetrieve sequences from a file,导入上述的.fasta的文件,选择AlignmentAlign By Clustalw或Align By Muscle。选择默认参数进行比对。将结果保存。(为了节约时间,多序列比对的结果我们可以不处理)结果如下图在MEGA主程序中,选择Phylogeny,选择一种构建树的方法,导入上述保存的结果,在参数选择中,“Phylogeny Test”选择“Bootstrap method”,选择500或者100

21、0,其他参数默认。 选择500时建树:对树的解释: NJ法根据修正净差异值先确定节点,再根据各部分到节点的距离构建树。各节点所标的数值为该节点到前一节点的距离。由图可看出,这16条序列是同源序列,具有共同的祖先序列,即SIVmon Cercopithecus Monkeys序列。1. 系统发生分析的步骤? 主要为三步(1)分子序列或特征数据的分析;(2)系统发生树的构造;(3)结果的检验。2. 为什么不直接使用序列的全长,而只是部分序列? 一是由于序列的长度过长,造成比对时的误差较大,同时,由于各序列的长度不同,可能造成比对的失真,同时,比对过长的序列,造成的损耗大,而对比关键的部分序列,效率

22、更大,更能找出差异与联系。3. 为什么在构建进化树之前需要进行多序列比对?对多序列比对结果应该如何进行处理?同时比对一组序列对于研究分子结构、功能及进化关系更为有用。例如,某些在生物学上有重要意义的相似性只能通过将多个序列对比排列起来才能识别。同样,只有在多序列比对之后,才能发现与结构域或功能相关的保守序列片段。多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。应进行简单的分析与评判,并进行初步的处理与优化,达到进一步的结果,从而对构建进化树起更加准确的结果。4. 常用的构建树的方法有几大类? 系统发生树的构建方法

23、分为两大类:一是基于距离的构建方法。有非加权组平均法、邻近归并法、Fitch-Margoliash法和最小进化方法。二是基于离散特征的构建方法。有最大简约法、最大似然法、进化简约法和相容性方法。 或者根据建树算法在执行过程中采用的搜索方式,系统发生树的构建方法也可以分为以下3类。(1)穷尽搜索方法即产生所有可能的树,然后根据评价标准选择一棵最优的树。(2)分支约束方法即根据一定的约束条件将搜索空间限制在一定范围内,产生可能的树,然后择优。(3)启发式或经验性方法根据先验知识或一定的指导性规则压缩搜索空间,提高计算速度。5. 树是如何进行统计学评估的? 对于所构建的系统发生树,统计分析的误差可能会影响所建树的可靠性。运用大量的模拟实验可以比较这些树的建树方法的统计可靠性。即运用多种方法建树,得到的结果应比较类似,这才说明树构建的合理性。

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1