5-微阵列PPT文件格式下载.ppt

上传人:b****9 文档编号:13964737 上传时间:2022-10-16 格式:PPT 页数:70 大小:2.30MB
下载 相关 举报
5-微阵列PPT文件格式下载.ppt_第1页
第1页 / 共70页
5-微阵列PPT文件格式下载.ppt_第2页
第2页 / 共70页
5-微阵列PPT文件格式下载.ppt_第3页
第3页 / 共70页
5-微阵列PPT文件格式下载.ppt_第4页
第4页 / 共70页
5-微阵列PPT文件格式下载.ppt_第5页
第5页 / 共70页
点击查看更多>>
下载资源
资源描述

5-微阵列PPT文件格式下载.ppt

《5-微阵列PPT文件格式下载.ppt》由会员分享,可在线阅读,更多相关《5-微阵列PPT文件格式下载.ppt(70页珍藏版)》请在冰豆网上搜索。

5-微阵列PPT文件格式下载.ppt

指从DNARNA蛋白质合成的全过程。

基因表达的最终产物是蛋白。

人之所以能生长发育、健康生活,正是靠多少万个基因在表达它各自的蛋白。

人没有血红蛋白,就不能生存,所以,血红蛋白的基因(珠蛋白基因)先天出了毛病,就成为遗传病。

现在知道,恶性肿瘤、高血压、糖尿病以至老年痴呆都是基因发生了故障,但是,有多少个基因以及是那一种基因出了故障还不清楚。

基因表达,生物信息讲义,基因通过表达控制着特定的蛋白质组成(如血红蛋白)。

所有的体细胞都含有同样的基因,但在细胞逐步分化后,往往有些基因表达,有些不表达,或仅在胚胎期或病理情况下表达。

基因表达,生物信息讲义,基因表达基因表达数据基因表达数据分析基本信息分析调控信息分析,基本知识,生物信息讲义,基因表达数据,基因表达数据:

通过对基因表达的实验研究,得到的相关数。

示例:

酵母菌中部分基因的表达矩阵,生物信息讲义,基因表达数据,酵母菌中部分基因的表达矩阵,生物信息讲义,目前流行的获取基因表达数据的方法生物芯片生物芯片(Biochips)包括DNA芯片(有时也被称为基因芯片、或微阵列(Microarray)、组织芯片、蛋白质芯片和细胞芯片。

美国加州Affymetrix公司oligonucleotidemicroarrayStandfordcDNA,基因表达数据,生物信息讲义,基因表达数据,基因芯片,生物信息讲义,生物信息讲义,基因芯片的原理:

杂交原理(Hybridization)DNA具有著名的双螺旋结构,两条链上的碱基互补配对。

即A与T、C与G、G与C、T与A配对。

碱基互补的两条链结合在一起的过程就称为杂交,我们可以利用杂交来确定DNA的序列。

如果一条DNA链是GATTACA,它互补DNA的序列就是CTAATGT,基因表达数据,生物信息讲义,Whatishybridization?

A,A,B,B,C,C,D,D,FromSouthernetal(1999),Probes,Targets,Co-hybridize,mRNA-labeledcDNA,TheDNAsattachedtothesupportaredefinedasprobes,whilethelabeledDNAsaredefinedastargets.,生物信息讲义,生物信息讲义,通过DNA芯片获取基因表达数据首先选取来自不同状态的样本染色、杂交洗脱扫描、分析获得结果,如正常组织与肿瘤组织,不同发育阶段组织,或用药之前与用药之后组织等,其中一种称为实验样本experimentalsamples,另外一种称为参考样本referencesample,实验样本和参考样本RNA分别用不同的红、绿荧光染料去染色,并将它们混合,与微阵列上的探针序列进行杂交,获得微阵列上每个点的红、绿荧光强度(Cy5和Cy3),其比值(Cy5/Cy3)称为该基因在实验样本中的表达水平。

可以对上述比值进行以2为底的对数变换即以Log2(Cy5/Cy3)表示该基因的表达水平。

最终获得基因表达矩阵(以字母G=gijmxn表示,其中m表示基因个数,n表示实验样本个数。

这就是所谓的基因表达谱,是进一步进行生物信息学处理的基础,其数据质量直接影响后续的分析结果。

基因表达数据,生物信息讲义,Asimplegenearray,ABCDE,1,2,3,4,5,A2=“ProteinkinaseA”D2=“GlutamatereceptorNMDAR”E1=“ActincDNA”,Amagnificationviewofarobotprinting,基因表达数据,生物信息讲义,应用比较正常不同组织细胞中基因的表达模式研究正常组织与病理组织基因表达差异研究药物处理细胞后基因表达变化,只在肾脏中表达的基因就不大可能与精神分裂症有关。

一些药物的靶点是在整个身体中分布广泛的蛋白质,这类药物的副作用往往比较大。

基因表达数据,生物信息讲义,基因表达基因表达数据基因表达数据分析基本信息分析调控信息分析,基本知识,生物信息讲义,基因表达数据分析基本信息,常用的方法与技术1、数学统计方法2、动态规划方法3、机器学习与模式识别技术4、数据库技术及数据挖掘(详细介绍)5、人工神经网络技术6、专家系统7、分子模型化技术8、量子力学和分子力学计算9、生物分子的计算机模拟10、因特网(Internet)技术,生物信息讲义,1、数学统计方法,生物活动常常以大量、重复的形式出现,既受到内在因素的制约,又受到外界环境的随机干扰。

因此概率论和数学统计是现代生物学研究中一种常用的分析方法数据统计、因素分析、多元回归分析是生物学研究必备的工具隐马尔科夫模型(HiddenMarkovModels)在序列分析方面有着重要的应用。

与隐马尔科夫模型相关的技术是马尔科夫链(MarkovChain),生物信息讲义,2、动态规划方法,动态规划(DynamicProgramming)是一种解决多阶段决策过程的最优化方法或复杂空间的优化搜索方法动态规划解决问题的基本过程是:

将一个问题的全局解分解为局部解,逆序递推求出局部最优解,随着执行过程的推进,“局部”逐渐接近“全局”,最终获得全局最优解,生物信息讲义,3、机器学习与模式识别技术,机器学习机器学习是模拟人类的学习过程,以计算机为工具获取知识、积累经验1、遗传算法采用随机搜索方法,具有自适应能力和便于并行计算2、神经网络的理论是基于人脑的结构,其目的是揭示一个系统是如何向环境学习的,这一种方法被称为联接主义。

模式识别模式识别是机器学习的一个主要任务。

模式是对感兴趣客体定量的或者结构的描述,而模式识别就是利用计算机对客体进行鉴别,将相同或者相似的客体归入同种类别中模式识别主要有两种方法:

根据对象的统计特征进行识别,根据对象的结构特征进行识别,生物信息讲义,4、数据库技术及数据挖掘,数据库技术数据仓库虚拟数据库技术(VirtualDatabase,简称VDB)数据挖掘(datamining)又称作数据库中的知识发现(KnowledgeDiscoveryinDatabase),它是从数据库或数据仓库中发现并提取隐藏在其中的信息的一种新技术,它能自动分析数据,对它们进行归纳性推理和联想,寻找数据间内在的某些关联,从中发掘出潜在的、对信息预测和决策行为起着十分重要作用的模式数据挖掘过程一般分为4个基本步骤:

数据选择、数据转换、数据挖掘和结果分析,生物信息讲义,5、人工神经网络技术,人工神经网络(ArtificialNeuralNetwork,简称ANN)是通过模拟神经元的特性以及脑的大规模并行结构、信息的分布式和并行处理等机制建立的一种数学模型在生物信息学中,使用得最多的是反向传播神经网络(BackPropagationNeuralNetwork,简称BP网)。

BP网被认为是稳定性和鲁棒性较强的人工神经网络之一,而且属于有监督学习的网络模型。

标准的BP网由三层神经元组成:

输入层、隐藏层和输出层,生物信息讲义,输入层,隐藏层,输出层,反向传播神经网络结构示意,生物信息讲义,6、专家系统,专家系统(ExpertSystem)是一种基于知识的智能系统,它将领域专家的经验用一定的知识表示方法表示出来,并放入知识库中,供推理机使用知识库是专家系统的第一重要组成部分,知识库中的知识通常分为两类:

一类领域的事实性知识,或广泛公用的知识另一类是启发性知识,是领域专家在长期研究和实践过程中积累起来的经验总结知识获取方式大致上可以分为两种:

一种是由知识工程师向领域专家询问有关知识,经过整理编辑后将知识转换成计算机表示形式,送入知识库另一种是针对大量数据进行机器学习,分析、总结和抽取出有用的新知识,这是更高层次的知识获取方式。

专家系统的另一个重要部分是推理机,由它来控制和协调整个系统,并根椐当前输入的数据和知识,按一定的推理策略,去解决当前的问题,推导出结论,生物信息讲义,知识库,领域专家,用户,AI专家,专家系统的基本结构,生物信息讲义,7、分子模型化技术,分子模型化(Molecularmodeling)是利用计算机模拟分子结构、研究分子之间相互作用的一种技术分子模型化是进行分子设计的基础。

分子图形学(MolecularGraphics)是进行分子模型化的一项重要技术,正是由于分子图形学和其它计算化学方法(如分子力学、分子动力学)的相互结合,才使得分子模型化方法取得成功,生物信息讲义,生物信息讲义,8、量子力学和分子力学计算,量子力学主要研究原子、分子、凝聚态物质、以及原子核和基本粒子的结构、性质的基础理论,在化学等有关学科中得到了广泛的应用分子力学(MolecularMechanics)方法是一种非量子力学的计算分子结构、能量与性质的方法,该方法应用经验势能函数,即经验力场方法模拟分子的结构,计算分子的性质在进行分子结构分析、构象优化、分子间相互作用研究及分子模拟时需要应用量子力学或分子力学,生物信息讲义,9、生物分子的计算机模拟,所谓生物分子的计算机模拟就是从分子或者原子水平上的相互作用出发,建立分子体系的数学模型,利用计算机进行模拟实验,预测生物分子的结构和功能,预测动力学及热力学等方面的性质分子动力学和蒙特卡罗方法(MonteCarlomethod)是两种最常用的技术,另一种模拟方法是模拟退火方法,生物信息讲义,计算机模拟实验,产生,设计,解释,生物信息讲义,10、因特网(Internet)技术,Internet已经成为生物学研究的平台,同时也成为分子生物学研究人员进行信息交流特别是生物分子数据的交流的场所通过网络查询或搜索所需要的生物信息,使用分析工具将所要处理的数据直接送到相应的网络服务器上,服务器接受你的处理请求,并将处理结果返回,生物信息讲义,常用的数据挖掘技术聚类传统聚类技术新的聚类技术分类关联分析,基因表达数据分析基本信息,生物信息讲义,聚类分析聚类分析特别适用于模式分类数不知道的情况基本步骤:

确定基因表达的数据计算相似性矩阵,各个矩阵元素代表两个基因的表达是否相似选择算法进行聚类分析显示分析结果。

基因表达数据分析基本信息,生物信息讲义,对数据进行聚类分析之前,必须将包含在基因表达矩阵中的数据进行相似程度分析,并且对分析结果进行量化。

通常情况下,相似往往被赋于一个较大的量化的值,而不相似则由一个较小的量化的值来表示。

在实际计算中,往往以距离代替相似的概念,相似性度量被转化为两个基因表达模式之间的距离。

距离越小,表达模式越相近,反之,则表达模式差异大。

基因表达数据分析基本信息,生物信息讲义,传统聚类方法1.简单聚类2.层次式聚类3.K平均聚类4.自组织映射神经网络5.模糊聚类分析方法,基因表达数据分析基本信息,生物信息讲义,1、简单聚类假设有n个基因表达数据向量分别为X1,X2,XN令任意一个基因的表达向量为第一个聚类的中心依次处理其它基因在处理第i个基因时,首先计算该基因的表达数据向量与现有各类中心的距离假设与第j类的距离Dij最小,并且DijT,则将基因i分配到第j类;

否则生成一个新类,该类的中心为第i个基因的表达向量。

生物信息讲义,2、层次式聚类,生物信息讲义,3、K平均聚类任意选取K个基因表达向量作为初始聚类中心Z1,Z2,Zk反复迭代计算如果|X-Zj(l)|X-Zi(l)|(i=1,2,K,ij),则将X所代表的基因归于第j类。

按照上述办法处理所

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 畜牧兽医

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1