第二版复杂疾病的分子特征与计算分析_精品文档.ppt

上传人:b****2 文档编号:2008086 上传时间:2022-10-26 格式:PPT 页数:100 大小:6.69MB
下载 相关 举报
第二版复杂疾病的分子特征与计算分析_精品文档.ppt_第1页
第1页 / 共100页
第二版复杂疾病的分子特征与计算分析_精品文档.ppt_第2页
第2页 / 共100页
第二版复杂疾病的分子特征与计算分析_精品文档.ppt_第3页
第3页 / 共100页
第二版复杂疾病的分子特征与计算分析_精品文档.ppt_第4页
第4页 / 共100页
第二版复杂疾病的分子特征与计算分析_精品文档.ppt_第5页
第5页 / 共100页
点击查看更多>>
下载资源
资源描述

第二版复杂疾病的分子特征与计算分析_精品文档.ppt

《第二版复杂疾病的分子特征与计算分析_精品文档.ppt》由会员分享,可在线阅读,更多相关《第二版复杂疾病的分子特征与计算分析_精品文档.ppt(100页珍藏版)》请在冰豆网上搜索。

第二版复杂疾病的分子特征与计算分析_精品文档.ppt

生物信息学生物信息学第十一章第十一章复杂疾病的复杂疾病的分子分子特征特征与计算分析与计算分析中南大学中南大学陈小平、李曦陈小平、李曦哈尔滨医科大学哈尔滨医科大学徐良德徐良德生物信息学生物信息学学习提纲学习提纲重点重点复杂疾病的分子特征复杂疾病的分子特征复杂疾病遗传学研究策略复杂疾病遗传学研究策略复杂疾病遗传学研究相关统计分析方法复杂疾病遗传学研究相关统计分析方法常用遗传学统计分析集成软件的使用常用遗传学统计分析集成软件的使用难点难点复杂疾病遗传学研究中计算分析的算法选择及复杂疾病遗传学研究中计算分析的算法选择及分析要点分析要点复杂疾病相关数据库复杂疾病相关数据库基因分型的方法基因分型的方法熟悉熟悉第一节第一节引言引言(Introduction)人类常见病,包括恶性肿瘤、心脑血管病、代谢系人类常见病,包括恶性肿瘤、心脑血管病、代谢系统疾病、神经系统疾病、精神和行为异常等绝大多统疾病、神经系统疾病、精神和行为异常等绝大多数都是复杂性疾病。

复杂疾病不符合孟德尔定律,数都是复杂性疾病。

复杂疾病不符合孟德尔定律,疾病的发生发展涉及复杂的生物学过程,是疾病的发生发展涉及复杂的生物学过程,是21世纪世纪生物医学重大的挑战之一生物医学重大的挑战之一。

第二节第二节复杂疾病的分子特征复杂疾病的分子特征与数据资源与数据资源(MolecularCharactersandDataofComplexDisease)一、复杂疾病的分子特征一、复杂疾病的分子特征

(一)复杂疾病的定义

(一)复杂疾病的定义复杂疾病复杂疾病(complexdisease),又称多基因病,又称多基因病(ploygenicdisorder),是指由多种遗传和环境因,是指由多种遗传和环境因素共同决定的一类疾病。

与单基因病相比,复杂疾素共同决定的一类疾病。

与单基因病相比,复杂疾病具有遗传异质性、基因微效性、表型复杂性、种病具有遗传异质性、基因微效性、表型复杂性、种族差异性以及环境相关性等特点。

族差异性以及环境相关性等特点。

复杂疾病涉及多种基因和蛋白:

众多基因通过蛋白复杂疾病涉及多种基因和蛋白:

众多基因通过蛋白质复合物,调控网络以及互作通路来控制的。

质复合物,调控网络以及互作通路来控制的。

复杂疾病受环境因素影响。

同一个体在不同条件下复杂疾病受环境因素影响。

同一个体在不同条件下对环境的响应不同。

基因组的个体差异使不同人对对环境的响应不同。

基因组的个体差异使不同人对环境的响应也不同。

环境的响应也不同。

(二)遗传变异是复杂疾病的决定因素

(二)遗传变异是复杂疾病的决定因素遗传因素遗传因素在在大多数复杂疾病中起决定作用大多数复杂疾病中起决定作用;人群中任意两个不相关个体人群中任意两个不相关个体DNA序列序列99.8%一致,一致,0.2%存在差异;存在差异;基因组的不同导致基因组的不同导致生理表型、罹患疾病的风险及药生理表型、罹患疾病的风险及药物反应表型物反应表型的差异的差异,在人类多样性形成中,在人类多样性形成中具有具有重要重要意义。

意义。

单核苷酸多态单核苷酸多态:

人类染色体上的单个核苷酸的差异,人类染色体上的单个核苷酸的差异,是人类基因组变异的主要类型。

是人类基因组变异的主要类型。

单核苷酸多态单核苷酸多态(singlenucleotidepolymorphism,SNP)SNP相关的基本概念相关的基本概念等位等位(allele):

SNP是一种双等位多态(即是一种双等位多态(即SNP的的二态性)二态性)基因型基因型(genotype):

同源染色体上一对同源染色体上一对SNP等位等位的组合的组合单体型单体型(haplotype):

特定染色体区域相邻近的特定染色体区域相邻近的SNP的组合的组合SNP等位、基因型、单倍型与等位、基因型、单倍型与TagSNP最小等位频率最小等位频率(minorallelefrequency,MAF):

群群体中,一对体中,一对SNP等位中出现较少的等位基因的频等位中出现较少的等位基因的频率。

率。

常见常见SNP的的MAF应应5%,而罕见而罕见SNP的的MAF1%。

非同义非同义SNP(non-synonymousSNP):

能够改变):

能够改变基因产物结构或影响基因表达量的基因产物结构或影响基因表达量的SNP。

连锁块连锁块(linkageblock):

指):

指位于染色体上某一区位于染色体上某一区域的一组相互关联的域的一组相互关联的SNP。

人类基因组中的其他变异人类基因组中的其他变异插入插入/删除多态删除多态(in/del)微卫星微卫星(microsatellite,MS)拷贝数变异拷贝数变异(copynumbervariants,CNV)二、人类孟德尔遗传二、人类孟德尔遗传疾病数据库(疾病数据库(OMIMOMIM)MIM(MendelianInheritanceinMan)与)与OMIMOMIM由由由美国国立卫生研究院由美国国立卫生研究院(NationalInstitutesofHealth,NIH)、约翰霍普金斯大学)、约翰霍普金斯大学(JohnsHopkinsUniversity)共同)共同开发开发和和维护维护OMIM数据库网址:

数据库网址:

http:

/www.ncbi.nlm.nih.gov/omim/OMIM主页(主页(http:

/www.ncbi.nlm.nih.gov/omim)MIMMIM编号范围编号范围遗传方式遗传方式100000-199999常染色体常染色体显性性遗传或表型(于或表型(于1994年年5月月15号号创建)建)200000-299999常染色体常染色体隐性性遗传或表型(于或表型(于1994年年5月月15号号创建)建)300000-399999X连锁位点或表型位点或表型400000-499999Y连锁位点或表型位点或表型500000-599999线粒体位点或表型粒体位点或表型600000-染色体位点或表型(于染色体位点或表型(于1994年年5月月15号号创建)建)OMIM编号代表的遗传方式编号代表的遗传方式“*”:

代表已知:

代表已知致病基因的序列信息,没有加致病基因的序列信息,没有加“*”表示其遗传模式虽然已有推测,但没有被证表示其遗传模式虽然已有推测,但没有被证实或实或该该基因与其他记录所包含的基因位点的基因与其他记录所包含的基因位点的分离情况分离情况尚尚不清楚;不清楚;“#”:

表示这种表型可以由两个或者多个基因中的一表示这种表型可以由两个或者多个基因中的一个发生突变而引起;个发生突变而引起;OMIMOMIM号前号前特殊符号的含义特殊符号的含义“+”:

表示这个记录包含基因的序列信息和表型;表示这个记录包含基因的序列信息和表型;“%”:

表示记录中描述了一个已知的孟德尔表型,表示记录中描述了一个已知的孟德尔表型,但对其潜在的分子机制但对其潜在的分子机制尚尚不清楚;不清楚;“”:

表示该记录已不存在或表示该记录已不存在或已已被其他记录所代替。

被其他记录所代替。

OMIMOMIM数据的下载数据的下载OMIM数据可在数据可在http:

/omim.org/downloads页面注册页面注册下载,可下载的文件包含下载,可下载的文件包含全部的全部的OMIM文件文件(omim.txt.Z),OMIM中的基因文件中的基因文件(genemap)及其解释文件及其解释文件(genemap.key),以及疾病信息,以及疾病信息(morbidmap)OMIM还提供还提供genemap和和morbidmap的网络查询形式的网络查询形式,在主页点击在主页点击Gettingstart可进入查询选择页面可进入查询选择页面OMIM查询查询选择选择页面页面genemap查询页面查询页面ClinicalSynopsis查询页面查询页面OMIM数据库的使用数据库的使用(以(以AlzheimersDisease为例)为例)三三、基因型和表型数据库(基因型和表型数据库(dbGAPdbGAP)基因型和表型数据库基因型和表型数据库(genotypeandphenotypedatabase,dbGAP)NIH开发开发和和维护维护包含大量高通量复杂疾病遗传学研究的基因型和表包含大量高通量复杂疾病遗传学研究的基因型和表型数据型数据访问网址:

访问网址:

https:

/www.ncbi.nlm.nih.gov/gap数据根据开放程度分为公开数据数据根据开放程度分为公开数据(publicdata)和控和控制访问数据制访问数据(controlledaccessdata)。

公开数据可以在公开数据可以在dbGAP的服务器中免费下载,控制的服务器中免费下载,控制访问数据的获取和使用则有一系列的限制。

首先,要访问数据的获取和使用则有一系列的限制。

首先,要获取这类数据须向获取这类数据须向dbGAP管理机构提交申请,获批管理机构提交申请,获批后才能获得下载所申请数据的权限。

其次,必须严格后才能获得下载所申请数据的权限。

其次,必须严格遵循数据使用规定。

遵循数据使用规定。

dbGAP中所有的数据均有一个中所有的数据均有一个禁止日期禁止日期(embargoday)。

dbGAPdbGAP数据类型数据类型OMIM主页主页(http:

/www.ncbi.nlm.nih.gov/omim)申请访问控制数据申请访问控制数据数据下载(数据下载(ftp:

/ftp.ncbi.nlm.nih.gov/dbgap)关联结果浏览器关联结果浏览器关联结果浏览器可查询某基因与哪些表型性状相关。

关联结果浏览器可查询某基因与哪些表型性状相关。

这里以这里以LRP5为例,经搜索发现为例,经搜索发现LRP5中的中的4个个SNP在在GWAS研究中分别与骨密度和心肌梗死显著相关。

研究中分别与骨密度和心肌梗死显著相关。

关联结果浏览器关联结果浏览器表型表型-基因型整合器基因型整合器表型表型-基因型整合器基因型整合器可查询某表型性状相关的基因。

可查询某表型性状相关的基因。

这里以骨密度(这里以骨密度(bonedensity)为例,经搜索发现在)为例,经搜索发现在GWAS研究有研究有32个个SNP位点与骨密度显著相关。

位点与骨密度显著相关。

表型表型-基因型整合器基因型整合器四四、人类疾病相关多态数据资源人类疾病相关多态数据资源癌症基因数据库癌症基因数据库(cancergenomeanatomyproject,CGAP)人类基因突变数据库人类基因突变数据库(humangenemutationdatabase,HGMD)基因卡片数据库基因卡片数据库(genecards)CGAP主页主页(http:

/cgap.nci.nih.gov/cgap.html)下载页面图所示,下载页面图所示,其中其中包含了人和小鼠两个物种包含了人和小鼠两个物种的基因注释、基因表达及相关的文库中的数据。

的基因注释、基因表达及相关的文库中的数据。

HGMD主页(主页(http:

/www.hgmd.cf.ac.uk/ac/index.php)查询前需先注册、登陆。

注册需采用学术邮箱(含查询前需先注册、登陆。

注册需采用学术邮箱(含.edu的邮箱),注册后登陆密码将在的邮箱),注册后登陆密码将在24小时内发送小时内发送至注册邮箱。

至注册邮箱。

GeneCards主页(主页(http:

/www.genecards.org/)查询结果页面查询结果页面,以以CYP2C9为例为例其他常用复杂疾病相关数据库其他常用复杂疾病相关数据库肿瘤基因数据库肿瘤基因数据库(thetumorgenedatabase,TGDB)网网址:

址:

http:

/www.tumor-gene.org/TGDB/tgdb.html人类基因组流行病学导航人类基因组流行病学导航(TheHumanGenomeEpidemiologyNavigator,HuGENavigator)网址:

)网址:

http:

/(三三)高分辨率高分辨率熔熔解曲线解曲线(high-resolutionmeltingcurveanalysis,HRM)(四四)基因芯片基因芯片方方法法(五)(五)基质辅助激光解吸电离飞行时间质谱基质辅助激光解吸电离飞行时间质谱(matrix

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 高等教育 > 经济学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1