0530王碧琦博士研究生学位论文finalWord文档格式.docx
《0530王碧琦博士研究生学位论文finalWord文档格式.docx》由会员分享,可在线阅读,更多相关《0530王碧琦博士研究生学位论文finalWord文档格式.docx(143页珍藏版)》请在冰豆网上搜索。
二〇一六年五月
姓名:
王碧琦院系:
公共卫生学院学号:
1111110131
北京大学医学部学位论文原创性声明和使用授权说明
原创性声明
本人郑重声明:
所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。
除文中已经注明引用的内容外,本论文不含任何其他个人或集体已经发表或撰写过的作品或成果。
对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。
本声明的法律结果由本人承担。
学位论文使用授权说明
本人完全了解北京大学医学部关于收集、保存、使用学位论文的规定,即:
●按照学校要求提交学位论文的印刷本和电子版本;
●学校有权保存学位论文的印刷本和电子版,并提供目录检索与阅览服务;
●学校可以采用影印、缩印、数字化或其它复制手段保存论文;
●在不以赢利为目的的前提下,学校可以公布论文的部分或全部内容;
●学校可以为存在馆际合作关系的兄弟高校用户提供文献传递服务和交换服务。
□即时发布□一年发布□二年发布
(保密论文在解密后遵守以上规定)
日期:
年月日
中国成年双生子肥胖与DNA甲基化的相关性研究
研究生姓名:
王碧琦
导师:
李立明
院(部):
公共卫生学院流行病与卫生统计学系
摘要
一、研究背景:
肥胖是全球和中国面临的日趋严重的健康问题,它不但是一种严重危害人们健康的疾病,而且是高血压、2型糖尿病、心脑血管疾病等慢性病的重要危险因素,从而导致巨大的疾病负担。
WHO估计目前全球及中国成人肥胖率分别为13.0%和7.3%,每年至少280万成年人死于由超重或肥胖导致的疾病。
深入了解探讨肥胖的病因及发病机制对开展有针对性的预防与控制有着十分重要的意义。
大量研究发现,肥胖是由环境因素、遗传因素以及二者交互作用决定的复杂性疾病。
与肥胖相关的环境因素包括膳食、体力活动、吸烟、饮酒等生活方式以及社会经济状况等。
截至2015年,全基因组关联研究(GWAS)及其Meta分析研究发现,与肥胖相关单核苷酸多态性位点(SNPs)有97个。
所有这些基因多态性累计对肥胖变异的解释程度约为2.7%。
研究表明,遗传对肥胖的作用不局限于基因结构变异,而是表现在基因-环境的交互作用或基因功能变异。
已有队列研究及临床试验发现,膳食和\或体力活动与肥胖相关基因存在交互作用。
然而这些基因-环境交互作用背后的原因或机制尚不明确。
表观遗传现象可能是解释基因-环境交互作用背后原因的重要因素,也有可能是独立于基因-环境交互作用对肥胖产生影响的基因功能变异。
表观遗传学是研究基因核苷酸序列不发生改变的情况下,基因表达发生可遗传的变化。
表观遗传变异包括DNA甲基化、基因组印记、染色质重塑等方面,其中DNA甲基化是目前研究最多的一种表观遗传现象。
近年来,有关肥胖的表观遗传学研究受到广泛关注,探讨相关基因DNA甲基化水平与肥胖的相关性及其规律与特点已成为本领域热点。
本研究采用全基因组DNA甲基化关联研究策略,以中国双生子人群作为发现人群,以4个中国一般人群为验证人群,以期发现在中国人群中与肥胖相关的DNA甲基化位点及其作用机制。
二、研究目的:
1.探索特异DNA甲基化位点与肥胖及其相关指标的相关性,环境因素对肥胖与DNA甲基化位点关系的影响;
2.探索多个DNA甲基化位点所在基因构成的生物学途径与肥胖的关系;
3.探索肥胖相关DNA甲基化位点与基因结构及基因表达的关系。
三、研究内容与方法:
本研究以中国双生子登记系统的双生子为发现人群,以另外4个中国一般人群队列为验证人群,在全基因组范围分析与肥胖相关的特异DNA甲基化位点、涉及生物学途径及其与基因结构和基因表达之间的作用规律。
1.研究对象
采用双生子人群作为全基因组DNA甲基化位点发现人群,一般人群作为全基因组DNA甲基化位点验证人群:
(1)双生子人群
中国双生子登记系统是目前中国最大的双生子登记平台,有超过3万对有效登记的双生子。
本研究纳入符合以下所有标准的双生子:
2013年居住在山东、江苏、浙江和四川地区,年龄≥18岁,在系统中自报BMI或腰围满足一定条件(双生子中一人BMI>
27kg/m2,另一人BMI<
25kg/m2,且二者相差至少为3kg/m2;
或男性同性别双生子中一人腰围≥90cm,另一人腰围<
90cm;
女性同性别双生子中一人腰围≥80cm,另一人腰围<
80cm),从未患有肿瘤、冠心病(包括心绞痛、心梗发作、急性冠脉综合症等)和\或脑卒中的双生子。
(2)一般人群
验证人群来自东风同济队列、焦炉职业工人队列、武汉珠海社区人群队列以及十堰东风医院健康体检人群这4个一般人群队列。
纳入所有在基线收集信息时满足年龄≥18岁,调查时期并未患有急性或慢性疾病,未有任何身体不适感及近2周未发生发热或感染状况的研究对象。
2.
双生子人群用问卷调查收集一般人口学特征、生活方式及疾病状况等信息,包括性别、年龄、吸烟、饮酒、膳食、体力活动、近期用药情况和社会经济状况等。
用体格检查收集BMI、腰围、腰臀比等信息。
收集1ml外周血血清测定血脂指标(总胆固醇TC、甘油三酯TG、低密度脂蛋白胆固醇LDL-C、高密度脂蛋白胆固醇HDL-C)和血清血糖指标(空腹血糖、空腹血清胰岛素、胰岛素抵抗稳态模型评估HOMA-IR)。
收集2ml全血测定糖化血红蛋白并用于全基因组DNA和DNA甲基化检测。
一般人群采用与双生子人群相类似的方式进行问卷调查、体格检查及DNA样本检测。
3.样本检测方法
(1)生化指标检测
双生子人群TC、TG采用酶比色法测定,LDL-C和HDL-C采用试剂直接测定,空腹血糖采用改进的己糖激酶酶法测定,空腹血清胰岛素采用ADVIACentaur免疫分析系统的化学发光免疫分析法测定,HOMA-IR根据空腹血糖和胰岛素水平计算得出(HOMA-IR=[空腹血糖(mmol/L)×
胰岛素(U/ml)]/22.5),糖化血红蛋白采用TosoHG7糖化血红蛋白仪高压液相法检测。
上述指标主要采用瑞典Roche公司试剂及标准方法。
(2)DNA样本检测
利用BioTeke全血DNA提取试剂盒提取全血DNA。
DNA甲基化检测采用含亚硫酸氢盐的试剂盒(ZymoEZDNAMethylationkit)将未甲基化的胞嘧啶C转换成胸腺嘧啶T,而甲基化的胞嘧啶C不会转换,从而区分甲基化位点与未甲基化位点。
转换后样本采用InfiniumHumanMethylation450K芯片对外周血全血白细胞进行全基因组DNA甲基化检测。
最后通过iScan仪器进行芯片扫描及成像。
全基因组DNA检测在全血DNA浓度和纯度达标后,用HumanOmniZhongHua-8BeadChip芯片对外周血全血白细胞进行全基因组基因型检测并进行卵型鉴定。
基因表达检测采用TRIZOLLS溶液(Invitrogen)将白细胞总RNA从全血白细胞分离,用HumanHT-12v4ExpressionBeadChip测定基因表达的信息。
4.数据统计分析策略与方法
采用R(3.1.2)语言minfi程序包读取DNA甲基化信号并转化成β值(β值定义为甲基化信号占甲基化和非甲基化信号之和的比例),进行样本和位点质量控制后,用DASEN函数对数据进行标准化,标准化后的数据用sva函数进行代理变量分析,调整潜在混杂因素。
对连续变量(BMI、腰围、腰臀比)采用nlme函数进行混合效应模型分析,用Manhattan图和q-q图分别描述甲基化位点所在位置及人群分层。
分类变量(是否肥胖)采用ebayes函数进行经验贝叶斯配对调整的t检验,用volcano图描述甲基化水平在肥胖组与对照组的差异。
另外,在富集分析中分别采用GOrilla软件和自编程序进行Fisher’s精确检验和置换检验,分析多个位点构成的生物学途径与肥胖的关系。
甲基化位点与邻近SNPs关联分析采用LocusZoom图进行描述。
全基因组分析采用FDR(Benjamini&
Hochberg法)矫正显著性水平。
验证人群采用R(3.1.2)语言lm函数分别在单个人群中将DNA甲基化与BMI(或腰围、腰臀比)进行线性回归,再用Metafor程序包进行Meta分析(固定效应模型)合并回归结果(显著性水平按Bonforroni矫正)。
DNA甲基化与基因表达关系分析采用quantile-quantile标准化及逆正态性转换后,再做线性回归的方法(显著性水平按Bonforroni矫正)。
四、研究结果:
本研究收集双生子人群研究对象469名,平均年龄44.8岁(年龄范围18.0岁到80.9岁),65.9%为男性,52.7%为同卵双生子。
一般人群研究对象1307名,分别为东风同济队列765人(平均年龄64.5岁,51.2%为男性)、焦炉职业工人队列137人(平均年龄46.5岁,78.1%为男性)、武汉珠海社区人群队列(武汉162人,珠海99人,平均年龄分别为50.4岁和59.5岁,男性分别占77.8%和80.8%)、十堰东风医院健康体检人群144人(平均年龄41.2岁,74.3%为男性)。
甲基化与肥胖相关分析结果可分为以下3个部分:
1.DNA甲基化位点与肥胖及其相关指标的相关分析结果:
用CNTR作为发现人群构建混合效应模型分析单个DNA甲基化位点与BMI、腰围、腰臀比的相关,分别发现有9个、4个和1个与这些指标相关的位点(显著性水平FDR<
0.05)。
验证人群Meta分析结果发现与BMI、腰围和腰臀比相关的位点分别有6个(cg00574958位于CPT1A基因、cg06500161位于ABCG1基因、cg17061862、cg06012428位于ARID1B基因、cg17156534位于TOP1基因、cg11024682位于SREBF1基因)、3个(cg00574958位于CPT1A基因、cg06500161位于ABCG1基因、cg17061862)和1个(cg00574958位于CPT1A基因)。
CPT1A、TOP1、ARID1B和cg17061862与肥胖相关指标呈负相关,ABCG1和SREBF1与肥胖相关指标呈正相关。
另外,在CNTR人群发现部分位点和BMI的关系与年龄、饮酒等环境因素有交互作用。
3.肥胖相关DNA甲基化与基因结构和基因表达的关系:
截取全基因组DNA数据距离肥胖相关甲基化位点周围100万个碱基对范围内的SNPs。
构建混合效应模型分析DNA甲基化位点与SNPs(加性模型)之间的关联(显著性水平取10-4)。
结果发现与cg17061862相关的SNPs位点(关联P值最小位点为rs7937639,P值=1.75E-13),未发现位于CPT1A、ABCG1、ARID1B、TOP1或SREBF1基因上的甲基化位点与邻近SNPs位点相关。
肥胖相关DNA甲基化位点与基因表达相关分析发现:
位于ABCG1基因上的cg06500161与2个基因表达位点ILMN_2329927和ILMN_1794782相关(P值分别为9.11E-05和5.14E-04),位于SREBF1基因上的cg11024682与2个基因表达位点ILMN_2328986和ILMN_1663035相关(P值分别为1.24E-02和4.79E-03)。
甲基化水平与基因表达均呈负相关性。
五、研究结论:
1.中国人群中发现与BMI相关DNA甲基化位点有6个,其中3个(CPT1A、ABCG1和SREBF1)在其他人群中有报道,且生物学机制比较明确;
另外3个(TOP1、ARID1B和cg17061862)为中国人群中新发现的肥胖相关位点。
2.富集分析结果说明肥胖产生可能是一个主要涉及脂质和能量代谢途径,但又和其他许多生物途径相关的复杂过程。
3.CPT1A、ABCG1、ARID1B、TOP1或SREBF1基因上甲基化位点与邻近SNPs位点未发现关联。
ABCG1、SREBF1基因上甲基化位点与基因表达相关,其他基因并未发现甲基化位点与基因表达相关。
本研究通过以肥胖及其相关指标为结局,采用特殊人群作为发现人群,一般人群作为验证人群发现中国人群中与肥胖相关的DNA甲基化位点。
此外,结合基因组学(基因位点)、表观组学(DNA甲基化)和转录组学(基因表达)全面、系统分析了肥胖发生的可能机制,为肥胖的预防和控制及其病因学研究提供了科学依据。
【关键词】肥胖,全基因组DNA甲基化,基因位点,基因表达,双生子,中国人群
DNAmethylationandobesity:
astudyofadulttwinsinChina
Ph.Dcandidate:
BiqiWang
Supervisor:
LimingLi
School(Department):
DepartmentofEpidemiologyandBiostatistics,SchoolofPublicHealth
Abstract
Objective:
Therewerethreepurposesinthisstudy:
1.ExploringthecorrelationanditsdirectionbetweenindividualDNAmethylationsitesandobesityincludingobese-relatedtraits,andinvestigatingtheenvironmentalfactorsthatmodifiedtheBMIandmethylationrelationship.
2.Exploringgenebiologicalfunctionalpathwayswhichareconstitutedbymultiplemethylationsites,andtheirrelationshipwithobesity.
3.Searchingobesity-relatedDNAmethylationsitesandtheirrelationshipwithgenotypesandgeneexpression.
1.Participants
Thereweretwokindsofpopulations:
(1)Twinspopulation:
ChineseNationalTwinRegistry(CNTR)iscurrentlyChina'
slargesttwinregistryplatform,includingmorethan30,000pairsoftwins.Theincludedcriteriaoftwinsinthisstudywere:
livinginShandong,Jiangsu,ZhejiangandSichuanregionatyear2013,ageatleast18years-old,self-reportedBMIorwaistcircumferencemetcertainconditions(withintwinpair,oneBMI>
27kg/m2andanotherpersonBMI<
25kg/m2,withadifferenceatleast3kg/m2;
ormalesame-sextwinswithonewaist≥90cm,anotherwaist<
90cm;
femalesame-sextwinswithonewaist≥80cm,anotherpersonwaist<
80cm),notsufferingfromcancer,coronaryheartdisease(includingangina,myocardialinfarction,acutecoronarysyndrome,etc.)and/orahistoryofstroke.
(2)Generalpopulations
2.DataCollection
Wecollectedtwins’informationaboutdemographiccharacteristics,lifestyleanddiseaseconditionsandotherinformationbyquestionnaires,includinggender,age,smoking,drinking,diet,physicalactivity,recentdruguseandsocio-economicstatus.BMI,waistcircumference,waist-hipratiowerecollectedbyphysicalexamination.Lipidandglucoselevelsweredeterminedby1mlperipheralbloodserum(totalcholesterolTC,triglycerideTG,lowdensitylipoproteincholesterolLDL-C,high-densitylipoproteincholesterolHDL-C,fastingglucose,fastingseruminsulin,HOMA-IR).Wecollected2mlwholebloodfortestingglycatedhemoglobin,whole-genomegenotypingandDNAmethylationdetection.Analogousmethodswereusedbyquestionnaires,physicalexaminationandDNAdetectioninreplicationpopulations.
3.SampleDetection
(1)Biochemicalparameters
(2)DNAsamplestested
WeusedBioTekewholebloodDNAextractionkittoextractbloodDNA.
DNAmethylationwasdetectedbycontainingsodiumbisulfitekit(ZymoEZDNAMethylationkit)toconvertunmethylatedcytosinetothymidine.Afterconversion,weusedInfiniumHumanMethylation450Kchiptodetectperipheralbloodleukocytegenome-wideDNAmethylationthenscannedandimagedthechipinformationthroughiScaninstrument.
WholebloodDNAconcentrationandpurityweretestedpriortogenome-wideDNAdetecting.TheHumanOmniZhongHua-8BeadChipwasforgenome-widegenotypingandtwinzygositydetermination.
ItwasusedTRIZOLLSsolution(Invitrogen)toisolatetotalRNAfromwholebloodwhitebloodcells,thendetectedbyHumanHT-12v4ExpressionBeadChipforgeneexpressiontesting.
4.Statisticalanalysis
WeusedR(3.1.2)languageminfipackagetoreadDNAmethylationsignalandconvertittoβvalue(βvalueisdefinedastheproportionsofmethylatedsignalinallunmethylatedandmethylatedsignals),carriedoutsampleandprobesqualitycontrolthennormalizedthedatabyDASENfunction.Normalizeddatawasanalyzedbysurrogatevariableanalysisbysvafunctionforadjustingpotentialconfoundingfactors.Forcontinuousvariables(BMI,waistcircumference,waist-hipratio),weusednlmefunctionofmixedeffectsmodel,withManhattanandq-qplotstodescribethelocationofmethylationsitesandpopulationstratification.Categoricalvariables(beingobeseornot)wereusedebayesfunctionofempiricalBayespairedmoderatedt-test,describingthedifferencesinmethylationlevelsinobeseandcontrolgroupswithvolcanoplots.Inaddition,theenrichmentanalysiswereconductedbyGOrillasoftwareandRcodesbyFisher'
sexacttestandpermutationtesttofindoutobesity-relatedbiologicalpathways.TheasscociationofmethylationsitesandneighboringSNPswasanalyzedusingLocusZoomplot.FalsediscoveryrateFDR(Benjamini&
Hochbergmethod)wasusedtocorrectthelevelofsignificance.
ReplicationpopulationswereusedR(3.1.2)lmfunctiontoconductlinearregressionofDNAmethylationandBMI(orwais