ImageVerifierCode 换一换
格式:PDF , 页数:49 ,大小:1.38MB ,
资源ID:16119620      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/16119620.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(基于序列信息的转录因子结合位点和启动子理论预测资料下载.pdf)为本站会员(b****2)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

基于序列信息的转录因子结合位点和启动子理论预测资料下载.pdf

1、内蒙古大学硕士学位论文基于序列信息的转录因子结合位点和启动子理论预测姓名:#杨科利申请学位级别:#硕士专业:#生物物理学指导教师:#李前忠20070420基于序列信息的转录因子结合位点和启动子理论预测摘要基因转录调控一直是生物信息学研究的一个重要内容,转录因子结合位点和启动子的识别是研究基因转录调控的重要环节,是构建基因调控网络的一个核心问题。#本文基于已知的转录因子结合位点和启动子序列数据,从序列信息出发,提出了整合位点保守型参量和位置权重矩阵预测转录因子结合位点的位置权重矩阵打分函数方法以及联合位置权重矩阵和离散增量预测启动子的支持向量机方法。#基于转录因子结合位点序列通常比较短且保守,引

2、入矩阵模型描述转录因子结合位点的特性,同时依据转录因子结合位点的位点保守性各不相同,将碱基保守性参数引入矩阵模型,从而提出预测转录因子结合位点的位置权重打分函数算法(P W M S A)。#首先将四种碱基随机出现的频率作为背景频率,以单碱基位点保守性参量结合单碱基位置权重矩阵的P W M S A 算法对2 2 种转录因子结合位点进行预测,总体S e l f _ c o n s i s t e n c y 检验为8 7 5 9,1 0-f o l dc r o s s v a l i d a t i o n 检验为8 5 4 8。#然后考虑到基因序列中的四种碱基并非随机出现,以四种碱基实际出现的

3、频率作为背景频率,用P W M S A 算法对酵母九种转录因子结合位点进行预测,S e l f-c o n s i s t e n c y 检验预测成功率达8 3 1 4,1 0-f o l dc r o s s v a l i d a t i o n 检验预测成功率为7 7 5 I。#同时,引进两种最新的评价指标,将P W M S A 算法与现有的1 0 种预测转录因子结合位点的软件进行比较,结果表明P W M S A 算法的评价指标均高于现有的算法,在核昔酸和结合位点片段两种评价水平上,预测成功率分别高出其他算法4,7 个百分点。#考虑到转录因子结合位点之间存在碱基相互作用共同贡献与蛋白的

4、亲和力,利用已知的9 种酵母转录因子结合位点序列构建近邻核苷酸二联体位置权重矩阵,计算位点近邻二联体核苷酸保守性参量,使用P W M S A 算法对9 种酵母转录因子结合位点进行预测,S e l f c o n s i s t e n c y 检验和J0-f o l dc r o s s v a l i d a t i o n 检验预测成功率分别达到8 8 0 4,8 1 1 0,明显高于单碱基位置权重矩阵的结果。#基于启动子序列的内容特征和信号特征与非启动子序列的区别,利用离散量方法提取启动子序列的内容特征;#构建核心启动子元件的位置权重矩阵,使用位置权重矩阵提取启动子序列的信号特征,最后提

5、取启动子和非启动子序列碱基组份特征。#构建了基于综合启动子序列的内容特征和信号特征预测启动子序列的支持向量机分类器,并对人类P o lI I 启动子进行预测,1 0-f o l dC r O S S v a l i d a t i o n 检验为9 5 7 0,对另外选取的独立测试集预测成功率为9 8 3 0,同时与现有的7 种预测启动子的软件和算法进行比较,我们的算法预测成功率敏感性为9 7 0 0,特异性为9 7 9 8,结果明显优于现有的预测算法和软件。#关键词:#转录因子结合位点,启动子,位置权重矩阵,离散增量,支持向量机B A S E DO N T H EI N F O R M A

6、T I O No FS E Q U E N C E ST 0P R E D I C TT H ET R A N S C R I P T I O NF A C T O RB I N D I N GS I T E SA N DP R O M O T E RA B S T R A C TT h eg e n et r a n s c r i p t i o nr e g u l a t i o ni sac e n t r a lc h a l l e n g eo fb i o i n f o r m a t i c s;#a ni m p o r t a n ts t e pi nt h i s

7、c h a l l e n g ei st h ea b i l i t yt oi d e n t i f yt r a n s c r i p t i o nf a c t o rb i n d i n gs i t e sa n dp r o m o t e r B a s e do nt h ek n o w nt r a n s c r i p t i o nf a c t o rb i n d i n gs i t e sa n dp r o m o t e rs e q u e n c e s,an e wp o s i t i o nw e i g h tm a t r i c

8、 e ss c o r i n ga l g o r i t h m(P W M S A)f o rp r e d i c t i n gt r a n s c r i p t i o nf a c t o rb i n d i n gs i t e si sp r e s e n t e d I na d d i t i o n,t h es u p p o r tv e c t o rm a c h i n e(S V M)m o d e lc o m b i n e dw i t hi n c r e m e n to fd i v e r s i t yi su s e dt Op r

9、 e d i c tp r o m o t e r s B a s e do nt h ed i f f e r e n c eo f n u c l e o t i d ep r o b a b i l i t yi ne v e r yp o s i t i o no ft r a n s c r i p t i o nf a c t o rb i n d i n gs i t e s,t h es i t e sc o n s e r v a t i o ni n d e x e sM ja r ec a l c u l a t e d An o v e lp o s i t i o n

10、w e i g h tm a t r i c e ss c o r i n ga l g o r i t h m(P W M S A)f o rp r e d i c t i n gt r a n s c r i p t i o nf a c t o rb i n d i n gs i t e si sp r e s e n t e d T r a n s c r i p t i o nf a c t o rb i n d i n gs i t e s(T F B S)c a nb ep r e d i c t e db yu s i n go fs i t e sc o n s e r v

11、a t i o ni n d e x e sa n dt h ep o s i t i o nw e i g h tm a t r i c e s(P W M)A tf i r s t,t h eT F B Sf o r2 2k i n d so ft r a n s c r i p t i o nf a c t o ri nE c o l i k 1 2g e n o m ea r ep r e d i c t e db yu s i n gP W M S A B yu s i n go ft h es e l f-c o n s i s t e n c yt e s ta n dt h e

12、10-f o l dC R O S S v a l i d a t i o nt e s t,t h er e s u l t ss h o wt h a tt h eo v e r a l lp r e d i c t i o na c c u r a c i e sa r e8 7 5 9 a n d8 6 4 5,r e s p e c t i v e l y A f t e rt h a t,t h eT F B Sf o r9k i n d so ft r a n s c r i p t i o nf a c t o ri ns d c c h a r o m y c e sc e

13、r e v i s i a eg e n o m ea r ea l s op r e d i c t e db yu s i n gP W M S A T h er e s u l t si ns e l f c o n s i s t e n c yt e s ta n dt h e10-f o l dc r o s s-v a l i d a t i o nt e s ts h o wt h a tt h eo v e r a l lp r e d i c t i o na c c u r a c i e sa r e8 3 1 4 a n d7 7 5 1。#r e s p e c t

14、 i v e l y B yc o m p a r i n go u ra l g o r i t h mw i t ho t h e rt e ns o f t w a r e su s i n gt h es a m ep e r f o r m a n c em e a s u r e sa n db e n c h m a r k e dd a t a b a s e,t h er e s u l t ss h o wt h a tt h eo v e r a l lp r e d i c t i o na c c u r a c i e so fP W M S Aa r e4 a n

15、 d7 m o r et h a nt h eo t h e rt e na l g o r i t h m s,r e s p e c t i v e l y,a tb i n d i n gs i t e ss e g m e n tl e v e la n dn u c l e o t i d el e v e l 一T h et h i r d,b yc o n s i d e r i n gt h ei n t e r d e p e n d e n te f f e c t sb e t w e e nb a s e si nt r a n s c r i p t i o nf a

16、 c t o rb i n d i n gs i t e ss e q u e n c e s,t h ep a i r w i s en u c l e o t i d ed e p e n d e n tP W Ma n dt h eP r e-c o n s e r v a t iv ei n d e xv e c t o r sa r ei n c o r p o r a t e di nP W M S A T h er e s u l t so fp r e d i c t i o nf o r9k i n d so ft r a n s c r i p t i o nf a c t o r si nS a c c h a r o m y c e sc e r e v i s i a eg e n o m ea r ef u r t h e ri m p r o v e d T h er e s u l t ss h o wt h a tt h eo v e r a l lp r e d i c t i o na c c u r a c i e sa r e8 8 0 4 a n d8 1 1 0,b yu

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1