DNA计算机在分子生物学中的研究进展.docx
《DNA计算机在分子生物学中的研究进展.docx》由会员分享,可在线阅读,更多相关《DNA计算机在分子生物学中的研究进展.docx(11页珍藏版)》请在冰豆网上搜索。
DNA计算机在分子生物学中的研究进展
目录
第一章生物计算机的现状和发展1
1.1生物计算机出现的背景1
1.1.1电子计算机的缺陷1
1.1.2生物计算机的优势1
1.2生物计算机技术2
1.2.1生物计算机的物质基础2
1.2.2生物计算机的数学基础3
1.2.3生物计算机的数据结构3
1.3生物计算机的研究现状4
第二章DNA计算机基本原理6
2.1DNA计算机的诞生6
2.2DNA计算机理6
2.3DNA计算模型7
2.4DNA计算的应用8
第三章DNA计算机在分子生物学的应用9
3.1基因组数据和数据基因组9
3.2DNA计算机的算法研究与基因表达调控研究不谋而合9
3.3出色的句子和笨拙的文章9
3.4基因治疗10
第四章未来展望11
第五章参考文献12
DNA在分子生物学中的研究进展
第一章生物计算机的现状和发展
1.1生物计算机出现的背景
1.1.1电子计算机的缺陷
集成电路是电子计算机的核心部分。
要想提高计算机的工作速度和存储量,关键是实现更高的集成度。
传统计算机的芯片是用半导体材料制成的,这在当时是最佳的选择,但随着计算机技术迅猛发展,硅芯片的集成度越来越高,它的弱点也日益显现出来[1]。
作为计算机心脏的CPU运算速度越来越快,体积越来越小,但在单位面积上容纳的元件数是有限的,终有一天CPU上集成电路的尺寸会因为间隙过于狭小而产生干扰,达到运算速度的最高极限。
这是由于电路器件的过度密集和电路相互干扰、散热困难等问题之间存在着固有矛盾。
由摩尔定律可知,芯片制造商们能够通过在结晶硅片上蚀刻极其细微的凹槽,使晶体管数目每隔18个月翻一番。
现在,人们在市场中已经可以买到0.13微米的CPU,下一代0.09微米的CPU也正在研制中,但是这一尺寸的CPU即将走向硅芯片的终点。
因为再往下发展,晶体管将变得如此之小,以致于其硅部件的尺寸将达到分子级,在这种超近距离内,将产生量子效应,引起短路。
因此,0.05微米精度的电路工艺可能将是硅芯片的发展终点。
目前,在全世界范围内的科学家正在进行下一代计算机研究,希望能解决电子计算机的这一缺陷,科学界看好的未来计算机有这三类:
光计算机、量子计算机、生物计算机,即DNA(DeoxyriboNucleicAcid脱氧核糖核酸)计算机,本章针对生物计算机进行介绍。
[1][2]
1.1.2生物计算机的优势
生物分子计算机有独特的优势,用分子计算处理某些问题,比传统的计算方法更为有效。
将生命活动的指令进行编码的遗传分子DNA和RNA(核糖核酸),比硅芯片上的电子元件要小很多,甚至可小到几十亿分之一米。
而且,生物芯片本身具有天然独特的立体化结构,其密度要比平面型硅集成电路高5个数量级。
纳米技术家认为,DNA具有在极小空间里存储海量信息的自然特性,遗传密码符号的间距仅有0.34纳米,1立方米的DNA溶液可存储1万亿亿比特数据;1立方厘米DNA溶液将超过1万亿片CD光盘的存储容量。
[2]
试管状的生物计算机中含有大量遗传物质工具,因此,生物计算机能够同时进行数千次甚至上百万次计算。
在传统的计算机中,对于处理的问题,它是以电流的速度一个一个地检验所有可能的解决方案。
而生物计算机真正的优势在于它可以同时对整个分子库里的所有分子(或答案)进行处理,而不必按照次序一个一个地分析所有可能的答案。
可以这样比喻一下,一道数学题是一把锁,计算机是一串钥匙。
电子计算机在开这把锁的时候是一次试一把钥匙,而DNA计算机在开这把锁的时候是一次试几百万把钥匙,所以由DNA链组成的计算机速度将比现有的超级计算机快100万倍。
具有生命特征的这种电脑,运算次数甚至可以达到每秒1020或更高。
十几个小时的DNA计算,就相当于人类社会所有电脑问世以来的运算总量。
其效率自然不可同日而语,可谓是超级并行计算机。
[2]
生物计算机体积小、重量轻、能耗小(运算次数每秒1020以上,消耗的能量却只有普通电脑的十亿分之一)、散热少、能耐高温高寒。
另外,由于生物计算机所需的生物分子材料可利用基因技术通过细菌繁殖大量生产,因此它的造价将比半导体元件计算机要低。
生物计算机,从某种程度上说,是现在的电子计算机的对等物,但它是以化学和生物为基础的。
随着微电子技术和蛋白质工程的相互渗透,生物计算机将跃上历史的大舞台。
[2][3]
1.2生物计算机技术
1.2.1生物计算机的物质基础
70年代就有人发现,DNA处在不同状态下,可产生有信息和无信息。
后来有科学家发现,一些半醌类有机化合物的分子具备“开”和“关”两种电态功能,可以把它当成一个开关。
科学家们还进一步发现,蛋白质分子中的氢也具备“开”和“关”两种电态功能,因而也可以把一个蛋白质分子当成一个开关。
联想到晶体管的导通或截止电压的高或低、脉冲信号的有或无等等,激起了科学家们研制生物电子元件的灵感,相继有一些简单的生物元件问世,如生物开关元件、生物记忆元件等。
[3]
生物计算机的主要原材料是生物工程技术产生的蛋白质分子,它作为生物芯片,以波的形式沿着蛋白质分子链传播信息,引起蛋白质分子链中单键、双键结构顺序的改变,从而传递了信息,而且它的集成度高,运算速度快,可以用生物分子作为软件,代替集成电路,设计制造生物计算机。
[3][4]
生物计算机是一种化学反应计算机。
它的基本构想是:
以DNA碱基序列作为信息编码的载体,利用现代分子生物学技术,在试管内控制酶的作用下控制DNA序列反应,实现运算过程;它以反应前DNA序列作为输入的数据,反应后的DNA序列作为运算的结果。
即DNA计算机的数据输入、输出和软件运行都是以DNA分子为基础,通过活的组织来完成编码信息的存储和运算。
[4]
1.2.2生物计算机的数学基础
1994年11月,计算机科学家L.阿德勒曼(L.Adleman)在《科学》杂志上公布了生物计算机的理论,并成功地运用生物计算机解决了一个有向哈密尔顿路径问题,这说明DNA计算蕴含的理念可使计算的方式产生“进化”。
[4]
生物计算机的提出,让人们有这样一个发现,即生物与数学的相似性:
一是生物体异常复杂的结构是对由DNA链表示的初始信息执行简单操作(复制、剪接)的结果;二是可计算函数f(x)的结果可以通过在x上执行一系列的基本简单函数而获得。
这两个过程有很大的相似性,而且可以利用生物过程来模拟数学过程。
更确切地说是,DNA链可用于表示信息,酶可用于模拟简单的计算。
[4]
1.2.3生物计算机的数据结构
DNA是由核苷酸的一些单元组成,这些核苷酸随着附在其上的化学组或碱基的不同而不同。
DNA共有四种碱基:
腺瞟呤、鸟瞟呤、胞嘧啶和胸腺嘧啶,分别用A、G、C、T表示。
一些单个的核苷酸顺序地连在一起形成DNA链。
[4]
像一串带有0和1编码的二进制数据链,DNA的数据密度是非常惊人的。
这些碱基沿着DNA分子链方向的空间距离是0.35纳米。
因此,DNA的惊人数据密度约是每厘米7Mb。
如果我们假设1平方纳米1个碱基,DNA的二维数据密度约是每平方厘米155000Gb。
目前所使用的普通硬盘数据密度是每平方厘米1Gb,因此DNA的二维数据密度大约是普通硬盘数据密度15万倍。
[4]
DNA链的另一个重要的性质是双螺旋结构,A碱基与T碱基、C碱基与G碱基结合在一起形成碱基对。
然而每个DNA序列都有一个互补序列,例如,如果序列S是ATTACGTCG,它的互补序列S’是AATGCAGC,S与S’结合在一起形成双螺旋DNA结构。
这种互补性使得DNA在计算方面具有独特的结构,而且在很多方面可以利用。
例如改正错误就是一个例子,在DNA中产生错误的原因是多方面的。
[4][5]
偶尔DNA酶也产生简单的错误,例如切掉那些不希望切掉的部分。
另外DNA还可能被热能和太阳光中的紫外线能量破坏。
如果错误发生在DNA双螺旋结构中的某一个螺旋序列中,修改酶可以参考互补序列恰当地恢复之。
DNA的双螺旋结构类似于计算机硬盘的RAID1阵列,即第二块硬盘是第一块硬盘的镜像,如果第一块硬盘的数据被破坏,可以根据第二块硬盘的数据恢复第一块硬盘的数据。
在生物系统中,由于有修改错误的特性,使得错误率非常低。
例如,在DNA复制方面,每10亿个复制的碱基中只有1个错误,即错误率是10-9。
[5]
1.3生物计算机的研究现状
美国南加州大学阿德拉曼博士1994年首次使用试管中的DNA解决了一道实际的数学题,该生物计算机由装满有机液体的微型试管组成,承担计算任务的DNA分子就溶在液体之中,它通过控制DNA分子间的生化反应来完成运算。
[5]
以色列维茨曼科学研究所的研究人员开发出一种由DNA和生物分子制成的可运行程序的分子计算机。
现在,该研究所的研究人员又研制出一“台”速度达每秒330万亿次运算的生物计算机,这种计算机的运算速度比现在普通计算机快10万倍,这台计算机也是世界上迄今为止最小的生物计算装置。
这种计算机中的DNA既可以为整个计算机提供输入信息,又可以为计算机提供运行所必须的能量。
[5]
美国威斯康星大学的研究人员最近也制造出一台生物计算机。
它由大约100万亿个人工合成的DNA链状结构组成,能进行一些相对复杂的运算。
这部计算机寿命很短,很原始,但它使人们看到希望:
生物计算机不是梦。
[5][6]
虽然生物计算机的研究已经取得了很大的成果,但生物计算机的使用目前正处在理论探讨阶段。
不论体外或体内,DNA计算的所有潜在用途还只是纯理论的探讨。
与此同时,科学家还在研究DNA的其他特性:
这些特性不仅能够用于储存信息,还能用于构成计算机集成电路的其他部件。
其中一种特性就是自装配,即互补的DNA分子能够互相识别并在溶液中结合在一起。
此外,DNA链也许还能像微小的线路一样导电。
[6]
第二章DNA计算机基本原理
2.1DNA计算机的诞生
自计算机问世50多年来,运算速度已提高了约10亿倍。
在最新一代芯片中,晶体管之间的连接导线的厚度已被蚀刻到只有0.18µm。
科学家认为,电路线宽在0.1µm以下将不可避免地达到仅有单个分子大小的物理学极限,到2020年,传统计算机在信息存储和处理方面不大可能有大的发展,传统计算机的发展可能将走入穷途末路。
由于无数高新技术的研究对计算机的性能不断提出更高要求,各种新型计算机的研究开发势在必行。
量子计算机和生物计算机包括DNA计算机有可能为计算机进一步发展另辟蹊径。
1994年,L.Adleman首创了DNA计算的概念,在Science上发表了研究结果,介绍了用DNA进行特定目的计算解决图论中Hamiltonian有向路径NP问题,该研究引起了许多生物学家和计算机科学家及其他许多领域科学家的兴趣。
欧阳颀等在Science发表文章,利用DNA分子出色地解决了Clique计算问题。
2001年11月,Nature杂志上报道了一种由DNA分子和相应的酶分子构成的DNA生物计算机,体积只有一只试管的1/16,每秒可执行10亿次作业,准确率高达99.8%,这种DNA计算机也是世界上第一部输入输出、软件和硬件均由生物分子组成的有图灵机功能的可程序自律计算机器,是DNA计算机研究的标志性重大进展。
2001年,美国科学家利用简单的分子生物学操作进行DNA计算,为一个有24个变量、100万种可能结果的数学难题(3-SAT问题)找到了答案,这是迄今利用非电子化计算手段解决的最复杂数学问题。
[6]
早些时候国内也有一些研究者从不同角度对DNA计算(机)进行了总结,但是国内尚未见DNA计算机的实验研究的报道。
我们实验室在DNA计算机的试管实验方面已经做了不少努力,完成了第一个简单的试管型DNA计算机,并首次从实验上把自动机功能与表面DNA计算结合在一起。
[7]
2.2DNA计算机理
DNA计算是利用DNA双螺旋结构和碱基互补配对规律进行信息编码,将要运算的对象映射成DNA分子链,通过生物酶的作用,生成各种数据池,再按照一定的规则将原始问题的数据运算高度并行地映射成DNA分子链的可控的生化反应过程。
最后,利用分子生物技术(如聚合链反应PCR、超声波降解、亲和层析、克隆、诱变、分子纯化、电泳、磁珠分离等),检测所需要的运算结果。
[7]
从数学上讲,单链DNA可看作由符号A、C、G、T组成的串,同电子计算机中编码0和1一样,可表示成4字母的集合来译码信息。
特定的酶可充当“软件”来完成所需的各种信息处理工作。
不同的酶用于不同的算子,如限制内核酸酶可作为分离算子,DNA结合酶可作为绑结算子,DNA聚合酶可作为复制算子,外核酸酶可作为删除算子等。
这样,通过对DNA双螺旋进行丰富的、精确可控的化学反应以完成各种不同的运算过程,就可研制成一种以DNA为芯片的新型计算机。
已被证明DNA计算至少在理论上是通用的,可以解决图灵机所能解决的所有问题。
[7]
2.3DNA计算模型
经过10多年的发展已有多种DNA计算模型被提出。
如剪接模型、粘贴模型、等同检测模型、插入/删除系统、最小计算模型等,这些模型都被证明和图灵机是等价的,也就是具有计算完备性。
[8]
插入/删除系统:
插入/删除系统是建立在上下文插入和删除基础上的DNA计算模型。
Kari等人利用建立在该系统基础上的递归可数语言特征.研究了形式语言和DNA计算的交叉性,证明了单个字母的插入/删除系统同样是计算完备的。
在该系统中,如何选择实际操作参数的数目,个体操作的速度,个体操作和序列操作的可靠性,信息载体的稳定性及一个实验中连续操作的数目都是要进一步研究的。
[8]
剪接系统:
Head在1987年利用形式语言对DNA序列进行分析的基础上,提出了剪接系统的概念。
1997年将其引入DNA计算领域,随后,Paun等人对该系统的通用性、计算能力和剪接运算等方面进行了详细的讨论。
剪接系统是目前研究较多、较为成熟的通用计算模型之一。
[8]
粘贴系统:
1996年,Roweis提出一种基于分子操作和随机访问内存的DNA计算粘贴模型。
它有着与剪接系统一样的计算能力,而且与有限自动机理论有着密切的联系,在运算过程中不需要DNA链的延伸,也不需要酶的作用,并且DNA链可重复使用。
1998年,Kari等人受到粘贴模型的启发,提出粘贴系统的概念随后,Paun等人将粘贴系统的概念推广到一个更为普遍的形式上。
已有许多实例用粘贴模型来计算。
但容错性还需进一步地研究。
[8]
等量检测模型:
1998年Yokomori提出了一种新的DNA计算模型DNA—EC。
此模型是基于简单的等量检测计算理论。
同检测原理非常简单,可在任何一种机器上实现,特别适合于分子计算,因为等量检测只需对两记忆单元进行等量性检测,而记忆单元可描绘成双链DNA序列形成的符号串。
[8]
从严格的数学意义上讲,等量检测模型提供了一个极具吸引力的计算理论基础,所需元素操作数目不多,模型简单。
但此模型的在实验室中的可行性还有待研究。
随着DNA表面模型、DNA二级结构、DNA空间构造、DNA自装配微结构、鞭绳PCR的研究,新的模型必将出现,且这种模型是计算完备的、可编程、易实现的。
[8]
2.4DNA计算的应用
(1)解决某些NP完全问题和一些难解的数学问题。
如HPP问题、满足性问题、最大集团问题;
(2)数据加密和解密。
这是超级计算机应用的一个重要领域;
(3)智能控制;
(4)生物化学、组合化学和医学等;
(5)Boolean电路和数据流逻辑运算的仿真和实现。
[9]
第三章DNA计算机在分子生物学的应用
3.1基因组数据和数据基因组
当一个细胞被看成一台计算机时,细胞中的基因组在这个计算机中的角色就是个重要的问题。
它是编程软件还是数据,还是兼而有之,这方面还没有太多的争论,主要原因是DNA计算机的复杂性和概念上巨大的新颖性。
我们认为基因组的主要功能
还是编程,但是在一定程度上也有数据库的功能。
由于DNA分子有巨大的储存功能,把大量的数据储存在DNA长链上并整合到某种细胞的基因组中,这种数据就是基因组数据;大量的数据也可以体外存放在某种形式的DNA分子中,这些DNA分子可以做成数据基因组。
[9]
3.2DNA计算机的算法研究与基因表达调控研究不谋而合
人类基因组可能是迄今为止最大的计算程序。
基因组研究中已经出现许多目前计算机难以解决的计算问题(计算量或算法),如:
基因调控网络预测;基于特殊算法的大规模的序列比较;多个基因组的同时比较和高级算法实现;染色体的折叠过程模拟;基因组和蛋白组的综合代谢网络模拟和药物效应模拟等等。
[9][10]
3.3出色的句子和笨拙的文章
染色体是实现基因表达调控和发育的时空机制等DNA算法的行为工具。
相对于单个的基因来讲,染色体是一个巨大的机器;如果说单独一个基因表达的过程是一个小程序,那么染色体在生命个体的全部过程中的活动就是一个巨大的程序软件包。
或者说,单独一个基因表达的过程是一个句子,而染色体行为是撰写一篇生命过程的文章。
句子的优美固然重要,但是文章表达的内涵是更重要的。
笨拙的文章(如癌症)中间我们经常看到精美的文句。
DNA计算机的研究将帮助把人类基因组中的字,词,句,篇章结构等进行详尽的分析。
[10]
3.4基因治疗
在基因组中发生任何形式的突变或病毒感染都可以认为是“计算机病毒”,因为基因组实际是一个大软件,任何改变该软件正常运行的基因组变化可以当作“计算机病毒感染”;作为病毒,有其特殊的源代码,将来可以设计能识别许多源代码的DNA剪切装置并自动进行“查毒”和“杀毒”;如果该装置与可以进出细胞的超微型机器人结合在一起,其应用前景不可估量。
[10]
第四章未来展望
DNA计算机具有划时代的意义。
计算机的计算方式是依据一定的法则对有关符号串进行变换的过程。
目前计算机中的加减乘除是一种物理性质的符号变换,但是DNA计算机中对应的有一套生物化学性质的变换,即DNA分子的切割,连接,插入和删除等。
随着DNA计算机的发展,RNA或其他生物大分子也要越来越多地介入到DNA计算机中以实现更高级更复杂的算法。
这种计算方法的变革是前所未有的,是更高级形式的计算方法,具有划时代的意义。
它将彻底改变计算机硬件的性质和基本运作。
极为重要的是,DNA计算机中的算法研究已经超越了纯粹计算机研究本身,它实际上也是在研究生命的本质过程,即基因组是通过怎样的编程(算法)来实现生物个体的生命过程(发育,衰老,疾病,死亡等,即生,老,病,死)。
所以,DNA计算机的研究可能是把其他高技术导入生命科学并实现技术操纵的一个关键窗口。
有关的研究必须引起我们的高度重视。
目前计算机的算法是人类运算历史自然发展的必然性结果,是一种物理性质的符号变换,不论是目前的高速超级计算机或今后发展的纳米计算机都(可能)处于这种框架。
而DNA计算机的特性完全
不同。
DNA计算机解决了传统计算机难以解决的NP问题和3-SAT问题也说明了这一点。
传统计算机可能无法从根本上解决生命科学的问题。
DNA计算机的研制势在必行。
21世纪将是生命科学的时代,分子生物学和先进计算科学的结合将推动由人类基因组计划引发的下一场生物技术革命。
[11]
第五章参考文献
[1]王瑞玲.生物计算机的现状和发展[j],中国计算机大会,2005(11):
121.
[2]ComputerArchitecture,AQuantitativeApproach.
[3]郑纬民,汤志忠,计算机系统结构,清华大学出版社.
[4]许进;张雷DNA计算机原理、进展及难点
(1):
生物计算系统及其在图论中的应用[期刊论文]-计算机学报2003(01)
[5]崔光照;刘玉琳;张勋才数据存储新方向:
DNA分子存储技术[期刊论文]-计算机工程与应用2006(42)
[6]TakahashiK;YaegashiS;AsanumaHPhoto-andthermoregulationofDNAnanomachines2005
[7]OguraY;SumiyamaF;KawakamiTManipulationofDNAmoleculesusingopticaltechniquesforopticallyassistedDNAcomputing[外文会议]2004
[8]洪龙.朱梧槚.王建东分子生物计算机层次结构及分子计算基本概念的讨论[期刊论文]-南京邮电大学学报(自然科学版)2006(6)
[9]6.徐慧.武海萍.樊春海.李文新.张治洲.贺林基于水溶性导电高分子材料的高灵敏度生物传感器[期刊论文]-科学通报2004(19)
[10]AtlanH;KoppelMThecellularcomputerDNA:
programordata1990(03)
[11]郝宁湘DNA计算机:
数学与生命的交融[期刊论文]-自然辩证法研究2000(10)