一流科学家正在干什么Word文件下载.docx
《一流科学家正在干什么Word文件下载.docx》由会员分享,可在线阅读,更多相关《一流科学家正在干什么Word文件下载.docx(4页珍藏版)》请在冰豆网上搜索。
“您有些什么症状?
”她的这个系统是为了帮助医生与病人交流而设计的,但可以扩大到兼容其他的语种和情景,最终发展成为便于文化背景不同的人相互沟通的“万能翻译”软件。
近年来,人们对计算机翻译提出了更准确、更有效和适应多语种的要求,高宇清的工作正处于这一发展愈益加快的研究领域的最前沿。
与逐字翻译网上文件的商用系统不同,她的软件着眼于所谓的语义分析:
提取文本或讲话中最可能的含义,按概念分类存储,然后用另一种语言把同样的思想表达出来。
比如在翻译“我身体感到不舒服”这句话时,软件先要断定说话人生病了,然后用目标语言产生一个与那人健康有关的句子。
如果计算机里存储了足够的语义概念,就会很容易将一种新的语言与网络相连接,而不必为汉语-阿拉伯语或英语-阿拉伯语的翻译机分别编程了。
当然,口语翻译需要将语音转换成文本,对文本进行辨析,再用语音合成技术输出翻译结果。
此外,一个实用性系统还必须自动地适应语音识别误差、异常单词组合和新的对话情景。
为了应对这些“复杂性不亚于制造原子弹”的挑战,高宇清和她的同事将语义分析同统计算法结合起来,使计算机能通过文本和人工翻译的比较来学习翻译模式。
由她们开发的中英文翻译软件,已先后在笔记本电脑和个人数字助理上得到应用。
它收入的词汇量只有几千个,却足以满足日常谈话的需要,在有关医疗护理和后勤的交谈中精确度达到了90%,被美国防部列入专项研究。
同时被列入这一项目的“单向对话词汇书”,则已发放到驻阿富汗和伊拉克等地的美军士兵手中。
据悉,这项技术可望在今年晚些时候加以推广,从中受益的将遍及商务会议、文件研究、监视和旅游业等领域。
这位女科学家表示:
“10年内每个人的手持或移动电话都会用上它。
”
合成生物学
———将催生大量现在无法想象的用途
在普林斯顿大学砖墙上爬满常春藤的校园里,在有几分倾斜的小山上,毫不显眼地坐落着罗恩·
韦斯的生物试验室。
惟一与众不同的是,它居然与好些机电工程实验室毗邻。
然而,这样选址对韦斯来说是恰当的。
作为一名训练有素的计算机工程师,他在研究生院深造期间就受生物学的诱惑而开始给细胞编起程序来了。
韦斯是涉足合成生物学研究的为数不多的人员之一。
这是一个初现雏形的领域,它有助于将基因一丝不苟地“装配”成网络,按照构思的程序,指挥细胞去执行任何一项任务,通过与简单的杆菌或人体细胞相结合大大提升生物传感功能,甚至还有可能在构建供移植的完整人体器官方面,发挥眼下还难以想象的作用。
为了控制细胞行为,研究人员现已研制出不同的基因“电路”———具有特殊设计的成组互动式基因。
韦斯在这方面似乎走得更远。
除了对这些电路进行微调和设计复杂的细胞系统外,他还成功地将基因网络插入细胞,有选择地促成那些执行任务最出色的细胞优先发育,而且这个过程可以一直重复到他获得想要的结果为止。
在得到美国防部赞助的研究项目中,他就是用这种方式使平素非群居的杆菌变得互相沟通的。
结果,这些杆菌不但能琢磨出刺激物离它有多远,还会相应地改变其作出的反应———本质上相当于一个几乎可监测任何异变的活生生的传感器。
对于韦斯来说,计划中最雄心勃勃、同时也最难以实现的项目是为成人干细胞编程。
这些非专化的细胞常见于许多人体组织,如果受到正确的诱发,它们都会发育成特定种类的成熟细胞。
按照韦斯的设想,只要通过刺激一些细胞分化为骨头,刺激另一些细胞分化为肌肉和软骨等组织,那么,研究人员就能引导细胞去修补损坏的心脏或缔造出功能较之任何人造替代物更优异的合成膝关节。
但哺乳动物的细胞是如此错综复杂,这个任务要远远比杆菌编程来得困难。
目前,韦斯和他的同事们已从小鼠中提取出成人干细胞,完成了为其编程的工作。
纳米线技术
———“我们基本上可以制造任何想要的东西了。
在众多的技术门类中,很少有像纳米技术那样被前景看好的。
它有助于萎缩数十年之久的电子工业迎来全面复兴,令能源生产到医疗诊断等众多行业为之面貌一新。
目前,世界各大公司纷纷为此项技术而斥资,几乎每一所名牌大学都以率先展开相关研究而自豪。
学会如何制作纳米线这一纳米器件的关键,则成了摆在研究人员面前的一大热门课题。
顾名思义,纳米线又长又细,体积微小———也许只有人类头发宽度的万分之一。
如今,研究人员能将纳米线的直径从5毫微米调整至几千毫微米,长度可达到几百微米。
这种导线整合成较大的结构后,不仅可以制作激光器、晶体管和存储器阵列,就连类似猎犬嗅探器官的化学敏感结构也不在话下。
但以微调纳米线性能取得的非凡进展而论,则当首推美国加利福尼亚大学伯克利分校的纳米线开拓者、华裔年轻科学家杨培东了。
圈内人士称,这一技术挑战获得的成功意味着:
“我们基本上可以制造任何想要的东西了。
为了研制纳米线,杨培东和他的同事利用特殊的小室,先在里面将黄金或其他金属的薄膜熔化,以形成纳米尺度的微滴。
然后,向它们发射硅烷之类的化学蒸气,使其分子分解。
这些分子以短序列使熔化的纳米微滴过饱和后,便形成了纳米结晶。
随着更多的蒸气在金属微滴上的分解,结晶就会像一棵树那样往上生长。
同时在数百万个金属微滴上进行这一操作,使科学家有机会对大量的纳米线加以组织。
杨培东“栽种”的氮化镓和氧化锌纳米线已长成大片的森林,它们能发射紫外线光,有助于“芯片上的实验室”迅速而廉价地分析医学、环境和其他取样。
由于在生长过程中引进不同的蒸气,杨培东改变了纳米线的成分,使它形成硅和半导体硅锗的界面,其早期用途是对计算机芯片的冷却。
此外,这类器件还有可能最终发展成为高效的能源,从汽车废热或太阳热量中产生电能。
当然,对如此细微的纳米线进行电气连接仍是一大难关,世界各地有100个研究小组正在进行攻关。
贝叶斯机器学习
———解开现实生活中扑朔迷离之谜
美国斯坦福大学的达夫妮·
科勒副教授正在运用概率论中一度晦涩费解的贝叶斯统计学开发程序,它们在解决基因怎样发挥功能等问题的同时,也深入揭示了有关不确定性这一计算机科学中长期悬而未决的难解之谜的真相。
科勒在谈到她的研究时称:
“人类整合各种不同证据的能力是有限的,而计算机则不然。
托马斯·
贝叶斯是18世纪英国长老会的一名牧师,他所构思的观念是如何帮助现代计算机科学的呢?
以往的机器推理必须明确每一个因果关系,如“下雨使草地变湿”;
而基于贝叶斯数学概率的程序则可以收集大量的数据,比如“天正在下雨”、“草地一片潮湿”等,然后自行推断出其间可能存在的联系或“从属性”。
这一点之所以重要,是因为新的生物医学技术提供的数据浩如烟海,使研究人员难以解开其间相互纠葛、扑朔迷离的关系,结果放慢了寻找特效新药的速度。
科勒的程序对上千种基因数据进行了梳理,也测试了某些基因活动可从其他基因的变化上得到解释的概率。
特别是她在扩展贝叶斯编程器运用的视觉模型后,以图像形式显示了物体及其性质和关系。
举例来说,预测艾滋病人对药疗法的反应不但要了解病人先前有何反应,同时也得看病人身上携带着什么病毒株,哪些病毒株具有抗药性等诸如此类的因素。
目前,研究人员正在设法使这些方法适应各种实际用途的需要,已推出了能自动绘测废弃地雷区的机器人等。
英特尔公司也开发出可对半导体晶片上的试验数据进行解码的程序。
最近,科勒实验室有一批研究生加盟Google网站,为的是尝试用贝叶斯方法来发现和探索网上大量互联数据的模式。
利用贝叶斯技术设计的程序在市场上也很走俏,例如微软Outlook20XX中就包含有贝叶斯office助理。
英国Agena公司研制的贝叶斯软件,可根据收视率的高低将电视节目推荐给卫星和有线电视用户。
该公司希望在世界各地部署这项技术。
T射线
———让隐匿物体原形毕露,一目了然
人类肉眼只能感应到范围狭小的电磁波谱。
于是,有了能显现骨骼中可疑阴影的X射线、让某些化学物质熠熠闪烁的紫外线光,还有可供夜间观察的近距离红外线辐射。
如今,研究人员正在开发波谱中的一个新领域:
太赫辐射,简称T射线。
由于这种射线善于穿透很多常见的物质,不仅使隐匿的物体原形毕露,就连其成分也一目了然。
因此,机场保安和医疗成像技术都可因此而改观。
早在上世纪90年代后期,东芝试验室的唐·
阿诺尼就把T射线视为取代牙科用X射线的理想选择了。
原来,T射线奏效的范围恰好在波长延伸成微波前的远红外线区域里,利用它可以探明牙根的腐烂状况,但又不至于引起有害的电离辐射。
研究人员经过试验发现:
只要在半导体芯片上激起强效而极短促的激光脉冲,就会产生太赫辐射(因其频率为每秒万亿次,故名)。
射线的飞行时间会随着它在材料缝隙或不同厚度间的穿越而发生变化,所以研究人员可据此测绘出一颗牙齿的三维图像。
用阿诺尼自己的话来说:
“T射线可以填补X射线、核磁共振成像和医生肉眼之间的重要空白。
去年8月,东芝属下的Tera
View公司推出了一种评估版的T射线扫描仪,它在外观和工作原理上都酷似一台复印机。
被测物一放到成像视窗上,就会有T射线光束穿越而过;
当检测器测出传输的射线时,屏幕上将随之显示图像。
如果被测物体积过大,成像视窗上放不下,则另有一条探测臂可实施活动扫描。
据悉,这种仪器将在一、两年内大规模投产。
T射线系统的用途非常广泛。
电子消费产品公司可以用它检验制造方面存在的缺陷,食品加工厂可以测定密封包装内的含水量,以确保食物新鲜。
它用于诊断皮肤癌或乳腺癌也十分有效,能帮助医生更准确地将病变组织切除。
目前,Tera
View公司正在同英美两国政府进行谈判,准备研制一种能与金属探测器配合使用的扫描仪,以便检查旅客衣服口袋里藏匿的剃须刀或爆炸物。
最近,美国宇航局也获得了一台这样的扫描仪,准备用它来探查航天飞机上绝缘泡沫的裂缝。
分布式存储
———帮你解除文档管理后顾之忧
组织文档、电子表格、音乐、图片和录像抑或为防失窃或故障而维护正规的备份文件,都是每个计算机用户在数据管理中面临的一大麻烦。
要是从任何一台计算机,从任何一个地方敲击几下键盘,即可将数据存储到互联网的旮旯角落里岂不美哉?
一门处于萌芽中有“分布式存储”之称的技术就能解决这个难题。
它一方面简化数字文件的维护和存取,使重要文件摆脱对特定计算机或系统的依赖,另一方面又解除了人们对断电或硬驱动失灵带来灾难的后顾之忧。
执著地追求这一美梦的,是麻省理工学院计算机科学家哈里·
巴拉克利希南。
他的工作是围绕着“分布式散列表”这一更新计算机科学中经典概念的努力而展开的。
大约从上世纪50年代以来,散列表就提供了一条快速组织数据的捷径:
经过一次简单的数学运算,给每个文件指定它在表上属于自己的行,再由后者存储文件的位置。
如今,这样的表已随处可见,构成了多数软件必不可少的一部分。
在巴拉克利希南所探究的分布式存储模式中,文件被分散到各处的互联网,就像散列表为它们的位置罗列清单一样。
由于每个表都指向其他的表,所以被搜索的第一个散列表要是没有为你想要的文件列出清单,它就会指向其他最终仍只需几毫秒即可显示文件位置的表。
“你可以在整个机器的范围里移动和复制文件,而你获取它们的方式不变。
”巴拉克利希南解释说。
关键在于设计出有效的路径,既让数据通过网络,同时又使各个表保持更新的状态。
如果这个问题处理好了,那么,分布式散列表就能将互联网转变成一系列自动组织、易于搜索的编档机柜。
麻省理工学院正在按这一设想研制原型机,它可按常规为文件系统摄取“快照”并在互联网上广为散布。
巴