ImageVerifierCode 换一换
格式:DOCX , 页数:11 ,大小:29.03KB ,
资源ID:10750979      下载积分:3 金币
快捷下载
登录下载
邮箱/手机:
温馨提示:
快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。 如填写123,账号就是123,密码也是123。
特别说明:
请自助下载,系统不会自动发送文件的哦; 如果您已付费,想二次下载,请登录后访问:我的下载记录
支付方式: 支付宝    微信支付   
验证码:   换一换

加入VIP,免费下载
 

温馨提示:由于个人手机设置不同,如果发现不能下载,请复制以下地址【https://www.bdocx.com/down/10750979.html】到电脑端继续下载(重复下载不扣费)。

已注册用户请登录:
账号:
密码:
验证码:   换一换
  忘记密码?
三方登录: 微信登录   QQ登录  

下载须知

1: 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。
2: 试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。
3: 文件的所有权益归上传用户所有。
4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
5. 本站仅提供交流平台,并不能对任何下载内容负责。
6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。

版权提示 | 免责声明

本文(大学毕业论文计算机专业.docx)为本站会员(b****8)主动上传,冰豆网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知冰豆网(发送邮件至service@bdocx.com或直接QQ联系客服),我们立即给予删除!

大学毕业论文计算机专业.docx

1、大学毕业论文计算机专业毕 业论文论文题目: 姓 名: 学 号: 学习中心: 专 业: 指导教师: 二 年 月毕业论文承诺书提示:根据北京语言大学网络教育学院论文写作的规定,如发现论文有抄袭、网上下载、请人代写等情况,毕业论文一律不及格。同时取消学士学位申请资格。毕业论文不及格者,可申请重写一次,并按重修缴纳费用。本人承诺:本人已经了解北京语言大学的毕业论文写作的有关规定;本人的论文是在指导教师指导下独立完成的研究成果。整篇论文除了文中已注明出处或引用的内容外,绝没有侵犯他人知识产权。对本论文所涉及的研究工作做出贡献的个人和集体,均已在文中以明确方式注明。签 名:_ _日 期:_目 录摘要2Ab

2、stract3第一章 绪 论 111前言 112 研究背景12信息抽取概述 11。2。2基于内容的文本信息提取 21。开发人机交互的标注工具的意义31.4任务描述 315论文的组织和安排3第二章标注工具的设计原则和设计思想第三章 标注工具的具体开发 53。开发环境的选择5.2标注工具的设计3。2。1标注工具的界面算法52.2结构设计 53.。1人机交互界面详细设计63菜单和工具栏的设计 63.4标注过程文本的处理 634。关系标注详细设计 63。4.事件标注详细设计35 标注结果 63。6技术难点讨论结束语2致谢2参考文献 人机交互文本标注工具开发作者: * 指导教师:*(指导教师职称)摘要:

3、基于内容的文本信息提取是当前的一个研究热点,无论搜索引擎还是问答系统,其根本的基础是有效的获取文本中的信息。使用机器学习的方法从语料库中获取有效的知识,以支持文本信息的处理已经成为计算语言学的一个主流技术,而带标语料库则是这一技术的基础。 带标语料库的建设的基础就是对大量的文本进行标注,并以一定的结构来存储。这样一来就需要开发一个具有友好的人机交互界面的文本标注工具来辅助文本标注,在一定程序上减轻标注工作者的负担.这次文本标注工具的设计,处理的目标是纯文本文件,以一篇文档为单位提供用户进行实体,事件,关系的标注,并在标注过程中给出标注的中间结果,最后在保存标注文件的时候进行处理,以xm语言格式

4、进行输出存储。标注工具的功能包括对文本的实体,事件,关系三大类的标注,对标注过的文本进行标记,提醒用户标注进度,最后对标注中间结果的处理与保存。本文是对这次人机交互文本标注工具的设计与实现的详细的阐述。首先对背景及理论知识作了具体的介绍。然后,分别进行文本标注工具的系统分析、总体架构分析,并对每个模块的具体实现做详细地讲解。最后,本文还介绍本次文本标注工具设计的缺陷以及未来改进的方案,并对本次标注工具的开发作总结。关键词: 人机交互,文本标注,F编程e Inrctive Tt taging To Delopment Author: * tor: * Asct:e text iformatone

5、xrtion son conent is a currentstd hosot Rgardlessf the seach eior h inerrgaorrepndrsysm, thirbsicoundinisgain tet nfomaion ieffetive.se te ehod of cin larning to ginshe effeti knge fo Cps ,supporting te text infoation procssin i already eme copuainl lnuists ainstrea tchnologTheagd copusis the techca

6、l foundtionhe targetf this text taggin ol dsg s the procsedoora(text)。 Taking the inlepece f tex fouses to tag entities,reltions,ents, nd show nteediate results duringtagng rcess . clmatng in the preserain of tang doumentroesed xl lngg tothotpufomt stoage.h tools funtina anottio nclung agginth eniti

7、es, he evns, htio labeled the taging ofxt , remin users the tagngrogrs, and delng the intdiat result rocesig ad presvaion.Te ewill scibe a isuss over the dein and ralizaion f thisintratx tagig tool。 sly,detaled eoreticl backgrounds ill ben;ecoly, aalysis of hitool nd general struturefor it and te fu

8、ll esiptons abut the realzaon of each mdelil btrduced; fiay, the efct f he deiofh ool imovement to tuture dvopmet wil givennd a ummar of he strucua theerfore o thesystm willbe dlivered as wll. Key wr: Hman omputer Iteracve, ex taggng, 第一章 绪 论 前言随着互联网的广泛普及,语言信息处理的社会需求越来越大,人们迫切需要用自动化的手段处理海量的语言信息.语言资源有

9、计划有规模的开发对于语言信息处理领域的研究和开发具有重要意义。对文本进行标注就是语言资源建设的一个方面,人机交互式的标注工具是进行语料标注的有效手段,从一定程度上可以的减轻标注工作者的负担,同时还可以辅助检查标注结果。 开发界面友好的标注工具可以进一步的提高标注工作者的效率,同时结构化的输出更方便标注数据的后续使用。12研究背景12.1信息抽取概述信息抽取是指从一段文本中抽取指定的事件,事实等信息,形成结构化的数据并填入一个数据库中供用户查询使用的过程。即它从文本中抽取用户感兴趣的事件,实体和关系,被抽取出来的信息以结构化的形式描述,然后存储在数据库中,为情报分析和监测、比价购物、自动文摘、文

10、本分类等各种应用提供服务。例如,灾害预防部门可以从自然灾害的新闻报道中抽取出灾害的类型、时间、地点、人员伤亡、经济损失等情况;医生可以从病人的医疗记录中抽取出症状、诊断记录和检验结果;安全部门分析有线新闻和广播电视的文本来找到和总结恐怖分子活动记录等。一般来说,信息抽取系统的处理对象是自然语言文本尤其是非结构化文本。但广义上讲,除了电子文本以外,信息抽取系统的处理对象还可以是语音、图像、视频等其他媒体类型的数据。1。2。2基于内容的文本信息提取基于内容的文本信息提取是当前的一个研究热点,无论搜索引擎还是问答系统,其根本的基础是有效的获取文本中的信息。使用机器学习的方法从语料库中获取有效的知识,

11、以支持文本信息的处理已经成为计算语言学的一个主流技术,而带标语料库则是这一技术的基础。由于语言本身的复杂性和富含信息的特点,使得语料库标注的内容、对象可以在语法、语义、语用等各个层次上进行,语料库标注的内容和程度,从根本上决定了从文本中可以提取出的信息内容和信息粒度,也决定了进行文本内容计算的对象、方法.比如,对于文本片断,据美国加利福尼亚州罗斯维尔市警方说,一架单引擎飞机12日在罗斯维尔市郊坠毁,机上人全部死亡,被飞机撞毁的一座房屋中2人失踪.其中所包含的信息有:飞机坠毁的时间(2日)、地点(罗斯维尔市郊)、伤亡情况(2人死亡,人失踪)、该消息的来源(警方)、飞机本身的状态属性(单引擎)、消

12、息来源的属性(美国加利福尼亚州罗斯维尔市警方)、死亡人员的属性(机上2人)、失踪人员的属性(被飞机撞毁的一座房屋中人)、。这些信息直接反映了文本片断的意义,包括了命名实体、实体(如“罗斯维尔市”、“飞机”);实体的属性及其间的关系(如“罗斯维尔市警方”与“警方,失踪人员和房屋的关系);事件(如“坠毁”事件)及其属性(事件的时间、地点、伤亡情况等).表达这些信息的语言形式是丰富多样的,我们将其称为意义单元。因此,有效地标注文本中的意义单元,是面向文本内容计算进行资源建设的一个尝试。根据突发事件的类型,对真实文本中意义单元的属性、特征、相关连方式进行研究,并通过标注体系将其表现出来,是前人没有做过

13、的。从真实文本的实际数据出发,探索支持文本内容计算、具有意义信息标注的语料库建设是一个新的尝试。目前,面向文本信息提取的带标语料库的研究,ACE项目进行的较为深入。AC对语料库标注形式、方法、内容、对象都作了大量的研究,其标注内容包括文本中的实体表达、实体间的关系表达、事件的表达等.本文受AC标注内容的启发,通过对ACE已标数据的分析,确定了以意义单元作为标注对象,期望在标注内容上更加精炼,标注的语言层次上能够贯通各个层级,同时面对不同的事件信息,能有更精确的表达形式。此外,从资源建设的角度来看,我们必须建设我们自己的语料库。开发人机交互的标注工具的意义目前语料加工的方式主要有三种方式,即人工

14、、自动、和人机结合的半自动方式。由于自然语言处理技术的限制,自动加工方式会给语料库标注带来一些错误,而人工加工方式非常昂贵,需要大量的人力资源。相比之下,半自动加工方式则兼顾两者的优点。人机结合的方式有两种:一种是计算机自动选择语料库中需要人工干预的自动加工方式不能解决的部分,从而减少人的工作;另一种反是则实现由计算机对加工的语料进行自动加工,然后由人工校对。对文本进行标注就是语言资源建设的一个方面.人工标注的过程是一个艰苦的、费时费力的,然而从语言信息处理发展的观点来看,是一个必须进行的过程.h_L /Y z因此开发一个可以辅助标注工作的工具就有它的意义。人机交互式的标注工具是进行语料标注的

15、有效手段,从一定程度上可以的减轻标注工作者的负担,同时还可以辅助检查标注结果的一致性等问题。开发界面友好的标注工具可以进一步的提高标注工作者的效率,同时结构化的输出更方便标注数据的后续使用。1.任务描述本次标注工具开发的主要工作是idw风格的交互环境设计与实现和适用于文本成分的标注风格的设计与实现。具体就是要完成以下的这些任务:A.人机交互界面的设计B.人机交互界面的实现C.实体,关系,实现具体标注的实现D.标注中间结果的显示E.标注结果的结构化输出。5论文的组织和安排整个论文分为四个部分,绪论介绍了这个标注工具出现的背景,解释了我们构造这个工具的必要性,后面各章节全部围绕标注工具设计开发的各

16、个细节来描述。分别为第章标注工具的设计原则和设计思想,包括用户的各种需求和工具要具备的功能,预先估计工具开发过程中可能会遇到的困难,为工具的具体开发和实现打好基础。第3章标注工具的具体开发,包括开发环境的选择,设计思想的详细实现,技术难点的分析讨论。第4章 对这次标注工具开发的总结,分析工具的缺陷以及没有解决的问题,以及对系统以后改进发展的看法。第二章标注工具的设计原则和设计思想2。研究方法和指导思想2.2标注工具的设计原则2。2。 文本标注工具的设计原则.3人机交互界面设计原则第三章 标注工具的具体开发3。1开发环境的选择。2标注工具的设计32.1标注工具的界面算法 .22结构设计33 标注

17、工具的详细设计3.。人机交互界面详细设计3。2菜单和工具栏的设计34标注过程文本的处理4.1实体标注详细设计3.2关系标注详细设计。3事件标注详细设计35 标注结果技术难点讨论第四章标注工具的缺陷分析和功能展望尽管工具经过反复的设计和考虑,性能进行尽可能的优化,但是本次的标注工具的缺陷还是非常多的,由于时间的紧张和能力的有限,还有许多的功能可以去实现,还有许多的地方需要改进。本次标注工具实现了简单的人机交互环境,但还有许多需要处理的过程。如用户标注之后发现标注出错撤销标注的操作,标注过程中的一些用户提示和交互。标注中间结果的处理,如对标注中间结果按标注内容在原始文本中的位置排序的实现。结束语本

18、论文工作实现了三个功能模块:标注模块:标注模块实现文本的实体、关系、事件三部分的标注。这个模块要主要是对文本进行处理,文本的选择,光标在文本中的位置,文本的获得,文本位置的比较等等。2。菜单模块:根据用户标注的需要,设计上下文菜单来实现功能。用户通过使用上下文菜单来进行标注工作。3。用户界面模块:提供用户良好的界面环境和输入环境,这次标注工具的界面由两个窗口组成,方便用户对照标注结果进行标注。虽然完成了论文预定目标,但是在人机交互上的处理上还有待进一步完善。致谢 这次毕业设计是在杨尔弘老师的热心指导下才能够得以完成的.首先感谢她对我学习上的教育和帮助.在这次毕业设计中,我多次在交互界面的设计和

19、文本信息处理上和杨老师进行深入的讨论。由于这次设计周期很长,杨老师一直是耐心的等待我的设计和测试的结果。 再者要感谢这大学四年来在生活和学习上帮助我的院系老师,是他们教授的本领陪伴我度过了这充实的大学生活。我在这四年中的收获也是很大的。综合素质有很大的提高,这和老师们的关心教导是分不开的。最后感谢与我一起共度四年的同学们,是我们的互相帮助让我们一起成长,一起进步,最终顺利的毕业。 参考文献1 Jff rosie著MFC Windos 程序设计 北京:清华大学出版社2002年月2 郑阿奇 主编 Visual + 使用教程第二版北京:电子工业出版社 003年8月3 朱巧明 李培峰 吴娴 朱晓旭 等主编 中文信息处理技术教程 北京:清华大学出版社 2005年9月4 方可燕 主编Vsual + 6.0实战与精通 北京:清华大学出版社 查阅了CRchdtView类中相关函数的用法 查阅了关于“软件人机界面设计”的技术文章以及“设计为人”的关于界面设计的文章

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1