毕业设计论文简历管理系统Word格式文档下载.docx
《毕业设计论文简历管理系统Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《毕业设计论文简历管理系统Word格式文档下载.docx(20页珍藏版)》请在冰豆网上搜索。
文献法。
文献法是通过调查文献来获得资料,从而全面地、正确地了解掌握所要研究问题的一种方法。
主要作用有:
1.根据有关的历史和现状,帮助确立开题。
2.能形成关于研究对象的一般印象,有助于观察和访问.3.能得到现实资料的比较资料.4.有助于了解事物的全貌
系统分析法
系统分析方法是指把要解决的问题作为一个系统,对系统要素进行综合分析,找出解决问题的可行方案的咨询方法。
五、研究步骤
(1)确定简历管理系统的研究课题
(2)通过查阅文献、利用网络搜索等多种方式搜集与课题内容相关的信息。
(3)确立研究该课题的思路以及方法
(4)系统分析与设计
(5)在老师指导下修改、完善课题
(6)课题研究结束
六、参考文献
[1]江志祥.智能简历解析系统的研究与实现[D].北京邮电大学,2009.
[2]张艳梅,胡文淑,曾鍚.基于神经网络的中文分词技术研究[J].软件导刊,2007,(23):
16-18.
[3]余战秋.中文分词技术及其应用初探[J].电脑知识与技术,2004,(32):
81-83.
[4]沈斌.基于分词的中文文本相似度计算研究[D].天津财经大学,2006.
[5]马军红.面向中文的文本相似度计算方法研究[J].网络财富,2010,(10):
165.
[6]朱扬勇,孙婧.推荐系统研究进展[J].计算机科学与探索,2015,9(5):
516-517.
[7]任磊.推荐系统关键技术研究[D].华东师范大学,2012.
指导教师签名:
2017年5月20日
摘要
进入信息时代,信息可以在多种渠道中进行传播。
一则招聘信息可以在多个渠道发布,企业的招聘部门收到的简历数据日益增多,如何提高筛选简历效率是对招聘部门提出的新要求。
求职者需要让自身简历在大量的简历中脱颖而出,除了自身的具备的专业素养还需要有一份内容突出、精美的简历。
简历管理系统帮助企业在众多的简历中缩减查看简历范围,根据科学的计算方法保证结果的科学性。
简历管理系统是基于Python的jieba分词和利用余弦定理对文本进行文本相似度计算。
采用.net开发语言和MySQL数据库,B/S技术架构。
系统对简历进行分词处理,赋予权重后,采用余弦定理文本相似度计算,筛选出符合用户需求范围内的简历。
系统采用MySQL数据库,支持大量的大型的数据库;
MySQL优化了SQL查询,提高查询速率。
简历管理系统极大的提高了简历的筛选效率,利用分词技术、对部分词赋予权重进行相似度计算最大限度降低误差,以符合实际需求。
简历管理系统的特点是:
系统结构简单,迅速提取目标信息。
关键词:
大数据、分词、数据分析、简历
ABSTRACT
Intheinformationage,informationcanbespreadthroughmultiplechannels.Arecruitmentinformationcanbepublishedinmultiplechannels,andtherecruitmentdepartmentoftheenterprisereceivesmoreandmoreresumedata.Howtoimprovetheefficiencyofscreeningresumesisanewrequirementfortherecruitmentdepartment.Jobseekersneedtomaketheirresumesstandoutinalargenumberofresumes,withtheexceptionofaprofessionalqualitythatrequiresanoutstandingresume.
Theresumemanagementsystemhelpsbusinessesshrinkthescopeoftheirresumesandmakesuretheresultsarescientificbasedonscientificcalculations.TheresumemanagementsystemisbasedonaPython'
sbinarywordandusingthelawofcosinestocalculatethetextualsimilarityofthetext.AdevelopmentlanguageandMySQLdatabase,B/Stechnicalarchitecture.So,thesystemhastosplitthewordstotheresume,giveittotheweight,andthenitUSESthelawofcosinestodeterminetheprofile,andthenselecttheresumethatmatchestheuser'
sneeds.ThesystemusesMySQLdatabasetosupportalargenumberoflargedatabases;
MySQLoptimizesSQLqueriestoimprovequeryspeed.
Theresumemanagementsystemgreatlyimprovesthescreeningefficiencyoftheresume,usingthewordsegmentationtechniqueandtheweightofsomewordstotheweighttominimizetheerrortomeettheactualdemand.Resumemanagementsystemischaracterizedbysimplesystemstructureandquickextractionoftargetinformation.
Keywords:
Bigdata;
Dividetext;
Analysisdata;
Resume
1概述
3
1.1选题背景
1.2现状分析
5
2相关研究
3系统分析
4
3.1系统功能分析
3.1.1用户需求分析
3.1.2系统的功能模块图
3.2系统业务流程分析
3.2.1业务流程图
3.3系统数据流程分析
6
3.3.1数据流程图
7
4数据字典
9
5系统设计
10
5.1E-R图
5.2数据表设计
13
5.3代码设计
14
5.4安全设计
15
6系统实施
6.1系统开发平台与技术简介
6.2系统实施界面
16
6.2.1登陆界面设计
7总结
17
参考文献
1概述
1.1选题背景
临近毕业季,毕业生们身边开展着各种校园招聘会、人才市场招聘以及各种网络平台的招聘。
面对各个渠道提供的各种企业岗位,很多毕业生选择海投简历,这种方式无疑是工作量大、效率最低的。
对于企业而言,面对众多格式不一、各具特色的简历,必须需要筛选简历找到最合适的人选。
若人工一份份工阅读,必然造成一定的资源浪费,且效率较低。
因此,对于企业,若能够对一份简历进行有效数据进行筛选提取,便可筛掉一部分不符合岗位需求的求职者,提高一定的工作效率节省一定的资源;
对于求职者,若清楚各企业的岗位的要求,便不必海投简历,省去时间精力,应聘也有一定的方向。
1.2现状分析
一份应聘简历含有应聘者的基本信息、经历以及个人能力的简述。
每一份简历都具备一定的信息量。
现今,信息传播速度较快、传播平台较多,一则应聘消息可以通过报刊、官方公众媒体、招聘中介、招聘平台、校招、人才市场招聘等多种方式加以传播。
多渠道招聘信息的传播有利于企业寻找到最适合的人选,然而招聘部门收到的简历量也有了较大幅度的增加。
因此,在大量简历中如何快速、有效找到最符合某职位的人员是对应聘部门工作人员的新要求[1]。
显然,若是人工一份份阅读,是最传统较为浪费资源的方式。
如果结合一定的算法设计一个可以筛选指定内容有关的简历便可缩减招聘部门一定的工作量。
2相关研究
Jieba分词:
有三种分词模式[2-4]
精确模式,将句子最精确地切开;
全模式,把句子中所有的可以成词的词语都扫描出来,速度非常快,但是不能解决歧义;
搜索引擎模式,在精确模式的基础上,对长词再次切分,提高召回率。
用户可以自定义词典,以增加更高的正确率,通过计算分词的关键词TF/IDF权重,来抽取关键词。
基于简历内容的分词算法[5-7],将简历内的文字进行分词处理,得到分词后的样本。
对分词后的样本赋予权重。
再根据文本相似度余弦定理计算与目标信息的相关程度,根据相关程度判别简历是否通过筛选[7-12],实则是基于内容的推荐系统。
3系统分析
系统分析也称为“系统方法”[11]。
以系统的整体最优为目标,对系统的各个方面进行定性和定量分析,为决策者提供直接判断和决定最优系统方案所需的信息和资料。
3.1系统功能分析
简历管理系统是面向企业和求职者的简历管理系统。
总体任务是:
面向企业,能够缩减企业人事部查看求职者简历花费的时间;
面对求职者,能够根据系统所提供各个企业的要求条件,修改自己简历,增大录用的概率。
3.1.1用户需求分析
对于求职者,他们目的是能够找到一份满意的工作。
如今招聘形式的多样化,提供了大量的招聘信息,在有限的时间内找到最合适用户的工作才是最重要的。
因此他们的需求有:
(1)众多招聘信息中能够筛选出合适自己的岗位
(2)制作有特色的简历
对于企业招聘部门,参与招聘的人员增多,随之而来投送的简历也逐渐增多,需要在有限的时间内找到合适的人选。
招聘部门的要求有:
(1)有效地筛选符合该岗位要求的应聘者
(2)尽可能花费较少的时间,并保证筛选的质量
(3)能够发布招聘信息,增添新的应聘信息发布渠道
3.1.2系统的功能模块图
3.2系统业务流程分析
业务流程是以达到或者完成某个目标由不同的人分别共同进行一系列有逻辑活动的相关活动的集合[1]。
流程管理以流程为中心,通过优化企业的组织机构,灵活易变的流程设计,来提高企业的运行效率,优化资源利用率。
3.2.1业务流程图
1.顶级业务流程图,如图3-2-1所示
图3-2-1顶级业务流程图
2.简历管理系统面向企业子系统业务流程图,如图3-2-2所示
图3-2-2简历管理系统面向企业子系统业务流程图
3.简历管理系统面向企业子系统业务流程图,如图3-2-3所示
图3-2-3简历管理系统面向求职者子系统业务流程图
4.简历管理系统面向管理员子系统业务流程图,如图3-2-4所示
图3-2-4简历管理系统面向管理员子系统业务流程图
3.3系统数据流程分析
数据流程分析是把数据在组织(或原系统)内部的流动情况抽象地独立出来,舍去了具体组织机构、信息载体、处理工作、物资、材料等,单从数据流动过程来考查实际业务的数据处理模式。
现有的数据流程分析多是通过分层的数据流程图(DFD)来实现的[13]。
3.3.1数据流程图
1.顶级数据流程图,如图3-3-1所示
图3-3-1简历管理系统顶层数据流程图
2.简历管理系统第一层数据流程图,如图3-3-2、3-3-3、3-3-4所示
图3-3-2简历管理系统面向企业第二层数据流程图
图3-3-3简历管理系统面向企业第二层数据流程图
图3-3-4简历管理系统面向管理员第二层数据流程图
4数据字典
数据字典主要包括数据元素、数据结构、数据流、数据储存、处理逻辑的定义和描述。
数据存储在数据字典中,只描述数据的逻辑结构,不涉及它的物理组织主要描述它所表示的数据结构和输入、输出数据流。
数据结构标号和名称具有唯一性[13]。
(1)数据项:
数据项是数据的最小单位。
描述数据的静态,具有不可再分的逻辑性。
数据项包括:
数据项编号;
数据项名称;
别名;
简述;
类型及宽度;
取值范围。
数据项编号:
DM-001
数据项名称:
企业用户名
别名:
username
简述:
企业用户登录的用户名
类型及宽度:
Varchar;
60位
(2)数据结构:
数据结构描述数据项之间的关系可由若干数据项、数据结构与数据结构组成。
数据结构包括:
数据结构编号;
数据结构名称;
组成;
相关数据流;
相关逻辑处理。
数据结构编号:
S01-01
数据结构名称:
企业用户基本信息
组成:
企业注册编号+企业法人姓名+企业公司地址+企业联系方式
相关数据流:
修改招聘信息
相关逻辑处理:
修改招聘信息管理
(3)数据流:
数据流是由一个或一组固定的数据项组成。
可以由一个已定的数据结构,可以由若干数据元素、简单数据结构和复杂的数据结构组成。
数据流包括:
数据流编号;
数据流名称;
数据流来源;
数据流去向;
数据流量;
高峰流通量。
数据流编号:
C01-01
数据流名称:
筛选后简历清单
数据流来源:
企业用户导入简历
数据流去向:
复试者名单
数据流量:
100份/分钟
高峰流通量:
(4)数据储存:
数据存储在数据字典中,只描述数据的逻辑储存结构,不涉及它的物理组织,主要描述它所表示的数据结构和输入、输出数据流。
数据储存包括:
数据存储编号;
数据储存名称;
数据存储组成;
关键字。
数据存储编号:
D01-1
数据存储名称:
招聘信息
招聘企业、岗位、要求、薪资、其他
数据储存组成:
招聘企业、招聘岗位、岗位要求、薪资、联系方式、其他
关键字:
招聘企业、招聘岗位、岗位要求、薪资、联系方式
(5)处理逻辑:
处理逻辑在数据流程图中只进行简单的描述,与数据流程途中的编号和名称一致。
处理逻辑包括:
数据逻辑编号;
数据逻辑名称;
处理;
输入;
输出;
处理频率。
数据逻辑编号:
XS01-02
数据逻辑名称:
简历关键字匹配
将分词后的简历与关键词匹配得到筛选后的简历编号
处理:
输入:
分词后的简历集
输出:
与关键词匹配后的简历集
处理频率:
5系统设计
5.1E-R图
实体是现实世界中可区别于其他对象的“事件”或“物体”,每个实体有一组性质,其中一部分可以唯一标识,实体可以是实实在在的,也可以是抽象的;
联系是指实体的联系分为实体的内部联系和实体与实体之间的联系。
实体之间存在多种类型的联系,常见实体的三种类型:
(1)一对一联系(1:
1)
(2)一对多联系(1:
n)(3)多对多联系(m:
n)[14]。
1.企业用户、求职用户、管理员信息如图5-1-1、5-1-2、5-1-3
2.招聘表信息、简历储存表如图5-1-4、5-1-5
如图5-1-4招聘表信息
如图5-1-5简历储存表信息
3.简历管理系统实体之间的具体关系如图5-1-6
图5-1-6简历管理系统实体之间的具体关系
5.2数据表设计
1.管理员信息表,设置如下:
字段名
字段类型
字段宽度
是否为空
字段描述
PK/FK
ID
Int
30
Notnull
管理员ID
PK
Gname
Varchar
管理员用户名
GPSD
管理员密码
2.企业用户信息表,设置如下:
id
企业用户ID
Ename
70
Epsw
int
密码
Etel
char
60
联系方式
Edrs
100
企业地址
Enum
企业注册编号
Elname
20
企业法人姓名
Elnum
企业法人身份证号
3.求职者用户信息表,设置如下:
Sid
求职者用户ID
Sname
用户名
Spwd
Slnum
身份证号
Stel
4.招聘信息表,设置如下:
CID
招聘信息ID
Ces
招聘企业
Cjob
招聘岗位
Cdemand
200
要求
Ctel
Cels
300
null
其他
Csal
薪资
5.筛选后简历表,设置如下:
JID
简历表ID
Jcount
计算后结果
5.3代码设计
代码是用来代表某实体或实体某属性值的一种符号,通常由数字、字母组成。
易于被计算机和人识别和处理[14]。
代码设计的作用主要有以下几个方面:
唯一地标识一个实体或属性值;
系统集成基础;
便于分类和统计;
在某些场合节省储存空间;
便于排序和索引;
能提供专门的含义。
代码设计主要遵循以下几个原则:
唯一性,代码设计要保证每一个代码都有确定的代码实体,能够一一对应,不能出现两个相同的代码;
合理性;
可扩充性;
一致性;
标准性;
简单性;
稳定性。
1.企业用户ID编号:
顺序数
xxxx
xxxxxx
xxxxxxxxxxxxx
企业类别
注册时间:
月份日历数小时数
例如:
072013表示7月20日13时
注册年份
2.简历ID编号:
部门编号
xxxxx
5.4安全设计
系统的安全设计是一个非常重要的问题,特别是基于网络应用的信息系统。
系统的安全主要包括物理安全和逻辑安全两个方面[14-15]。
保证系统的物理安全需要保证相关的设置不收到外界的破坏,加强物理保护。
保证系统的逻辑安全是保证系统的信息完整性、保密性、可用性;
系统内所有的信息、数据正常的使用,正确的数据流向。
系统的安全威胁因素较多[14]。
在保证系统的物理安全过程中可能有人为或者非人为,直接或者间接伤害系统的物理设施。
例如软硬件的缺损。
系统是基于网络的应用信息系统,系统安全体系可能会受到来自网络的病毒攻击、非授权访问、盗取数据库信息、病毒感染等威胁。
需要采取以下措施预防系统受到安全威胁:
(1)专人管理系统的硬件设施;
定期检查跟换硬件设备是否完好;
对系统进行加密
(2)安装防火墙,保证安全上网。
(3)及时对系统信息进行备份,将可能的损失降到最低
(4)定期检查系统查看是否存在漏洞及时修补系统漏洞。
6系统实施
6.1系统开发平台与技术简介
简历管理系统采用MySQL数据库。
MySQL数据库支持多种操作系统,开发时受到开发系统因素影响较小,为多种编程语言提供了
API[16]。
编程语言多样化。
可以用Java也可以用Python。
支持多线程,充分地利用了CPU的资源,加快了运行速度。
同时MySQL数据库优化的
SQL查询算法,有效地提高查询速度,提供ODBC和
JDBC等多种数据库连接途径[17]。
在数据存储方面,支持大量的大型的数据库,可以处理大量的信息。
B/S结构即浏览器/服务器模式[18-19],是WEB兴起后的一种网络结构模式,WEB浏览器是客户端最主要的应用软件。
这种模式统一了客户端,将系统功能实现的核心部分集中到服务器上,简化了系统的开发、维护和使用。
客户机上只要安装一个浏览器。
浏览器通过WebServer同数据库进行数据交互。
(1)维护和升级方式简单。
对用户人力、物力、时间、费用的节省