理工科大学生新闻关注度挖掘分析.docx
《理工科大学生新闻关注度挖掘分析.docx》由会员分享,可在线阅读,更多相关《理工科大学生新闻关注度挖掘分析.docx(25页珍藏版)》请在冰豆网上搜索。
理工科大学生新闻关注度挖掘分析
题目理工科大学生新闻关注度挖掘分析
学生姓名张婷学号1121024050
所在学院数学与计算机科学学院
专业班级信息管理与信息系统1102班
指导教师钟永友
完成地点陕西理工学院
2015年5月20日
陕西理工学院本科毕业论文(设计)任务书
院(系)数学与计算机科学学院专业班级信息管理与信息系统(信管1102)学生姓名张婷
一、毕业论文题目理工科大学生新闻关注度挖掘分析
二、毕业论文工作自2015年3月16日起至2015年6月20日止
三、毕业论文进行地点:
陕西理工学院
四、毕业论文应完成内容及相关要求:
本论文旨在研究当代理工类大学生对新闻的关注度。
理工类学生的专业特点及思维方式是否会影响到对新闻的关注。
这为大学宣传部门提供一个新闻发布策略,并为大学生提供一个正确的舆论导向。
本论文任务主要研究以下内容:
(1)课题研究的目的及意义
(2)分析国内外大学生新闻关注度方面的研究现状及研究方法。
(3)设计调查问卷,获取有关理工科学生关注新闻方面的数据
a.关注新闻的行为分析,归纳分类列出可能影响因素。
b.设计调查问卷获取数据
(4)通过调查数据利用相关挖掘工具进行分析,包括两方面:
a.关联分析。
如专业与新闻类别的相关性,性别与新闻类别相关性,年级与新闻类别的相关性等。
b.聚类分析。
通过新闻关注频率、新闻种类、媒体方式等指标因素对不同专业进行聚类
通过上述两方面分析,得出大学生对新闻关注度的结论。
为大学生提供相应感兴趣的新闻信息,并引导学生关注其他种类的新闻。
为大学宣传部门提供建议决策。
(5)针对分析结果,提出不足,并提出进一步的研究设想。
五、毕业论文应收集资料及参考文献:
收集资料:
收集相关资料,设计问卷调查,得出研究数据。
查阅国内外关于新闻关注度方面挖掘分析的研究资料。
参考文献:
[1]刘龙启,刘蕴晗,麻辉凯,李孟筑.关于大学生新闻关注状况的调查研究[J].文教资料,2012(7):
131-134.
[2]邓烽,陈正香,陈玲玲,田伊伊.大学生对新闻关注度及关注方向分析报告以福建部分地方高校为例[J].数字化用户,2013(9):
120-121.
[3]陈红梅,阮晓琴.高校网络新闻关注度提升之途径探析[J].江西科技师范学院学报,2012(4):
94-96.
六、毕业论文的进度安排:
2015.3.9-2015.3.20了解课题,收集资料,撰写开题报告。
2015.3.21-2015.4.5调查、查阅、整理资料,确定研究方法、研究内容、研究重点与难点和论文的写作框架。
2015.4.6-2015.4.26形成论文初稿
2015.4.27-2015.5.20修改论文形成论文终稿
指导教师签名系(教研室)主任签名
专业负责人签名批准日期2015-01-10
理工科大学生新闻关注度挖掘分析
张婷
(陕理工数学与计算机科学学院信息管理与信息系统专业1102班,陕西汉中723000)
指导教师:
钟永友
【摘要】研究大学生新闻关注的现状,为提高大学生新闻关注度提供正确的舆论导向。
本次对大学生新闻关注度的调查研究采用了调查问卷和访谈的方式获得研究数据,采用统计、关联、聚类的方法来分析、挖掘数据。
由此发现了大学生总体关注新闻的状态;不同专业、性别、年级与新闻内容的相关性;新闻频率、新闻内容、新闻媒体与不同专业的关系。
最后提出了提高大学生新闻关注的建议。
【关键词】理工科大学生;新闻关注度;挖掘;统计分析
引言
一个国家的新闻报道,不仅是各种消息传播的主要渠道,更是引导社会舆论、进行社会教育的重要方式,它在社会主义核心价值观传播中具有重要作用。
当代大学生作为同龄人中的佼佼者,是未来社会发展的中坚力量,是国家未来建设的主力军。
关注新闻,是大学生了解现代社会发展动态,提升素养,领会并形成社会主要核心价值观,拓宽认知范围,陶冶身心的重要途径;也是开阔视野,增长见识,促进自己专业学习的进步和知识见闻的丰富,推动自己学术研究能力的提高的重要途径。
大学生对新闻事件的敏锐观察能力,对社会发展的前瞻性预见,反映出大学生的政治社会程度。
因此,了解大学生对新闻关注的现状对我们来说具有非常重要的意义。
1选题的目的及研究意义
1.1研究背景
俗话说“国家兴亡,匹夫有责。
”国家的建设发展关系到我们每一个人的发展,尤其是作为祖国未来建设者的我们,更应该将自身的发展与祖国的需要紧密结合起来。
世界在飞速地发展,一个又一个的实例告诉我:
“两耳不闻窗外事,一心只读圣贤书”的时代已经过去,新的时代给我们当代大学生提出了更高的要求。
因此,新闻作为我们了解世界的一扇窗户,应该得到大学生的高度重视。
于是对大学生新闻关注度的调查研究也随之相继展开。
1.2研究目的
就当今社会来看,网络媒介已经成为我们获取信息的重要途径,而新闻更是我们了解外界的一扇窗,大学生作为当代社会的一个特殊群体,他们对新闻的关注是怎样的一个现状呢?
比如:
他们喜欢关注什么样的新闻?
什么因素影响他们对新闻的关注?
他们获取新闻信息的主要来源又是什么呢?
正是因为有如此多的困惑,所以我们做了这份调查,以此获得相关的线索,获得以下研究目的:
1)了解陕西理工学院大学生关注新闻的现状;
2)理工类学生的专业特点及思维方式对新闻关注的影响;
3)发现问题,找出解决方案,使我校大学生更加关注新闻时事,拓宽知识面,增长见识;
4)为我校宣传部门提供一个新闻发布策略。
1.3研究意义
一个国家的新闻报道,不仅是各种消息传播的主要渠道,更是引导社会舆论、进行社会教育的重要方式,它在社会主义核心价值观传播中具有重要作用。
当代大学生作为同龄人中的佼佼者,是未来社会发展的中坚力量,是国家未来建设的生力军。
关注新闻,是大学生了解现代社会发展动态,提升素养,领会并形成社会主要核心价值观,拓宽认知范围,陶冶身心的重要途径;也是开阔视野,增长见识,促进自己专业学习的进步和知识见闻的丰富,推动自己学术研究能力的提高的重要途径。
大学生对新闻事件的敏锐观察能力,对社会发展的前瞻性预见,反映出大学生的政治社会程度。
因此,了解大学生对新闻关注的现状对我们来说具有非常重要的意义。
2国内外研究现状
由于了解大学生新闻关注的现状具有非常重要的意义,因此国内外都对其进行了非常深入的研究。
在对大学生新闻关注度的研究上,不同的学者在不同的方面都进行了深入的研究并提出了自己独特的观点。
中国著名学者李安琪在2011年发表研究称大学生阅读新闻的时间是和年级的上升成反比的。
即大一学生关注新闻的时间最长,大四学生关注新闻的时间最短,而大二和大三学生则为于两者之间。
但是在刘龙启学者2012年却提出了与李安琪学者不同的观点。
刘龙启学者在调查研究中发现大二学生关注新闻时间最长,而大一学生关注时间最短,大四学生和大三学生在位与第二与第三。
在这份调查报告中,刘龙启学者还提出了大学生关注新闻的基本现状:
网络是大学生阅读新闻的主要媒介,新闻阅读涉及的内容趋向于多元化,不同的阅读群体对新闻存在差异等。
江姗姗教授则在2010年对当代大学生的阅读倾向进行了研究。
同样在国外也有许多学者对大学生新闻关注进行了深入研究并提出其得出的结论。
国外对新闻学的研究比中国对新闻学的研究要早很多,中国第一个新闻团体—北京大学新闻研究所的建立在1918年,而当时国外对新闻学进行研究的学者已经发现了很多问题,并提出自己的观点。
经过了数十年的发展,国外学术界对新闻的研究主要在4个层面展开,即微观—选择研究、宏观—选择研究、微观—建构研究和宏观—建构研究,分别在新闻把关、新闻流向、新闻内容与新闻媒介的社会建构分析、媒介帝国主义与媒介政治经济学等领域取得丰硕成果。
近年来的研究趋势表现为在方法上重视中观研究。
3调查方式及相关研究理论
了解大学生新闻关注的现状可以间接了解当今大学生的兴趣点、责任感等,可以为学校和社会给大学生提供一个正确的、积极的、向上的价值观、人生观和社会观提供导向功能。
为了得到有关大学生新闻关注的各方面数据,本次研究采用调查问卷和访谈的方法获取原始数据,采用统计、关联和聚类的方法对数据进行挖掘分析。
3.1 调查问卷设计及发放
由于地域及各方面因素的限制,本次研究将以陕西理工学院的理工科学生为研究对象。
为了提高调查结果的精确性和可以了解到不同阶段大学生关注新闻的现状,在选取样本时采用分层抽样和随机抽样相结合的方法。
本次调查总计发放调查问卷160份,其中男女各80份,各年级40份总的回收率为95.6%。
表3.1问卷调查表的发放分布表
大一
大二
大三
大四
男
女
男
女
男
女
男
女
发放数
20
20
20
20
20
20
20
20
回收数
18
20
20
19
20
20
20
20
回收率
0.9
1
1
0.95
1
1
1
1
调查问卷问卷共计三部分。
第一部分为调查主题:
理工科大学生新闻关注度调查表;第二部分为被调查者的基本信息,包括有:
性别、专业、年级,是被调查者自己填写;第三部分为了解被调查者新闻关注现状的各方面问题,有10个选择题,1个简答题。
在第三部分中1-3和9-10为单选题,4-8为多选题。
第1题与第9题为调查大学生对新闻的态度;第2-3题为调查大学生关注新闻的频率和时间;第4-5题为调查大学生关注新闻的方向和内容;第6-7题为调查大学生关注新闻时选取的途径以及选取这种途径的原因;第8题为调查大学生关注新闻的初衷;第10题为调查大学生获取新闻之后的活动;第11题为发散题,借此可使大学生思考于影响自己关注新闻的因素,并提出可以提高自己新闻关注度的意见。
3.2访谈
由于问卷调查所了解的问题比较固定和浅显,因此本次调查还采用了访谈的方法,随机选取了20名理工科学生进行访谈。
访谈的内容除了问卷调查表中的所有问题,重点谈到大学生对当前新闻报道的各方面看法和对校园新闻宣传各方面意见。
最后对访谈结果进行总结并分析,得出结论。
3.3相关研究理论
本次研究主要采用统计的方法来分析大学生关注新闻的总体趋势,采用关联分析的GIR模型来进行新闻内容与不同性别、不同年级的大学生的联系,采用聚类的思想进行新闻频率、新闻内容、新闻媒体与不同专业大学生的关系。
3.3.1关联分析
1993年,Agrawal等人在首先提出关联规则概念,同时给出了相应的挖掘算法AIS,但是性能较差。
1994年,他们建立了项目集格空间理论,并依据上述两个定理,提出了著名的Apriori算法,至今Apriori仍然作为关联规则挖掘的经典算法被广泛讨论,以后诸多的研究人员对关联规则的挖掘问题进行了大量的研究。
关联规则挖掘在数据挖掘中是一个重要的课题,最近几年已被业界所广泛研究。
关联规则最初提出的动机是针对购物篮分析(MarketBasketAnalysis)问题提出的。
假设分店经理想更多的了解顾客的购物习惯。
特别是,想知道哪些商品顾客可能会在一次购物时同时购买?
为回答该问题,可以对商店的顾客事物零售数量进行购物篮分析。
该过程通过发现顾客放入“购物篮”中的不同商品之间的关联,分析顾客的购物习惯。
这种关联的发现可以帮助零售商了解哪些商品频繁的被顾客同时购买,从而帮助他们开发更好的营销策略。
关联规则定义为:
假设I=
是项的集合,给定一个交易数据库
,其中每个事务(Transaction)t是I的非空子集,即
,每一个交易都与一个唯一的标识符TID(TransactionID)对应。
关联规则是形如
的蕴涵式,其中
且
,X和Y分别称为关联规则的先导(antecedent或left-hand-side,LHS)和后继(consequent或right-hand-side,RHS)。
关联规则
在D中的支持度(support)是D中事务包含
的百分比,即概率
;置信度(confidence)是包含X的事务中同时包含Y的百分比,即条件概率
。
如果满足最小支持度阈值和最小置信度阈值,则称关联规则是有趣的。
这些阈值由用户或者专家设定。
3.3.2聚类分析
聚类分析又称群分析、点群分析,是定量研究样品或指标分类问题的一种多元统计方法。
其中类指相似元素的集合。
聚类分析定义:
聚类分析的输入可以由一组有序对(X,s)或(X,d)表示,这里X表示一组样本,s和d分别是度量样本间相似度或相异度(距离)的标准。
聚类系统的输出是对数据的区分结果,即
=
,其中
是X的子集,且满足如下条件:
(1)
;
(2)
。
C中的成员
称为类或簇。
每个类可以通过一些特征来描述。
通常可以有如下几种表示方式:
(1)通过类的中心或类的边界点表示一个类。
(2)使用簇类树中的结点图形化地表示一个类。
(3)使用样本属性的逻辑表达式表示类。
聚类分析的目的是将研究对象进行分类。
它是在事先不知类别的情况下对数据进行分类的分析方法。
分类的依据有两类:
距离与相似系数。
常用的距离有以下几种:
1﹑明考夫斯基距离
2﹑绝对距离
3﹑欧氏距离
4﹑切比雪夫距离
5﹑马氏距离
6﹑兰氏距离
常用的相似系数有以下几种:
1﹑夹角余弦
2﹑相关系数
聚类分析根据所用方法不同可分为系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法等等;根据分类对象不同又分为对样品聚类(又称Q型聚类分析)以及对变量进行聚类(又称R型聚类分析)。
对前者聚类多用距离,而后者聚类时多用相似系数。
4调查结果及分析
通过对回收的问卷数据的汇总分析并结合访谈的结论本次调查发现了大学生对新闻关注的总体特征。
4.1大学生关注新闻的频率较高,但时间较短
世界时刻处在变化当中,而新闻也每天都在更新当中。
在图4.1中可看出,73.3%的大学生每天都在浏览新闻,13.33%的大学生2-3天一浏览新闻,仅有13.33%的大学生3天以上浏览一次新闻。
虽然大学生基本都是每天都在关注新闻,但是有图4.2也可看出,大学生每次浏览新闻的时间都很短,72.33%的大学生在“30分钟以内”,超过60分钟的只有3.22%。
图4.1大学生新闻关注频率分布图
图4.2大学生每次浏览新闻的时间分布图
4.2大学生关注的多为国内新闻,校内新闻关注最少,内容多为时政和娱乐
“国家兴旺,匹夫有责”,国家的兴旺发展和我们每个人都有着极其紧密的联系。
有图可知,86.67%的大学生都在关注国内新闻,因此可见,当代大学生还是很有国家主人翁意识的。
有50%的大学生不但关注国内新闻同时还关注国际新闻,随时了解世界各国的发展动向。
与之想成鲜明对比的是地方新闻尤其是校内新闻大学生鲜有关注,仅占34.11%和20%。
由此可见,校内宣传部门应认真思考当前的宣传策略,对以往的宣传策略进行改进,增加学生对校内新闻的关注度。
从各种内容的新闻占大学生关注的比重上来看,时政类时大学生最喜爱看的新闻,占84.44%左右;娱乐类新闻为大学生第二大关注内容,占55.56%;而军事和体育类新闻所占比重基本相同,都为33%左右;美食类新闻排名最后为28.89%。
图4.3大学生关注新闻的方向分布图
图4.4大学生关注新闻的内容分布图
4.3大学生获取新闻的途径多为手机、电脑,传统传播媒体所占比重越来越少
现代信息技术日新月异,科技力量使人们的生活习惯、消费习惯发生了巨大的变化。
传统的传播媒体如:
报纸、杂志、广播、电视等已越来越不为人们所用,而是选择更加方便的手机、电脑等新式传播媒体。
大学生选择浏览新闻的途径同样印证了这一点。
93.33%的大学生选择手机作为媒介来关注新闻;71.11%的大学生利用电脑来关注新闻;仅仅只有31%左右的大学生采用报纸、广播、杂志和电视来关注新闻。
图4.5大学生新闻关注途径的分布图
4.4便捷和时效性强为大学生选择新闻传播途径的重要因素
传播新闻的媒介有广播、报纸、杂志、电视、手机、电脑等,但绝大多数大学生都选用手机和电脑来关注新闻,是什么因素影响大学生选择关注新闻的途径?
根据本次研究可知,
便捷是影响大学生选择阅读新闻途径最主要的因素,时效性强是影响大学生选择阅读新闻途径的第二大因素,相比较而言大学生对新闻自身的真实性和丰富度关注不是特别大,这也许与大学生所处的社会地位有关他们。
大学生在校读书期间,由于学习压力,基本没有空闲时间,于是他们在干一些事时方便、快捷便成为首要选择。
图4.6大学生选择新闻关注途径的原因分布图
4.5大学生关注新闻的初衷
“有因必有果”,基本上每个大学生都会对新闻进行关注,但是每个人关注新闻的初衷的不尽相同。
在图表中可以看出有60%的大学生关注新闻是为了关注国家大事、开阔眼界,而有44.44%的大学生关注新闻是为了消磨时间,排在第三的为积累谈资,学习和考试需要的仅为4.44%,受家庭和学校影响的只为15.56%。
图4.7大学生关注新闻的初衷分布图
4.6大学生对待新闻的态度
大学生对待新闻的态度直接影响了大学生对新闻关注的时间和频率。
在认为关注新闻对自己“非常有帮助”的大学生中85%以上的都非常关注新闻。
但是只要20%的大学生认为关注新闻对自己非常有帮助,34%的大学生认为关注新闻对自己的帮助一般,而又44%的大学生认为关注新闻对自己只有一点,2%的大学生认为关注新闻对自己一点帮助也没有。
5不同层次大学生关注新闻的差异
5.1大学生性别与关注新闻内容的关联分析
男女大学生由于生理、心理等各方面的差异,使得他们各自关注新闻的内容有所变差。
本次研究使用clementine对大学生关注的新闻内容与性别进行关联分析得到图5.1所示数据。
由数据结果图显示的置信数confidence(minconfidence=80%)和支持度support(minsupport=20%)可知,男大学生与军事、体育、时政类新闻关联紧密,说明男大学生一般都会关注此类新闻;而关注娱乐、军事的男大学生一般也会关注教育类新闻;关注时政、美食类新闻的男大学生也会关注军事类新闻。
女大学生与娱乐、美食类新闻关联紧密,尤其是美食类新闻;一般关注美食类和同时关注关注教育、军事的女大学生会关注娱乐类新闻;关注体育和军事的女大学生也会关注美食类新闻;关注军事类新闻的女大学生一般也会关注时政类新闻。
图5.1大学生关注新闻的内容和性别的关联关系
图5.2大学生关注新闻的内容和性别的关联关系
5.2大学生所处的年级与关注新闻内容的关联分析
从刚步入大学校门的大一新生,到马上进入社会的大四老生,他们的性格变得越来越成熟,所关注的焦点也慢慢不同。
由大学生关注新闻的内容与年级的关联分析结果图可知,娱乐类新闻与大一学生关联最深,与大三学生的关联最小,这说明大一学生关注娱乐新闻的最多,而大三学生关注最少;教育类新闻则与大三学生关联程度最大,大一学生关联最少,这说明大三学生关注教育类新闻的人最多,这与大三学生有考研、留学等选择有关。
大四学生也多关注时政类新闻,这与他们马上步入社会有关。
在大四学生中关注娱乐的大学生一般也会关注军事类新闻,关注美食类新闻的大学生一般也会关注娱乐新闻。
在大三学生中,关注教育的一般也会关注时政类新闻;而关注美食教育的一般也会关注时政类新闻。
在大二学生中,关注美食、军事的一般也会关注娱乐类新闻。
在大一学生中,关注美食的一般会同时关注娱乐新闻;关注军事的一般也会同时关注时政、娱乐类新闻;而同时关注军事、体育的一般也会关注时政类新闻。
图5.3大学生关注新闻的内容与年级的关联关系
图5.4大学生关注新闻的内容与年级的关联关系
5.3不同专业的大学生在新闻关注方面的差异
不同专业的大学生因为其专业的不同、所需信息的不同等各方面的差异性造成在新闻关注方面的差异化。
为了得出这种差异化本次研究采用聚类的方法,通过新闻关注频率、新闻种类、关注新闻的途径等对不同专业进行聚类。
首先根据大学生新闻关注的频率时间对不同专业进行聚类,由表5.5可知,当聚类为4时,信息管理与信息系统专业、机械专业、工程管理专业为聚为一类,而地理、应用化学聚为一类,电气自动化聚为一类。
当聚类为6时,地理、机械、信息管理与信息系统为聚为一类,剩下的各自聚为一类。
表5.5新闻频率对不同专业大学生的类成员聚类表
Case
8Clusters
7Clusters
6Clusters
5Clusters
4Clusters
3Clusters
地理
1
1
1
1
1
1
机械
2
2
2
2
2
1
工程管理
3
3
3
3
3
2
电气自动
4
4
4
4
3
2
信息管理
5
5
5
3
3
2
信息管理
6
6
5
3
3
2
信息管理
7
1
1
1
1
1
信息管理
3
3
3
3
3
3
信息管理
3
3
3
3
3
2
信息管理
3
3
3
3
3
2
信息管理
3
3
3
3
3
2
信息管理
3
3
3
3
3
2
工程管理
3
3
3
3
3
2
信息管理
3
3
3
3
3
2
信息管理
3
3
3
3
3
2
信息管理
3
3
3
3
3
2
信息管理
7
1
1
1
1
1
应用化学
3
3
3
3
3
2
工程管理
8
7
6
5
4
3
信息管理
1
1
1
1
1
1
网络工程
3
3
3
3
3
2
再次,根据新闻种类(娱乐、时政、教育、美食、体育、军事)对不同专业进行聚类,由于新闻种类的繁多而依次对专业进行聚类。
第一次是有娱乐与专业进行聚类。
由表可知,当聚为第5类时,信息管理与信息系统、数学、光电信息工程、网络工程、地理聚为一类,而化工、测量技术与与仪器、计算机聚为一类。
当为第4类时,地理、信管、网络工程、工程管理、数学聚为一类,而化工、测量技术、计算机、建筑学则聚为一类。
再根据关注娱乐新闻的人数把类分为四类:
很高、高、低、很低。
由此发现化工、测量技术与仪器、建筑学、计算机为对娱乐关注低的区域,信管、地理等为对娱乐关注高的专业,临床医学为对娱乐关注最低的专业。
而以此为例,分别以时政、教育、美食、体育、军事与专业进行聚类。
发现,机械、飞行动力专业队军事内容的关注度最高,数学和工程管理的对军事新闻的关注度数最低,其他专业处于中间位置;在对美食类新闻的关注中,化学、工程管理、数学、临床医学的关注度最高,网络、、机械专业关注度最低,其他专业为于中间位置。
而地理专业对时政的关注度最高,化工和临床医学关注度最低;教育类各类专业都基本相同。
表5.6新闻关注内容娱乐对不同专业的类成员聚类表
Case
8Clusters
7Clusters
6Clusters
5Clusters
4Clusters
3Clusters
地理
1
1
1
1
1
1
机械
2
2
2
2
2
2
工程管理
3
3
3
3
3
1
电器自动
4
4
4
4
3
1
信息管理
5
5
5
1
1
1
信息管理
6
6
6
5
4
3
信息管理
7