网络舆情数据采集系统开发毕业设计论文Word文档格式.docx
《网络舆情数据采集系统开发毕业设计论文Word文档格式.docx》由会员分享,可在线阅读,更多相关《网络舆情数据采集系统开发毕业设计论文Word文档格式.docx(59页珍藏版)》请在冰豆网上搜索。
计算机科学与技术学院
学生姓名:
专业:
信息安全
班级:
学号:
指导教师:
答辩组负责人:
填表时间:
2013年6月
重庆邮电大学教务处制
摘要
互联网发展至今,传统媒体已经日渐落寞,作为新生代媒体,网络已经在这一领域占据了越来越重要的地位,而且这种趋势还在上涨。
现今,越来越多的人通过互联网来表达自己对社会现状的态度和政治诉求等等,从互联网这一自由开放的媒体中了解民生,开展网络舆情信息采集和分析,已经各级政府部门目前面临的重要课题。
互联网作为新生代媒体,其发展势头迅猛,各大门户网站纷纷进军互联网领域抢占市场,竞争十分激烈,而其中新浪在这场竞争中表现得相当出色,新浪微博成为民众信息分享平台的首选。
本论文就设计了一个专门针对新浪微博的舆情数据采集系统,它包含如下几个功能:
查询指定用户的微博信息、查询指定微博的评论信息和转发信息、查询指定用户的所有粉丝和搜索该用户的指定粉丝、查询指定用户的所有关注和搜索该用户的指定关注以及将上述信息保存到本地数据库中,供以后对数据进行分析。
该系统是基于新浪官方提供的API来开发的,采用Java和MySQL实现软件的开发,Java实现软件的界面和数据展示,MySQL实现数据的存储。
工作时,它根据用户输入的信息,采用多线程方式去采集用户数据,主界面弹出等待提示框,给用户提供良好的用户体验。
在展示数据的时候,考虑到微博数据的庞大,该系统采用了分页技术来展示数据,而且对界面进行了美化,给用户提供一个美观的界面浏览。
【关键词】网络舆情新浪微博JavaMySQL微博API
ABSTRACT
SincethedevelopmentofInternet,traditionalmediahasalreadylonely,asanewgenerationofmedia,thenetworkhasbecomemoreandmoreimportantinthisfield,andthetrendisstillrising.Nowadays,moreandmorepeoplethroughtheInternettoexpressthemselvesonthesocialstatusoftheattitudeandpoliticalappealandsoon,tounderstandthepeople'
slivelihoodfromtheInternetwhichisafreeandopenmedia,networkpublicopinioninformationcollectionandanalysis,animportantissuehasbeenatalllevelsofgovernmentdepartmentsarecurrentlyfacing.
Internetasanewgenerationofmedia,themomentumofrapiddevelopment,themajorportalshavetoenterthefieldofInternettoseizethemarket,competitionisveryfierce,andSinainthiscompetitionperformedverywell,Sinamicro-blogpublicinformationsharingplatformofchoice.ThisthesisistodesignaspecificSinamicro-blogpublicopiniondataacquisitionsystem,whichincludesthefollowingfunctions:
queryspecifiestheuser'
smicro-blog,micro-bloginformationqueryspecifiesthecommentinformationandforwardinginformation,queryspecifiestheuserallthefansandsearchtheuserspecifiedfans,queryspecifiesalloftheuser'
sattentionandsearchthespecifieduserattentionandtheinformationissavedtoalocaldatabase,forlaterdataanalysis.
ThesystemisbasedonAPItoSinaofficialdevelopment,developedusingJavaandMySQLsoftware,Javasoftwareinterfaceanddatadisplay,MySQLdatastorage.Whenworking,itaccordingtotheinputinformationofauser,usingmultiplethreadstocollectuserdata,themaininterfacepopsupwaitforapromptbox,toprovideuserswithagooduserexperience.Inthedisplayofthedatawhenthemicro-blog,consideringthehugedata,thesystemusesthepagingtechniquetodisplaydata,andtheinterfaceisbeautiful,toprovideuserswithabeautifulinterfacetobrowse.
【Keywords】NetworkpublicopinionSinamicro-blogJavaMySQLMicro-blogAPI
前言
截至目前,国内关于网络舆情的概念还没有一个统一的定义,来自天津社科院的王来华认为:
舆情在其狭义上是指民众受中介性社会事项,刺激而产生的社会政治态度;
而网络舆情,则主要指使用网络者或俗称“网民”的社会政治态度[1]。
我个人也比较认同王来华教授的观点。
随着因特网在全球范围内的飞速发展,网络媒体已被公认为是继报纸、广播、电视之后的“第四媒体”,网络成为反映社会舆情的主要载体之一。
网络环境下的舆情信息的主要来源有:
新闻评论、BBS、微博等。
网络舆情表达快捷、信息多元,方式互动,具备传统媒体无法比拟的优势。
在我国,网民以往都是呈原子状态的个体分散在全国各区域,而如今,一个由“网络化用户”构成的“网众”群体已悄然崛起,并以数以亿计的庞大用户群体构成了一个“压力集团”,截至目前,这个集团的数量与力量还呈现出上升的态势[2]。
结合网络舆情的特性和我国的基本国情,网民通过互联网来表达自己的观点诉求已成为我国公民参与政治生活的重要部分。
当某一社会事件被迅速关注进而升温成为社会焦点或公共性事件时,国内网民便纷纷通过网络发表自己的看法。
正是基于这样的形式,网络舆情数据采集分析成为各级政府部门面临的不可或缺的重要课题。
经过这几年发展,新浪微博[3]在国内社交平台市场的竞争中算是领先一步,他占据了大部分用户群体。
结合国内对舆情信息的采集分析工作的迫切需求,本文的作品就设计了一个专门针对新浪微博的舆情数据采集系统,它包含如下几个功能:
查询指定用户的微博信息、查询指定微博的评论信息和转发信息、查询指定用户的所有粉丝和搜索该用户的粉丝、查询指定用户的所有关注和搜索该用户的关注;
该作品不仅做了数据的展现,还实现了数据存储,每次查询的用户信息、微博信息等都被存储在本地数据库中。
舆情数据采集是舆情信息监控的基础,这明确了本系统存在的意义。
另外,对政府部门来说,他们可以通过研究这些舆情数据,了解民众的政治态度和需求,只有更彻底的了解民生,才能更好的制定政策为人民服务;
对于商家来说,他们可以研究这些舆情数据,了解消费者对他们产品的评价,就能有针对性的对产品进行改善,这样既能提升产品的质量,获得消费者的信赖,又能增加收益,达到双赢的目的;
对于研究所来说,他们可以对这些数据进行数据挖掘,实现其相应的价值。
第一章系统相关技术概述
第一节Java技术概述
一、Java简要介绍
Java由SunMicrosystems公司于1995年5月推出的一门面向对象的程序设计语言,用它编写的应用程序具有跨平台的特征。
Java框架下包含三大平台:
JavaSE、JavaEE和JavaME。
JavaSE是Java平台标准版的简称,用于开发服务器、桌面和嵌入式设备中的Java应用程序;
JavaEE一种用来简化企业解决方案的开发、部署和管理相关的复杂问题的体系结构,JavaEE的基础是JavaSE;
JavaME是一个用来为移动平台提供的基于Java环境开发的技术规范的集合。
Java技术凭借着它的高效性、安全性、通用性和平台移植性,目前被广泛应用于个人PC、移动电话、科学超级计算机、游戏控制台和互联网等领域。
在全球云计算和移动互联网的产业环境下,Java[4]更具备了显著优势和广阔前景。
二、GUI图形用户界面
随着互联网的飞速发展,Java技术也得到了越来越广泛的应用。
而无论我们是采用JavaSE、JavaEE还是JavaME开发,图形用户界面都是我们不能逃避的问题。
现在的用户总希望我们开发的软件功能丰富强大而又操作简单,这就需要开发者注重界面的友好性,GUI就成了Java开发者不可或缺的重要课题。
Java使用AWT和Swing类库来完成图形用户界面的编程,其中AWT的全称是抽象窗口工具集(AbstractWindowToolkit),它是Sun公司最早提供的GUI库,这个GUI库提供了一些基本功能,但这个GUI库的功能比较有限,所以后来又提供了Swing库[5]。
Java开发者通过使用AWT和Swing提供的组件库,程序只需创建所需的图形组件,并用合适的布局管理器来组织这些组件按照特定的方式排列,就可以开发出非常完美的用户界面。
如果想要实现用户与界面之间的交互,开发者还应为程序添加事件监听,让事件处理来完成响应用户动作。
本论文作品主要用到了Swing库中的JButton、JLable、JTextField、JTable、JScrollPanel、JFrame、JPanel等组件,用到了AWT库中的BorderLayout、FlowLayout等布局管理器组件。
三、多线程
多线程是Java的一大特色,那么什么是多线程呢,下面用一个简单的例子来解释:
我们可以在操作系统中同时运行多个任务,一个任务就是一个程序,每个运行中的程序我们称为一个进程,在这个程序运行时,内部可能包含了多个顺序执行流,每个顺序执行流就是一个线程。
既然有多线程,那么必然会有单线程,所谓单线程就是说程序内部只有一条顺序执行流;
则多线程就可以理解为程序内部有多条顺序执行流,而且多个顺序执行流之间互不干扰。
Java的多线程有两种实现方式:
继承Thread类和实现Runnable接口。
本论文作品