基于态势评估的网络舆论监控与引导系统的研究_精品文档Word格式文档下载.doc
《基于态势评估的网络舆论监控与引导系统的研究_精品文档Word格式文档下载.doc》由会员分享,可在线阅读,更多相关《基于态势评估的网络舆论监控与引导系统的研究_精品文档Word格式文档下载.doc(5页珍藏版)》请在冰豆网上搜索。
![基于态势评估的网络舆论监控与引导系统的研究_精品文档Word格式文档下载.doc](https://file1.bdocx.com/fileroot1/2022-10/12/d2d78443-86fe-46ad-8cbe-8c40fd542e28/d2d78443-86fe-46ad-8cbe-8c40fd542e281.gif)
态势评估;
贝叶斯网络
中图分类号:
TP393文献标识码:
A
ResearchofInternetPublicOpinionMonitoringandGuidingSystem
basedonSituationAwareness
SIXia-Meng,LiuYun,ChengHui,ZhangYan-Chao
(KeyLaboratoryofCommunication&
InformationSystems(BeijingJiaotongUniversity),BeijingMunicipalCommissionofEducation,Beijing,100044)
Abstract:
Internetpublicopinioncanreflectthetrendofopinionintime,soitisimportanttograspit.BecauseoftheCharacteristicsoffreedomandhigh-speed,internetpublicopinionisuncertainandtime-disorderedduringtransmission.Currentinternetopinionproductsneglecttherelationbetweenopinioncollectionandopinionanalysis,whichleadthemhardtoadjustaccordingtothechangeofinternetpublicopinionduringpropagation.Thispaperpresentsaschemeforinternetpublicopinionmonitoringandguidingbasedonsituationawareness,throughtakeadvantageofknowledgebasedsystemandBayesiannetwork.Itresolvestheproblemofopinioninformationcollection'
sseparationfromopinioninformationanalysisbymeansofmodifyingtacticsofopinionmonitoringaccordingtoreal-timeinternetpublicopiniondata.
Keywords:
Opiniondynamic;
Informationfusion;
Situationassessment;
Bayesiannetwork
第期基于态势评估的网络舆论监控与引导系统的研究5
1引言
随着网络的进一步普及,我国的网民数量已经得到了很大的突破,网民的意见在互联网中聚集,进一步成为网络舆论,已经对我国的现实生活产生了巨大的影响【1】。
从总体上来看,网络舆论突发事件会给国家政策安全带来冲击,混淆人民群众的视听,因此,宏观舆论的研究,作为网络内容安全中最重要的一部分,开始受到舆论管理部门和科研院所的高度重视。
网络舆情分析系统发展到现在,出现了许多原型系统和市场产品:
国内包括方正智思——网络舆情互联网信息监控分析系统及舆情预警辅助决策支持系统、上海交通大学信息安全工程学院的网络媒体内容监管系统、军犬网络科技有限公司的军犬舆情智能监控系统等,对网络舆情的分析提供了多种辅助手段。
国外相关产品有:
Autonomy公司发布的三大系列专门针对中国市场的应用产品等。
这些网络舆情产品都能对网络舆论进行有效引导与合理分析。
然而,由于人们的生活习惯等因素,造成了网络舆论在传播过程中并不是随时间规则连续的,有可能在一小段时间内没有人发帖,而在有些时间段内网民高度关注,讨论热烈。
这样,就笔者所掌握的材料来看,目前已有的舆情产品尚未针对舆论信息相对于时间的无规律性做出专门的设计。
本文通过态势评估的方法,对网络舆论信息实时分析,根据分析的结果及时调整监控策略,从而使网络舆论监控更具针对性,解决了网络舆论信息相对于时间的无序性问题【2】。
本文以宏观舆论形成中的标志性现象为突破点,采用态势评估的方法来动态监控网络舆论演化,综合专家系统和贝叶斯网络等各种技术与知识,实时跟踪舆论动态,分析舆论倾向。
本文提出的基于态势评估的网络舆论监控引导系统解决了网络舆论信息采集与信息分析脱离的问题,可以根据前一周期的舆论信息来动态调整本次监控策略,从而使舆论监控更具针对性,保证了网络内容的安全,提高了网络舆论监控效率。
2态势评估介绍
态势评估(SituationAssessment)是信息融合理论的高层功能模型。
信息融合,原称数据融合,最初是在20世纪70年代初期由美国海军首先提出的,它是一个对来自多传感器和信息源的数据、信息进行检测、联合、相关、评价及合并的多级、多方面处理过程,最终获得提炼后的状态和目标评估及对局势和威胁的及时、全面的评价【2】。
到目前为止,态势评估还没有统一的定义,只有大量对态势评估的功能描述,最著名的就是美国国防部的联合领导实验室JDL(JointDirectorsofLaboratories)的数据融合处理模型中的描述:
态势评估是建立关于作战活动、事件、时间、位置和兵力要素组织形式的一张视图,将所观测到的战斗力量分布与活动和战场周围环境、敌作战意图及敌机动性有机地联系起来,分析并确定事件发生的原因,得到关于敌方兵力结构、使用特点的估计,最终形成战场综合态势图【3】。
由于态势评估根据实体和被观察事件的关系,结合先验知识和多源实施观察数据来确定实体的意义。
在态势评估中,尤其强调关系信息,例如实体间的自然亲近关系、通讯拓扑关系、因果关系和隶属关系等【4,5】。
利用态势评估的这些功能,网络舆论监控系统将其应用到网络舆论监控中。
根据分布式网络爬虫收集的网络数据,结合知识库和专家系统,分析当前舆论状态,并根据分析结果,实时调整爬虫爬行间隔、爬行深度、爬行宽度和聚焦内容等设置,从而有针对性地收集数据以更高效地监控网络舆论。
这样,在第一轮大范围的从网络上收集舆论信息之后,经过基于知识库的态势觉察后,会发现一些较有威胁、需要加强监控的话题。
根据态势评估的思想,系统将把该信息传回爬虫,进行定向爬行,从而在短时间内针对某个话题进行智能监控。
3系统框架
网络舆论监控引导平台在态势评估技术的基础上进行研究和设计。
借用通信系统的思想,本平台按照流程主要分为四个子系统,分别完成收集、存储、预处理、分类、分析、态势评估、预测、系统管理八个功能。
这四个子系统中每个部分都是相对独立的单位,它们分别都有其各自的构建特点及职责功能,但在平台运行时又相互联系、相互协调,呈现系统性、协作性的运作状态。
系统框架见图1。
图1系统框架图
Fig.1SystemFramework
(1)信息采集:
实时采集网络舆论数据并存储,根据态势评估结果动态调整信息采集策略,实现动态监控网络舆论的功能。
(2)信息处理:
解析存储的数据,去掉大量页面冗余信息;
分析经过去噪后的数据,具体包括:
分词、摘要、聚类、热点发现以及敏感话题发现。
(3)态势评估:
根据本地服务器已存的舆论数据,结合相关知识库和专家系统,分析当前舆论所处的演化阶段,从而调整下一阶段数据采集器即网络爬虫的数据采集策略及引导策略,便于更有针对性地监控引导该话题。
(4)信息发布:
将态势评估后的结果发布到平台上,实现人机间双向交互。
4态势评估流程
本平台在对网络舆论监控引导中态势评估的整个流程是:
首先将从一直监测着网络数据的网络爬虫得到的网络舆论数据进行去噪音、分类分析,根据数据挖掘得到的结果,结合知识库进行态势觉察,根据觉察结果得出具体舆论参数数值;
在态势理解阶段,根据受到的具体舆论参数数值更新各个备选态势的确信值分配;
在态势分析阶段基于之前的确信值分配,利用贝叶斯网络技术评价每个备选态势的可信度,得到最终解,即该类型网络舆论的演化阶段,预测其演进趋势,并指导网络爬虫进行下一阶段的数据采集。
态势评估的具体流程如图2所示:
图2态势评估流程图
Fig.2SituationAssessmentFlowChart
基于态势评估的舆论监控引导过程分为六个具体步骤:
(1)监测网络:
一方面利用网络爬虫对网络舆论进行实时监测,将监测到的数据传入下面的态势觉察步骤中,以备判断目前舆论演进情况;
另一方面接受态势分析后的指令,调整数据采集方案。
(2)态势觉察:
结合知识库,在已有的舆论研究结果的接触上,判断数据挖掘后的舆论信息是否与已判断的舆论类型一致,如果不一致,则继续监测;
如果一致,则将该舆论数据传入下一个步骤。
(3)传播数据:
将新收到的舆论数据传播给态势评估的各个部分。
(4)态势理解:
根据收到的舆论数据更新各个舆论演进模型的确信值,从而为新一轮的态势评估做准备。
(5)数据反馈:
更新后的确信值反馈回网络爬虫,引导网络爬虫有目的地采集对于该态势评估有用的网络舆论数据。
(6)态势分析:
判断更新的确认值是否支持已确定的网络舆论类型,如果是,则确定该网络舆论类型;
如果不是,则返回网络爬虫接着监测网络舆论数据。
(7)决策:
当评估出网络舆论的具体特点,及其模型后,预测其演进趋势,并采取相应的引导措施。
5关键技术
5.1专家系统
之所以称为专家系统,是因为通过该方法所获取的知识以及思维推理方式都来自于专家。
但目前的专家系统的知识来源也有可能是专业人员或其他学习途径,因此统称为基于知识的系统【3】。
本文针对专家系统知识的不同来源,将专家系统分为知识库和人工辅助系统。
其中,知识库即已有的舆论研究结论,已上升到理论阶段;
人工辅助系统即专业人员根据经验和思维推理进行的辅助评估。
由于态势评估的分析对象是经过网络爬虫得到的舆论信息,可能是片面、模糊的或不准确的;
知识库也是经验性的;
求解过程需要反复试探;
造成了求解结果也可能具有不确定性。
因此,结合专业人员的人工辅助手段,可以解决该病态结构问题。
专家系统共包括5个部分:
知识库;
人工辅助;
含有动态、静态数据的全局数据库;
推理机;
人机接口;
知识获取组件和解释组件等。
知识库中的专家知识进行知识表达的机制有很多种,例如产生式规则、语义网络、框架、脚本等。
推理机根据收到的数据在知识库中进行搜索并得到结果。
5.2贝叶斯网络
贝叶斯网络(Bayesiannetwork),也称贝叶斯置信网络,是目前人工智能领域一种很重要的推理技术【2】。
它是基于概率推理的图形化网络,而贝叶斯公式即式
(1)