大数据时代对统计工作的影响Word文档下载推荐.docx
《大数据时代对统计工作的影响Word文档下载推荐.docx》由会员分享,可在线阅读,更多相关《大数据时代对统计工作的影响Word文档下载推荐.docx(2页珍藏版)》请在冰豆网上搜索。
关键词:
大数据;
政府统计;
统计
中图分类号:
C829.23 文献标志码:
A 文章编号:
1000-8772-(2015)17-0100-01
本文将从大数据的内涵和特征,大数据时代给统计工作的影响以及政府统计工作如何应对大数据时代带来的冲击三个方面来阐述大数据与政府统计的关系。
一、大数据的内涵及特征
何谓大数据?
不同行业,不同技术背景的人有不同的理解。
维基百科是这样定义大数据的:
大数据指的是所涉及的资料量规模巨大到无法通过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。
与传统意义上的大数据相比,大数据的“大”和“数据”都被赋予了新的意义,它绝不仅仅是体量的问题,更重要的是通过海量数据的交换、整合、分析,创造出新的价值。
大数据背景下统计调查与数据分析研讨会结合统计工作认为大数据指那些超过传统数据系统处理能力、超越经典统计思想研究范围、不借用网络无法用主流软件工具及技术进行单机分析的复杂数据的集合,对于这一数据集合,在一定的条件下和合理的时间内,我们可以通过现代计算机技术和创新统计方法,有目的地进行设计、获取、管理、分析,揭示隐藏在其中的有价值的模式和知识。
结合国内外专家对大数据内涵的解释,其基本特征体现在以下四个方面。
1.数据体量巨大。
大型数据计量单位,从TB级别,跃升到PB级别,将来要处理的是ZB级甚至有可能更高。
2.数据类别多样化。
数据类型囊括了结构化、半结构化和非结构化数据。
3.数据量包含的价值密度低。
海量信息里有用的信息需要提炼。
4.达理速度快。
大量数据具有时效性,必须快速处理否则数据就失去了分析的意义。
二、大数据对统计工作的影响
1.大数据使传统调查方法受到冲击
在非普查年份,抽样调查是传统的数据收集的主要方式,在大数据概念下,样本就是总体,要分析与某事物相关的所有数据,不再需要通过样本的调查分析来推断总体。
在信息化的物联网时代,数据不是为了特定的数据收集目的而产生,而是一切可记录、可储存的信号,存在着不规则和模糊不清的特性。
传统的数据收集方法在大数据时代具有很大的局限性,甚至连处理和分析都无法用传统的应用软件进行。
2.大数据时代对统计标准带来挑战
在数据结构简单、规模小的数据时代,受到数据量以及数据处理水平的限制,统计要全面准确地反映总体就必须要求有限数据量具有更高的精确度。
在大数据时代,数据的不精确性是允许的,我们不再担心海量数据库中某个数据点对整体的影响。
我们在接受纷繁复杂的各类型数据时,更加关注大数据的发展轮廓和趋势,适当的忽略微观层面的精确度,可以让我们在宏观层面拥有更好的洞察力。
3.统计数据关系分析的重点面临转变
在过去的统计工作中,我们习惯寻找客观事物的因果关系,即使我们很难去确定彼此之间的缘由,我们仍然习惯去寻找因果。
在大数据时代,海量数据间结构复杂、数据变量之间关系纵横交错,预设客观事物间因果关系以及分析因果关系变得相对复杂,很多因果关系难以寻求,也没有意义寻求。
我们转而关注的是不同变量间的相关关系,也许相关关系不能告诉我们事情为何发生,但它会提醒我们事情正在发生。
三、统计在迎接大数据时代的对策
对于政府统计的发展来说,大数据时代是一把双刃剑,带来技术的冲击的同时也提供了发展壮大的机会。
1.建立适应大数据时代要求的统计机构体系
互联网经济的快速发展,政府统计部已经不是大数据的唯一拥有者。
统计系统处理需要从海量数据中得到常规信息,还需要深度挖掘有价值的数据。
统计部门必须依照大数据的收集、整理和分析这几个步骤进行相应的机构设置。
数据收集部门要以现有统计业务系统和大量业务数据的积累为基础,整合来各种结构化和非结构化数据。
然后由专门的数据分析极大拓展统计数据内容,探索数据背后潜在的价值,增加数据发布频率,更加有效地解读数据间的关联性、匹配性。
提高政府统计数据的客观性、及时性和权威性。
2.构建政务信息资源共享平台
虽然目前互联网上已存有海量的数据,但不同的企业和部门之间的信息是隔离的,就连政府业务系统之间,也远未实现政务信息资源的共享。
在大数据时代,只有打破信息封锁,消除打息孤岛现象,才能充分实现大数据的价值。
这就要求我们政府机构搭建可以提供大规模海量数据计算以及海量数据处理能力安全可靠信息共享平台。
通过官方的数据统计平台,跨部门、跨区域、跨层级都可以在这个数据平台上存储、更新,共享信息,后台运作云计算等先进技术对历史的和现有的数据整理归类,这样大大提高数据的效用性。
3.构建与大数据时代相匹配的统计分析系统
目前的统计系统针对结构化数据的处理和挖掘已经有了比较成熟的模型和算法,但产生于互联网和物联网时代的海量数据,不仅包涵了结构化数据,还包括了大量的半结构化和非结构化数据,这些数据体量庞大,结构复杂,统计系统要着力研究将非结构化数据转化为结构化的方法和技术,通过信息技术对海量数据的预处理,提高数据处理的智能化程度,并通过各种分析方法提高统计分析问题的高度和深度,最终提升政府统计的分析的预测和预警水平,为政府决策提供有效依据。
参考文献:
[1]严霄凤,张德馨.大数据研究[J].计算机技术与发展,2013(4).