人工智能初步论文.docx
《人工智能初步论文.docx》由会员分享,可在线阅读,更多相关《人工智能初步论文.docx(6页珍藏版)》请在冰豆网上搜索。
![人工智能初步论文.docx](https://file1.bdocx.com/fileroot1/2023-1/31/b27727cd-1900-4fef-b1d4-6ed9d93758b3/b27727cd-1900-4fef-b1d4-6ed9d93758b31.gif)
人工智能初步论文
课程名称:
人工智能初步
论文题目:
大数据的现状与未来发展
引言
大数据(Big Data)是继云计算、物联网之后IT产业又一次颠覆性的技术变革。
对国家治理模式、对企业的决策、组织和业务流程、对个人生活方式都将产生巨大的影响。
最早提出大数据时代已经到来的机构是全球知名咨询公司麦肯锡。
麦肯锡在研究报告中指出,数据已经渗透到每一个行业和业务职能领域,逐渐成为重要的生产因素。
而人们对于海量数据的运用将预示着新一波生产率增长和消费者盈余浪潮的到来。
关键词:
大数据云计算海量发展影响
一、大数据的产生背景
近几年以来,大数据一词越来越多地被提及与使用,人们用它来描述和定义信息爆炸时代产生的海量数。
人类至此已经进入了数据时代。
数据的影响已经渗入到了产业、科研、教育、家庭和社会等各个层面。
而这样的一个大数据时代是怎样一步一步产生的呢?
以我总结的观点可将它分为以下四点:
1、信息科技进步
信息处理、信息存储和信息传递,几十年来这三个能力的飞速进步,是人类科技史上最为激动人心的事件之一。
1965年,戈登·摩尔准备了一个关于计算机存储器发展趋势的报告。
在他开始绘制数据时,发现了一个惊人的趋势:
芯片上可容纳的晶体管数目,每隔18个月左右便会增加一倍,性能也将提升一倍。
后来人们发现这不仅适用于对存储器芯片的描述,也精确地说明了计算能力和磁盘存储容量的发展,于是,摩尔定律成为许多工业对于性能预测的基础,主宰了信息产业的发展。
在摩尔定律的指引下,信息产业周期性地推出新的计算机,操作系统和计算能力均在不断提高。
工业界和个人都不断地升级计算机设备,从而推动信息产业的巨大进步。
这短短40余年的历史,使信息处理和储存能力获得了成千上万倍的提升。
事实上,存储的价格从20世纪60年代1万美元1MB,降到现在的1美分1GB的水平,其价差高达亿倍。
在线实时观看高清电影,在几年前还是难以想象的,现在却变得已习以为常了。
网络的接入方式也从有线连接向高速无线连接的方式转变。
毫无疑问,网络带宽和大规模存储技术的高速持续发展,为大数据时代提供了廉价的存储和传输服务。
2、互联网诞生
互联网的出现,在科技史上可以比肩“火”与“电”的发明。
互联网把每个人桌面上的计算机连接起来,改变了人们的生活,成为大家获取各类数据的首要渠道。
因为互联网的内在机理,使互联网成为大规模接近消费者、最理解消费者的工具和平台。
互联网没有删除键,人们在互联网上的一言一行都被忠实地记录。
互联网就像每个人的记录者,它从不知疲倦,事不分大小,悉心而精准地记录着大家的数字化生活。
3、云计算与大数据
云计算,再一次改变了数据的存储和访问方式。
在云计算出现之前,数据大多分散保存在每个人的个人计算机中、每家企业的服务器中。
云计算,尤其是公用云计算,把所有的数据集中存储到“数据中心”,也即所谓的“云端”,用户通过浏览器或者专用应用程序来访问。
近几年兴起的建设云计算基地的风潮,客观上为“大数据”的诞生准备了必备的储存空间和访问渠道。
云计算是大数据诞生的前提和必要条件。
没有云计算,就缺少了集中采集数据和存储的数据商业基础。
云计算为大数据提供了存储空间和访问渠道;大数据则是云计算的灵魂和必然的升级方向。
4、物联网
物联网是另一个信息技术领域的热词,究其本质是传感器技术进步的产物。
遍布大街小巷的摄像头,是大家可以直观感受到的一种物联网形态。
事实上,传感器几乎无处不在,使用它可以监测大气的温度、压强、风力,监测桥梁、矿井的安全,监测飞机、汽车的行驶状态。
一架军用战斗机上的传感器多达数千个。
现在大家常用的智能手机中,就包括重力感应器、加速度感应器、距离感应器、光线感应器、陀螺仪、电子罗盘、摄像头等各类传感器。
这些不同类型的传感器,无时无刻不在产生大量的数据。
其中的某些数据被持续地收集起来,成为大数据的重要来源之一。
二、什么是大数据
大数据是指那些超过传统数据库系统处理能力的数据。
它的数据规模和转输速度要求很高,或者其结构不适合原本的数据库系统。
为了获取大数据中的价值,我们必须选择另一种方式来处理它。
数据中隐藏着有价值的模式和信息,在以往需要相当的时间和成本才能提取这些信息。
如沃尔玛或谷歌这类领先企业都要付高昂的代价才能从大数据中挖掘信息。
而当今的各种资源,如硬件、云架构和开源软件使得大数据的处理更为方便和廉价。
即使是在车库中创业的公司也可以用较低的价格租用云服务时间了。
对于企业组织来讲,大数据的价值体现在两个方面:
分析使用和二次开发。
对大数据进行分析能揭示隐藏其中的信息。
例如零售业中对门店销售、地理和社会信息的分析能提升对客户的理解。
对大数据的二次开发则是那些成功的网络公司的长项。
例如Facebook通过结合大量用户信息,定制出高度个性化的用户体验,并创造出一种新的广告模式。
这种通过大数据创造出新产品和服务的商业行为并非巧合,谷歌、雅虎、亚马逊和Facebook它们都是大数据时代的创新者。
1、大数据四个特性
海量性:
企业面临着数据量的大规模增长。
例如,IDC最近的报告预测称,到2020年,全球数据量将扩大50倍。
目前,大数据的规模尚是一个不断变化的指标,单一数据集的规模范围从几十TB到数PB不等。
简而言之,存储1PB数据将需要两万台配备50GB硬盘的个人电脑。
此外,各种意想不到的来源都能产生数据。
多样性:
一个普遍观点认为,人们使用互联网搜索是形成数据多样性的主要原因,这一看法部分正确。
然而,数据多样性的增加主要是由于新型多结构数据,以及包括网络日志、社交媒体、互联网搜索、手机通话记录及传感器网络等数据类型造成。
其中,部分传感器安装在火车、汽车和飞机上,每个传感器都增加了数据的多样性。
高速性:
高速描述的是数据被创建和移动的速度。
在高速网络时代,通过基于实现软件性能优化的高速电脑处理器和服务器,创建实时数据流已成为流行趋势。
企业不仅需要了解如何快速创建数据,还必须知道如何快速处理、分析并返回给用户,以满足他们的实时需求。
根据IMSResearch关于数据创建速度的调查,据预测,到2020年全球将拥有220亿部互联网连接设备。
易变性:
大数据具有多层结构,这意味着大数据会呈现出多变的形式和类型。
相较传统的业务数据,大数据存在不规则和模糊不清的特性,造成很难甚至无法使用传统的应用软件进行分析。
传统业务数据随时间演变已拥有标准的格式,能够被标准的商务智能软件识别。
目前,企业面临的挑战是处理并从各种形式呈现的复杂数据中挖掘价值。
2、大数据三个特征
除了有四个特性之外,大数据时代的数据还呈现出其他三个特征。
第一个特征是数据类型繁多。
包括网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。
第二个特征是数据价值密度相对较低。
如随着物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如何通过强大的机器算法更迅速地完成数据的价值“提纯”,是大数据时代亟待解决的难题。
第三个特征是处理速度快,时效性要求高。
这是大数据区分于传统数据挖掘最显著的特征。
三、大数据的整体态势和发展趋势
1、大数据的整体态势
虽然大数据目前在国内还处于初级阶段,但是商业价值已经显现出来。
未来,数据可能成为最大的交易商品。
大数据的整体态势和发展趋势,主要体现在几个方面:
大数据与学术、大数据与人类的活动,大数据的安全隐私、关键应用、系统处理和整个产业的影响。
大数据整体态势上,数据的规模将变得更大,数据资源化、数据的价值凸显、数据私有化出现和联盟共享。
在应用方面,大数据对IT技术架构的挑战,大数据的生态环境问题,大数据的应用及产业链将日益突出。
大数据的真正意义并不在于大带宽和大存储,而在于对容量大且种类繁多的数据进行分析并从中萃取大价值。
采用大数据处理方法,生物制药、新材料研制生产的流程会发生革命性的变化,可以通过数据处理能力极高的计算机并行处理,同时进行大批量的仿真比较和筛选,大大提高科研和生产效率。
数据已成为矿物和化学元素一样的原始材料,未来可能形成“数据探矿”、“数据化学”等新学科和新工艺模式。
在市场人才方面,大数据的发展会催生许多新兴新职业,会产生数据分析师、数据科学家、数据工程师,有非常丰富的数据经验的人才会成为稀缺人才。
随着大数据的发展,数据共享联盟将逐渐壮大成为产业的核心一环。
随着大数据的共享越来越大,隐私问题也随之而来,比如说每天手机产生的通话、位置等等。
但这给带来了便利的同时也给带来了个人隐私的问题。
数据资源化,大数据在国家和企业和社会层面成为重要的战略资源,成为新的战略制高点和抢购的新焦点。
2、大数据的发展趋势
当然,大数据还有着无限的发展空间,大数据技术有可能从以下几个方面突破
1、革命性的算法
大数据研究不是简单地建一个数据中心,也不是使用传统方法在超级计算机上处理生物信息、脑科学、天文物理、遥感、气象等领域的海量数据,即使找到线性复杂性的算法也对付不了Peta级以上的数据。
必须研究革命性的大数据处理系统结构和革命性的算法和软件,以应对数据指数级增长的挑战。
2、大数据的测量与感知理论
大数据不是采集得越多越好,要在不明显增加采集成本的条件下尽可能提高数据的质量。
要研究如何科学合理地抽样采集数据,减少不必要的数据采集。
当前数据跨领域跨行业的拉通和共享仍存在大量壁垒,海量数据的收集,特别是关联领域的同时收集和处理存在很大挑战。
只有跨领域的数据分析才更有可能形成真正的知识和智能,从而产生更大的价值。
3、高效率低成本的数据存储
大数据中有大量的冗余,消除冗余是降低开销的重要途径。
大数据的存储方式不仅影响效率也影响成本,需要研究高效率低成本的数据存储方式。
需要研究多源多模态数据高质量获取与整合的理论技术、错误自动检测与修复的理论技术和低质量数据上的近似计算的理
论和算法。
4、降低数据处理、存储和通信能耗
大数据的处理、存储和通信都将消耗大量的能源,研究创新的节能技术是重要的基础研究方向。
5、开展交叉科学研究
大数据研究是跨学科的研究,可以发展为一门新型交叉学科。
这项研究不仅与自然科学有关,还涉及心理学、经济学、社会学等社会科学。
探讨网络数据的产生、扩散的基本机制,就需要从社会、经济和技术层面探讨网络数据涌现的规律与价值度量方法。
应积极鼓励开展交叉科学研究。
四、大数据发展的意义
1、对大数据的处理分析正成为新一代信息技术融合应用的结点
移动互联网、物联网、社交网络、数字家庭、电子商务等是新一代信息技术的应用形态,这些应用不断产生大数据。
云计算为这些海量、多样化的大数据提供存储和运算平台。
通过对不同来源数据的管理、处理、分析与优化,将结果反馈到上述应用中,将创造出巨大的经济和社会价值。
2、大数据是信息产业持续高速增长的新引擎
面向大数据市场的新技术、新产品、新服务、新业态会不断涌现。
在硬件与集成设备领域,大数据将对芯片、存储产业产生重要影响,还将催生一体化数据存储处理服务器、内存计算等市场。
在软件与服务领域,大数据将引发数据快速处理分析、数据挖掘技术和软件产品的发展。
3、大数据利用将成为提高核心竞争力的关键因素
各行各业的决策正在从“业务驱动”转变“数据驱动”。
对大数据的分析可以使零售商实时掌握市场动态并迅速做出应对;可以为商家制定更加精准有效的营销策略提供决策支持;可以帮助企业为消费者提供更加及时和个性化的服务;在医疗领域,可提高诊断准确性和药物有效性;在公共事业领域,大数据也开始发挥促进经济发展、维护社会稳定等方面的重要作用。
4、大数据时代科学研究的方法手段将发生重大改变
例如,抽样调查是社会科学的基本研究方法。
在大数据时代,可通过实时监测、跟踪研究对象在互联网上产生的海量行为数据,进行挖掘分析,揭示出规律性的东西,提出研究结论和对策。
五、结语
在时代不断发展的过程中,数据已成为与自然资源、人力资源一样重要的战略资源,隐含着巨大的价值,已引起科技界和和企业界的高度重视。
而大数据又是信息科技与工业生产和社会发展紧密融合的枢纽,是信息科技发展的高级阶段。
其影响力超越信息产业,将引起社会、经济、学术、科研、国防、军事等领域的深刻变革。
如果我们能够有效地组织和使用大数据,人们将得到更多的机会发挥科学技术对社会发展的巨大推动作用,孕育着前所未有的机遇。
参考文献:
[1]李建义.《数据库原理及开发》.中国水利水电出版社
[2]维克托•迈尔•舍恩伯格.《大数据时代》.浙江人民出版社
[3]艾伯特-拉斯洛•巴拉巴西.《爆发》.中国人民大学出版社
[4]《IT部门如何应对大数据时代?
》.CIO时代网