大数据的时代背景与商务智能.docx

上传人:b****6 文档编号:5805606 上传时间:2023-01-01 格式:DOCX 页数:20 大小:42.33KB
下载 相关 举报
大数据的时代背景与商务智能.docx_第1页
第1页 / 共20页
大数据的时代背景与商务智能.docx_第2页
第2页 / 共20页
大数据的时代背景与商务智能.docx_第3页
第3页 / 共20页
大数据的时代背景与商务智能.docx_第4页
第4页 / 共20页
大数据的时代背景与商务智能.docx_第5页
第5页 / 共20页
点击查看更多>>
下载资源
资源描述

大数据的时代背景与商务智能.docx

《大数据的时代背景与商务智能.docx》由会员分享,可在线阅读,更多相关《大数据的时代背景与商务智能.docx(20页珍藏版)》请在冰豆网上搜索。

大数据的时代背景与商务智能.docx

大数据的时代背景与商务智能

大数据的时代背景与商务智能

整个世界已经迎来了大数据时代。

根据最新调查结果显示,2015年将有近200亿个设备连接到互联网上,这些设备不仅是电脑,更有汽车、工厂设备、数字标牌等。

越来越多的智能终端设备给产业发展带来巨大机遇。

到2020年,人类产生的数据总量将达到40ZB,全球范围内服务器的数量将会增加10倍,而由企业数据中心直接管理的数据量增加14倍,IT专业人员的数量增加1.5倍。

2013年,世界朝着数字时代又进了一步。

这是一个变化的新纪元,对社会经济的影响将比工业革命大2-3倍。

世界数据总量的90%左右是在过去两年里创造出来的。

到2020年,储存数据数量将比2010年大50倍。

许多权威人士认为这一数据大爆炸堪比新型石油,甚至是一种全新的资产类别。

传统的统计数据往往是通过数字来表达的,而在大数据时代,我们面临更多的是非结构化的数据,比如图像、文本、日志,还有比如XX的搜索数据。

这些数据都从微观层面反映了社会经济、人们日常生活行为的方方面面。

如果我们能够把现有的这些数据都收集起来进行深入的分析和挖掘,就会发现这些数据当中隐藏的更深刻的规律和现象,就能更好地服务于政府决策和社会各方面的需求,大数据的真正价值就体现在这里。

第一部分:

大数据的时代背景

从数据谈起

说起大数据,无疑是离不开数据的,我们就先从数据谈起。

数据是无所不在的。

我们就来看看大数据在以下几个领域的应用。

无所不在的数据

(1)——政府数据

首先是政府部门的统计数据,说到这个,我们知道国家统计局每年都要编写的《中国统计年鉴》。

以前国家统计数据,是层层上报,人工统计,比如,国家进行人口普查,是县级——市级——省级——国家这样层层上报人口数据,这样得到的数据往往滞后,很不准确。

70万家企业联网“直报”统计数据

从2012年2月18日开始,全国70万家"三上"企业和房地产开发经营企业在统一的数据采集和处理平台上,通过互联网直接向国家数据中心或国家认定的省级数据中心报送统计数据。

这样就保证了数据的准确性,及时性。

2013年11月19日下午,阿里巴巴、XX、中国联通等11家涉足大数据的领军企业代表走进北京月坛南街57号,与国家统计局签署关于大数据的战略合作协议,共同探讨和推进大数据在政府统计中的应用。

战略合作内容,主要是共同研究探讨建立大数据应用的统计标准,包括指标定义、口径、范围、分类等;确定利用企业数据完善、补充政府统计数据的内容、形式及实施步骤,包括数据采集、处理、分析、挖掘、发布等。

在此基础上,合作双方将建立战略合作关系。

政府统计部门收集的数据来源更广更多,有各个部门的行政记录,有电商企业的数据,有包括搜索记录、社交记录和媒体等互联网数据。

电子政务:

通过政府信息化,大数据能够提高政府决策的科学性和精准性,提高政府预测预警能力以及应急响应能力,节约决策的成本。

以财政部门为例,基于云计算、大数据技术,财政部门可以按需掌握各个部门的数据,并对数据进行分析,做出的决策可以更准确、更高效。

另外,也可以依据数据推动财政创新,使财政工作更有效率、更加开放、更加透明。

无所不在的数据

(2)——金融数据

大数据帮助金融企业提升IQ

互联网对于金融,主要是支付、信贷、储蓄三个方面。

我们认为,现在大数据在互联网金融领域主要解决三个问题:

第一是解决运营交易成本过高的问题。

网银降低了20万个网点成本,而阿里主要是把信用和抵押进行置换。

第二是提供流动性,解决资产与负债流动性不匹配的问题。

P2P就是将存款进行转让,比如众筹。

第三是拓展4000万中小微企业市场。

互联网金融出现以后,更大的变化是把市场体量做大了,不是只服务于我们现有的客户,还可以把碎片化的需求和供给进行整合,进而细化渗透到很多中小企业市场和中小客户市场。

那么,是不是互联网就是终极形态?

我们给出了一个经济范畴的定义,即这样的模式怎么去挣钱。

互联网早期最简单的业务形式是2B,传统经济模式下,企业向客户出售产品或服务,以直接赚取金钱为目的,衡量指标就是产量等概念。

第二个时代就是2C,互联网经济下,企业尽可能多地发展用户,不以直接从用户处赚取金钱为目的,希望通过后向收费或者发掘用户终身价值等方式赚取利润。

这个时代,像谷歌、Facebook等公司主要是经营用户,用户体量就是衡量标准。

未来我们看到的将是2D的业务形态,也就是大数据经济。

数据将是未来企业的重要资产,企业通过数据创造新的商业模式,或直接通过数据售卖以及利用数据提供增值服务获得巨大利润。

在这一时代,海量用户和良好的数据资产将成为未来核心竞争力与收入的重要来源。

这个数据未必是靠人的点击。

比如,你可能与运营商没有任何交易往来,但是手机的传感器在持续记录你的位置信息,这个信息在不断地跟基站通讯,你的行为就已经被运营商捕捉了。

所以2D更多的是以数据为驱动力的生意模式。

这种生意模式把附加值扩展得很大。

而互联网只能通过广告来盈利,因为它依靠的是注意力经济。

这种模式下,很难挣钱,只有少量通过马太效应才能盈利。

现在细分市场的很多数据规模能驱动产生新的价值。

以上是大的经济形态。

具体来讲,大数据更多的是帮助金融企业包括传统银行获得金融IQ,即接触市场和接触用户的权利和能力。

综合来看,识别用户的行为和潜在需求,了解和感知市场,进而形成一个正反馈的干预市场的能力,这可以看做是金融企业的IQ。

金融企业如何拥抱大数据?

另外,金融业本身也在发生业务革新。

银行属性从记账式的卖方更多转向风险、欺诈、定价的买方属性,而这些特点很多都是非线性的,需要大量的计算能力。

业务驱动加之科技目标驱动,使得新的基础设施部署成为必然。

大数据首先要数据全量在线。

现在太多系统都是孤立的,银行的对公、对私,还有卡业务都是分开的,当把所有业务糅合在一起时,会发现很多客观规律。

舍恩伯格的《大数据时代》在国内非常畅销,书中有一个核心的概念——全量。

因为全量视角下看到的内容、方式完全不一样。

有一个保险公司的案例,这家保险公司以前只能做抽样,对高端人群、对某一个险种人群的调查,通过在两千个维度里抽取一些维度,比如收入,进行建模,建模之后进行试用,再考察结论。

现在有了大规模的计算能力,就不进行干预,完全让机器自己去找规律,让机器学习出在两千个维度里到底什么是建模的规则,这完全是黑箱建模的思路。

黑箱建模让我们发现了很多以前我们不知道的内容和规律。

比如,实现机器学习以后,我们能发现反洗钱有1000多条在线规则。

对于保险用户,我们也发现很多有意思的现象,在九千多万用户里有百分之零点几的用户的年收入4万多,但是买了7万多的保险产品。

那么相应的销售人员是以怎样的保险理财理念去推销产品的?

有怎样的经验?

这是需要发掘的。

当然,为了面向用户,所有大数据的处理要做到容易解读。

在这个过程中,全量数据可以帮助发现业务规则。

在无假设条件下,通过机器学习能发现用户的一些特征。

这些工具、方式、方法,帮助金融用户非常清楚地了解到以前未知的市场和未知的用户。

对数据进行分析可以挖掘出大量沉睡的文字性内容。

比如银行信用卡记录,以前我们只能靠用户的消费水平去识别这个用户属于高端、中端还是低端。

除了数字以外,是不是还有其他信息呢?

比如消费记录,他是经常去沃尔玛还是其他超市购物,经常去夜店还是星巴克,怎么识别他是一个白领还是一个新新人类?

这些通过分类能非常清晰地获取。

也就是以前我们可以对数据进行操作,现在对文字也同样可以进行操作。

无所不在的数据(3)——零售业、物联网

提到零售业,我们就想到零售王国沃尔玛,沃尔玛有一个经典的案例,那就是:

啤酒和尿布的例子,这个例子早已过时,现在沃尔玛有一个新的例子:

东海岸——中海岸——西海岸

在美国,东海岸与中海岸时差两小时,东海岸的沃尔玛超市早上开门营业两小时之后,这时候中海岸才开始营业,沃尔玛就会把东海岸当天这两小时的营业情况、相关数据传给中海岸,中海岸就会根据这个数据知道了这天人们的购买喜好,决定货品怎么摆放,哪些货物摆放在一起会比较好,然后等中海岸的沃尔玛营业两小时之后,西海岸才到早上,才开始营业,同样,把东海岸和中海岸的营业数据传到西海岸。

这种方式给沃尔玛带来了很大的利润。

RFID技术与物联网应用:

RFID是RadioFrequencyIdentification的缩写,即射频识别,俗称电子标签。

RFID射频识别是一种非接触式的自动识别技术,它通过射频信号自动识别目标对象并获取相关数据,识别工作无须人工干预,可工作于各种恶劣环境。

RFID技术可识别高速运动物体并可同时识别多个标签,操作快捷方便。

RFID是一种简单的无线系统,只有两个基本器件,该系统用于控制、检测和跟踪物体。

系统由一个询问器(或阅读器)和很多应答器(或标签)组成。

适应领域:

物流和供应管理、生产制造和装配、航空行李处理、邮件、快运包裹处理、文档追踪、图书馆管理动物身份标识、运动计时、门禁控制、电子门票、道路自动收费.从大型远距离UHF标签到细小的UHF标签。

可以为客户做定制化生产,满足各种要求。

RFID技术在超市和图书馆中的应用。

物联网:

物联网(InternetofThings,缩写IOT)是一个基于互联网、传统电信网等信息承载体,让所有能够被独立寻址的普通物理对象实现互联互通的网络。

物联网一般为无线网,由于每个人周围的设备可以达到一千至五千个,所以物联网可能要包含500兆至一千兆个物体,在物联网上,每个人都可以应用电子标签将真实的物体上网联结,在物联网上都可以查找出它们的具体位置。

通过物联网可以用中心计算机对机器、设备、人员进行集中管理、控制,也可以对家庭设备、汽车进行遥控,以及搜寻位置、防止物品被盗等各种应用。

物联网将现实世界数字化,应用范围十分广泛。

物联网的应用领域主要包括以下几个方面:

运输和物流领域、健康医疗领域、智能环境(家庭、办公、工厂)领域、个人和社会领域等,具有十分广阔的市场和应用前景。

自从1999年最早提出“物联网概念”以来,物联网得到了极大的发展,特别是2009年8月温家宝总理提出“感知中国”以来,物联网被正式列为国家五大新兴战略性产业之一,写入“政府工作报告”,物联网在中国受到了极大的关注,物联网通过智能感知、识别技术与普适计算、广泛应用于网络的融合中,也因此被称为继计算机、互联网之后世界信息产业发展的第三次浪潮。

如果说2013年的物联网在喧嚣中前行,那么2014年的物联网则是伴随着希望前行,而且曙光渐现。

我们需要注意的几个重要关键词包括:

车联网、云计算、大数据、北斗导航、智能家居、智慧城市。

车联网

说到物联网不可遗漏的当然是车联网,早在2012年的北京国际汽车展览会期间,中国移动就展示了基于TD-LTE的4G车联网概念产品,而现阶段,在4G时代全面到来的背景下,车联网的发展愈发迅猛。

不仅仅巨头Google一直在深耕车联网,我国自主车企当中也有厂商在积极跟进,最早试水车联网技术的是上汽集团,一直走在本土开发车联网的前列,其inkaNet系统被广泛搭载在荣威350、荣威550、W5以及MG5等多款车型上。

目前几乎所有的整车企业都在车联网技术方面进行了大量的投入。

未来车联网技术将重新定义汽车DNA。

借助无线通讯,城市内车与车之间,车与建筑之间,车与人之间都将建立更加智能紧密的互联。

通过装载在车辆上的电子标签通过无线射频等识别技术,实现在信息网络平台上对所有车辆的属性信息和静、动态信息进行提取和有效利用,并根据不同的功能需求对所有车辆的运行状态进行有效的监管和提供综合服务。

并且将电视、电脑、手机都可以和汽车里的屏幕连接在一起,驾驶过程中娱乐化的程度大大加强。

无人驾驶

无人驾驶被人认为是车联网的终极目标,无人驾驶车依赖的技术很多,比如导航、雷达、庞大数据计算等,要实现这些技术需要和物联网紧密结合起来。

尽管车联网不过是近几年才兴起的事情,而物联网技术的成熟则极大的推动了车联网的进展。

车联网技术是实现无人驾驶技术和智能化交通的第一步,而在无人驾驶技术普及的第一阶段,车联网技术将迎来爆发期。

自动泊车系统

在我印象中小时候经常能听到从某辆车上传出“倒车请注意”的声音,后来想想觉得当时技术不发达没有达到帮助驾驶的水平,只能通过提示车后的行人注意安全。

过了没几年什么倒车雷达、倒车影像以及带有循迹功能的倒车系统全面铺开,无论是对人还是对物驾驶者都可以更安全的控制车辆。

而我今天要说的是自动泊车系统,顾名思义驾驶者双手可以离开方向盘,在车辆停好之前要做的只是等待。

早在几年前自动泊车系统还是豪华品牌的专利,比如雷克萨斯LS460这种豪华车上。

如今自动泊车系统的准入门槛降低了不少,诸如大众途观、CC、迈腾以及福特翼虎、北京现代全新胜达等车型都配备了该系统。

一般情况下自动泊车系统主要由两部分组成:

控制单元和位于前后保险杠以及两侧的超声波雷达探头。

按动自动泊车辅助系统激活按钮之后,雷达探头可在车辆行驶时对车辆两侧进行扫描,低时速(一般为30km/h)及侧向距离1.5米左右之内均能成功完成车位扫描。

但基本上当车位旁出现树木,路灯杆等柱状物时,为避免雷达侦测出现误差而发生碰撞风险,此时系统将不被激活。

控制单元对雷达反馈的信息进行分析,从而估算出车位是否足以容纳车辆停放。

当车位长度大于车辆长度1.4米以上或更高时,控制单元会通过行车电脑显示屏发出准予停车的提示。

驾驶者只需要拨动转向灯开关,告诉系统靠道路哪一侧停车即可。

自动泊车系统随后将通过助力转向系统对车辆行驶方向进行干预,并以控制单元规划好的路径将车辆停入车位。

目前,大众汽车旗下产品如途观,迈腾和CC均搭载2.0版本的自动泊车系统。

这套系统除可以帮助车辆以倒库的方式停入车位,也可以实现侧方停车。

而诸如途安上的以及其它一些品牌的系统则只能实现侧方停车。

无所不在的数据(4)——卫星导航

全球四大卫星导航系统

•北斗卫星导航系统

•美国的GPS

•俄罗斯的格洛纳斯

•欧盟的伽利略系统

此处主要介绍一下北斗导航系统

北斗导航

导航的市场需求正快速起步,在国内,XX、谷歌、高德等IT企业都开发了自己的导航系统,对位置能进行准确的判断。

而北斗卫星导航系统是中国自行研制的全球卫星定位与通信系统(BDS),是继美全球定位系统(GPS)和俄GLONASS之后第三个成熟的卫星导航系统。

自从中国北斗导航卫星系统正式运行以来,我们相信未来车载导航会逐渐从GPS转到北斗上来。

随着我国自主建设的北斗卫星导航系统逐渐提供持续可靠的定位服务,我国已经开发出北斗车载导航产品。

在未来两年内,投入运行的车载导航终端将达到千万台,由此产生的汽车电子信息增值将超过千亿元。

北斗导航相对于GPS,

一、它同时具备定位与通讯功能,不需要其他通讯系统支持。

而GPS只能定位。

二、覆盖范围大,没有通讯盲区。

北斗系统覆盖了中国及周边国家和地区,不仅可为中国、也可为周边国家服务。

三、特别适合于集团用户大范围监控管理和数据采集用户数据传输应用。

四、融合北斗导航定位系统和卫星增强系统两大资源,因此也可利用GPS使之应用更加丰富。

五、自主系统,安全、可靠、稳定,保密性强,适合关键部门应用。

现在,北斗导航系统在试运行一周年之后,正式开始向亚太地区提供区域服务,这意味着,2014年将是北斗导航系统应用元年后的新开始,而中国“北斗”国际化的脚步亦将大幅迈开。

无所不在的数据(5)——生命科学

要解决当前生命科学的问题,需要从时空状态对生老病死进行解读,这就需要大数据,这种大数据揭示的就是大科学,这种大科学就是人类发展史上最大的产业。

生命科学已进入大科学、大数据时代,基因资源是源头。

如何去储存这些资源,为未来研究的使用提供基础成为一个关键问题。

 为了适应更庞大数据存储、处理、分析与应用的要求,深圳华大基因研究院还和国家超算天津中心、深圳超算中心、广州超算中心等机构展开战略性合作。

下一步,将通过云计算的模式来组织存储和处理相关数据。

人类基因组计划

人类基因组计划(humangenomeproject,HGP)是由美国科学家于1985年率先提出,旨在阐明人类基因组30亿个碱基对的序列,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息,使人类第一次在分子水平上全面地认识自我。

这一计划旨在为30多亿个碱基对构成的人类基因组精确测序,发现所有人类基因并搞清其在染色体上的位置,破译人类全部遗传信息。

与曼哈顿原子弹计划和阿波罗计划并称为三大科学计划。

人类脑计划

人类脑计划,包括神经科学和信息科学这当今自然科学两大热点的相互结合研究,其目标是利用现代化信息工具,将大量、不同层次的有关脑的研究数据分析、处理、整合与建模,建立神经信息学数据库和有关神经系统所有数据的全球知识管理系统,以便从分子水平到整体系统水平研究、认识、保护、开发大脑。

无所不在的数据(6)——网络大数据

近年来大数据的飙升主要还是来自日常生活,特别是互联网公司的服务。

著名咨询公司IDC的统计,2011年全球被创建和复制的数据总量为1.8ZB(10的21次方),其中75%来自于个人(主要是图片、视频和音乐),远远超过人类有史以来所有印刷材料的数据总量(200PB)。

Google公司通过大规模集群和MapReduce软件,每个月处理的数据量超过400PB;XX每天大约要处理几十PB数据;Facebook注册用户超过10亿,每月上传的照片超过10亿张,每天生成300TB以上的日志数据;淘宝网会员超过3.7亿,在线商品超过8.8亿,每天交易数千万笔,产生约20TB数据。

大数据在国内外各大企业中已经有了成熟和广泛的应用。

作为中国最大的电子商务平台,淘宝有海量的商业数据,现今淘宝面临数据量大、内容多样、维度丰富(涵盖近百个不同行业的商品维度,五级商品类目体系、近十万个品牌)、源数据质量不高(非法交易、恶意评价、用于自定义属性)等问题。

对于淘宝面临的挑战,分布式存储计算、实时计算、实时流处理、基于云计算的数据挖掘、数据可视化和数据产品实践等是应对大数据浪潮的关键技术。

对于中国最大的搜索公司XX,凭借入口优势,拥有了中国最大的消费者行为数据库,覆盖95%的中国网民,日均响应50亿次搜索请求,搜索市场占比达67%。

XX副总裁王湛介绍,XX已经建成了包括XX指数、司南、风云榜、数据研究中心和XX统计在内的五大数据体系平台,帮助企业实时了解消费者行为、兴趣变化,以及行业发展状况、市场动态和趋势、竞争对手动向等信息,以便适时调整营销策略。

腾讯是在大数据时代下,最令人期待和遐想的一家互联网公司。

腾讯更加完整的记录了人们在互联网上的行为轨迹和社会属性。

根据腾讯披露的信息显示,截至目前(2013年9月),腾讯拥有超过8.254亿QQIM活跃账户,6亿的空间用户,5.4亿微博注册用户和5亿微信用户。

这些海量信息汇聚在一起,就能够获取到用户的兴趣爱好、归属地、社会关系链等一系列有价值的信息。

然后,利用大数据和关系链,腾讯就能为用户筛选、推荐最适合他的内容。

雅虎作为一个老牌互联网企业,在大数据领域有着深厚的技术积累和影响力。

雅虎有全球最大的Hadoop集群,大约25000个节点,主要用于支持广告系统和个性化新闻系统。

而且雅虎也是Hadoop开源社区最主要的贡献者,贡献率超过70%。

另外,雅虎也非常注重在大数据其它领域的投资,其在中国刚刚收购了大数据分析公司智拓通达,完成了新CEO梅耶尔上任以来的首次真正意义上的海外收购。

大数据一个著名的故事,就是Google用twitter的数据做预测,也是最早利用大数据技术对美国流感分布情况进行预测,并取得成功。

比如不久前我国爆发的H7N9禽流感,天云大数据公司采用语义空间主题投影方式,跟踪了数百个相互关联的信息点,建立语义网络,在二度以上传播空间深度挖掘,从而发现了更多不为认知的事实。

其中用到了上千个变量,有H7N9、流感、豆粕、鸡、发热、口罩、医院等,每一个变量有权重,每一个变量有依赖关系,这些依赖关系和权重从数亿片的论坛、微博、专业资讯网站里抽取出来。

建立模型以后,可以跟踪整个主题变化。

将主题热度与豆粕价格做比较,显示出明显的负相关性。

对于期货公司而言,这些碎片化的公共的信息具有巨大经济价值。

这些以前我们认为碎片化的东西、情绪化的东西,很难量化,现在可以被大数据的能力所量化了。

由于这些网络数据,大数据又扩展到另外一个范畴。

自然语义的内容、视觉的内容、行为关系网络等复杂的关系,这些内容在以前的数据结构上很难处理,现在有了大规模的计算平台,大数据可以让系统用新的组织方式,比如矩阵、向量进行处理。

比如关系网络,快递人员给许多收件人打电话,这些人没有互相形成拓扑结构。

这个数据非常稀疏,但是有很大的社会属性和经济价值,它会通过评估关系的链条来描述出很多个体的社会属性,也就是个体的社会资本。

现在供应链金融规模比较大,但是是靠线下、专业领域技巧去识别供应链。

其实银行根据转账记录建立一个大的社交网络就可以传播这些链条,就可以把一些细碎的、小型供应链通过计算模式挖掘出来。

以前我们了解一件事情,可能大多是非常准确、非常精确的,不允许有任何混杂性的操作,要完全匹配。

比如,面对流感这样的突发性疫情,利用互联网信息可以快速确认疫情分布。

传统做法是通过搜索引擎技术对相关关键词进行主题跟踪,得到疫情分布。

大数据

所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

网络上每一笔搜索,网站上每一笔交易、每一笔输入都是数据,通过计算机做筛选、整理、分析,所得出的结果可不仅仅只得到简单、客观的结论,更能用于帮助企业经营决策,搜集起来的数据还可以被规画,引导开发更大的消费力量。

如何来看大数据与传统数据的区别?

银行做数据业务做了十多年,那么大数据和传统数据的仓库有哪些差异?

实际上就是群体和个体的差异。

互联网数据完全瞄向个体,数据结构也是精准于个体,而传统的数据面向经营指标、面向群体。

宏观意义上来看,假如小明去了一百次书店,以前要回答的问题是他第一百零一次买不买书,即业绩和经营指标的问题;而现在,互联网关心的是什么?

最关心的是他第一百零一次买什么书,需要将什么样的内容推荐给他。

这不是一个概率问题,而是一个模糊的程度问题。

要量化这个程度,我们一定要基于个体,而不是基于群体的共性描述。

传统定义上,更多关注的是一类人群,用同一类规则制订套餐给他们;而在互联网时代,要把每个人都精准刻画出来,进行精准匹配。

有电商说他们要做到一百万用户要有一百万个商店,特别是在移动的小屏幕上,三次点击以后就会损失一个客户。

所以差异化绝对不可能是对群体共性的描述,而完全是对个体差异的刻画。

关于大数据的深度分析,很重要内容就是个性化的信息推荐。

个性化的信息推荐不仅仅是基于用户的相似性这么简单的东西,还有大量比较深入的复杂模型。

比如说,就用户看资讯而言,我们怎么样去判断一个用户点开一条八卦资讯后,是继续深挖八卦到死,还是转而浏览另外一个新闻。

同样,有的用户登陆淘宝只是逛逛而已,有些用户则是很明确地想要买一些东西,这就需要对用户的意图进行预测,这里面涉及到一些比较难的机器学习技术。

我们现在生活的是信息化的世界,未来会走向个性化。

在这一点上有一个例子,耐克制作了一款鞋子,在这个鞋子里装上了传感器,然后穿上这个鞋子的人,你一天大概走多少路,而且你走路的状态比如着力点等相关情况的数据都会通过传感器传到耐克公司,耐克公司就会根据这些数据来给你量身定做鞋子。

这样,未来的销售模式将会是个性化的。

大数据的典型特征(3V)

“大数据”这个词,光从字面来看,可能会让人觉得只是容量非常大的数据集合而已。

但是,容量只不过是大数据特征的一个方面,如果只拘泥于数据量的话,就无法深入理解当前围绕大数据所进行的讨论。

因为“用现有的一般技术难以管理”这样的状况,并不仅仅是由于数据量增大这一个因素所造成的。

大数据的特征,可以用三个V开头的关键词来描

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 人文社科 > 教育学心理学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1