1、我认为如果说过去五十年是摩尔定律的时代,未来二十年就是数据为王的时代。大数据会带来机器智能,也就是说让我们的计算机变得非常聪明,以至于它超过我们人类的智能。为什么这么说呢?我们刚才讲了,计算机的发展速度本身是一个指数增长,而我们人的智能的发展速度是一个线性增长,甚至还会稍微慢一点,那么一定在某一个时间点,它会重合。今天可能就是这个重合的时间点,那可能你又会问了,为什么正好在这个时间点上,我们会有这么多的数据?一个是互联网的收集和积累,再有一个就是今天各种传感器,各种智能设备,各种监控设备,它们无时无刻地不在为我们提供大量的数据。而在我们过去,因为存储量、计算量不够的时候,我们把这些数据都抛弃掉
2、了,不是说这些数据在过去不存在现在存在,只是说我们现在因为半导体事业的发展,我们有能力、有可能来存储和处理这样一些数据。二、什么是机器智能在讲机器智能以前,我们就首先要说说,什么是机器智能?我们都知道1946年人类第一台电子计算机诞生了,名字叫做ENIAC(电子数值积分计算机)诞生。那台计算机其实计算速度只有一秒钟五千次,大概是你的手机计算速度差不多可能几十万分之一。那么计算机诞生后不久,人类其实就开始考虑,说既然这个计算机计算速度能这么快,它能不能产生一些智能?所以五十年代初的时候,计算机老祖宗阿兰图灵就提出了一个叫图灵测试的概念。什么意思呢?就是说在屏幕后面,我放一台机器放一个人,然后我们
3、问他一个问题,比如说天为什么是蓝色的?计算机给一个,人给一个,给出的答案让我来判断,说哪一个计算机给的?哪个是人给的?如果我判断不出来,哪个答案是计算机给的或者是人给的,已经能够把这两个答案要混淆起来了,我就认为机器和人一样的智能。人类为这个目标做了20年,这20年的发展非常不顺利,到了1970年基本上计算机还做不了任何具有智能的事情。为什么会产生这样的问题呢?或者说这20年研究为什么会走弯路呢?主要是我们完全地按照人的方式去理解机器,没有完全按机器的方式理解。举一个例子,预测美国总统选举结果这么一个例子。比较著名的大家可能听说过盖洛普这样一个预测公司,那么它实际上是用一些传统的抽样的统计方法
4、做一些预测,有时灵,有时不灵。即使正确的时候,基本上误差两到三个百分点,在全国范围预测能准,但是你知道竞选是一个州一个州这么算选票,它不是一人一票制,所以它从来没有做到过美国50个州全部做对的。到了2012年,有一个毛头小伙子,这个人从来以前没有名,也不是什么了不得的科学家,他就做了一件事儿,他就在互联网上比如社交网络上,比如脸书上、推特上、地方的报纸上、大家的论坛上等等,凡是他能找到信息的地方,他就把信息都搜集起来,然后他做一次2012年美国总统选举结果的预测,50个州他全部预测对了。这件事在过去是不敢想象的,从这里头你可以看出,当这个数据完备了以后是非常可怕的。三、大数据一种颠覆式的思维方
5、式大家不知道有没有注意到这个名词大数据Big data,为什么不叫large data?其实在英语里,它并不是说一开始随机的选了这么一个词Big data就这么叫了,在英语里这个Big和Large虽然都是大的意思,但是有一个比较细微的差别,Big这个大是相对抽象一点的一个概念,Big、Small大和小是这样子。那Large是体量大,比如我这张桌子很大,我说Large table。大数据所以用big data,实际上它是指一种思维方式,一种抽象的概念。它不仅仅是讲我们数据的体量大,那么既然说到它是一个思维方式,是什么样的一个思维方式呢?我给大家再举一个例子。你从中学开始到大学,你的老师就会教你说
6、因果逻辑关系非常重要,为什么呢?因为没有了这个因果逻辑,我们这个推理就进行不下去了,过去说知其然一定要知其所以然。刚才我们就讲了那个美国总统竞选预测的这件事儿,它实际上就告诉了你一个结果,你问他为什么是这样子?是哪个州的人喜欢某个候选人哪句话吗?不是,他说不出这原因,但是它就给了个结果。这就是现在说先有了结论,然后你可能反过来推这些其中的原因,这是一个完全不同的思维方式。所以叫大数据,是指全新的这么一个思维方式。在2002年到2004年左右的时候,我在一家计算机公司做搜索,那么当时因为数据量变得很大,我们就观察到很多特点,你比如说你搜索了一个关健词,我们就说“凤凰卫视大数据”这样一个关健词。用
7、户老不点击第一条结果,老点击第三条结果,这里头就有一个原因,肯定你第一条结果做得不好,第三条结果可能更好。那么你的思维方式是什么样?你是否接受说把第三条结果我直接就搬到第一条去?按我们过去老师教我们的,因果关系你是不能这么做的,因为你不能跳过这个推理的过程来做件事,但是大数据的思维告诉你这件事儿是可以做的。当我们的脑筋转换成这样的一种思路的时候,我们实际上就是一个开始具有某种大数据的思维,这时候也就是我们在变相地承认,计算机在有一些方面其实比我们因为有数据的作用做的更好了。(一)大数据+机器智能:革新传统行业我想说,为什么说大数据这个事这么重要?大数据加上机器智能,它可以把我们以前所有的行业,
8、全部的改造的一遍,或者我换一句话说,就是说所有未来公司,都是某种程度上的一个大数据公司,我们不妨看两个传统行业的例子。第一个是关于意大利一个品牌服装公司的例子,大家知道可能如果你们去一些专卖店,你就会发现它把某一件衣裳,有的放在前面,有的放在后面,这里头可能有一些道理,但是你也说不出有什么道理。我和他们这些公司的有些销售人员做过一些了解,事实上像它们这些大牌的公司,在北京开一家这种专卖店,就是一比一的模型差不多要做三个,才能确定这个店里头的结构怎么布置,哪件衣裳放前头,哪件衣裳放后面更好。即使如此,这完全靠过去营销人员的经验,也很难检测说,到底这样放合适不合适。有些衣裳放前面,它就是卖不出去,
9、没人知道什么原因。那么这家品牌服装,它就做了一件很简单的事情。它就把衣裳的背后就是我们放防偷盗墨水那个地方放一个小芯片,如果谁拿了这个衣裳,到试衣间试衣服以后,试衣间再放一个传感器,能记录你什么时候进去的,在那里头试了多长时间这个衣裳,然后它就通过这个数据,就可以提高销售。为什么呢?因为假设哪件衣裳又放在一个显眼的位置,如果大家不拿进试衣间去试,说明它在设计上肯定第一眼看上去就一定有什么一些什么问题。但是,如果很多衣裳,经常地拿到试衣间里去试,最后没人买,那可能在细节上有一些什么需要改进地方,这样它通过这么一件简单的事情,就能提高销售,这是一个非常传统的行业。再另外一个故事也非常的有意思。在一
10、家百货店,雇了一个学统计学的硕士,也不是什么一个非常大的科学家,就是一个学统计学的硕士。百货店每天有很多交易的数据,以前也不知道怎么办,后来有了这个移动互联网以后,这个百货店就跟顾客讲,说以前要给你打一张发票,你呢有时候也就扔掉了,有些时候你为了保存发票也麻烦,要不然你给我一个手机号码或给我一个邮箱,我给你发过去,我寄过去,那很多人就这么登记上了。在这个以前,你到百货店买东西,没人知道是谁买的,那么,自从他把这个手机和发票联起以来以后,他就知道哪个人什么时候买了些什么东西。后这个硕士生他就做了些统计就发现怀孕的妇女在不同的阶段买的产品它其实有一些共性,这就是从大数据分析得到的。比如说一开始怀胎
11、的时候要买比较胖的衣裳,然后后来以后要买宝宝服,要买纸尿裤、奶嘴等等,就基本上所有人都是走这么一个过程。然后他就提前给这些客户发优惠券,这样销售就很有针对性,而且效果不错。我不知道大家有多少人,你们在每天用网络购物,用即时通讯软件(淘宝、微信)支付,其实你相信不相信,它们的主人、它们的公司可能比你更知道,下一单交易你会发生在哪里。(二)用大数据解决智能问题计算机到底现在能不能回答问题?你说有了大数据,计算机就有智能了。那到底是不是这样子呢?我们就看刚才那个例子,就是说要回答天为什么是蓝色的这样一个例子,这个是我自己本人做的一个项目,这个问题实际上很多大学,很多科学家花了很长的时间,其实一直做不
12、出来。计算机回答简单的问题,比如说我们凤凰卫视是哪一年成立的、它的总部在哪儿,这样一些问题,就是说关于具体的一些事实的问题,那这个比较容易。那么难的问题有两种,一种是为什么的问题,一种是怎么做的问题。要回答为什么的问题就要回到我刚才讲说,原来我们在中学和大学的老师教你就是叫做因果逻辑,你要回答为什么,你要一些基本的科学知识,然后根据一个个因果关系推导出答案,这是我们过去被训练出来这样一个思维方式。我刚才又讲,计算机来解决这个问题,和人是不一样的。那么计算机怎么解决这个问题,其实我们把它看成一个大数据的问题,很容易做一个测试,你就输入中文“天为什么是蓝色的”,你在某一个搜索引擎上你就搜索一下子,
13、然后你把那些广告、视频等等这些插入的结果删去,保存十条自然搜索结果,然后你把这十个网页打开,80%的问题,你就能找到你所需要的答案。但是如果你不看这十个网页内容,你只看这十条结果摘要,只有20%到30%的情况,你能找到这个问题答案。这就是过去机器智能和人的智能的大概一个差异。随着计算机处理能力越来越强,这个数据越来越完备,我们所要做的一件事是什么事?我们不是根据物理学的原理,不是根据逻辑推理来回答“天为什么是蓝色的”,我们是把所有可能有这个答案的网页给找着,然后再分析每一句话,看看哪一句话像是这问题的答案,再把这些像是答案的话,重新地组合,重新地交换次序,构成一个段落作为一个回答。然后我们把它
14、送给用户做评测,我们就让他比较说,你觉得这个答案是否满意,那么对于80%的问题,用户说他们觉得这个答案都非常好,也就是说,在80%左右的问题上,这个计算机和人在复杂问题上,他们具有了同等智能。所以这就是用大数据解决智能问题的一个方法。(三)谁是未来社会的操控者:人还是机器?那我们再讲一个具体的例子,就是无人驾驶汽车,你可以把它当做一个机器人,说起来这也是一个非常有意思的事情。在2004年的时候,一些经济学家,他们当时就在考虑说,由于计算机变得越来越聪明,有一些问题人原来做的现在都被机器给拿去做了,人看来是变得好像好多工作会越来越丢掉,哪些事儿是人能做机器不能做的?他们想来想去就想了开车,为什么
15、想这个呢?因为有两个原因:一个原因是我们本能地会觉得说这开车是一件蛮难的事,不信你们考车的时候有多少人是好几次才考过的,人要眼观六路,耳听八方,然后脑和手脚还要比较协调。2004在美国还进行了一次无人驾驶汽车的拉力赛,第一名也跑了大概只有十几公里就挂掉了,剩下来的车不是提前撞了就是抛锚了,而且开车的速度比爬可能要稍微快一点,还没有我们骑自行车快,就是这样的一个状态。所以经济学家信心满满觉得说可能这件事情是机器做不到的。但是就到了2010年,纽约时报的一个报道。那么他就说这个无人驾驶汽车已经在公路上,包括大街小巷也包括高速公路上,跑了大概十几万公里快二十万公里,没有出现一次交通事故。当然出现了一次是后面人撞到它了,不是它撞了别人,因为我们人有时候看到黄灯,本能的是要加速,而那个无人驾驶车,它不懂得违反交通规则,所以它就停在那了。为什么做到这一点呢?其实可能大家知道,就是互
copyright@ 2008-2022 冰豆网网站版权所有
经营许可证编号:鄂ICP备2022015515号-1