三大技术助力美国国家安全局监控用户数据.docx

上传人:b****6 文档编号:7539232 上传时间:2023-01-24 格式:DOCX 页数:6 大小:19.87KB
下载 相关 举报
三大技术助力美国国家安全局监控用户数据.docx_第1页
第1页 / 共6页
三大技术助力美国国家安全局监控用户数据.docx_第2页
第2页 / 共6页
三大技术助力美国国家安全局监控用户数据.docx_第3页
第3页 / 共6页
三大技术助力美国国家安全局监控用户数据.docx_第4页
第4页 / 共6页
三大技术助力美国国家安全局监控用户数据.docx_第5页
第5页 / 共6页
点击查看更多>>
下载资源
资源描述

三大技术助力美国国家安全局监控用户数据.docx

《三大技术助力美国国家安全局监控用户数据.docx》由会员分享,可在线阅读,更多相关《三大技术助力美国国家安全局监控用户数据.docx(6页珍藏版)》请在冰豆网上搜索。

三大技术助力美国国家安全局监控用户数据.docx

三大技术助力美国国家安全局监控用户数据

三大技术助力美国国家安全局监控用户数据

全球消费者平均每月使用的网络、电子邮件和数据流量图北京时间6月13日消息,据国外媒体报道,上周,随着美国政府利用互联网监视和追踪民众的消息浮出水面,这使得互联网履行其最初使命的前景看似暗淡。

现代计算技术正帮助公司和政府准确、快速地分析庞大的数据资源,其中数据库系统、机器学习和Hadoop基础架构三大技术发挥了非常重要的作用。

以下是文章内容全文:

仅仅在五年之前,诸如美国国家安全局这样的政府机构要想通过关键词的方式高效率地分析数百万份电话、文本消息和在线聊天记录,简直是不可能完成的任务。

不过目前,一系列新技术的使用则让NSA拥有相对充分的人力和财力做到这一点。

尤其考虑到,这些关键词最终有可能避免未来针对美国恐怖袭击的放生。

这些新技术能够在一个单独的数据库里存储大量不同类型的数据,而且不需要使用造价昂贵的硬件设备就能够实现数据的高速处理,同时还无需数据分析专家提前设定假设条件。

哈佛商学院客座教授、数据分析专家汤姆达文波特指出:

这些新技术为政府部门节省了巨额开支,同时还极大地提高了政府部门分析此类数据的能力。

虽然需要配套的数据中心支持才能完成数据分析任务,但这些技术的成本要远比几年前低得多。

NSA斥资十二亿美元在犹他州打造大型数据中心将于今年秋季投入使用。

目前尚不明确的是,到底NSA在覆盖全美的数据中心使用的是何种计算技术。

但总体来说,这些技术被分为三大类型:

1.数据库系统大多数使用SQL编程语言的传统数据库是把数据存储在由行与列组成的表格中。

然而,当遇到存储包括电子邮件或文本信息等字符串时,传统数据库就暴露了能力有限的弊端。

而且它们还无法处理图片或视频。

而于2009年年底开始出现的新型数据库NoSQL则突破了传统数据库的能力限制,可以允许数据分析专家针对所有类型的数据创建信息要求。

这些新型数据库包括MongoDB、Cassandra和SimpleDB等。

在帮助公司分析超大型数据组方面,NoSQL数据库体现出了非凡的能力。

比如,美国保险数据供应商VeriskAnalyticsInc.的分析师就在针对数十亿客户资料不断运行各种不同的数据模式和分析方法,以从中发现虚假保险索赔记录。

Verisk副总裁兼首席信息官佩里罗泰拉表示,使用IBM提供的传统DB2数据库需要通宵达旦地工作6个小时才能完成工作。

此后,分析师还得投入大量时间研究得出的数据结果,并提出新的信息要求,而这恐怕还得再熬一个晚上。

他指出,分析师每次都需要花费几周时间才能创建出新的数据模型。

Verisk最近刚刚开始使用更换后的NoSQL数据库,分析师仅用30秒就能完成相同类型要求的运行。

罗泰拉表示:

突然之间,你的模型建构告别了几天才更行一次的传统,变成了实时更新状态。

通过使用NoSQL数据库,你可以在一天内多次进行数据运行,这极大地缩短了获得数据结果的时间。

这项功能简直太强大了。

对于美国在线图片交易平台服务商ShutterstockInc.来说,如果没有NoSQL,该公司简直无法生存。

Shutterstock拥有超过2,400万张图片的存储库,而且每天还以1万张图片的速度递增。

其中的每张图片都拥有相关数据来帮助用户缩小搜索范围。

Shutterstock的数据库还记录用户在该网站上的所有网络行为,这些行为不仅包括诸如他们授权何种图片这样的重大决定,而且还包括微小的细节,比如他们的鼠标箭头经常停留在什么地方以及停留的具体时长。

2.机器学习传统分析要求分析师对数据有充分的了解,然后才能创建假设问题,进而针对数据库提出复杂的问题。

而最近以机器学习和自然语言处理为核心的编程技术则依靠计算机程序来发现数据类型,甚至还可以根据上下文阐明模糊词汇的意义。

达文波特指出:

你可以把机器学习程序植入多个数据之中,然后你就会看到该程序会给你提供什么样的分析结果。

通过使用自然语言处理技术,你还可以分辨出‘炸弹’这个词是百老汇舞台剧的剧名,还是恐怖分子将会使用的武器。

权威市场研究机构GartnerInc.的分析师道格拉斯莱尼指出,机器学习又被称之为认知分析,它能够让分析师提出的问题不断进行自我修正。

比如,在新信息出现时,零售商就可以使用该技术来实时自动更新计价算法。

这些新信息包括天气、时间、甚至是消费者在其零售店里的行为视频。

莱尼表示:

以前,更新价格往往需要一天多的时间,但这些零售商现在可以每小时就制定一个新价格,并借助趋势信息实施产品的实时定价。

我不确定他们在一年前能否做到这一点。

3.Hadoop基础架构直到最近,还是只有造价昂贵的硬件设备才能够运行特别复杂的计算机程序,比如超大型计算机设备。

但现在,Hadoop开源软件分布式系统基础架构已经能够让从资料库提取信息的过程进行分布实施。

在这一过程中,不同的分析任务被分配给大量造价低廉的服务器进行分析,每个服务器只负责分析其中的一部分内容,然后这些内容又会在任务结束后被汇总在一起。

达文波特表示:

这非常省钱,而且运行速度特别快。

这种将复杂的问题分配给大量造价低廉的计算机处理的能力有助于人们获得问题的及时反馈,而且人们还会获得大量的数据变量。

比如,美国汽车信息网站E可以帮助汽车经销商预测一辆车在他们自己的停车场里停留的平均时间。

这种预测能够最大限度地缩短一辆车售出的时长。

E的首席信息官菲利普波特洛夫指出:

对于汽车经销商来说,这可是衡量销售业绩最为重要的指标之一。

流媒体视频服务商NetflixInc.则使用Hadoop勾勒出用户使用多种设备接入视频的流量数据图谱。

这有助于Netflix提高其为移动设备、笔记本和电视机提供视频数据的可靠性,同时帮助Netflix规划流媒体电影和电视剧集的未来增长。

此外,Hadoop还帮助Netflix更好地分析客户喜好,从而为该公司提供改进建议。

以下内容为繁体版全球消費者平均每月使用的網絡、電子郵件和數據流量圖北京時間6月13日消息,據國外媒體報道,上周,隨著美國政府利用互聯網監視和追蹤民眾的消息浮出水面,這使得互聯網履行其最初使命的前景看似暗淡。

現代計算技術正幫助公司和政府準確、快速地分析龐大的數據資源,其中數據庫系統、機器學習和Hadoop基礎架構三大技術發揮瞭非常重要的作用。

以下是文章內容全文:

僅僅在五年之前,諸如美國國傢安全局這樣的政府機構要想通過關鍵詞的方式高效率地分析數百萬份電話、文本消息和在線聊天記錄,簡直是不可能完成的任務。

不過目前,一系列新技術的使用則讓NSA擁有相對充分的人力和財力做到這一點。

尤其考慮到,這些關鍵詞最終有可能避免未來針對美國恐怖襲擊的放生。

這些新技術能夠在一個單獨的數據庫裡存儲大量不同類型的數據,而且不需要使用造價昂貴的硬件設備就能夠實現數據的高速處理,同時還無需數據分析專傢提前設定假設條件。

哈佛商學院客座教授、數據分析專傢湯姆達文波特指出:

這些新技術為政府部門節省瞭巨額開支,同時還極大地提高瞭政府部門分析此類數據的能力。

雖然需要配套的數據中心支持才能完成數據分析任務,但這些技術的成本要遠比幾年前低得多。

NSA斥資十二億美元在猶他州打造大型數據中心將於今年秋季投入使用。

目前尚不明確的是,到底NSA在覆蓋全美的數據中心使用的是何種計算技術。

但總體來說,這些技術被分為三大類型:

1.數據庫系統大多數使用SQL編程語言的傳統數據庫是把數據存儲在由行與列組成的表格中。

然而,當遇到存儲包括電子郵件或文本信息等字符串時,傳統數據庫就暴露瞭能力有限的弊端。

而且它們還無法處理圖片或視頻。

而於2009年年底開始出現的新型數據庫NoSQL則突破瞭傳統數據庫的能力限制,可以允許數據分析專傢針對所有類型的數據創建信息要求。

這些新型數據庫包括MongoDB、Cassandra和SimpleDB等。

在幫助公司分析超大型數據組方面,NoSQL數據庫體現出瞭非凡的能力。

比如,美國保險數據供應商VeriskAnalyticsInc.的分析師就在針對數十億客戶資料不斷運行各種不同的數據模式和分析方法,以從中發現虛假保險索賠記錄。

Verisk副總裁兼首席信息官佩裡羅泰拉表示,使用IBM提供的傳統DB2數據庫需要通宵達旦地工作6個小時才能完成工作。

此後,分析師還得投入大量時間研究得出的數據結果,並提出新的信息要求,而這恐怕還得再熬一個晚上。

他指出,分析師每次都需要花費幾周時間才能創建出新的數據模型。

Verisk最近剛剛開始使用更換後的NoSQL數據庫,分析師僅用30秒就能完成相同類型要求的運行。

羅泰拉表示:

突然之間,你的模型建構告別瞭幾天才更行一次的傳統,變成瞭實時更新狀態。

通過使用NoSQL數據庫,你可以在一天內多次進行數據運行,這極大地縮短瞭獲得數據結果的時間。

這項功能簡直太強大瞭。

對於美國在線圖片交易平臺服務商ShutterstockInc.來說,如果沒有NoSQL,該公司簡直無法生存。

Shutterstock擁有超過2,400萬張圖片的存儲庫,而且每天還以1萬張圖片的速度遞增。

其中的每張圖片都擁有相關數據來幫助用戶縮小搜索范圍。

Shutterstock的數據庫還記錄用戶在該網站上的所有網絡行為,這些行為不僅包括諸如他們授權何種圖片這樣的重大決定,而且還包括微小的細節,比如他們的鼠標箭頭經常停留在什麼地方以及停留的具體時長。

2.機器學習傳統分析要求分析師對數據有充分的瞭解,然後才能創建假設問題,進而針對數據庫提出復雜的問題。

而最近以機器學習和自然語言處理為核心的編程技術則依靠計算機程序來發現數據類型,甚至還可以根據上下文闡明模糊詞匯的意義。

達文波特指出:

你可以把機器學習程序植入多個數據之中,然後你就會看到該程序會給你提供什麼樣的分析結果。

通過使用自然語言處理技術,你還可以分辨出‘炸彈’這個詞是百老匯舞臺劇的劇名,還是恐怖分子將會使用的武器。

權威市場研究機構GartnerInc.的分析師道格拉斯萊尼指出,機器學習又被稱之為認知分析,它能夠讓分析師提出的問題不斷進行自我修正。

比如,在新信息出現時,零售商就可以使用該技術來實時自動更新計價算法。

這些新信息包括天氣、時間、甚至是消費者在其零售店裡的行為視頻。

萊尼表示:

以前,更新價格往往需要一天多的時間,但這些零售商現在可以每小時就制定一個新價格,並借助趨勢信息實施產品的實時定價。

我不確定他們在一年前能否做到這一點。

3.Hadoop基礎架構直到最近,還是隻有造價昂貴的硬件設備才能夠運行特別復雜的計算機程序,比如超大型計算機設備。

但現在,Hadoop開源軟件分佈式系統基礎架構已經能夠讓從資料庫提取信息的過程進行分佈實施。

在這一過程中,不同的分析任務被分配給大量造價低廉的服務器進行分析,每個服務器隻負責分析其中的一部分內容,然後這些內容又會在任務結束後被匯總在一起。

達文波特表示:

這非常省錢,而且運行速度特別快。

這種將復雜的問題分配給大量造價低廉的計算機處理的能力有助於人們獲得問題的及時反饋,而且人們還會獲得大量的數據變量。

比如,美國汽車信息網站E可以幫助汽車經銷商預測一輛車在他們自己的停車場裡停留的平均時間。

這種預測能夠最大限度地縮短一輛車售出的時長。

E的首席信息官菲利普波特洛夫指出:

對於汽車經銷商來說,這可是衡量銷售業績最為重要的指標之一。

流媒體視頻服務商NetflixInc.則使用Hadoop勾勒出用戶使用多種設備接入視頻的流量數據圖譜。

這有助於Netflix提高其為移動設備、筆記本和電視機提供視頻數據的可靠性,同時幫助Netflix規劃流媒體電影和電視劇集的未來增長。

此外,Hadoop還幫助Netflix更好地分析客戶喜好,從而為該公司提供改進建議。

全球消费者平均每月使用的网络、电子邮件和数据流量图北京时间6月13日消息,据国外媒体报道,上周,随着美国政府利用互联网监视和追踪民众的消息浮出水面,这使得互联网履行其最初使命的前景看似暗淡。

现代计算技术正帮助公司和政府准确、快速地分析庞大的数据资源,其中数据库系统、机器学习和Hadoop基础架构三大技术发挥了非常重要的作用。

以下是文章内容全文:

仅仅在五年之前,诸如美国国家安全局这样的政府机构要想通过关键词的方式高效率地分析数百万份电话、文本消息和在线聊天记录,简直是不可能完成的任务。

不过目前,一系列新技术的使用则让NSA拥有相对充分的人力和财力做到这一点。

尤其考虑到,这些关键词最终有可能避免未来针对美国恐怖袭击的放生。

这些新技术能够在一个单独的数据库里存储大量不同类型的数据,而且不需要使用造价昂贵的硬件设备就能够实现数据的高速处理,同时还无需数据分析专家提前设定假设条件。

哈佛商学院客座教授、数据分析专家汤姆达文波特指出:

这些新技术为政府部门节省了巨额开支,同时还极大地提高了政府部门分析此类数据的能力。

虽然需要配套的数据中心支持才能完成数据分析任务,但这些技术的成本要远比几年前低得多。

NSA斥资十二亿美元在犹他州打造大型数据中心将于今年秋季投入使用。

目前尚不明确的是,到底NSA在覆盖全美的数据中心使用的是何种计算技术。

但总体来说,这些技术被分为三大类型:

1.数据库系统大多数使用SQL编程语言的传统数据库是把数据存储在由行与列组成的表格中。

然而,当遇到存储包括电子邮件或文本信息等字符串时,传统数据库就暴露了能力有限的弊端。

而且它们还无法处理图片或视频。

而于2009年年底开始出现的新型数据库NoSQL则突破了传统数据库的能力限制,可以允许数据分析专家针对所有类型的数据创建信息要求。

这些新型数据库包括MongoDB、Cassandra和SimpleDB等。

在帮助公司分析超大型数据组方面,NoSQL数据库体现出了非凡的能力。

比如,美国保险数据供应商VeriskAnalyticsInc.的分析师就在针对数十亿客户资料不断运行各种不同的数据模式和分析方法,以从中发现虚假保险索赔记录。

Verisk副总裁兼首席信息官佩里罗泰拉表示,使用IBM提供的传统DB2数据库需要通宵达旦地工作6个小时才能完成工作。

此后,分析师还得投入大量时间研究得出的数据结果,并提出新的信息要求,而这恐怕还得再熬一个晚上。

他指出,分析师每次都需要花费几周时间才能创建出新的数据模型。

Verisk最近刚刚开始使用更换后的NoSQL数据库,分析师仅用30秒就能完成相同类型要求的运行。

罗泰拉表示:

突然之间,你的模型建构告别了几天才更行一次的传统,变成了实时更新状态。

通过使用NoSQL数据库,你可以在一天内多次进行数据运行,这极大地缩短了获得数据结果的时间。

这项功能简直太强大了。

对于美国在线图片交易平台服务商ShutterstockInc.来说,如果没有NoSQL,该公司简直无法生存。

Shutterstock拥有超过2,400万张图片的存储库,而且每天还以1万张图片的速度递增。

其中的每张图片都拥有相关数据来帮助用户缩小搜索范围。

Shutterstock的数据库还记录用户在该网站上的所有网络行为,这些行为不仅包括诸如他们授权何种图片这样的重大决定,而且还包括微小的细节,比如他们的鼠标箭头经常停留在什么地方以及停留的具体时长。

2.机器学习传统分析要求分析师对数据有充分的了解,然后才能创建假设问题,进而针对数据库提出复杂的问题。

而最近以机器学习和自然语言处理为核心的编程技术则依靠计算机程序来发现数据类型,甚至还可以根据上下文阐明模糊词汇的意义。

达文波特指出:

你可以把机器学习程序植入多个数据之中,然后你就会看到该程序会给你提供什么样的分析结果。

通过使用自然语言处理技术,你还可以分辨出‘炸弹’这个词是百老汇舞台剧的剧名,还是恐怖分子将会使用的武器。

权威市场研究机构GartnerInc.的分析师道格拉斯莱尼指出,机器学习又被称之为认知分析,它能够让分析师提出的问题不断进行自我修正。

比如,在新信息出现时,零售商就可以使用该技术来实时自动更新计价算法。

这些新信息包括天气、时间、甚至是消费者在其零售店里的行为视频。

莱尼表示:

以前,更新价格往往需要一天多的时间,但这些零售商现在可以每小时就制定一个新价格,并借助趋势信息实施产品的实时定价。

我不确定他们在一年前能否做到这一点。

3.Hadoop基础架构直到最近,还是只有造价昂贵的硬件设备才能够运行特别复杂的计算机程序,比如超大型计算机设备。

但现在,Hadoop开源软件分布式系统基础架构已经能够让从资料库提取信息的过程进行分布实施。

在这一过程中,不同的分析任务被分配给大量造价低廉的服务器进行分析,每个服务器只负责分析其中的一部分内容,然后这些内容又会在任务结束后被汇总在一起。

达文波特表示:

这非常省钱,而且运行速度特别快。

这种将复杂的问题分配给大量造价低廉的计算机处理的能力有助于人们获得问题的及时反馈,而且人们还会获得大量的数据变量。

比如,美国汽车信息网站E可以帮助汽车经销商预测一辆车在他们自己的停车场里停留的平均时间。

这种预测能够最大限度地缩短一辆车售出的时长。

E的首席信息官菲利普波特洛夫指出:

对于汽车经销商来说,这可是衡量销售业绩最为重要的指标之一。

流媒体视频服务商NetflixInc.则使用Hadoop勾勒出用户使用多种设备接入视频的流量数据图谱。

这有助于Netflix提高其为移动设备、笔记本和电视机提供视频数据的可靠性,同时帮助Netflix规划流媒体电影和电视剧集的未来增长。

此外,Hadoop还帮助Netflix更好地分析客户喜好,从而为该公司提供改进建议。

以下内容为繁体版全球消費者平均每月使用的網絡、電子郵件和數據流量圖北京時間6月13日消息,據國外媒體報道,上周,隨著美國政府利用互聯網監視和追蹤民眾的消息浮出水面,這使得互聯網履行其最初使命的前景看似暗淡。

現代計算技術正幫助公司和政府準確、快速地分析龐大的數據資源,其中數據庫系統、機器學習和Hadoop基礎架構三大技術發揮瞭非常重要的作用。

以下是文章內容全文:

僅僅在五年之前,諸如美國國傢安全局這樣的政府機構要想通過關鍵詞的方式高效率地分析數百萬份電話、文本消息和在線聊天記錄,簡直是不可能完成的任務。

不過目前,一系列新技術的使用則讓NSA擁有相對充分的人力和財力做到這一點。

尤其考慮到,這些關鍵詞最終有可能避免未來針對美國恐怖襲擊的放生。

這些新技術能夠在一個單獨的數據庫裡存儲大量不同類型的數據,而且不需要使用造價昂貴的硬件設備就能夠實現數據的高速處理,同時還無需數據分析專傢提前設定假設條件。

哈佛商學院客座教授、數據分析專傢湯姆達文波特指出:

這些新技術為政府部門節省瞭巨額開支,同時還極大地提高瞭政府部門分析此類數據的能力。

雖然需要配套的數據中心支持才能完成數據分析任務,但這些技術的成本要遠比幾年前低得多。

NSA斥資十二億美元在猶他州打造大型數據中心將於今年秋季投入使用。

目前尚不明確的是,到底NSA在覆蓋全美的數據中心使用的是何種計算技術。

但總體來說,這些技術被分為三大類型:

1.數據庫系統大多數使用SQL編程語言的傳統數據庫是把數據存儲在由行與列組成的表格中。

然而,當遇到存儲包括電子郵件或文本信息等字符串時,傳統數據庫就暴露瞭能力有限的弊端。

而且它們還無法處理圖片或視頻。

而於2009年年底開始出現的新型數據庫NoSQL則突破瞭傳統數據庫的能力限制,可以允許數據分析專傢針對所有類型的數據創建信息要求。

這些新型數據庫包括MongoDB、Cassandra和SimpleDB等。

在幫助公司分析超大型數據組方面,NoSQL數據庫體現出瞭非凡的能力。

比如,美國保險數據供應商VeriskAnalyticsInc.的分析師就在針對數十億客戶資料不斷運行各種不同的數據模式和分析方法,以從中發現虛假保險索賠記錄。

Verisk副總裁兼首席信息官佩裡羅泰拉表示,使用IBM提供的傳統DB2數據庫需要通宵達旦地工作6個小時才能完成工作。

此後,分析師還得投入大量時間研究得出的數據結果,並提出新的信息要求,而這恐怕還得再熬一個晚上。

他指出,分析師每次都需要花費幾周時間才能創建出新的數據模型。

Verisk最近剛剛開始使用更換後的NoSQL數據庫,分析師僅用30秒就能完成相同類型要求的運行。

羅泰拉表示:

突然之間,你的模型建構告別瞭幾天才更行一次的傳統,變成瞭實時更新狀態。

通過使用NoSQL數據庫,你可以在一天內多次進行數據運行,這極大地縮短瞭獲得數據結果的時間。

這項功能簡直太強大瞭。

對於美國在線圖片交易平臺服務商ShutterstockInc.來說,如果沒有NoSQL,該公司簡直無法生存。

Shutterstock擁有超過2,400萬張圖片的存儲庫,而且每天還以1萬張圖片的速度遞增。

其中的每張圖片都擁有相關數據來幫助用戶縮小搜索范圍。

Shutterstock的數據庫還記錄用戶在該網站上的所有網絡行為,這些行為不僅包括諸如他們授權何種圖片這樣的重大決定,而且還包括微小的細節,比如他們的鼠標箭頭經常停留在什麼地方以及停留的具體時長。

2.機器學習傳統分析要求分析師對數據有充分的瞭解,然後才能創建假設問題,進而針對數據庫提出復雜的問題。

而最近以機器學習和自然語言處理為核心的編程技術則依靠計算機程序來發現數據類型,甚至還可以根據上下文闡明模糊詞匯的意義。

達文波特指出:

你可以把機器學習程序植入多個數據之中,然後你就會看到該程序會給你提供什麼樣的分析結果。

通過使用自然語言處理技術,你還可以分辨出‘炸彈’這個詞是百老匯舞臺劇的劇名,還是恐怖分子將會使用的武器。

權威市場研究機構GartnerInc.的分析師道格拉斯萊尼指出,機器學習又被稱之為認知分析,它能夠讓分析師提出的問題不斷進行自我修正。

比如,在新信息出現時,零售商就可以使用該技術來實時自動更新計價算法。

這些新信息包括天氣、時間、甚至是消費者在其零售店裡的行為視頻。

萊尼表示:

以前,更新價格往往需要一天多的時間,但這些零售商現在可以每小時就制定一個新價格,並借助趨勢信息實施產品的實時定價。

我不確定他們在一年前能否做到這一點。

3.Hadoop基礎架構直到最近,還是隻有造價昂貴的硬件設備才能夠運行特別復雜的計算機程序,比如超大型計算機設備。

但現在,Hadoop開源軟件分佈式系統基礎架構已經能夠讓從資料庫提取信息的過程進行分佈實施。

在這一過程中,不同的分析任務被分配給大量造價低廉的服務器進行分析,每個服務器隻負責分析其中的一部分內容,然後這些內容又會在任務結束後被匯總在一起。

達文波特表示:

這非常省錢,而且運行速度特別快。

這種將復雜的問題分配給大量造價低廉的計算機處理的能力有助於人們獲得問題的及時反饋,而且人們還會獲得大量的數據變量。

比如,美國汽車信息網站E可以幫助汽車經銷商預測一輛車在他們自己的停車場裡停留的平均時間。

這種預測能夠最大限度地縮短一輛車售出的時長。

E的首席信息官菲利普波特洛夫指出:

對於汽車經銷商來說,這可是衡量銷售業績最為重要的指標之一。

流媒體視頻服務商NetflixInc.則使用Hadoop勾勒出用戶使用多種設備接入視頻的流量數據圖譜。

這有助於Netflix提高其為移動設備、筆記本和電視機提供視頻數據的可靠性,同時幫助Netflix規劃流媒體電影和電視劇集的未來增長。

此外,Hadoop還幫助Netflix更好地分析客戶喜好,從而為該公司提供改進建議。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 自然科学 > 生物学

copyright@ 2008-2022 冰豆网网站版权所有

经营许可证编号:鄂ICP备2022015515号-1