22個美國企業(yè)大數(shù)據(jù)應(yīng)用實例
最早關(guān)于大數(shù)據(jù)的實用案例發(fā)生在美國第二大超市塔吉特百貨。
孕婦對零售商來說是個含金量很高的顧客群體,但是她們一般會去專門的孕婦商店。人們一提起塔吉特,往往想到的都是日常生活用品,卻忽視了塔吉特也有孕婦需要的一切。在美國,出生記錄是公開的,等孩子出生了,新生兒母親就會被鋪天蓋地的產(chǎn)品優(yōu)惠廣告包圍,那時候再行動就晚了,因此必須趕在孕婦懷孕前期就行動起來。
塔吉特的顧客數(shù)據(jù)分析部門發(fā)現(xiàn),懷孕的婦女一般在懷孕第三個月的時候會購買很多無香乳液。幾個月后,她們會購買鎂、鈣、鋅等營養(yǎng)補充劑。根據(jù)數(shù)據(jù)分析部門提供的模型,塔吉特制訂了全新的廣告營銷方案,在孕期的每個階段給客戶寄送相應(yīng)的優(yōu)惠券。結(jié)果,孕期用品銷售呈現(xiàn)了爆炸性的增長。2002年到2010年間,塔吉特的銷售額從440億美元增長到了670億美元。大數(shù)據(jù)的巨大威力轟動了全美。
創(chuàng)想智慧城市研究中心分析認(rèn)為,這個案例說明大數(shù)據(jù)在企業(yè)營銷上的成功,利用大數(shù)據(jù)技術(shù)分析客戶消費習(xí)慣,判斷其消費需求,從而能進(jìn)行精確營銷。
總部位于美國阿肯色州的世界著名商業(yè)零售連鎖企業(yè)沃爾瑪擁有世界上最大的數(shù)據(jù)倉庫系統(tǒng),為了能夠準(zhǔn)確了解顧客在其門店的購買習(xí)慣,沃爾瑪對其顧客的購物行為進(jìn)行購物籃分析。沃爾瑪數(shù)據(jù)倉庫里集中了其各門店的詳細(xì)原始交易數(shù)據(jù),在這些原始交易數(shù)據(jù)的基礎(chǔ)上,沃爾瑪利用NCR數(shù)據(jù)挖掘工具對這些數(shù)據(jù)進(jìn)行分析和挖掘,可以很輕松地知道顧客經(jīng)常一起購買的商品有哪些。他們有了一個意外的發(fā)現(xiàn):“跟尿布一起購買最多的商品竟是啤酒!”
這是數(shù)據(jù)挖掘技術(shù)對歷史數(shù)據(jù)進(jìn)行分析的結(jié)果,反映數(shù)據(jù)內(nèi)在的規(guī)律。沃爾瑪派出市場調(diào)查人員和分析師對這一數(shù)據(jù)挖掘結(jié)果進(jìn)行調(diào)查分析,經(jīng)過大量實際調(diào)查和分析,揭示了隱藏在“尿布與啤酒”背后的美國人的一種行為模式:在美國,一些年輕的父親下班后經(jīng)常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。既然尿布與啤酒一起被購買的機(jī)會很多,于是沃爾瑪就在其一個個門店將尿布與啤酒擺放在一起,結(jié)果是尿布與啤酒的銷售量雙雙增長。
除此之外,沃爾瑪為其網(wǎng)站W(wǎng)almart.com自行設(shè)計了最新的搜索引擎Polaris,利用語義數(shù)據(jù)進(jìn)行文本分析、機(jī)器學(xué)習(xí)和同義詞挖掘等。沃爾瑪公布,語義搜索技術(shù)的運用使得在線購物的完成率提升了10%到15%,這就意味著數(shù)十億美元的銷售額。
傳統(tǒng)奢侈品牌PRADA正在向大數(shù)據(jù)時代邁進(jìn)。在紐約旗艦店里,每件衣服上都有RFID碼,每當(dāng)顧客拿起衣服進(jìn)試衣間時,這件衣服上的RFID會被自動識別,試衣間里的屏幕會自動播放模特穿著這件衣服走臺步的視頻。人一看見模特,就會下意識地認(rèn)為自己穿上這衣服就會是那樣,不由自主地會認(rèn)可手中所拿的衣服。
而在顧客試穿衣服的同時,這些數(shù)據(jù)會傳至PRADA總部。包括:每一件衣服在哪個城市哪個旗艦店什么時間被拿進(jìn)試衣間停留多長時間,數(shù)據(jù)都被存儲起來加以分析。如果有一件衣服銷量很低,以往的作法是直接被廢棄掉。但如果RFID傳回的數(shù)據(jù)顯示這件衣服雖然銷量低,但進(jìn)試衣間的次數(shù)多。那就說明存在一些問題,衣服或許還有改進(jìn)的余地。
這項應(yīng)用在提升消費者購物體驗的基礎(chǔ)上,還幫助Prada提升了30%以上的銷售量。傳統(tǒng)奢侈品牌在大數(shù)據(jù)時代采取的行動,體現(xiàn)了其對大數(shù)據(jù)運用的視角,也是公司對大數(shù)據(jù)時代的積極回應(yīng)。
Daikin Applied公司是日本Daikin工業(yè)的一部分,Daikin工業(yè)是世界上最大的HVAC制造商。通過合作伙伴的幫助,公司部署了一套精密的軟硬件產(chǎn)品用來收集并分析了4000多個不同的有關(guān)其商業(yè)化的屋頂供熱和空調(diào)單元的數(shù)據(jù)點。這套由英特爾公司設(shè)計的系統(tǒng)可實現(xiàn)與天氣預(yù)報同步,使大廈的管理人員能夠根據(jù)天氣預(yù)報提前調(diào)整好整座大廈的溫度,并且可以讓Daikin公司了解到某個調(diào)節(jié)能源供應(yīng)的部件可能會出現(xiàn)問題,這樣Daikin公司就可以提前派遣一個維修機(jī)器的技術(shù)人員前去維護(hù)。
未來,利用這套系統(tǒng)Daikin公司將會分析一些本地化的應(yīng)用基礎(chǔ)設(shè)施上產(chǎn)生的重要數(shù)據(jù),基于此可以幫助減少特定設(shè)備部件的能源輸出和損耗。
同時,Daikin公司使用功率計來檢測每個單元中的能源供應(yīng)情況。通過網(wǎng)絡(luò),這個功率計可以將能源信號的相關(guān)數(shù)據(jù)傳輸?shù)接⑻貭柕脑粕?,并在這個云上分析這些數(shù)據(jù)以便決定HVAC系統(tǒng)中每個組件,如風(fēng)扇或制冷壓縮機(jī)實際的能源使用率。
業(yè)主通過Daikin公司的商業(yè)Rebel制冷或供熱泵能夠?qū)崟r地跟蹤能源的消耗情況。如果沒有后端分析系統(tǒng),Daikin公司就不得不去升級HVAC系統(tǒng)中每一個組件中的功率計。Facinelli表示,這將需要非常高昂的成本來完成這項工作。
一旦系統(tǒng)中每個部件的能源使用數(shù)據(jù)是有效數(shù)據(jù)的話,那么這些數(shù)據(jù)就會被傳輸?shù)紻aikin公司的云上。Daikin公司的云是運行在微軟的Microsoft Azure共有云上,Daikin利用它來進(jìn)行故障檢測和診斷,以預(yù)測設(shè)備是否需要維護(hù)。
在Daikin公司,有關(guān)單一設(shè)備部件的能源使用數(shù)據(jù)是非常有價值的。執(zhí)行運營副總裁Kevin Facinelli說:“經(jīng)過一段時間,如果你看到一個發(fā)動機(jī)上的能源使用在持續(xù)增長,這就清楚地告訴你這個發(fā)動機(jī)的性能和壽命都開始衰竭。”這種提示信息能夠提前一個月告訴技術(shù)專家這臺機(jī)器出現(xiàn)故障,這樣技術(shù)專家就有足夠的時間去處理這個問題,對這臺機(jī)器進(jìn)行維護(hù)。
Daikin公司提供的能源使用數(shù)據(jù)還可以提醒用戶在必要時更換過濾器,而不是讓用戶按照常規(guī)的維護(hù)規(guī)定來更換,因為像風(fēng)扇這樣的設(shè)備組件當(dāng)過量的灰塵或其他物質(zhì)阻塞了過濾器,風(fēng)扇就需要消耗更多的能源來維持其正常的工作。目前,該公司可以應(yīng)用幾項技術(shù)來構(gòu)建這一系統(tǒng),包括移動計算、云計算、數(shù)據(jù)分析,而良好的用戶體驗也是非常必要的。
美國NCR公司(美國現(xiàn)金出納機(jī)公司)同樣也會收集其公司產(chǎn)品,包括ATM機(jī),在商店擺放的自助服務(wù)機(jī)和電影院的自助售票機(jī)上的數(shù)據(jù)信息,并用來預(yù)測分析,提前發(fā)現(xiàn)一些潛在的問題。這家公司的全球服務(wù)策略和項目管理副總裁Mark Vigoroso表示,預(yù)測分析是為了發(fā)現(xiàn)這些產(chǎn)品或機(jī)器上可能出現(xiàn)的一些問題,這可以給技術(shù)人員留出幾天的時間到現(xiàn)場去診斷問題的原因,并修好設(shè)備,做好設(shè)備維護(hù)工作。
通過對數(shù)據(jù)的分析,NCR公司可以了解到磁卡需要在機(jī)器上刷多少次才能達(dá)到這個機(jī)器的極限,或者打印機(jī)最多能夠打印多少張收據(jù)。這樣,在一些大型活動期間,通過提前的準(zhǔn)備工作,以使機(jī)器的使用頻率變得更高,而NCR公司可以通過預(yù)測數(shù)據(jù)來判斷哪些設(shè)備需要進(jìn)行維護(hù),以防止其在使用時出現(xiàn)故障。
NCR公司使用來自Teradata公司的Aster軟件,Teradata公司于2007年從NCR公司分離出去。NCR公司企業(yè)數(shù)據(jù)庫和商業(yè)智能高級總監(jiān)Brian Valeyko說:“用戶可以利用Aster軟件創(chuàng)建類似SQL的查詢,并通過一種簡單的方式來做一種復(fù)雜的分析。”分析師們能夠在一個完全孤立的環(huán)境中創(chuàng)建查詢,而不用擔(dān)心生產(chǎn)應(yīng)用中出現(xiàn)任何負(fù)面的影響。NCR公司已經(jīng)創(chuàng)建了一種統(tǒng)一的數(shù)據(jù)架構(gòu),該架構(gòu)允許來自Aster數(shù)據(jù)庫、Teradata公司其他的數(shù)據(jù)庫,以及Hadoop的查詢。
利用這一統(tǒng)一的數(shù)據(jù)架構(gòu),NCR公司可以通過比以前更快的速度創(chuàng)建新的查詢。過去,創(chuàng)建一個新的算法來對特定的組件進(jìn)行預(yù)測分析則需要三到六個月的時間。而且,根據(jù)數(shù)據(jù)集的大小,這些算法可能需要幾天,甚至幾周的時間才能得出結(jié)果。根據(jù)其新近實施的統(tǒng)一數(shù)據(jù)架構(gòu),Valeyko計算目前該公司可以用以前20%的時間來完成預(yù)測分析。
利用相關(guān)數(shù)據(jù),NCR公司還可以處理各種新類型的數(shù)據(jù)分析。對此,Valeyko列舉了一個關(guān)于NCR公司打印機(jī)設(shè)備的例子,該設(shè)備上產(chǎn)生的數(shù)據(jù)能夠被利用到其他不同的產(chǎn)品中。據(jù)分析師的發(fā)現(xiàn),這些數(shù)據(jù)不僅能夠預(yù)測出所有產(chǎn)品中的打印機(jī)是否出現(xiàn)故障,同時也能了解到打印機(jī)出現(xiàn)問題實際上與為其供電的特定電源有關(guān)。
UPS快遞多效地利用了地理定位數(shù)據(jù)。為了使總部能在車輛出現(xiàn)晚點的時候跟蹤到車輛的位置和預(yù)防引擎故障,它的貨車上裝有傳感器、無線適配器和GPS。同時,這些設(shè)備也方便了公司監(jiān)督管理員工并優(yōu)化行車線路。UPS為貨車定制的最佳行車路徑是根據(jù)過去的行車經(jīng)驗總結(jié)而來的。僅2011年,UPS的駕駛員就節(jié)約了近4828萬公里的路程。
Seton Healthcare是采用IBM最新沃森技術(shù)醫(yī)療保健內(nèi)容分析預(yù)測的首個客戶。該技術(shù)允許企業(yè)找到大量病人相關(guān)的臨床醫(yī)療信息,通過大數(shù)據(jù)處理,更好地分析病人的信息。
在加拿大多倫多的一家醫(yī)院,針對早產(chǎn)嬰兒,每秒鐘有超過3000次的數(shù)據(jù)讀取。通過這些數(shù)據(jù)分析,醫(yī)院能夠提前知道哪些早產(chǎn)兒出現(xiàn)問題并且有針對性地采取措施,避免早產(chǎn)嬰兒夭折。
它讓更多的創(chuàng)業(yè)者更方便地開發(fā)產(chǎn)品,比如通過社交網(wǎng)絡(luò)來收集數(shù)據(jù)的健康類App。也許未來數(shù)年后,它們搜集的數(shù)據(jù)能讓醫(yī)生給你的診斷變得更為精確,比方說不是通用的成人每日三次一次一片,而是檢測到你的血液中藥劑已經(jīng)代謝完成會自動提醒你再次服藥。
Express Scripts就是這么一家處方藥管理服務(wù)公司,目前它正在通過一些復(fù)雜模型來檢測虛假藥品,這些模型還能及時提醒人們何時應(yīng)該停止用藥。Express Scripts能夠解決該問題的原因在于所有有關(guān)數(shù)據(jù)。因為它每年管理著1.4億個處方,覆蓋了一億個美國人和65,000家藥店,雖然該公司能夠識別潛在問題的信號模式,但它也使用數(shù)據(jù)來嘗試解決某些情況下之前曾經(jīng)發(fā)現(xiàn)的問題。
學(xué)者賽北在 《解放戰(zhàn)爭時期毛澤東農(nóng)民教育思想初探》中對解放戰(zhàn)爭時期毛澤東農(nóng)民教育思想進(jìn)行了一些研究。解放戰(zhàn)爭時期,為了適應(yīng)客觀環(huán)境的變化,以毛澤東為主要領(lǐng)導(dǎo)人的中國共產(chǎn)黨,在保持原來教育思想及教育方法等的基礎(chǔ)上,及時調(diào)整農(nóng)民教育的內(nèi)容及形式,進(jìn)一步重視農(nóng)民的科學(xué)文化、思想政治教育,進(jìn)一步倡導(dǎo)農(nóng)民學(xué)習(xí)的自愿性及探索農(nóng)民教育方式的多樣性,為解放戰(zhàn)爭的最后勝利奠定了堅實的群眾基礎(chǔ)。[8]
保險行業(yè)并非技術(shù)創(chuàng)新的第一陣地,然而MetLife保險公司已經(jīng)投資3億美元建立一個新式系統(tǒng),其中的第一款產(chǎn)品是一個基于Mongo DB的應(yīng)用程序,它將所有客戶信息存儲在一起。
Mongo DB匯聚了來自70多個舊系統(tǒng)的數(shù)據(jù),并將它合并成一個單一的記錄,目前存儲了24TB的數(shù)據(jù),包括MetLife的全部美國客戶,盡管它的目標(biāo)是擴(kuò)大它的國際客戶和用多種語言,同時也可能創(chuàng)建一個面向客戶的端口。它的數(shù)據(jù)備份幾乎是實時的。
大多數(shù)疾病可以通過藥物來達(dá)到治療效果,但如何讓醫(yī)生和病人能夠?qū)W⒓右粌蓚€可以真正改善病人健康狀況的干預(yù)項目卻極具挑戰(zhàn)。安泰保險目前正嘗試通過大數(shù)據(jù)達(dá)到此目的。安泰保險為了幫助改善代謝綜合癥患者的預(yù)測模型,從千名患者中選擇102個完成實驗。在一個獨立的實驗室工作內(nèi),通過患者的一系列代謝綜合癥的檢測試驗結(jié)果,在連續(xù)三年內(nèi),掃描600,000個化驗結(jié)果和18萬索賠事件。將最后的結(jié)果組成一個高度個性化的治療方案,以評估患者的危險因素和重點治療方案。這樣,醫(yī)生可以通過“服用他汀類藥物”及“減重5磅”等建議來減少患者未來10年內(nèi)50%的發(fā)病率。
在洛杉磯開過車的人一定都經(jīng)歷過那里噩夢般的交通擁堵情況。目前政府在I-10和I-110州際公路上建立了一條了收費的快速通道。政府可通過大數(shù)據(jù)引導(dǎo)駕駛?cè)藛T在該通道上的行駛情況,保證交通暢通。
施樂就是參與此次項目的公司,它的抗擁塞項目,包括用Express Lanes、動態(tài)定價,深度需求等來維持秩序的設(shè)計。施樂公司的首席技術(shù)執(zhí)行官Natesh Manikoth表示,如果司機(jī)支付給駕駛熱車道(高占用收費系統(tǒng)),他必須保證車速每小時45英里左右。如果交通開始擁堵,私家汽車的支付價格將上升,以減少他們進(jìn)入,而將車道騰給高占用率的車輛,例如公共汽車和大巴車。
施樂還有另一個項目在洛杉磯,稱為ExpressPark,目標(biāo)是讓人們知道他們在哪能找到停車場和所花費的金額,不僅要確保定價,同時更要確保數(shù)據(jù)實時到達(dá)用戶手中。例如,系統(tǒng)可以提前40分鐘告知用戶停車位置。
許多人通過Facebook更新個人狀態(tài)、分享圖片以及他們“喜歡”的內(nèi)容。奧巴馬的總統(tǒng)競選活動也通過使用社交網(wǎng)絡(luò)的各種數(shù)據(jù)功能完成競選,競選團(tuán)隊不僅通過社交網(wǎng)絡(luò)尋找支持者,而且還通過社交網(wǎng)絡(luò)召集了一批志愿軍。
早在2006年,F(xiàn)acebook聯(lián)合創(chuàng)始人克里斯·休斯就建議扎克伯格在網(wǎng)站上推出相關(guān)服務(wù),幫助總統(tǒng)候選人在Facebook上建立個人主頁,以便他們進(jìn)行形象推廣。2006年9月,F(xiàn)acebook全面開放,用戶數(shù)量爆炸式增長,當(dāng)年年底達(dá)到1200萬。這一過程恰好有利地推升了奧巴馬的知名度。此后,在克里斯的輔佐下,奧巴馬掀起了一系列的網(wǎng)絡(luò)活動,在Facebook、MySpace等社交網(wǎng)站上發(fā)表公開演講、推廣施政理念,贏得大量網(wǎng)民支持,募集到5億多美元的競選經(jīng)費。
最終,“黑人平民”戰(zhàn)勝了實力雄厚的對手,成為美國歷史上第一位黑人總統(tǒng),之后,在第二次的選舉中更獲得連任。此次選舉被認(rèn)為是美國民主的巨大進(jìn)步,而互聯(lián)網(wǎng)則提供了前所未有的實施手段,其中尤以Facebook代表的社交網(wǎng)站最為突出,以至于有人戲稱之為“Facebook之選”。
十多年前,音樂元數(shù)據(jù)公司Grace note收到來自蘋果公司的忠告,建議其購買更多的服務(wù)器。Grace note照做了,而后蘋果推出iTunes和iPod,Grace note從而成為了元數(shù)據(jù)的帝國。
在車內(nèi)聽的歌曲很可能反映你的真實喜好,Grace note就擁有此種技術(shù)。它采用智能手機(jī)和平板電腦內(nèi)置的麥克風(fēng)識別用戶電視或音響中播放的歌曲,并可檢測掌聲或噓聲等反應(yīng),甚至還能檢測用戶是否調(diào)高了音量。這樣,Grace note可以研究用戶真正喜歡的歌曲,聽歌的時間和地點。
Grace note擁有數(shù)百萬首歌曲的音頻和元數(shù)據(jù),因而可以快速識別歌曲信息,并按音樂風(fēng)格、歌手、地理位置等分類。
SpotHero是一種手機(jī)應(yīng)用,支持iOS和Android手機(jī),能夠跟蹤入網(wǎng)城市的停車位。用戶只需要輸入地址或者在地圖中選定地點,就能看到附近可用的車庫或停車位,以及價格和時間區(qū)間。SpotHero能夠?qū)崟r跟蹤停車位數(shù)量變化,目前已經(jīng)能夠?qū)崟r監(jiān)控包括華盛頓、紐約、芝加哥、巴爾的摩、波士頓、密爾沃基和紐瓦克等七個城市的停車位。
2014年,谷歌啟動了一個名為Baseline Study的全新科研項目,希望全面描繪健康人的身體究竟應(yīng)該是何模樣。
該項目由50歲的分子生物學(xué)家安德魯·康拉德(Andrew Conrad)負(fù)責(zé)。雖然目前還有很多大型的醫(yī)療和基因研究項目存在,但Baseline搜集的信息數(shù)量更大,范圍更廣。他們希望幫助研究人員更早地發(fā)現(xiàn)心臟病和癌癥的各種跡象,進(jìn)而推廣預(yù)防措施,而不僅僅把精力放在治療上。
該項目并不局限于具體的疾病,而是會使用各種全新的診斷工具搜集成百上千的不同樣本。之后,谷歌便會利用其龐大的計算能力來尋找這些信息中隱藏的“生物標(biāo)簽”,從而幫助醫(yī)療研究人員提前發(fā)現(xiàn)疾病。
例如,該研究可能會發(fā)現(xiàn)一些能夠幫助人們分解高脂肪食物的生物標(biāo)簽。擁有這些生物標(biāo)簽的人,可以將患上高膽固醇和心臟病的時間延后,沒有這類生物標(biāo)簽的人則會更早患上心臟病。一旦Baseline發(fā)現(xiàn)了這一標(biāo)簽后,研究人員便可通過檢查了解哪些人缺乏這類標(biāo)簽,并幫助他們糾正習(xí)慣,或者開發(fā)出新的治療方法,幫助其更好地分解高脂肪食物。
谷歌擁有當(dāng)今全球規(guī)模最大的電腦網(wǎng)絡(luò)和數(shù)據(jù)中心,可以迅速提供搜索結(jié)果和視頻服務(wù)。這同樣可以用于存儲和分析醫(yī)療信息。目前為止,多數(shù)已經(jīng)發(fā)現(xiàn)的生物標(biāo)簽都與晚期疾病有關(guān),因為這種研究普遍集中于病人。因此,利用現(xiàn)有數(shù)據(jù)盡早判斷疾病的效果不佳。研究人員認(rèn)為,這一新項目將成為一次意義重大的跨越,因為人體太過復(fù)雜,而科學(xué)家目前對于DNA、酶和蛋白質(zhì)之間的相互作用,以及飲食等環(huán)境因素對人體的影響都知之甚少。而此次研究可以為科學(xué)家提供更多信息。
谷歌表示,Baseline將采用匿名方式進(jìn)行,搜集的數(shù)據(jù)也僅限于醫(yī)療目的。這些數(shù)據(jù)不會與保險公司分享。盡管如此,此事還是引發(fā)了很大的擔(dān)憂。這些數(shù)據(jù)今后將為保險公司帶來巨大的價值,還有人可能會在招聘和結(jié)婚時參考相關(guān)數(shù)據(jù)。Baseline將聘請杜克大學(xué)和斯坦福大學(xué)的醫(yī)學(xué)院對其進(jìn)行監(jiān)督,由他們控制信息的使用方式。
越來越多的大型公司開始對開源大數(shù)據(jù)平臺Hadoop進(jìn)行戰(zhàn)略性投資,而在今天,計算行業(yè)巨頭惠普也成為了其中一員。
惠普與2011年從雅虎分拆出來的Hadoop創(chuàng)業(yè)公司Hortonworks達(dá)成戰(zhàn)略性合作關(guān)系,對后者投資5000萬美元。在此以前,Hortonworks已經(jīng)宣布將從私募股權(quán)投資巨頭貝萊德和對沖基金公司Passport Capital等投資者那里獲得融資。
Hortonworks和惠普聯(lián)手開發(fā)Hadoop技術(shù),使其在惠普的Haven大數(shù)據(jù)平臺上運行。而作為面向大型企業(yè)提供硬件、軟件和服務(wù)的全球最大公司之一,惠普將成為Hortonworks的強(qiáng)力后盾,為其提供服務(wù)和支持。
Hadoop是一種開源技術(shù),其設(shè)計目的是在分布式計算環(huán)境下讓人們能更加容易地處理海量數(shù)據(jù)。一旦一批數(shù)據(jù)被注入Hadoop集群,那么公司就可以運用分析工具來收集有用的數(shù)據(jù)。Hadoop是大數(shù)據(jù)的重要組成部分,其基本理念是用戶可以對其收集到的任何數(shù)據(jù)提出智能化的問題,從而獲得很多有用的信息,而其關(guān)鍵則是要找出應(yīng)該提出什么樣的問題。電商巨頭eBay和社交媒體公司Twitter都已在使用Hadoop技術(shù)。
對于Hortonworks來說,惠普的注資代表著該公司達(dá)成了一項戰(zhàn)略性合作關(guān)系。在2014年2月份,開源技術(shù)廠商紅帽已經(jīng)宣布與Hortonworks達(dá)成戰(zhàn)略性合作;此外,Hortonworks還與微軟合作,其Hadoop技術(shù)不僅在Linux平臺上運行,同時也已登陸Windows平臺。除此以外,Hortonworks還與美國十大上市軟件公司之一天睿(Teradata)和德國軟件巨頭SAP簽署了轉(zhuǎn)銷協(xié)議。
根據(jù)需求和庫存的情況,該公司基于SAS的系統(tǒng)對多達(dá)7300萬種貨品進(jìn)行實時調(diào)價。
該公司用KXEN軟件來分析數(shù)十億計的交易以及客戶的特性,然后通過預(yù)測模型對特定用戶進(jìn)行動態(tài)的營銷活動。這項舉措減少了90%的預(yù)測模型構(gòu)建時間。SAP公司正在試圖收購KXEN。
PredPol公司通過與洛杉磯和圣克魯斯的警方以及一群研究人員合作,基于地震預(yù)測算法的變體和犯罪數(shù)據(jù)來預(yù)測犯罪發(fā)生的幾率,可以精確到500平方英尺的范圍內(nèi)。在洛杉磯運用該算法的地區(qū),盜竊罪和暴力犯罪分布下降了33%和21%。
這家超市連鎖在其數(shù)據(jù)倉庫中收集了700萬部冰箱的數(shù)據(jù)。通過對這些數(shù)據(jù)的分析,進(jìn)行更全面的監(jiān)控并進(jìn)行主動的維修,以降低整體能耗。
以往,AmEx(美國運通)只能實現(xiàn)事后諸葛式的報告和滯后的預(yù)測。傳統(tǒng)的BI已經(jīng)無法滿足業(yè)務(wù)發(fā)展的需要。于是,AmEx開始構(gòu)建真正能夠預(yù)測忠誠度的模型,基于歷史交易數(shù)據(jù),用115個變量來進(jìn)行分析預(yù)測。該公司表示,對于澳大利亞將于之后四個月中流失的客戶,已經(jīng)能夠識別出其中的24%。
Infinity Property&Casualty Corp.利用黑暗數(shù)據(jù)(dark data)變廢為寶。Laney對于黑暗數(shù)據(jù)的定義是,那些針對單一目標(biāo)而收集的數(shù)據(jù),通常用過之后就被歸檔閑置,其真正價值未能被充分挖掘。在特定情況下,這些數(shù)據(jù)可以用作其他用途。該公司用累積的理賠師報告來分析欺詐案例,通過算法挽回了1200萬美元的代位追償金額。
最近,國外車險品牌Esurance推出一款名為Fuelcaster的App,專門幫助車主們預(yù)測近期油價,提供“出手”還是“繼續(xù)觀望”的建議,同時還可顯示周邊10個加油站的油價對比。據(jù)了解,Fuelcaster正是利用從全國各地加油站收集而來的大量數(shù)據(jù)計算而成。車主只需輸入?yún)^(qū)號,就可獲得所在區(qū)域的油價預(yù)測。Esurance App由Deutsch L.A.設(shè)立的Invention.ist實驗室開發(fā)。
目前,試圖優(yōu)化農(nóng)場的舊金山初創(chuàng)公司Ceres Imaging正在加利福尼亞面積介于2000至2萬英畝之間的4塊農(nóng)場上收集數(shù)據(jù),嘗試?yán)煤A繑?shù)據(jù)來幫助農(nóng)戶優(yōu)化作物的水源以及營養(yǎng)供應(yīng)。
具體的做法是:將傳感器、攝像頭等一系列零件整合進(jìn)一個小型的、模塊化的盒子里,這個盒子可以方便地與無人機(jī)、小型飛機(jī)進(jìn)行組合,進(jìn)而與為農(nóng)場提供空中播種、殺蟲劑噴灑之類的公司合作,來搜集大范圍農(nóng)場的實時數(shù)據(jù),再與一些固定區(qū)域的圖像傳感器結(jié)合,共同收集到大量農(nóng)場數(shù)據(jù),再將這些數(shù)據(jù)進(jìn)行處理,上傳至云端,就可以方便地了解到農(nóng)場土地以及作物的詳細(xì)情況。農(nóng)戶可以方便地使用任何接入互聯(lián)網(wǎng)的設(shè)備,查看這些信息,從而做出決策。未來,CeresImaging計劃出售收集到的數(shù)據(jù)來獲得營收,做一家“數(shù)據(jù)即服務(wù)”的2C服務(wù)公司。