文 本刊記者 王柳
大數(shù)據(jù)不僅要解決“大”的問題,更重要的是如何將挖掘分析的結(jié)果直觀呈現(xiàn)出來,轉(zhuǎn)換為用戶真正需要的洞察力。
步入大數(shù)據(jù)時(shí)代后,企業(yè)面臨的挑戰(zhàn)不僅是急劇增加的數(shù)據(jù)容量、種類和速度,還有如何發(fā)掘數(shù)據(jù)價(jià)值,像如何通過社交網(wǎng)絡(luò)數(shù)據(jù)決定企業(yè)的品牌和產(chǎn)品定位?如何讓企業(yè)的線上競爭策略更加高效?如何才能更準(zhǔn)確吸引目標(biāo)用戶?
市場研究機(jī)構(gòu)IDC的調(diào)研結(jié)果顯示,到2020年全球數(shù)據(jù)容量將達(dá)到35 ZB(即35萬億TB),且數(shù)據(jù)的類型和種類將更加復(fù)雜。多數(shù)分析師認(rèn)為,其中高達(dá)85%的新數(shù)據(jù)都是非結(jié)構(gòu)化的數(shù)據(jù)。
巧婦難為無米之炊,想要挖掘大數(shù)據(jù)的價(jià)值,首先要收集存儲。微軟大數(shù)據(jù)解決方案的數(shù)據(jù)管理平臺可以無縫地存儲和處理包括結(jié)構(gòu)化、非結(jié)構(gòu)化和實(shí)時(shí)數(shù)據(jù)在內(nèi)的所有類型的數(shù)據(jù)。像其推出的HDInsight是一種適合企業(yè)使用的、基于HDP的Hadoop服務(wù),它將Windows的簡易性和可管理性帶給Hadoop,提供了結(jié)合Hadoop的擴(kuò)展平臺,并為大數(shù)據(jù)提供了靈活且可擴(kuò)展的云,用戶可以根據(jù)自己的需求選擇平臺。
如能搜集全世界相關(guān)數(shù)據(jù)作為參照系來分析企業(yè)收集的大數(shù)據(jù)資料,更能夠提高數(shù)據(jù)分析結(jié)果的代表性并提升對企業(yè)的指導(dǎo)價(jià)值。微軟大數(shù)據(jù)解決方案,通過將數(shù)據(jù)和模型與公開的數(shù)據(jù)服務(wù)相結(jié)合,實(shí)現(xiàn)了突破性的數(shù)據(jù)發(fā)現(xiàn)。通過使用Windows Azure Marketplace中的應(yīng)用程序和智能挖掘算法,用戶還能發(fā)現(xiàn)更多隱藏的信息與數(shù)據(jù)挖掘模式。此外,微軟大數(shù)據(jù)解決方案還能通過企業(yè)信息化管理工具將原始數(shù)據(jù)轉(zhuǎn)換成可靠一致的數(shù)據(jù),并通過SQL Server 分析服務(wù)的高級分析功能來實(shí)現(xiàn)數(shù)據(jù)的精煉。
雅虎通過將其龐大的存儲在Apache Hadoop開源框架中的數(shù)據(jù)整合到微軟SQL Server 2008 R2當(dāng)中,成功地幫客戶提高了廣告投放的效率,并成功讓廣告商增加了在雅虎網(wǎng)站的廣告投放費(fèi)用。
美國得克薩斯大學(xué)研究表明,數(shù)據(jù)利用率提高10%,財(cái)富100強(qiáng)中企業(yè)人均產(chǎn)出會提高14.4%,零售、咨詢服務(wù)行業(yè)人均產(chǎn)出會分別提高49%、39%,食品、建筑、鋼鐵等傳統(tǒng)行業(yè)人均產(chǎn)出也可提高20%以上。但據(jù)Forrester Research對大量大型企業(yè)調(diào)研結(jié)果顯示,企業(yè)大數(shù)據(jù)的利用率僅為12%左右。主要是大數(shù)據(jù)的分析結(jié)果不夠直觀。
微軟全球高級副總裁、大中華區(qū)董事長兼首席執(zhí)行官 賀樂賦:“微軟就是通過先進(jìn)算法幫助用戶更高效地挖掘有用數(shù)據(jù)。”
微軟全球高級副總裁,大中華區(qū)董事長兼首席執(zhí)行官賀樂賦(Ralph Haupter)在不久前微軟大數(shù)據(jù)媒體溝通會上表示:“微軟就是通過先進(jìn)算法幫助用戶更高效地挖掘有用數(shù)據(jù),再以用戶最熟悉、最直觀的形式表現(xiàn)出來,從而幫助用戶做出決策。”
微軟大數(shù)據(jù)解決方案可以讓客戶通過熟悉的工具,比如由Hive add-in for Excel生成的Excel界面,從Hadoop功能中獲取有價(jià)值的洞察力。也可經(jīng)由企業(yè)熟悉的BI工具,如SQL Server 分析服務(wù)、PowerPivot以及通過Hive Open Database Connectivity驅(qū)動(dòng)生成的Power View來分析Hadoop中的非結(jié)構(gòu)化數(shù)據(jù)。通過集成.NET和新的JavaScript庫,微軟簡化了Hadoop中的編程。開發(fā)者可以在JavaScript中使用新的JavaScript庫來輕松編寫程序,然后通過一個(gè)簡單瀏覽器來部署他們的JavaScript代碼。