本刊記者|石菲
2011年,我們通過Watson知道了認知計算。當時人們還不知道這項吸引眼球的新奇技術(shù)能做些什么,而隨著大數(shù)據(jù)和云計算時代的到來,認知計算的商業(yè)化轉(zhuǎn)化越來越值得期待。但非結(jié)構(gòu)化數(shù)據(jù)的分析難度和中文語言的博大精深,讓認知計算在中國的應(yīng)用變得難上加難。
女王范、實際、欣賞美、有條理,喜歡在人群當中處于支配地位,這是喜歡梅西的球迷的性格分析。這些數(shù)據(jù)來自于2014年世界杯期間社交平臺上的球迷討論。IBM和騰訊根據(jù)網(wǎng)絡(luò)媒體平臺及社交網(wǎng)絡(luò)上發(fā)布的海量公開信息及數(shù)據(jù),進行精準的大數(shù)據(jù)分析,獲得關(guān)于球迷話題、球迷類型、球迷個性分析等一系列洞察。
在和騰訊的合作中,為深度挖掘社交平臺上形式豐富的非結(jié)構(gòu)化信息,提取有指導意義的洞察,IBM構(gòu)建了社交大數(shù)據(jù)分析系統(tǒng),利用機器自學習方法和自然語言分析技術(shù)來傾聽網(wǎng)民的“心聲”。
其中用到四點關(guān)鍵技術(shù)。命名實體識別是指在處理非結(jié)構(gòu)化數(shù)據(jù)時,不管球迷通過任何設(shè)備錄入信息,都有一些文字沒有標點符號,不同的短語在中文里有著不同的含義,需要IBM利用技術(shù)把人名、球隊名等識別出來,以便進一步的分析;話題檢測則用于幫助識別網(wǎng)友討論的話題;在理解球迷討論的話題后,利用語義情感分析可以判斷球迷的立場是支持還是否定,從而獲得球迷情感上的傾向;最后,社交平臺上聚集了眾多球迷,討論各種類型的話題,利用網(wǎng)絡(luò)關(guān)系抽取技術(shù),對球迷集中討論的眾多話題進行綜合分析,從而將話題間真正有價值、有分析意義的內(nèi)容關(guān)聯(lián)出來。
IBM大中華區(qū)全球信息服務(wù)部云計算服務(wù)總經(jīng)理余忠寧表示,“這個項目的技術(shù)熱點有兩方面,一方面是IT基礎(chǔ)架構(gòu)的支持,SoftLayer可以為大數(shù)據(jù)的抓取提供最直接和最有力的支持,保證了實時、靈活、穩(wěn)固、可擴展的計算力支持。另一方面是認知層面的計算能力。只有讓計算機理解人類的語言,理解人類的行為,才能幫助客戶找到價值亮點和洞察未來的方向。IBM目前已經(jīng)可以讓機器像人一樣了解語言表面和語言底下的信息?!?/p>
近幾年社交媒體和移動互聯(lián)網(wǎng)的火爆使得人人都可以很方便地發(fā)表觀點,這些數(shù)據(jù)蘊藏著巨大的商業(yè)價值。社交媒體上的討論不僅體現(xiàn)了球迷對球隊和球員的關(guān)注,在深入挖掘后也可以為商家?guī)硇碌纳虣C。比如根據(jù)喜歡不同球星的球迷分類,精準定位哪位球星適合某一類商品的廣告代言。
就在前些日子,IBM收購了人工智能創(chuàng)業(yè)公司Cognea。Cognea開發(fā)了一個基于認知計算和對話的人工智能平臺,致力于為銀行呼叫中心等企業(yè)客戶提供能夠個性化對話的虛擬助手。在IBM提供的虛擬展示中,沃森只借助一份內(nèi)部備忘錄就可以總結(jié)出一份虛構(gòu)的公司戰(zhàn)略和決策算法,同時它還具備了語音控制功能。經(jīng)過與虛擬高管的多次對話,沃森不斷地縮小相關(guān)結(jié)果的內(nèi)容,并最終得出一個結(jié)論。
認知計算的商業(yè)化應(yīng)用也許會在不久后為我們帶來不可思議的變化。