百度 北京 100085
隨著移動(dòng)互聯(lián)網(wǎng)的快速發(fā)展,應(yīng)用服務(wù)向移動(dòng)化、場(chǎng)景化演進(jìn),基于O2O的生活服務(wù)等業(yè)務(wù)逐漸興起并迅速普及,移動(dòng)電子商務(wù)得到快速的發(fā)展。據(jù)統(tǒng)計(jì),互聯(lián)網(wǎng)打車滲透率已經(jīng)超過40%、互聯(lián)網(wǎng)外賣訂單年增長超過5倍、而電影類業(yè)務(wù)基于互聯(lián)網(wǎng)的購票選座比例也已經(jīng)超過50%。
據(jù)易觀智庫EnfoDesk預(yù)計(jì),隨著商業(yè)模式的成熟,未來幾年移動(dòng)互聯(lián)網(wǎng)市場(chǎng)規(guī)模將持續(xù)增長,預(yù)計(jì)2017年市場(chǎng)規(guī)模將達(dá)到15 790.7億元,如圖1所示。另外據(jù)其監(jiān)測(cè)數(shù)據(jù)顯示,2013年移動(dòng)商務(wù)占移動(dòng)互聯(lián)網(wǎng)總體市場(chǎng)規(guī)模比例已達(dá)到67.8%,占比逐年上升。易觀智庫同時(shí)預(yù)計(jì),移動(dòng)電子商務(wù)未來幾年占比還將持續(xù)上升,2017年將達(dá)到87.4%,成為移動(dòng)互聯(lián)網(wǎng)市場(chǎng)結(jié)構(gòu)的主體。
圖1 2011年~2017年中國移動(dòng)互聯(lián)網(wǎng)市場(chǎng)規(guī)模及預(yù)測(cè)
移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)、終端和用戶的快速發(fā)展和普及,使更多的人和物理設(shè)備互聯(lián)。而隨著信息采集成本的不斷降低,物理世界加速向網(wǎng)絡(luò)空間量化,產(chǎn)生了海量的數(shù)據(jù)。根據(jù)國際數(shù)據(jù)公司IDC發(fā)布的研究報(bào)告,全球所有信息數(shù)據(jù)中90%產(chǎn)生于過去兩年,數(shù)據(jù)總量正在以指數(shù)形式增長,從2003年的5EB[1],到2013年4.4ZB[2],并將于2020年達(dá)到44ZB。
隨著互聯(lián)網(wǎng)+時(shí)代的到來,“聚合”和“調(diào)度”是提升效率的最核心要素。移動(dòng)電子商務(wù)的發(fā)展帶動(dòng)用戶產(chǎn)生的行為數(shù)據(jù)、交易數(shù)據(jù)、位置數(shù)據(jù)等數(shù)據(jù)激增,這些數(shù)據(jù)的“聚合”對(duì)于更好地實(shí)現(xiàn)移動(dòng)電子商務(wù)有著極高的價(jià)值,通過提升智能化手段,對(duì)這些數(shù)據(jù)進(jìn)行挖掘、利用和分析以提升現(xiàn)有業(yè)務(wù)體驗(yàn),實(shí)現(xiàn)智能化“調(diào)度”,可以進(jìn)一步實(shí)現(xiàn)對(duì)商戶、應(yīng)用平臺(tái)等的營銷決策、資源分配,解決商戶和用戶之間服務(wù)信息不對(duì)稱。
進(jìn)入移動(dòng)互聯(lián)網(wǎng)時(shí)代,用戶輸入和檢索需求更趨于復(fù)雜化和個(gè)性化,從最初的簡單獲取信息的需求,到現(xiàn)階段希望能夠通過搜索引擎直接獲取答案、連接服務(wù),這就需要實(shí)現(xiàn)海量數(shù)據(jù)的挖掘和智能處理,實(shí)現(xiàn)人和服務(wù)的精準(zhǔn)匹配。另外由于移動(dòng)終端的限制,用戶也更趨向于自然的交互方式,據(jù)統(tǒng)計(jì),現(xiàn)階段在百度的搜索請(qǐng)求中10%是以語音的形式表達(dá)的,而未來5年使用語音和圖像來表達(dá)需求的比例將超過50%?;谌绱苏鎸?shí)強(qiáng)大的需求,為了不斷提升移動(dòng)電子商務(wù)用戶體驗(yàn),就必須能夠更好地實(shí)現(xiàn)語音與圖像的識(shí)別準(zhǔn)確率,以及個(gè)性化的需求理解,從而實(shí)現(xiàn)智能的服務(wù)連接。在百度的眾多產(chǎn)品中,包括手機(jī)百度、百度外賣、百度糯米等應(yīng)用,用戶基于語音和圖像的交互日益增多,語音和圖像識(shí)別技術(shù)已經(jīng)成為移動(dòng)互聯(lián)網(wǎng)電子商務(wù)用戶體驗(yàn)提升的關(guān)鍵技術(shù)。
如今在移動(dòng)互聯(lián)網(wǎng)和大數(shù)據(jù)時(shí)代,大量的互聯(lián)網(wǎng)用戶將產(chǎn)生包括文本、圖像、語音、視頻、地理位置在內(nèi)的大量數(shù)據(jù),規(guī)模呈爆炸式增長的趨勢(shì)。面對(duì)海量數(shù)據(jù),以深度學(xué)習(xí)為代表的新興機(jī)器學(xué)習(xí)技術(shù),可以做到傳統(tǒng)人工智能算法無法做到的事情,其輸出結(jié)果會(huì)隨著數(shù)據(jù)處理量的增大而更加準(zhǔn)確,取得更好的效果。因此可以說深度學(xué)習(xí)及機(jī)器學(xué)習(xí)的發(fā)展,推動(dòng)“大數(shù)據(jù)+深度模型”時(shí)代的來臨,使得人工智能和人機(jī)交互技術(shù)大踏步前進(jìn),推動(dòng)圖像識(shí)別、語音識(shí)別、自然語言處理和深度問答等“視、聽、說”前沿技術(shù)的突破。
圖像識(shí)別技術(shù)是深度學(xué)習(xí)最早嘗試的技術(shù)領(lǐng)域。Yann LeCun等人在上世紀(jì)80年代末發(fā)明了卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Networks,CNN),該網(wǎng)絡(luò)是一種帶有卷積結(jié)構(gòu)的深度神經(jīng)網(wǎng)絡(luò),CNN的結(jié)構(gòu)受到著名的Hubel-Wiesel生物視覺模型的啟發(fā),尤其是模擬視覺皮層V1和V2層中Simple Cell和Complex Cell的行為。CNN雖然在小規(guī)模的問題上(如手寫數(shù)字)取得過當(dāng)時(shí)世界最好的結(jié)果,但一直沒有取得巨大成功,主要因?yàn)镃NN在大規(guī)模圖像上效果不佳。直到2012年10月,Hinton等人利用更深度的CNN在著名的ImageNet問題上取得了很大進(jìn)步,使得圖像識(shí)別技術(shù)大幅提升,其主要原因一方面來自算法的提升,例如防止過擬合技術(shù),另一方面更重要的是GPU帶來的計(jì)算能力提升和更多的訓(xùn)練數(shù)據(jù)。百度在2012年底將深度學(xué)習(xí)技術(shù)成功應(yīng)用于自然圖像OCR識(shí)別和人臉識(shí)別等問題,并推出相應(yīng)的桌面和移動(dòng)搜索產(chǎn)品;2013年,深度學(xué)習(xí)模型被成功應(yīng)用于圖像的識(shí)別和理解,驗(yàn)證準(zhǔn)確率得到大幅提升[3]。從百度的經(jīng)驗(yàn)來看,深度學(xué)習(xí)應(yīng)用于圖像識(shí)別不但提升了準(zhǔn)確性,而且避免了人工特征抽取的時(shí)間消耗,從而大大提高了在線計(jì)算效率。深度學(xué)習(xí)將取代“人工特征+機(jī)器學(xué)習(xí)”的方法而逐漸成為主流的圖像識(shí)別方法。
長期以來,以混合高斯模型(Gaussian Mixture Model,GMM)為代表的統(tǒng)計(jì)概率模型一直在語音識(shí)別應(yīng)用中占有壟斷性地位,其本質(zhì)上是一種淺層網(wǎng)絡(luò)建模,不能充分描述語音特征的狀態(tài)空間分布,特征維數(shù)一般是幾十維。采用深度神經(jīng)網(wǎng)絡(luò)后,可以充分描述特征之間的相關(guān)性,可以把連續(xù)多幀的語音特征并在一起,構(gòu)成一個(gè)高維特征,最終的深度神經(jīng)網(wǎng)絡(luò)可以采用高維特征訓(xùn)練來模擬。由于深度神經(jīng)網(wǎng)絡(luò)采用模擬人腦的多層結(jié)果,可以逐級(jí)地進(jìn)行信息特征抽取,最終形成適合模式分類的較理想特征。這種多層結(jié)構(gòu)和人腦處理語音圖像信息時(shí)有很大的相似性。深度神經(jīng)網(wǎng)絡(luò)的建模技術(shù),在實(shí)際線上服務(wù)時(shí),能夠無縫地和傳統(tǒng)的語音識(shí)別技術(shù)相結(jié)合,在不引起任何系統(tǒng)額外耗費(fèi)情況下,大幅度提升了語音識(shí)別系統(tǒng)的識(shí)別率,從而徹底改變了語音識(shí)別原有的技術(shù)框架。百度在2012年11月上線了第一款基于DNN的語音搜索系統(tǒng),成為最早采用DNN技術(shù)進(jìn)行商業(yè)語音服務(wù)的公司之一。
除了語音和圖像,自然語言處理也是深度學(xué)習(xí)發(fā)揮作用的技術(shù)領(lǐng)域。經(jīng)過幾十年的發(fā)展,基于統(tǒng)計(jì)的模型已經(jīng)成為NLP的主流,但作為統(tǒng)計(jì)方法之一的人工神經(jīng)網(wǎng)絡(luò)在NLP領(lǐng)域幾乎沒有受到重視。2008年,NEC美國研究院Collobert等人采用embedding方法和多層一維卷積的結(jié)構(gòu)來研究NLP問題,取得了與業(yè)務(wù)最前沿相當(dāng)?shù)臏?zhǔn)確率。最近斯坦福大學(xué)教授Chris Manning等人將深度學(xué)習(xí)用于NLP的工作也值得關(guān)注。
深度問答是一種基于海量互聯(lián)網(wǎng)數(shù)據(jù)和深度語義理解的智能系統(tǒng),基于對(duì)用戶自然語言的理解,實(shí)現(xiàn)對(duì)海量數(shù)據(jù)的深層分析和語義理解,并通過搜索和語義匹配技術(shù),提煉出答案信息,對(duì)信息進(jìn)行聚合、提煉,給出最全面、準(zhǔn)確的結(jié)果。其實(shí)現(xiàn)的難點(diǎn)主要在于正確理解用戶復(fù)雜和多變的需求,并掌握海量結(jié)構(gòu)化的知識(shí)庫數(shù)據(jù),這就需要強(qiáng)大的人工智能技術(shù)和海量復(fù)雜的大數(shù)據(jù)處理能力。深度問答關(guān)鍵技術(shù)包括問題分析和理解技術(shù)、實(shí)體知識(shí)體系建模技術(shù)、文本分析和關(guān)系抽取技術(shù)、語義分析和排序技術(shù)等。
針對(duì)不同類型的問題,提取答案的技術(shù)也會(huì)不同。
根據(jù)可采用的技術(shù),問題可以大致分為實(shí)體類問題和非實(shí)體類問題兩大類。實(shí)體類問題是指答案是實(shí)體的問題, 問題的答案可以是唯一實(shí)體或者實(shí)體的列表,需要通過問題分析技術(shù)分析出實(shí)體類別;對(duì)于非實(shí)體類的問題,需要通過問題分析技術(shù),把這些類型的問題跟實(shí)體類問題區(qū)分開來,因?yàn)檫@些問題的答案不再是實(shí)體,答案的形態(tài)也更加復(fù)雜。
實(shí)體類問答離不開實(shí)體知識(shí)體系的支撐,實(shí)體的類別、實(shí)體間的同位、上下位關(guān)系都十分重要;因此,一個(gè)完備的實(shí)體知識(shí)體系建設(shè)(ontology)對(duì)于問題回答十分必要。實(shí)體的同位、上下位關(guān)系可以通過整合多種來源的知識(shí)獲取,包括一些結(jié)構(gòu)化的數(shù)據(jù)如百度百科,也可以從普通文本中挖掘。
對(duì)文本的深層分析是深度問答用到的一項(xiàng)基礎(chǔ)技術(shù)。文本的分析分為多個(gè)層次,包括分詞、實(shí)體識(shí)別、句法分析乃至語義角色標(biāo)注,在這些分析的基礎(chǔ)上可以進(jìn)行知識(shí)獲取。而通過對(duì)海量數(shù)據(jù)進(jìn)行深層分析,可以有效過濾文本分析引入的噪音,使得知識(shí)更加精準(zhǔn)。文本分析和關(guān)系抽取技術(shù)不僅僅可以用于從普通文本抽取知識(shí),也可以用于語義匹配。
移動(dòng)電子商務(wù)實(shí)現(xiàn)了用戶、商戶、支付系統(tǒng)以及配送網(wǎng)絡(luò)的線上及線下的連接,同時(shí)也產(chǎn)生了海量的數(shù)據(jù),相比較于PC端的應(yīng)用,移動(dòng)電子商務(wù)系統(tǒng)對(duì)于這些海量數(shù)據(jù)的實(shí)時(shí)分析和計(jì)算提出了更高的要求。比如打車軟件調(diào)度系統(tǒng)、外賣系統(tǒng)等要求實(shí)時(shí)處理程序能夠確保在嚴(yán)格的時(shí)間內(nèi)響應(yīng),通常以秒為單位,甚至是毫秒。傳統(tǒng)的批量計(jì)算模型已無法滿足這些要求,必須用專門的實(shí)時(shí)計(jì)算系統(tǒng)替代。
為了更好地支撐自身的業(yè)務(wù),百度自主研發(fā)了國內(nèi)規(guī)模最大的實(shí)時(shí)計(jì)算平臺(tái)——Dstream和TM,它們各有千秋,適用于不同的業(yè)務(wù)場(chǎng)景,極大程度地滿足了移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)的實(shí)時(shí)調(diào)度問題[4]。Dstream旨在面向有向無環(huán)的數(shù)據(jù)處理流,滿足高時(shí)效性要求的計(jì)算業(yè)務(wù)場(chǎng)景,如百度外賣系統(tǒng)的實(shí)時(shí)調(diào)度和路徑規(guī)劃等,可達(dá)到毫秒級(jí)的響應(yīng),目前Dstream平臺(tái)的集群規(guī)模已超千臺(tái),單集群最大處理數(shù)據(jù)量超過50TB/天,集群峰值QPS 193W/S,系統(tǒng)穩(wěn)定性、計(jì)算能力已完全滿足海量數(shù)據(jù)時(shí)效性處理需求。
沿海區(qū)由于靠海,自然元素充足,陽光燦爛、沙灘平坦、風(fēng)景優(yōu)美都能滿足游客追求放松、娛樂的條件。因此海岸線在規(guī)劃之前本身就具有很強(qiáng)的視覺觀景性,對(duì)整個(gè)島嶼經(jīng)濟(jì)的發(fā)展,都有著直接和間接的價(jià)值。為實(shí)現(xiàn)人類與生態(tài)和諧共存,應(yīng)做到合理利用自然環(huán)境,堅(jiān)持生態(tài)環(huán)境保護(hù),力求在開發(fā)建設(shè)時(shí)期對(duì)當(dāng)?shù)氐纳鷳B(tài)環(huán)境破壞減到最小,從而實(shí)現(xiàn)取之自然,還之自然的原則,共同完成沿海景觀帶自我發(fā)展、自我保護(hù)和自我平衡的生態(tài)景觀系統(tǒng)。
TM則是queue-worker模式的準(zhǔn)實(shí)時(shí)workflow計(jì)算系統(tǒng),可滿足秒級(jí)到分鐘級(jí)的響應(yīng)。并具備transaction語義,流入平臺(tái)的數(shù)據(jù)即使在平臺(tái)發(fā)生故障的情況下,也能做到不重不丟,有著非常高的可靠性。這一系統(tǒng)主要應(yīng)用于低時(shí)延、高吞吐及對(duì)數(shù)據(jù)完整性要求極高的場(chǎng)景,如報(bào)表生成系統(tǒng)、計(jì)費(fèi)流計(jì)算等。
即使與Storm相比,Dstream在系統(tǒng)成熟度、性能、穩(wěn)定性等方面仍然優(yōu)勢(shì)明顯,具體對(duì)比數(shù)據(jù)如表1所示。
餐飲業(yè)被認(rèn)為是互聯(lián)網(wǎng)最早開始改造的傳統(tǒng)行業(yè),最成熟的平臺(tái)模式是團(tuán)購和外賣,本文以外賣系統(tǒng)為例探討移動(dòng)電子商務(wù)系統(tǒng)智能化技術(shù)的重要性。外賣是一個(gè)傳統(tǒng)的業(yè)務(wù),但是O2O時(shí)代的外賣系統(tǒng)卻是一個(gè)多種復(fù)雜技術(shù)的綜合體系,包括了多個(gè)層面的創(chuàng)新,如商業(yè)模式的創(chuàng)新、組織形態(tài)的創(chuàng)新和技術(shù)的創(chuàng)新。外賣業(yè)務(wù)實(shí)現(xiàn)的關(guān)鍵是提高配置效率,同時(shí)為用戶、騎士和商戶創(chuàng)造更多的價(jià)值,智能技術(shù)是其核心競爭力。
表1 DStream與Storm對(duì)比
一個(gè)基本的外賣流程主要包括如下3個(gè)環(huán)節(jié):用戶下單、訂單調(diào)度、騎士配送。系統(tǒng)流轉(zhuǎn)的最主要目的就是為了能夠促成用戶下單,并及時(shí)交付訂單。其背后最重要的兩大系統(tǒng)就是推薦系統(tǒng)和調(diào)度系統(tǒng),如圖2所示,通過推薦與調(diào)度系統(tǒng),對(duì)于訂單日志、騎士狀態(tài)、實(shí)時(shí)場(chǎng)景和點(diǎn)擊日志等動(dòng)態(tài)數(shù)據(jù)進(jìn)行分析,完成實(shí)時(shí)、有效的配送;同時(shí)通過用戶畫像、菜品信息、商戶畫像和場(chǎng)景偏好等靜態(tài)數(shù)據(jù)與實(shí)時(shí)的場(chǎng)景相結(jié)合實(shí)現(xiàn)精準(zhǔn)的推薦。例如百度外賣系統(tǒng)是國內(nèi)首家采用流式計(jì)算、智能調(diào)度算法構(gòu)建的外賣系統(tǒng),通過智能調(diào)度和推薦,能夠?qū)崿F(xiàn)用戶等待時(shí)間平均降低28%,騎士送單效率提升100%。
外賣系統(tǒng)中最重要的部分就是智能調(diào)度系統(tǒng),主要包括智能派單和路徑規(guī)劃兩個(gè)部分。在傳統(tǒng)的電子商務(wù)時(shí)代,調(diào)度主要是由調(diào)度員完成,假設(shè)一個(gè)調(diào)度員大概一天能管一千單左右,如果每天要實(shí)現(xiàn)一百萬單的話,就需要有一千個(gè)調(diào)度員,這是一個(gè)非常龐大的運(yùn)作體系。在移動(dòng)O2O時(shí)代,系統(tǒng)要處理海量的訂單和數(shù)據(jù),這就需要一個(gè)智能化、全自動(dòng)的調(diào)度系統(tǒng),要選擇合適的騎士,并同時(shí)考慮到LBS位置信息和訂單合并等信息,使得整個(gè)系統(tǒng)實(shí)現(xiàn)路徑最優(yōu)。
圖2 百度外賣系統(tǒng)
百度外賣系統(tǒng)的架構(gòu)如圖3所示。通過采集騎士、訂單、GIS服務(wù)和用戶等相關(guān)數(shù)據(jù)構(gòu)建實(shí)時(shí)場(chǎng)景下的約束變量,并通過流式計(jì)算、預(yù)估模型、相關(guān)性排序和動(dòng)態(tài)規(guī)劃等算法實(shí)現(xiàn)實(shí)時(shí)調(diào)度,包括路線規(guī)劃、智能導(dǎo)航、訂單自動(dòng)分配等。為了實(shí)現(xiàn)更好的實(shí)時(shí)調(diào)度,系統(tǒng)還實(shí)現(xiàn)了離線預(yù)測(cè)和配送監(jiān)控等功能。其中離線預(yù)測(cè)采用智能化手段實(shí)現(xiàn)出餐預(yù)估、熱點(diǎn)預(yù)測(cè)、運(yùn)力預(yù)測(cè)等,這些預(yù)測(cè)信息可以與調(diào)度系統(tǒng)結(jié)合,根據(jù)離線的場(chǎng)景分析來實(shí)現(xiàn)最優(yōu)的騎士配送路線。另外能夠?qū)崿F(xiàn)自動(dòng)化的騎士管理、商戶管理、調(diào)度檢測(cè)和配送監(jiān)控等業(yè)務(wù)層功能,也可以用于實(shí)時(shí)監(jiān)控及調(diào)整配送網(wǎng)絡(luò)。
圖3 外賣系統(tǒng)訂單流程圖
移動(dòng)電子商務(wù)需要將用戶需求和所需要的服務(wù)實(shí)現(xiàn)精準(zhǔn)對(duì)接,因此優(yōu)秀的移動(dòng)電子商務(wù)系統(tǒng)必須具備一個(gè)智能的推薦系統(tǒng)[5]。以百度外賣為例,通過智能化推薦系統(tǒng),可以實(shí)現(xiàn)數(shù)據(jù)、場(chǎng)景的分析以及用戶畫像,對(duì)于不同的用戶、地域以及時(shí)間段等復(fù)雜的場(chǎng)景,呈現(xiàn)出不同的商戶和菜品的排序。同時(shí)滿足業(yè)務(wù)生態(tài)各參與方的需求和利益。外賣平臺(tái)提供一個(gè)公正、良性的競爭環(huán)境,同時(shí)滿足用戶多場(chǎng)景個(gè)性化的需求、口味變化的需求,并為商戶提供新的機(jī)遇并建立良好的商戶成長體系,增加用戶黏性,極大地提高用戶轉(zhuǎn)化率。
百度外賣的推薦系統(tǒng)主要包括數(shù)據(jù)處理層、商戶建模層、算法層、策略層、用戶建模層和應(yīng)用層6個(gè)部分,如圖4所示。
圖4 智能推薦系統(tǒng)示意圖
其中商戶和用戶的建模包括離線和實(shí)時(shí)兩部分。商戶模型的離線數(shù)據(jù)包括商戶評(píng)級(jí)、適宜場(chǎng)景、商戶標(biāo)簽挖掘和商戶屬性等;實(shí)時(shí)數(shù)據(jù)包括實(shí)時(shí)運(yùn)力、實(shí)時(shí)庫存、商戶行為和運(yùn)營數(shù)據(jù)等;用戶建模層的離線數(shù)據(jù)包括用戶長期畫像及其短期畫像;實(shí)時(shí)數(shù)據(jù)包括購買場(chǎng)景分析和實(shí)時(shí)的用戶畫像等。推薦系統(tǒng)通過高效的實(shí)時(shí)計(jì)算系統(tǒng),分析百度海量的商戶及其用戶數(shù)據(jù),刻畫商戶和用戶模型,并通過多樣性策略實(shí)現(xiàn)精準(zhǔn)商戶排序、商戶推薦和菜品推薦,提升點(diǎn)擊率。
移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)的快速發(fā)展,使得行業(yè)技術(shù)門檻越來越高。移動(dòng)電子商務(wù)業(yè)務(wù)作為其中最為重要的分支之一,其業(yè)務(wù)及平臺(tái)實(shí)現(xiàn)涉及云計(jì)算、大數(shù)據(jù)、人工智能等多種技術(shù)的綜合應(yīng)用,因此可以說技術(shù)與研發(fā)能力是實(shí)現(xiàn)移動(dòng)電子商務(wù)業(yè)務(wù)創(chuàng)新、商業(yè)模式創(chuàng)新、優(yōu)化資源配置的有利保證。
移動(dòng)互聯(lián)網(wǎng)的發(fā)展實(shí)現(xiàn)了泛在連接和全面智能化的疊加,以及無所不在的連接和無所不在的感知,從而產(chǎn)生海量的數(shù)據(jù)。這些數(shù)據(jù)類型已不是單一的結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)占有非常大的比重,但是如果現(xiàn)有技術(shù)手段無法將大量的非結(jié)構(gòu)化數(shù)據(jù)與結(jié)構(gòu)化數(shù)據(jù)進(jìn)行統(tǒng)一和整合,就無法發(fā)掘數(shù)據(jù)中的重要價(jià)值。對(duì)于這些非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行分析和挖掘并實(shí)現(xiàn)其價(jià)值,人工智能是重要的技術(shù)發(fā)展方向。當(dāng)感知、連接和計(jì)算無所不在的時(shí)候,人工智能將會(huì)全面提升數(shù)據(jù)處理的實(shí)時(shí)性、準(zhǔn)確性和完整性。移動(dòng)電子商務(wù)業(yè)務(wù)的快速發(fā)展也直接得益于數(shù)據(jù)驅(qū)動(dòng)的創(chuàng)新及應(yīng)用,可以極大地提升用戶體驗(yàn)并降低成本。因此可以說人工智能是移動(dòng)互聯(lián)電子商務(wù)的最重要的技術(shù)推動(dòng)力,能夠提升“互聯(lián)網(wǎng)+”的智能化水平,并帶來技術(shù)、生產(chǎn)、商業(yè)模式的持續(xù)變革。
參考文獻(xiàn)
[1]易觀智庫.中國移動(dòng)生活服務(wù)市場(chǎng)專題研究報(bào)告[R],2014:1-3
[2]涂蘭敬.百度的技術(shù)突破與應(yīng)用[N/OL].[2015-07-20].http://www.ciw.com.cn/h/2562/404190-17609.html
[3]都大龍,余軼男,羅恒,等.基于深度學(xué)習(xí)的圖像識(shí)別進(jìn)展:百度的若干實(shí)踐[EB/OL].[2015-07-20].http://wenku.baidu.com/link?url=4lIdMG0VcK0RW_EXIrwg8qQRd6SnDwd w8tfho3O0UIgbIkv6GvjiosnYs8TsUpuYvOe52K5fyQRc C3QmKQLC5h5Hrh-n2IWbHu-Gm6VYKJi
[4]郭江亮.百度實(shí)時(shí)計(jì)算平臺(tái)的實(shí)現(xiàn)和應(yīng)用[J/OL].[2015-07-20].http://www.csdn.net/article/2014-10-28/2822319
[5]陳尚義.百度大數(shù)據(jù)應(yīng)用與實(shí)踐[EB/OL].[2015-07-20].http://www.open-open.com/news/view/1e2f98f