陳思恩
大數(shù)據(jù)領(lǐng)域蘊(yùn)藏很多的商業(yè)機(jī)會(huì),而不同的領(lǐng)域里積累了很多數(shù)據(jù),很多專家學(xué)者提到,中國發(fā)展場景化大數(shù)據(jù)是一塊寶地,因?yàn)橛泻芏鄶?shù)據(jù)沉淀、很多場景可以利用。我們可以看到很多企業(yè)在AI與大數(shù)據(jù)方面的發(fā)展相當(dāng)深入,可以解決很多通用問題,當(dāng)針對(duì)一個(gè)企業(yè)進(jìn)行剖析時(shí),很多應(yīng)用價(jià)值可以被挖掘出來。我們作為一個(gè)科技公司,致力于發(fā)展交通領(lǐng)域業(yè)務(wù)。而在交通領(lǐng)域中的民航,它的整個(gè)組織架構(gòu)分為三個(gè)重要板塊:航空公司、機(jī)場和民航管理機(jī)構(gòu)。全球約241家航空公司,如果將國外與國內(nèi)航空公司的數(shù)據(jù)結(jié)合起來,形成智能交通數(shù)據(jù)庫,從民航板塊作為出發(fā)點(diǎn),也可以解決鐵路出行問題。目前,我們和中國鐵路總公司合作,幫助解決客運(yùn)分析方面的問題,而公路出行不能一盤棋解決所有城市交通,應(yīng)圍繞一個(gè)省或一個(gè)城市的附屬關(guān)系進(jìn)行總體考量,若把民航出行、公路出行和鐵路出行這三個(gè)方面相互融合,則需要很長時(shí)間做深入的研究。
智慧交通領(lǐng)域囊括了很多方面,包括政府、交通管理機(jī)構(gòu)和企業(yè)本身的綜合性問題,同時(shí)收益也是組織的關(guān)注點(diǎn),而一些問題也是我們科技谷非常重視的問題,目前整個(gè)智慧交通技術(shù)迭代和整體算法衍生迭代較慢,最終導(dǎo)致解決此項(xiàng)問題相對(duì)困難。比如在收益模塊的系統(tǒng)價(jià)格昂貴,通常一個(gè)軟件作用于一個(gè)航空公司,其一年的收益就可達(dá)到上億元,而解決類似的問題,只能依賴于技術(shù)提升和驅(qū)動(dòng)。
科技谷從2012年開始著手研究智慧交通的出行架構(gòu)。從云、物理存儲(chǔ)到計(jì)算,涉及很多結(jié)構(gòu),包括數(shù)據(jù)函數(shù)驅(qū)動(dòng)、疊加和集中學(xué)習(xí)等,都需要在市場中打通,要發(fā)展智慧交通需要付出很多時(shí)間去耕耘。
我們區(qū)別于其他企業(yè)的是,從不同的場景中進(jìn)行整體創(chuàng)新,所提供的服務(wù)具有針對(duì)性,而發(fā)展智慧交通AI必須有兩個(gè)環(huán)節(jié)。第一,引入外部數(shù)據(jù)。把外部數(shù)據(jù)引入進(jìn)來與內(nèi)部數(shù)據(jù)相結(jié)合,通常的大數(shù)據(jù)公司從事技術(shù)層面開發(fā),科技谷是綜合解決方案的供應(yīng)商,可以幫企業(yè)解決大數(shù)據(jù)問題,引入企業(yè)所需要的數(shù)據(jù)源,同時(shí)對(duì)數(shù)據(jù)源進(jìn)行合理的歸集和整合。第二,大數(shù)據(jù)系統(tǒng)需要有數(shù)據(jù)支撐,同時(shí)需要一套AI的機(jī)器學(xué)習(xí)平臺(tái),很多大型企業(yè)希望能夠在通用部門中建設(shè)一套比較完整的機(jī)器學(xué)習(xí)通用模塊,并且由各個(gè)部門擴(kuò)展它的應(yīng)用場景。我們幫助企業(yè)搭建這個(gè)平臺(tái)去拓展企業(yè)的應(yīng)用場景,包括企業(yè)的整體流程化、管理的精細(xì)化和新算法,這些全部依賴于企業(yè)的數(shù)據(jù)量,在存儲(chǔ)的數(shù)據(jù)增加之后,以新存儲(chǔ)的數(shù)據(jù)帶動(dòng)算法場景的更新,才有可能創(chuàng)造一個(gè)持續(xù)運(yùn)營并且有價(jià)值的場景。場景依賴大數(shù)據(jù)系統(tǒng)建設(shè),我們已經(jīng)在航空公司、機(jī)場、民航局、市交委旅游局部署了相關(guān)系統(tǒng)來打通數(shù)據(jù)場景。
此外可通過增加機(jī)器學(xué)習(xí)算法,解決人工智能問題。而深度學(xué)習(xí)則更注重技術(shù),所以我們也在集成深度學(xué)習(xí)技術(shù)的同時(shí)解決AI中的具體場景。針對(duì)交通出行行業(yè)的企業(yè)來說,需要積累互聯(lián)網(wǎng)的海量數(shù)據(jù),這時(shí)需要有一個(gè)外部AI的分析能力,在平臺(tái)上我們?cè)黾恿诉@種能力,去分析外部的數(shù)據(jù),而外部的行為結(jié)構(gòu),會(huì)對(duì)整個(gè)收益結(jié)構(gòu)中不同的行為進(jìn)行分析,所以電商分析起到了決定性作用,因?yàn)樵瓉砥髽I(yè)預(yù)測外部數(shù)據(jù)可能需要提前兩周,但是隨著運(yùn)行效率的提高,準(zhǔn)確率可能提升至10%~20%,對(duì)于航空公司而言收益非常可觀。
外部數(shù)據(jù)和內(nèi)部數(shù)據(jù)相結(jié)合,無論是鐵路總局、機(jī)場、旅游機(jī)構(gòu),都會(huì)涉及人群畫像的豐富程度,所以通過外部的數(shù)據(jù)整合,對(duì)群體畫像進(jìn)行完善的前提是必須對(duì)關(guān)系路徑進(jìn)行分析,這需要大量使用圖型數(shù)據(jù)庫,以及各種圖的存儲(chǔ)方式,在每個(gè)板塊都通過路徑優(yōu)化的方式進(jìn)行分析。在畫像和關(guān)系圖譜的基礎(chǔ)牢固之后,再進(jìn)行整體推進(jìn)。航空公司的收益是對(duì)艙位進(jìn)行配售和定價(jià),這需要對(duì)歷史數(shù)據(jù)和實(shí)時(shí)行為進(jìn)行分析,運(yùn)用分布式處理技術(shù)可以實(shí)現(xiàn)單個(gè)系統(tǒng)監(jiān)控上百條航線,并以毫秒級(jí)的速度把結(jié)果展示出來,同時(shí)這種行為也可以用于安全維穩(wěn)。
而PDA(掌中電腦)的使用,可以通過決策數(shù)據(jù)的方式來保證不同的模型,進(jìn)行集中學(xué)習(xí)。同時(shí)我們進(jìn)行了鐵路的相關(guān)分析。鐵路為了更好地增加服務(wù),開始增加廣告推廣業(yè)務(wù)和配餐等服務(wù),而這些都依賴于基礎(chǔ)設(shè)施建設(shè),而大量的智能化設(shè)備的使用,因?yàn)闆]有辦法像人一樣的工作方式工作,則出現(xiàn)了以數(shù)據(jù)驅(qū)動(dòng)決策的企業(yè)開始從事這方面的研發(fā)。
鐵路需要運(yùn)用區(qū)塊鏈的架構(gòu)實(shí)現(xiàn)共享機(jī)制,而這種機(jī)制同樣可以應(yīng)用到航空公司和鐵路總局中,所以需要一套完整的智慧云服務(wù)體系。
我們?cè)谏钲诮⒘舜髷?shù)據(jù)民航中心,存儲(chǔ)了全國所有民航數(shù)據(jù),海關(guān)總署可直接調(diào)閱民航中心的數(shù)據(jù),可以對(duì)人群特征進(jìn)行查閱從而到達(dá)監(jiān)管目的。而針對(duì)每天大量的行李和旅客,如何做好數(shù)據(jù)的分發(fā)清洗,則依賴于底層架構(gòu)技術(shù)對(duì)數(shù)據(jù)進(jìn)行實(shí)時(shí)分析,要把整個(gè)體系做好,產(chǎn)業(yè)鏈上、下游和大數(shù)據(jù)產(chǎn)業(yè)生態(tài)平臺(tái)要搭建完整,這需要有投資機(jī)構(gòu)、政府資源和企業(yè)共同創(chuàng)建。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)endprint