劉鵬 南京大數(shù)據(jù)研究院院長(zhǎng)、教授/中國(guó)大數(shù)據(jù)應(yīng)用聯(lián)盟人工智能專(zhuān)家委員會(huì)主任
近幾年來(lái),社會(huì)的基礎(chǔ)設(shè)施發(fā)生了很大變化。今年6月18日,京東的無(wú)人配送車(chē)上路,一輛車(chē)一天可以運(yùn)送一千個(gè)包裹,相當(dāng)于十個(gè)快遞員的工效。以前的快遞倉(cāng)庫(kù)是相對(duì)雜亂的人工揀選,現(xiàn)在的快遞倉(cāng)庫(kù)已經(jīng)變成智能揀選。物流、倉(cāng)儲(chǔ)、工廠、碼頭、購(gòu)物都是如此——無(wú)人化、智能化成為趨勢(shì),效率提升愈發(fā)顯現(xiàn)。
為什么整個(gè)世界在最近兩年發(fā)生了這么大的變化?因?yàn)樾聲r(shí)代的信息基礎(chǔ)設(shè)施已經(jīng)初步建成,其基礎(chǔ)設(shè)施來(lái)自于物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)和人工智能的發(fā)展和應(yīng)用。
物聯(lián)網(wǎng)解決的是感知——感知數(shù)據(jù)、產(chǎn)生數(shù)據(jù);云計(jì)算解決的是海量數(shù)據(jù)的存儲(chǔ)和處理;大數(shù)據(jù)解決的是數(shù)據(jù)的挖掘和分析;人工智能解決的是數(shù)據(jù)的學(xué)習(xí)和理解。可以說(shuō)互聯(lián)網(wǎng)是傳感器,云計(jì)算是數(shù)據(jù)的處理,大數(shù)據(jù)是數(shù)據(jù)的挖掘,人工智能形成了真正的知識(shí)和智慧——這是同一個(gè)問(wèn)題四個(gè)不同的側(cè)面,不同的方向。
過(guò)去這些年,數(shù)據(jù)量增長(zhǎng)非常迅猛。據(jù)統(tǒng)計(jì),2004年全世界的數(shù)據(jù)總量是30EB(1EB相當(dāng)于10的18次方字節(jié)),2005年是50個(gè)EB,2006年是 161EB,2015年 是 7900EB,2020年 將 會(huì) 達(dá) 到35000EB。2004年至2020年數(shù)據(jù)量的增長(zhǎng)見(jiàn)圖2,即全球數(shù)據(jù)總量每過(guò)18個(gè)月就會(huì)增長(zhǎng)一倍,這個(gè)數(shù)據(jù)增長(zhǎng)符合新摩爾定律。大數(shù)據(jù)已經(jīng)成為社會(huì)最重要的資產(chǎn)。馬云曾經(jīng)說(shuō)過(guò),大數(shù)據(jù)賦予了我們洞察未來(lái)的能力。
圖1 新信息技術(shù)發(fā)展趨勢(shì)
圖2 2004年至2020年數(shù)據(jù)量的增長(zhǎng)
大數(shù)據(jù)在疫情預(yù)測(cè)、精確營(yíng)銷(xiāo)、信用交易、態(tài)勢(shì)評(píng)估、物流等各行各業(yè)均有廣泛的應(yīng)用。
2013年暴發(fā)禽流感的時(shí)候,淘寶上的有些地區(qū)板藍(lán)根銷(xiāo)量暴漲,通過(guò)淘寶的板藍(lán)根銷(xiāo)售大數(shù)據(jù),就可以反映出這些地區(qū)禽流感的疫情——因?yàn)楫?dāng)一個(gè)人頭痛腦熱的時(shí)候,通常會(huì)到淘寶上去買(mǎi)板藍(lán)根。
通過(guò)大數(shù)據(jù),我們還可以大大提高營(yíng)銷(xiāo)的效率。中國(guó)移動(dòng)做過(guò)一個(gè)試點(diǎn),在廣東用其掌握的數(shù)據(jù)對(duì)用戶(hù)做精確挖掘,依據(jù)數(shù)據(jù)精確挖掘設(shè)計(jì)了一些新產(chǎn)品,并有針對(duì)地向挑選的用戶(hù)做營(yíng)銷(xiāo),結(jié)果與平均水平的營(yíng)銷(xiāo)相比,營(yíng)銷(xiāo)提高了三倍。
在當(dāng)今的數(shù)據(jù)變現(xiàn)時(shí)代,數(shù)據(jù)起的作用非常大。手機(jī)客戶(hù)端,微信、微博、今日頭條,沒(méi)有哪一個(gè)手機(jī)的應(yīng)用是與用戶(hù)需求沒(méi)有關(guān)系的。朋友圈里看的東西是好友推薦的,今日頭條看的東西是它根據(jù)你的行為推薦的。騎共享單車(chē),阿里巴巴可以不用押金,是因?yàn)榘⒗镆呀?jīng)知道了你的信用。
馬云在幾年前就開(kāi)始做數(shù)據(jù)變現(xiàn)。2012年,馬云成立了一家公司叫重慶市阿里巴巴小額貸款有限公司。這家公司通過(guò)所掌握的海量數(shù)據(jù),對(duì)用戶(hù)的信用做挖掘、分析。當(dāng)用戶(hù)需要貸款時(shí),只要到平臺(tái)上提出申請(qǐng),然后錢(qián)就到了支付寶賬號(hào)。我們知道,向銀行貸款非常麻煩,需要提供單位收入證明,需要抵押房產(chǎn),經(jīng)過(guò)很多人的把關(guān),很多嚴(yán)格的審查,貸款可能過(guò)了一個(gè)月才能發(fā)放。然而,銀行的壞賬率是多少?1.5%,這是工行公布的數(shù)字,最近壞賬的比例還有所上升?;诨ヂ?lián)網(wǎng)的金融平臺(tái)的貸款,完全是根據(jù)大數(shù)據(jù)分析的個(gè)人信用貸款,比現(xiàn)在的銀行體系貸款更有效率,而且比銀行的壞賬率還要低得多。
圖3 小微金服集團(tuán)的大數(shù)據(jù)業(yè)務(wù)體系
傳統(tǒng)的計(jì)算已無(wú)法處理海量的數(shù)據(jù)。云計(jì)算技術(shù)具有超大規(guī)模、虛擬化、高可靠性、通用性、高可擴(kuò)展性、按需服務(wù)等特點(diǎn),通過(guò)虛擬化、自動(dòng)化、標(biāo)準(zhǔn)化的手段,有效提高數(shù)據(jù)的計(jì)算和處理能力、技術(shù)系統(tǒng)的建設(shè)、運(yùn)維和管理水平。2008年,阿里巴巴提出去IOE,其本意是,在IT架構(gòu)中,去掉IBM的小型機(jī)、Oracle數(shù)據(jù)庫(kù)、EMC存儲(chǔ)設(shè)備,代之以自己在開(kāi)源軟件基礎(chǔ)上開(kāi)發(fā)的系統(tǒng)。這實(shí)際上就是指硬件和操作系統(tǒng)的進(jìn)一步標(biāo)準(zhǔn)化,被新型的云計(jì)算技術(shù)所替換,也就是我們常說(shuō)的“云化”,這是互聯(lián)網(wǎng)的發(fā)展模式,數(shù)據(jù)中心正成為社會(huì)信息的基礎(chǔ)設(shè)施
接下來(lái)介紹一下云創(chuàng)大數(shù)據(jù)做的一些應(yīng)用案例。
(1)智慧城市
平安城市是一個(gè)綜合性非常強(qiáng)的特大型管理系統(tǒng),不僅需要滿(mǎn)足治安管理、城市管理、交通管理、應(yīng)急指揮等需求,而且還要兼顧災(zāi)難事故預(yù)警、安全生產(chǎn)監(jiān)控等方面對(duì)圖像監(jiān)控的需求,同時(shí)還要考慮報(bào)警、門(mén)禁等配套系統(tǒng)的集成以及與廣播系統(tǒng)的聯(lián)動(dòng)。
2012年周克華槍擊案,南京公安局組織了2000名警察去分析監(jiān)控的視頻,上了六套云存儲(chǔ)平臺(tái),有效支撐了破案線索的搜索。
我們構(gòu)建的云視頻平臺(tái),能夠把所有的監(jiān)控系統(tǒng)統(tǒng)合到一個(gè)平臺(tái)上。目前已經(jīng)整合構(gòu)建了南京和宜昌兩個(gè)城市的云視頻平臺(tái),可以通過(guò)人工智能分析視頻中的各種異常情況。比如,在小區(qū)門(mén)口,發(fā)生打架等異常事件,它會(huì)自動(dòng)報(bào)警(視頻打架檢測(cè))。在長(zhǎng)江大橋,我們通過(guò)人工智能可以自動(dòng)分析道路的交通狀況,堵不堵車(chē),有沒(méi)有交通事故。
在視頻監(jiān)控中,看到的人通常非常模糊,對(duì)此,我們發(fā)明了一種新技術(shù)叫視頻DNA,即使犯罪嫌疑人模樣看不清楚,由于每個(gè)人的視頻DNA數(shù)據(jù)都是不一樣的,我們通過(guò)人工智能可以準(zhǔn)確判斷每個(gè)人的差異,把它可視化出來(lái),就能夠識(shí)別出犯罪嫌疑人。前不久我們處理了13個(gè)案子,其中找到了9個(gè)嫌疑人。以前破不了的案子,現(xiàn)在利用視頻DNA技術(shù)就能可能偵破。
我們還做了南京青奧會(huì)的安全防范平臺(tái)——我的南京APP,里面有一個(gè)功能叫做交通大數(shù)據(jù),用戶(hù)可以在APP上點(diǎn)街上的攝像頭,實(shí)時(shí)看到街上的實(shí)況。
圖4 視頻智能分析