實際我們現(xiàn)在處在一個數(shù)據(jù)的海洋當中。2019年的春運是世界上最大的人口遷徙,有30億人次的流動。2018年“雙十一”有2135億的銷售額度?,F(xiàn)在,每天會產(chǎn)生450億的微信條目。手機的網(wǎng)民已經(jīng)達到8.17億。總體來說,我們國家的GDP數(shù)字經(jīng)濟占比已經(jīng)達到了34.8% ,超過了1/3。大數(shù)據(jù)時代,主要的背景是什么?現(xiàn)實世界有多大程度上可以被數(shù)據(jù)表示?我們的社會像素正在急劇提升。這個“像素”來自到處可見的感測設備——探頭、智能手機、可穿戴設備、車載設備。這些使社會的數(shù)字化程度越來越高,數(shù)據(jù)的粒度因此也越來越細。也就是說,數(shù)字化生活的兩個要素之一:像素,數(shù)據(jù)的粒度已經(jīng)具備。像素夠高的時候我們要干什么?形象地說是“成像”,就像手機、相機,像素越高成像的質(zhì)量可能越好,因此,成像是我們數(shù)字化生活中另外一個重要的要素,像素和成像對應起來,就把數(shù)據(jù)和算法聯(lián)系起來了,這就是我們所說的大數(shù)據(jù)時代。
大數(shù)據(jù)時代可以分成兩個階段,我們用商務的形態(tài)來說明這個問題。第一階段是數(shù)據(jù)商務階段。不斷地把現(xiàn)實生活中的要素、人財物,都進一步數(shù)據(jù)化,同時根據(jù)這些數(shù)據(jù)化的人財物進行算法的應用。第二階段是算法商務階段。當像素足夠高的時候,重點就變成了成像了,也就是說,重點變成算法應用。
數(shù)據(jù)商務階段和算法商務階段都圍繞著數(shù)據(jù)和算法進行,但是重點有所不同。數(shù)據(jù)商務階段就像做菜一樣,數(shù)據(jù)化的過程就是不斷準備材料的過程,不停地增加和豐富材料,然后根據(jù)已有的材料提供不同的菜品。但是算法商務階段是材料已經(jīng)足夠豐富了,這個時候要比的就是手藝了,你是不是能夠做得更好、更多。這就是我們所說的算法進階及應用創(chuàng)新,如“智能+”,我們可以用更加高尖的智能技術(shù),包括人工智能的很多技術(shù)在現(xiàn)有的大規(guī)模數(shù)據(jù)下進行應用。
人工智能的難點
是黑盒子問題
大數(shù)據(jù)的沖擊力量現(xiàn)在看來還在加劇,其中有一個力量非常值得關(guān)注,那就是人工智能。
當人工智能遇到大數(shù)據(jù)的時候,現(xiàn)在井噴式的發(fā)展才變成了可能。其實人工智能是現(xiàn)在這個時代中很多技術(shù)的一類,它本身已經(jīng)發(fā)展好幾十年了,但是為什么在近些年才得到了快速發(fā)展?
其實人工智能技術(shù)和這幾個關(guān)鍵詞有關(guān),那就是“ 學習、訓練、推理、演化、智能、智慧”,也就是說,它是關(guān)于這些關(guān)鍵詞的一類技術(shù)。特別重要的一點,它要根據(jù)大量的數(shù)據(jù)來進行學習和預測,就是從數(shù)據(jù)中學習,建立模型,并用于預測未來。
過去為什么不行呢?比如本來想學一個圓,但是過去的數(shù)據(jù)只有一個半圓,你說它怎么能學出這個圓呢?所以,進入大數(shù)據(jù)時代,當我們的數(shù)據(jù)有足夠的粒度和像素的時候它才成為可能,因為人工智能的主流技術(shù)首先是要基于大規(guī)模數(shù)據(jù)進行學習。
其次,人工智能算法本身需要非常強的計算能力,也就是算力,只有在大數(shù)據(jù)時代,有了云計算平臺、數(shù)據(jù)傳輸、數(shù)據(jù)的流通、數(shù)據(jù)的管理、諸如5G技術(shù)等,才能為進一步的大數(shù)據(jù)應用創(chuàng)造條件,為人工智能的發(fā)展提供非常好的環(huán)境和支撐。
現(xiàn)在可以看到我們身邊其實已經(jīng)有很多人工智能產(chǎn)品了,比如工業(yè)機器人、財務機器人、作業(yè)機器人、下棋機器人、能做詩作畫作曲的機器人等,這些機器人可以做很多我們過去認為不可能的事情。
人工智能在未來會波濤洶涌,一浪高過一浪地發(fā)展。但是它本身也有局限,目前的大數(shù)據(jù)技術(shù)特別是深度神經(jīng)網(wǎng)絡這樣的技術(shù),基本上屬于“黑盒子”的技術(shù),可以算得非常準,但是“為什么”還說不大清楚。在這種情況下,在一些重要的應用領(lǐng)域就受到局限,因為如果不知道“為什么”就不敢用這個方法做重要決策,如果不能通過非常清楚的機理來說明,實際它未來的應用也是有局限的?,F(xiàn)在,業(yè)界和學界都在攻關(guān)“可解釋人工智能”,實際就是人工智能在輸入和輸出之間,在數(shù)據(jù)和預測的結(jié)果之間,從數(shù)學上來講需要一點定理,一些形式化的機理。從認識論上來講需要一些因果關(guān)系。
現(xiàn)在這么熱鬧的人工智能,很多都是過去成果的工程化和產(chǎn)品化。它本身的理論突破,包括提到的可解釋性,也是大家在未來關(guān)注的重點。
不管怎么說,人工智能的應用已經(jīng)深刻地影響到我們了。作為人類,我們自己創(chuàng)造了一個“亞種”叫做機器人。機器人的行為是不是都在我們?nèi)说脑O想之中呢?會不會干一些我們想不到的事情呢?似乎這個擔憂是必要的。所以機器行為學應運而生。當人知道和我們打交道的是機器人時,人到底會有什么不同?機器如果只是模擬人的行為,那么我們用不用擔心它會做一些其他的事情?當人和機器人一起互動時,會不會有其他的一些問題出現(xiàn)?這些問題實際是很革命性的。傳統(tǒng)社會學、管理學、經(jīng)濟學、心理學等都是研究人、由人構(gòu)成的組織的行為,由人形成的網(wǎng)絡的行為。隨著各式各樣的機器人越來越多地出現(xiàn)在我們身邊,越來越多地替代人的工作,越來越多地挑戰(zhàn)人們在智力、計算上的能力,這個擔憂或者這樣的研究是非常必要的。所以,我們要研究機器如何塑造人類的行為,人類如何塑造機器的行為,以及人機協(xié)作的行為。最新的《自然》雜志上有一篇文章也是呼喚學界、業(yè)界關(guān)注機器的行為以及機器和人的行為。
運用大數(shù)據(jù)
要重視商業(yè)倫理
實際大數(shù)據(jù)的使用本身有很多令人擔憂之處。雖然科技發(fā)展飛速,但是人們使用科技是帶有價值取向的。比如大數(shù)據(jù)殺熟。
在傳統(tǒng)的營銷、管理里面我們都希望了解客戶的行為,更好地為他們服務。在市場的環(huán)境下我們也說,既然有人愿意用高價買,那就可能要給他提供更好的服務。但是在大數(shù)據(jù)環(huán)境下,這種處理有個度的問題。第一客戶是否知道他的信息被收集,第二他是否愿意真的出高價買。作為企業(yè)來講,又有經(jīng)營哲學上的思考。企業(yè)是以盈利為中心,還是以客戶為中心?當以客戶為中心時,客戶滿意與否就變成了主要的KPI,就是主要的決策考量,如果光考慮企業(yè)的盈利,而不考慮客戶,可能就不太會考慮用戶的感受。實際上大數(shù)據(jù)殺熟是在商業(yè)倫理層面的問題。
還有剛才提到的APP權(quán)限的濫用,以及數(shù)據(jù)的泄露,回到我們最開始提到的劍橋分析公司的例子,這家公司2018年就陷入了數(shù)據(jù)泄露和商業(yè)倫理的丑聞,最終關(guān)門了。不管怎么說,在大數(shù)據(jù)這個時代我們跟數(shù)據(jù)打交道就會碰到一系列社會問題、法律問題、道德問題,需要在企業(yè)層面、商業(yè)層面,在社會和政府層面立法立規(guī),在個人層面、在道德的層面大家來共同努力解決這些問題。技術(shù)發(fā)展特別快,這些問題的出現(xiàn)也變得越來越重要,我們應該有特別強的緊迫感,來更好地面對這些問題。
感測和響應大數(shù)據(jù)時代
過去的20年我們經(jīng)歷了特別大的技術(shù)變化。20年前,中國網(wǎng)民是62萬,互聯(lián)網(wǎng)普及率只有0.03%,網(wǎng)站一千多家?,F(xiàn)在中國網(wǎng)民已經(jīng)有8.29 億,互聯(lián)網(wǎng)普及率達到 59.6%,網(wǎng)站523 萬個,上網(wǎng)時間每天人均4小時。
在這樣的時代中,簡單地總結(jié)一下,我覺得就是兩個詞,“感測”和“響應”。時代的變化太快,我們應該敏銳地主動地感測和了解這個變化,同時不管是企業(yè)還是個人要作出自己的準備和自己的響應,因為大數(shù)據(jù)作為一個時代會伴隨我們相當長的時間。在未來的某一天,可能由大數(shù)據(jù)衍生出一個新的概念、一個新的內(nèi)涵、一類新的技術(shù),可能會變成一個新時代的符號,所以當下我們要面對大數(shù)據(jù),未來我們要融入新時代。