5G,也就是第五代移動通信技術的簡稱。它同互聯(lián)網革命一樣,會給經濟活動帶來“底層邏輯”的變革,比3G、4G技術的影響力范圍更廣。
3G、4G 技術的主要影響局限在生活消費領域,作為消費者的我們已經強烈地感受到了,但這些技術對經濟運行的基本構架影響還不算大。5G 跟4G 相比,不僅速度加快了10 倍,它的超大帶寬、超低時延和超可靠性等特點,使它可以直接影響工業(yè)生產、公共服務等眾多領域,其應用場景的廣度和深度都會得到極大拓展。
要正確認識5G 的意義,我們必須先了解幾個基本技術概念。
業(yè)界一般將5G 的應用場景分成三大塊:高速移動寬帶(eMMB)、高可靠低時延通信(URLLC)和大連接物聯(lián)網(mMTC)。
如何理解5G 三大應用場景的分類呢?
相對4G,5G 帶來了更快的速度、更短的延遲、更強的穩(wěn)定性、更低的能耗,以及能支持更多用戶。正好是5 個“更”,我們可以將其稱為5G 的5 個G(Geng,更)。大部分人只關注第一個G(更):“更快的速度”,也就是讓手機的上網速度更快。但對后面幾個G(更)的關注比較少。
“更短的延遲,更強的穩(wěn)定性”對應的是高可靠低時延通信(URLLC)。4G的響應速度大概為10~50毫秒,而5G可以控制在1毫秒以下(實測數(shù)據(jù)是平均0.64毫秒)。而且,這種低時延的可靠性相當高,可以達到99.999% 的可靠度。
5G 通信在終端高速運動和不斷切換基站鏈接的情況下,仍可以保持信號的穩(wěn)定和低延時,這是它強穩(wěn)定性的一個體現(xiàn)——即使以500 千米/小時的速度運動,5G 終端仍可以穩(wěn)定地從一個基站切換到另一個基站,信號時延和可靠性仍可以得到保證。
超低延遲和高可靠性讓5G 的應用范圍比4G 更廣闊,它將對以下領域影響較大:工業(yè)控制、交通安全、遠程制造、遠程手術等。
關于穩(wěn)定性的應用意義,我們可以舉兩個例子。
第一個例子,稱為“空客320 計劃”——用5G 設備在飛機上替代所有的信號傳輸電纜和光纜。這個研究項目一旦成功,可以讓空中客車(Airbus)這樣的大型客機重量減輕接近17 噸。
第二個例子,一家全國知名的大型化纖集團企業(yè),在“中國制造業(yè)企業(yè)500強”中排名200 余位。化纖長絲是他們的主打產品,每一根長絲需要72 根細絲絞合在一起才能做出來。每根細絲的直徑只有7 微米,也就是只有頭發(fā)的1/10 那么細。在機器加工過程中,經常會出現(xiàn)“飄絲”的現(xiàn)象(也就是有的細絲飄到別的長絲上去了),這樣就會出現(xiàn)殘次品。
類似的問題每年會給工廠帶來幾千萬的損失。以前只能是工人拿著手電筒巡檢,每半個小時就把所有的機器檢查一遍,但這樣做效率很低,因為細絲太細,而且在機器上傳送速度很快(4000米/分鐘),肉眼觀察十分困難。
但在5G 技術成熟以后,公司采用8K 高清攝像頭結合巡檢機器人,利用5G技術的低時延特性大大提升了產品的優(yōu)品率,徹底解決了長絲卷繞工藝中的“飄絲”檢測難題。該系統(tǒng)可以在幾百根微米級的細絲以4000 米/分鐘的下絲速度通過多孔軌道過程中,發(fā)現(xiàn)卷繞中出現(xiàn)的飄絲、漂雜等問題,徹底解決了質檢環(huán)節(jié)中的人工成本高、漏檢誤檢率高、次品率高等問題。
飛機的信號傳輸對可靠性要求極高,化纖檢測則要求是24小時不間斷地監(jiān)控機器運轉。在這兩種情況下,所需的網絡傳輸速度雖說4G 和WiFi 也能達到(當然5G 更快、更有保證),但是在高速傳輸過程中的可靠性卻很差,無法保證接收端與發(fā)射端長期且不間斷地連接。這種不可靠性在我們日常使用中不會存在什么大的問題,比如,我們在玩手機時,信號中斷幾秒鐘,大部分情況下我們是察覺不到的,即使是在線看視頻或聽音樂,也會因為緩存而感受不到卡頓。
但在飛行安全和工業(yè)生產領域,4G 的這種低可靠性就是不可接受的。正因如此,4G 和WiFi 技術在生活消費領域得到了廣泛應用,但在工業(yè)等其他領域中的使用率就相對較低了。
此外,像遠程視頻會議,雖然4G 和WiFi 信號也勉強可用,但其穩(wěn)定性較差,如果參與人數(shù)較多,則對實際會議的替代能力就相對較差。而在5G 的高速及高可靠性支持下,遠程會議才有可能較大規(guī)模地替代面對面的交流,進而徹底改變以往的商務溝通模式。
所以,我們才說,5G 技術會給我們的生產生活帶來顛覆性的改變,這也是它超越4G 技術的地方。
“更低的功耗,支持更多用戶”對應的是物聯(lián)網(mMTC)。5G 的連接密度相對4G 提高了10 ~ 100 倍,可以達到每平方千米數(shù)百萬個。例如,城市規(guī)劃的標準是每平方千米1 萬人,熱門景區(qū)在節(jié)假日期間的人流密度不會超過每平方千米100 萬人,所以,4G 基站的接入密度用來給大家玩手機是沒問題的。但如果要實現(xiàn)物聯(lián)網,其連接數(shù)量就很容易突破上限——水表、電表、燃氣管道地下管網,天上飛的、地上跑的、身上穿的、家里用的各種智能設備——假如要實現(xiàn)“萬物互聯(lián)”,如此大的接入密度,僅靠4G 技術是撐不住的。
物聯(lián)網的特點是信號小、數(shù)量大,而且芯片植入以后長期不用更換,很多場景要求在不更換電池的情況下芯片能連續(xù)使用十年以上,因此能耗必須控制到極低?!皵?shù)字地球”的概念早在2004年就被提出來了,中國從2008年開始就力推“智慧城市”建設。好多想法在當時看來近乎科幻,到現(xiàn)在也只有很小一部分實現(xiàn)了,主要就是遇到了通信技術瓶頸。隨著5G 時代來臨,技術瓶頸被一一突破,物聯(lián)網和智慧城市的概念將會迎來新一輪爆發(fā)。
5G技術的研發(fā)、制造,十多年前就開始了。開發(fā)5G 編碼的時間是2008年;而5G 的基礎設施布局,是商用牌照發(fā)放前后的一兩年;5G 的場景應用,則是基礎設施布局之后十多年甚至是更長時間。然而,從2019年下半年5G 牌照正式發(fā)放開始,“5G 革命”就進入了下半場,以場景應用來帶動其他產業(yè)全方位進步,將會成為驅動這個下半場的核心動力。
5G革命進入商業(yè)應用和產業(yè)化階段以后,我們就可以按照商業(yè)和產業(yè)的邏輯,來對5G 應用場景進行新的分類,如表1 所示。
表1 5G 應用場景與初步實踐
從這張表格,我們可以看出,5G 正在深入滲透進社會運行的方方面面,對生產、生活、公共服務等方面產生巨大的影響。這就預示了——今后,在這每一個場景中都會產生巨大的投資需求和產業(yè)空間,無數(shù)的機會等著我們去挖掘。
純粹從技術的角度來講,從1G 到5G,是通信技術發(fā)展的5 個階段。但從互聯(lián)網的角度來看,我們認為可以分為3 個時代:第一代互聯(lián)網是有線網絡時代,電話線、網線、光纖線都算,而1G 和2G 通信還不算互聯(lián)網技術;第二代互聯(lián)網是移動互聯(lián)時代,從3G 時代開始,移動通信才算融入了互聯(lián)網,3G 和4G 都屬于第二個時代;第三代互聯(lián)網是萬物互聯(lián)時代,標志就是5G。
在第一個互聯(lián)網時代,歐美企業(yè)發(fā)展了很多年以后,我們才開始跟進,進而出現(xiàn)了騰訊、阿里巴巴、百度、新浪、搜狐等一大批互聯(lián)網科技公司,基本上都是模仿國外的應用場景和商業(yè)模式。
第二個互聯(lián)網時代,是由美國的蘋果公司和谷歌公司為代表開啟的,但國內很快就跟進了,涌現(xiàn)出了微博、滴滴打車、抖音、移動支付、餓了么等新的應用創(chuàng)新以及一大批智能手機生產商,在發(fā)展后期基本實現(xiàn)了與國際創(chuàng)新的同步。其中,抖音短視頻和移動支付更是走在了世界前列。
而在第三個互聯(lián)網時代,以華為為代表的中國公司開始掌握主動權,中國很有可能會成為高科技企業(yè)變革的“領頭羊”——在硬件和軟件領域都將如此。這時候,高科技企業(yè)創(chuàng)新的空間會更加廣闊,也必然會有更多顛覆性的創(chuàng)新技術出現(xiàn)。
在表格“5G 應用場景分類”中——“場景技術特征”這一列,除了eMMB、mMTC、URLLC這3 個5G 技術特征以外,AI這個詞也經常出現(xiàn)。
AI,也就是人工智能(Artificial Inteligence)技術的簡稱。5G的諸多關鍵應用場景都必須要有人工智能技術的支持才能實現(xiàn),比如自動化生產、個人智能助理等。由于5G 的傳輸數(shù)據(jù)量極大,這些數(shù)據(jù)如果不能得到高效的分析處理,5G技術的意義就會大打折扣,難以取得相對于4G 等上一代通信技術的革命性優(yōu)勢。
人工智能是一種軟件技術,跟芯片和控制器等硬件結合起來,可以用來組織生產,駕駛汽車飛機等交通工具,給病人診斷疾病,解決各種數(shù)學、物理難題,等等。
無線通信技術分為一代、二代、三代、四代、五代,分別對應1G、2G、3G、4G、5G。人工智能技術也可以分為好幾代,目前主要是四代,技術上可預見的還有第五代,本書所關注的人工智能技術主要是第四代。
人工智能的四代劃分,主要以其所解決問題的復雜程度為標準。
第一代,是簡單組合的電腦控制系統(tǒng),只比人工控制模式復雜一點兒。比如,家庭常用的洗衣機,它的人工控制模式就是:按一個鍵放水—再按另一個鍵洗衣服—再按一個鍵脫水—再按一個鍵烘干,人為干預每一個環(huán)節(jié)。后來,人們在洗衣機中植入芯片和軟件程序,只需按一個鍵,洗衣機就可以自動完成放水、洗衣服、脫水、烘干的全過程。而且,洗衣機還可以根據(jù)衣物的重量來自己決定進水量和洗衣的時間。
把一步一步的人為操作,變成由電腦程序來一次性完成的工作,再讓機器自己根據(jù)一些簡單的變量做出選擇——這就是第一代人工智能。嚴格來說,它并不“智能”,只是實現(xiàn)了控制步驟的整體整合,它在任何方面都無法跟人類的智力水平相提并論。
第二代,可以在某些方面達到或者超過人類思維速度的復雜決策程序,也可以在某些方面與人類交流。比如,電腦可以跟人下象棋,一般人下不過電腦,但專業(yè)棋手卻很容易贏過電腦——這比全自動洗衣機的程序復雜多了。我們玩電腦單機游戲,以電腦為對手,一般會稱之為AI 對手——指的就是第二代人工智能。
在生活中,掃地機器人這種更復雜的家電出現(xiàn)了,它基本上可以在掃地這個方面代替人類——程序設定好之后自動充電、自動清掃,全程不需要人工參與。電腦可以實現(xiàn)基本的語音識別,并根據(jù)語音命令行動,還能夠根據(jù)歷史數(shù)據(jù)分析總結出用戶的一些偏好?,F(xiàn)在,大部分貼著AI 標簽的消費品和應用軟件,基本都是采用了第二代人工智能技術。
第三代人工智能,是使用了概率算法并可以進行簡單機器學習的人工智能。在規(guī)則清楚的情況下,這一代人工智能已經可以在某些特定方面超過人類最頂尖的專業(yè)選手。2016年3月,擊敗韓國圍棋選手李世石的谷歌軟件阿爾法狗(AlfaGo) ,就是第三代人工智能的產物。它計算棋路的方式還是人類給它設定的,也就是基于決策樹的“蒙特卡洛方法”——把窮舉問題變成概率問題,突破了計算機決策的計算速度上限,因此看起來更加智能了。另外,漢字的手寫輸入和掃描識別技術,也是基于第三代人工智能才得以實現(xiàn)的。
第四代人工智能,是可以進行自主深度學習的人工智能。人類并不需要告訴電腦該怎么做,只需要給出目標,而且是人類自身體力和智力都難以達到的目標,人工智能自己就會去學習并找到達到目標的方法和路徑,幫助人類更有效率地完成目標,甚至完成以前人類無法達到的目標。谷歌公司研發(fā)的新一代圍棋軟件阿爾法元(Alpha Zero)就是基于第四代人工智能做出來的。在它面前,橫掃一切人類圍棋大師的“阿爾法狗”就是幼兒園水平。“阿爾法元”對局“阿爾法狗”100 盤,連勝100 盤。而且,“阿爾法元”的下棋風格已經跟人類完全兩樣,縱觀人類上千年圍棋史,也找不出這個風格的布局方式。
所以,只有第四代人工智能,才算得上是比較完善的人工智能,也才能夠支撐一次真正意義上的產業(yè)革命。
第四代之后是第五代。第五代人工智能可能是基于量子計算的人工智能,但目前還停留在理論研究階段,何時可以實現(xiàn)不得而知。這個階段的人工智能不僅可以在某一項具體工作方面代替人類,還可以通過深度學習在諸多方面代替人類,甚至可以把一項完整、抽象而且持續(xù)時間長、場景變化復雜的任務交給它去完成。比如,可以在數(shù)年的時間內獨立照顧小孩或者老人起居,科幻電影中的智能機器人助手在這一階段會成為現(xiàn)實。
當下,“5G+ 人工智能+ 物聯(lián)網”產業(yè)革命尚不能指望第五代人工智能來支撐。有很多關于人工智能技術與人類最終命運的哲學化思考,比如人工智能會不會統(tǒng)治人類、人腦能否與機器大腦融合等,至少也要到第五代人工智能發(fā)展成熟之后,才真正有去思考的意義。
自從計算機發(fā)明以后,人類掀起過三次人工智能熱潮,前面兩次浪潮分別發(fā)生在20 世紀60年代和20 世紀80年代,但最后都“退潮”了,因為人工智能技術沒有產生預期的革命性影響。原因是這兩代技術和人類的思維能力差距太大,無法勝任大規(guī)模的、復雜的工作場景。只有在以深度學習為代表的第四代人工智能技術發(fā)展得比較完善以后,人工智能才能對我們的生產生活產生顛覆性的影響。
第四代技術和第三代技術的關鍵差別在哪里呢?
首先,為了更好地理解第三代技術的原理,我們以大家熟悉的棋類運動來舉例。
早期人工智能的技術,是利用計算機的計算能力實現(xiàn)“窮舉”(在研究對象是由有限個元素構成的集合時,把所有對象一一列舉出來,再對其一一進行研究), 算法完全是由人類程序員編制好的。比如下五子棋,只需要把五個棋子在棋盤上連在一起就可以獲勝,它的變化數(shù)量比較少(相對于現(xiàn)代計算機而言)。所以,只要把所有符合規(guī)則的落子方法都列舉出來,計算機就能找到可以獲勝的下棋方法。
同樣的辦法用來下象棋的話,難度就大多了。因為象棋的變化遠遠超過五子棋,棋子更多,規(guī)則也更復雜,按照21 世紀初期及其以前的計算機運算能力,根本無法實現(xiàn)窮舉。計算機跟人一樣,也就只能看幾步棋,不可能把所有的可能性都窮舉完。1997年擊敗國際象棋大師——卡斯帕羅夫的計算機“深藍”最多也就可以看12 步棋。
那怎么辦呢?以中國象棋為例,只能根據(jù)人類下象棋的經驗來“打分”。比如車是最厲害的子,給它打分是10分,炮和馬差不多,各6分。如果計算機能算出五步棋之內的所有下法,其中的一種是自己丟掉一個車,吃掉對方一個馬,那么就是丟掉10分的同時得到6分,最后算下來不劃算,失去了4分。它就不會采用這種下法。而另外一種是自己丟掉一個車,同時能吃掉對方一個炮和一個馬,那就是自己丟掉10分的同時得到12分,這樣是劃算的。
為什么車是10分,馬和炮是6分呢?計算機并不知道,這是人類根據(jù)經驗給打的分。
除了對棋子打分以外,人類還可以根據(jù)經驗對某些局面打分。比如,當頭炮是有利的局面,可以得5分,而一個卒的得分是2分。為了架起當頭炮,丟掉一個卒就是劃算的,而丟掉一個炮就是不劃算的。沉底炮可以得6分,臥槽馬也可以得6分。還可以再復雜一些,引進一些象棋口訣,比如“三子歸邊必贏棋”,也就是把車馬炮三個棋子都放到敵方棋盤的同一個方向,贏棋的概率就非常高。那么這個局面就可以打7分,為了實現(xiàn)這個局面,可以丟掉一個炮或者馬,等等。
通過人類經驗打分,并設計出一套計算規(guī)則,讓計算機對不同的局面打分。這樣,計算機就不用計算到最后,而只需計算未來的五六步棋即可,然后評估得分,選擇得分最高的那種走法就可以了。
這種方法被很夸張地稱為——“神經網絡算法”,聽上去很唬人,很多人聲稱它是對人類神經元決策方式的模擬,但本質上就是對不同要素或事件進行綜合決策,然后進行函數(shù)計算,得到一個數(shù)值,并根據(jù)這個值的高低來做最終決策——打分、函數(shù)和決策的標準都是人類定的。如果把“神經”兩個字去掉,叫“網絡算法”更符合其技術本質。
神經網絡算法——也就是“多要素打分算法”,在一開始,由于打分規(guī)則存在漏洞,還不能囊括棋局的全部變化,所以,人類象棋高手同計算能力不太強的電腦下棋時還有獲勝的希望。但隨著打分技術趨于完善以及計算機能力的提高,如今,在象棋領域,人類中的頂級高手基本上也無法戰(zhàn)勝電腦了。
到了圍棋這里,問題就更加復雜。圍棋規(guī)則簡單,但是棋子數(shù)量眾多,變幻無窮,人類現(xiàn)有的計算機技術根本無法實現(xiàn)窮舉——圍棋的落子可能性有1.43×10768種,可觀測宇宙范圍內的原子總數(shù)也不會超過1080。所以,圍棋的變化比全宇宙所包含的原子數(shù)量還要多上十多倍——圍棋的變化是如此之多,以至于計算機不僅無法窮舉,即使用打分的辦法,也會因為局面變化太復雜而漏洞百出。
為了解決這個問題——“蒙特卡洛方法”被引進了。
所謂“蒙特卡洛方法”,就是把窮舉法變成隨機抽樣法。“打分法”只能提前預測幾步棋,但這幾步棋卻實現(xiàn)了窮舉,本質上就是保留窮舉的同時犧牲計算的步數(shù)。而蒙特卡洛方法,就是不犧牲步數(shù)而放棄窮舉。當計算機面臨選擇的時候,它不會把所有的可能性都計算完,而是隨機選擇一種可能,一口氣把棋下完,然后再看是輸還是贏。所以,計算機可以利用自己強大的計算能力,進行數(shù)量巨大(比如十萬次)的隨機選擇,看輸和贏的概率,最后選擇贏的概率最高的那種方法來下棋。
比如,計算機執(zhí)白棋,人類對手執(zhí)黑棋。假設在某一步的時候,計算機面臨A、B、C、D四種落子選擇,它該選哪個呢?
首先,它假設自己把白棋落在了A點。然后,在符合圍棋規(guī)則的前提下,它開始隨機模擬落子A點以后的局面變化。它會根據(jù)圍棋規(guī)則一步一步地落下黑棋和白棋,一直到最后黑棋和白棋把整個棋盤填滿,這一局結束。這一次隨機落子的結果,假設是黑棋贏了,計算機就記下來:黑棋贏了一次。接著,計算機再來模擬另外一種落子方式,只要遵守圍棋規(guī)則而不管每一次落子是好棋還是爛棋——然后一直下到最后。這一次,可能是白棋贏了,計算機又記下來:白棋贏了一次。
由于每一次都是隨機落子,模擬接下來的整局所需要的計算量只有幾百次,這對計算機而言可謂微不足道。對一秒鐘可以運算3 億次的計算機來說,它一秒鐘就可以模擬出約100 萬個不同的棋局。
它在統(tǒng)計完這100 萬次隨機棋局后,發(fā)現(xiàn)有30 萬次是白棋贏了,70 萬次是黑棋贏了。于是計算機得出結論:把白棋落在A點的獲勝概率是30%。
用同樣的辦法,計算機再模擬100 萬次把白棋落在B點以后的隨機棋局,黑棋贏了50 萬次,白棋贏了50 萬次,勝率就是50%。
再繼續(xù)模擬白棋落子C點和D點的隨機棋局,得到結論:白棋落子C點的勝率是80%,落子D點的勝率是60%。
最后,計算機決定把白棋落在C點,因為勝率更高。
由于計算量巨大,即隨機樣本大,這種對勝率的預測相當準確。而且它不只是算一次——對手每下一步,計算機都會重新預測下一步棋所能取得的勝率,然后再選擇隨機勝率最高的下法。一直到最后,棋盤上的空間越來越小,計算機已經可以窮舉所有可能性,就不再用隨機概率預測,直接選擇勝率百分之百的方式走完殘局就可以。
戰(zhàn)勝圍棋名家李世石的圍棋軟件——阿爾法狗,用的就是這一原理。當然,它也同時采用了“神經網絡算法”的打分法:由一些專業(yè)棋手來根據(jù)圍棋理論對當前局面打分,將一些明顯不應該落子的地方排除掉,以提高計算機的計算精確度。此外,它還使用了簡單的機器學習技術,讓計算機自己根據(jù)實戰(zhàn)經驗對打分法進行改進。
這就是第三代人工智能技術。機器學習還得依賴人類經驗,只不過加入了概率計算,突破了計算機的窮舉極限。
第三代智能技術還有一個很關鍵的問題沒有得到解決:它表現(xiàn)的好壞,主要還是取決于人類自己進行經驗總結的質量。圍棋是一個規(guī)則比較簡單的事情,非常適合采用經驗打分加概率計算的方法來解決,但在一些具體的生產生活場景中,人類自己總結的經驗都不可靠。在這種情況下,第三代人工智能也就很難發(fā)揮作用了。
比如,在人臉識別領域,我們人類一眼就能分辨出圖片中的人臉。但要我們去寫出一個描述人臉特征的算法公式卻非常困難。人臉有什么特點?橢圓形的物體,上面蓋著一層黑色?那剃個光頭就不是人臉了?有兩個黑色的小圓圈,左右是白色的三角形,而且左右基本對稱?那人臉和貓臉、馬臉如何區(qū)分呢? 人類根據(jù)自身經驗可以快速得到一些結論,但這些結論要想總結清晰并改編成計算機語言,則非常困難。
在汽車自動駕駛領域,人類可以經過訓練變成合格的駕駛員。但道路情況千變萬化,要把所有可能的變化都變成精確的計算機語言,其復雜程度就太高了。
人類之所以具有智能,很大程度是因為我們具備從具體事物中抽象出概念的能力,然后用概念去應對一些變化的具體事物。這種能力要想變成計算機所能執(zhí)行的程序,在圍棋這種規(guī)則簡單的場景中尚可實現(xiàn),但在復雜的生產生活場景中,就大大超過了人類程序員所能承擔的工作量。
同第三代相比,第四代人工智能技術就有了質的改變。深度學習可以讓計算機自己從大數(shù)據(jù)中發(fā)現(xiàn)和定義特征。
如何理解這句話呢?
深度學習,就是讓計算機通過實踐來自己尋找打分標準和函數(shù)。比如下中國象棋,一個車的價值是10分還是9分還是11分?“馬后炮”的局面應該得幾分? 這些都是人類經驗結論?,F(xiàn)在人類不再告訴計算機結論了,只告訴它象棋的規(guī)則,讓它自己跟自己下象棋,不斷地下,然后自己總結出規(guī)律,給每個棋子打分,給每個不同的局面打分。計算機自己將規(guī)律總結出來,然后再用這個規(guī)律去跟人下棋,或者跟別的人工智能下棋,或者對照之前的象棋譜比較……總之,通過各種辦法來測試它總結的規(guī)律是不是“靠譜”。
每下一盤棋,計算機都會根據(jù)勝負修正自己所總結的規(guī)律。隨著下棋的次數(shù)不斷增多,規(guī)律就越趨于完美——這也就是“機器學習”的最大特點。計算機總結的規(guī)律數(shù)量巨大,但缺乏指向性,需要海量的實踐數(shù)據(jù)才能讓其所總結的規(guī)律最終優(yōu)化到可以戰(zhàn)勝人類高手。
計算機的計算速度極快,而且它可以24小時不間斷地下棋來改進自己總結的規(guī)律。因此,在棋類運動方面,通過機器學習成為高手是比較容易的?!鞍柗ㄔ保ˋlpha Zero,即谷歌的DeepMind 系統(tǒng))就是讓電腦自己和自己下棋來總結規(guī)律。
機器學習可以用于更復雜的領域。我們以圖片識別為例來說明。
第三代人工智能技術,是人類程序員先輸入一些判別各種物體特征的程序和算法,然后計算機再根據(jù)這些特征去判斷圖片上有沒有符合這些特征的,最后識別出來。由于圖片千變萬化,識別率長期以來都非常低,之前無數(shù)專業(yè)人員的努力,也就能讓計算機的識別率每年提高1% 左右。在2012年之前,頂級的算法最多也就能實現(xiàn)大約75% 的識別率。
2012年,這個局面被徹底改變了,電腦識別率一下提高了10 個百分點。此后,人臉識別等技術才具有了真正的實用性,被普遍應用到各個領域。
這個突破性的技術,就是深度學習。
同下圍棋一樣,人類給計算機設定了識別圖片的規(guī)則,然后讓它自己去嘗試。這個規(guī)則很簡單,就是讓它把一張圖片壓縮。比如,將一張1000 萬像素的圖片壓縮成100 萬像素,然后,再把這張100 萬像素的圖片還原成為1000 萬像素的圖片。同時,給計算機設定一些人類已知的各種數(shù)學工具,以供其使用。剛開始,計算機會隨機壓縮圖片,不過,如果沒有找好規(guī)律,壓縮之后會丟失掉很多圖片信息,最后還原出來的圖片同原圖對比差別較大。
慢慢地,經過萬億次的計算之后,計算機會自己發(fā)現(xiàn)一些規(guī)律。比如,某些圖片的某個部分A 與另一個部分B 是完全一樣的,那么它就可以只記錄A 部分的像素,然后記錄B 部分在圖片中的位置,刪掉B 部分的像素數(shù)據(jù)就可以了。 這樣就把圖片壓縮了。
再進一步,計算機可以找到一些概念性的總結,比如正方形的圖案、等邊三角形的圖案等。這樣,就只需要保留一條邊的數(shù)據(jù),然后加上“這是一個正方形的圖案的一條邊”或者“這是一個等邊三角形的一條邊”這個標志,就可以把這個圖案完整復原出來。如此,可以節(jié)省很多的空間,提高壓縮圖片的速率。
計算機不會有“正方形”和“等邊三角形”的概念,它只會把這些概念顯示為一串特征代碼,比如正方形是它發(fā)現(xiàn)的第一萬個圖形特征,它的代碼就可能是——10011100010000。這個時候,當人類看到計算機總結的這個圖案特征其實就是我們說的正方形,就輸入一個指令,告訴計算機,這個編碼為10011100010000 的圖案特征,我們人類叫作“正方形”。這樣,計算機就掌握了正方形這個概念。以后再輸入“正方形”的搜索指令,計算機就能快速地從無數(shù)圖片中找到正方形圖案。至于計算機自己是如何定義正方形特征的,人類可以不用管,人類只需要把計算機自己找到的這個特征的編碼和我們人類語言給它的定義連接起來就可以了。
運用這樣的原理,谷歌讓每秒鐘可以進行幾百萬億次計算的計算機反復對1000 萬張圖片進行“壓縮、復原、對照”。通過三天的運算,終于讓計算機發(fā)現(xiàn)了“人臉”這個特征。只要它在圖片中發(fā)現(xiàn)符合“人臉”這個特征的圖案,就會用一組特殊算法對這部分圖案進行壓縮,比如人的眼睛左右部分是基本對稱的,只需要記錄一只眼睛的數(shù)據(jù),然后記錄另一只眼睛的不同之處,就可以將圖片信息壓縮差不多一半。但計算機并不知道這個特征叫作“人臉”,它只是發(fā)現(xiàn)這個特征對壓縮圖片很有用,就對它進行編碼處理。這個時候,人類只需要告訴計算機:你發(fā)現(xiàn)的這個特征,我們叫作“人臉”。以后,我們只需輸入“人臉”搜索的指令,計算機就可以從無數(shù)的圖片中快速地把符合指令要求的人臉找出來。
“輸入—壓縮—復原—對照檢驗—改進”,對這5 個步驟反復進行,就可以讓計算機像人一樣,找到海量信息數(shù)據(jù)中的關鍵特征,并對其進行編碼處理。用這樣的辦法,我們就可以不用將人類的經驗特征一條一條地總結成計算機語言輸入電腦了,只需要編碼計算機自己總結出來的特征中與人類所總結的特征相符的東西就行了。
這個學習過程有時候需要人去監(jiān)督修正,有時候不需要,如此也就分出了有監(jiān)督的機器學習和無監(jiān)督的機器學習。計算機發(fā)現(xiàn)的壓縮規(guī)律本身還可以再作為輸入結果,進行再壓縮和再復原對照檢驗,變得更為抽象和精煉,這就是第二層的學習。層數(shù)增加到三層以后,就可以稱之為“深度機器學習”。谷歌的人臉識別技術,就是經過多層機器學習之后才逐漸趨于完善的。
目前,人們對新一輪人工智能的看法大體比較一致,主要有以下兩個看法。
第一,第四代人工智能還是有局限的人工智能技術。從技術上來看,要發(fā)展到人類水平智能(即通用人工智能或強人工智能)仍然存在巨大的障礙,達成該目標還很遙遠。
第二,人工智能已經具備廣泛的實用價值,將極大地改進人類認識世界和改變世界的模式,同時還會取代很多重復性高、技能要求不高的崗位。在這一輪人工智能技術的沖擊下,財務會計、客服代表、股票交易員、律師助理、司機、流水線工人等職業(yè)將會逐漸消失。
從產業(yè)經濟的角度來說,我們只需要考慮第二個方面,而無須期待或擔心人工智能超過人類及其之后的影響。諸如機器控制或者統(tǒng)治人類、人類通過電腦實現(xiàn)意識永生之類的事情,這些都還屬于科幻小說家的工作領域,不在本書研討的范圍之內。
盡管如此,深度學習的革命性意義仍然不容小覷。它讓計算機掌握了總結抽象規(guī)律的能力。這道關鍵的門檻邁過去之后,人工智能的應用范圍必將得到極大拓展。
人類不再需要代替計算機去總結規(guī)律,只需要給計算機提供足夠大的樣本數(shù)據(jù),然后告訴計算機需要什么樣的結果,剩下的絕大部分工作,就可以交給計算機來完成了(學習過程的一些關鍵節(jié)點還需要人類監(jiān)督干預,這樣可以保證學習結果精確可用)。這樣,人工智能所能解決問題的廣度,就可以超過人類程序員的總結能力和代碼輸入的工作量,幾乎是可以無限擴展了。
盡管在不同行業(yè)、領域的具體應用過程中,需要做的改進和有待突破的技術細節(jié)還有很多,計算機經過深度學習以后并不一定會得出肯定有意義的結果,整個過程仍然需要人類的監(jiān)督和輔助,但對于這些困難,只要消耗人類一定的人力、財力就可以完美解決了。
駕駛汽車就是典型的被人類所掌握的重復性工作。如果需要人類一條一條地輸入注意事項,告訴電腦該如何開車,需要海量的時間以及人類輸入的代碼,才能窮盡千變萬化的道路情況。但運用機器學習,只需要在足夠多的汽車上安裝圖像、距離、聲音和汽車狀態(tài)傳感器,然后不斷地搜集數(shù)據(jù)進行深度機器學習,讓計算機自己整合安全駕駛與各個傳感器指標數(shù)據(jù)的關聯(lián)。只要數(shù)據(jù)量足夠大,計算機就可以自己找到正確的駕駛方法。
人類的主要工作并不是告訴計算機如何判斷行駛的安全距離,如何確定剎車力度,如何應對突然出現(xiàn)的橫穿道路的行人,或者各種稀奇古怪的障礙物,而是搜集足夠龐大的數(shù)據(jù)和提供足夠大的計算容量,并在關鍵問題上幫助計算機完善修正由它自己總結出來的規(guī)律,確保深度學習向著有意義的方向發(fā)展。
深度學習算法最終不會發(fā)現(xiàn)絕對意義上的完美駕駛規(guī)則,但可以隨著數(shù)據(jù)量的增加和計算能力的提升無限接近這個目標,并最終讓電腦駕駛的安全性大大超越人類駕駛汽車的安全性。
在幾乎所有可以搜集到足夠多數(shù)據(jù)的領域內,這一算法都是可以運用的。
2020年12月,在“阿爾法狗”戰(zhàn)勝李世石四年之后,谷歌公司運用“阿爾法狗”的人工智能深度學習技術,在生物學的一個重要領域“蛋白質結構預測”取得了關鍵突破。這是一個困擾人類數(shù)十年的科學難題,按照傳統(tǒng)的科研方法幾乎就無法解決。但谷歌公司讓人工智能程序自己去對蛋白質結構的數(shù)據(jù)進行學習,人工智能程序在沒學過生物學的情況下,僅僅根據(jù)這些數(shù)據(jù),就自己找到了“蛋白質結構預測”的方法。這是人類運用深度學習解決關鍵科學問題的一個經典案例。它也說明第四代人工智能絕不僅僅是用來玩圍棋這種簡單規(guī)則游戲,而是人類科技研究方法的根本性突破。
以前,人類科學研究總想知道“為什么”,通過因果關系來推導科學結構。但第四代人工智能則可以完全拋開這種傳統(tǒng)思維模式,不需要知道“為什么”, 只需要對數(shù)據(jù)進行超大規(guī)模學習,就能找到問題的解決方案。而對方案背后的原理,計算機不知道,制造計算機和編寫計算機程序的人類也不知道。這是我們認識世界的方法論的一種根本性顛覆和創(chuàng)新。
在未來的數(shù)十年里,深度學習將對人類科研體系產生巨大的推動力,人類科學技術將會掀起新一輪的創(chuàng)新浪潮,并逐步向產業(yè)和商業(yè)領域轉化滲透,從而推動一場持續(xù)數(shù)十年的新興產業(yè)革命。其深遠的影響甚至可能會持續(xù)數(shù)個世紀。
在深度學習算法突破以后,這一輪人工智能的主要問題就從算法問題變成了數(shù)據(jù)問題。也就是說,在搜集數(shù)據(jù)越多、數(shù)據(jù)質量越高的領域,人工智能的替代率就會越高。
目前,人工智能替代人類做得最好的領域,并非大多數(shù)人想象的生產流水線或者汽車駕駛等一些看上去不太需要很多智力和知識的領域。實際上,生產線和汽車駕駛所需要的人類經驗相當復雜,尤其是要把這些經驗轉變成可以由機器自主學習的大數(shù)據(jù)非常困難。這一代人工智能技術對人類工作替代最廣的領域是金融領域——一個看上去技術含量非常高、需要極高智商和復雜知識的領域。
之所以如此,是因為金融領域的信息化基礎最好,數(shù)據(jù)最多也最豐富,而且質量很高。這是因為,金融決策所需要的信息幾乎全都數(shù)字化了。相比于人類,人工智能的優(yōu)勢更顯而易見。早在2014年,高盛便聯(lián)合谷歌開發(fā)了一款由AI 驅動的大數(shù)據(jù)智能分析處理引擎:肯碩(Kensho)。當肯碩被問到:“iPhone6 發(fā)布后,哪些股票會漲”的時候,它只用了不到一秒鐘就給出了精確的答案。
根據(jù)商業(yè)智能公司“聯(lián)盟(Coalition)”提供的數(shù)據(jù):2011—2016年,在全球10 家領先的投資銀行中,從事固定收益業(yè)務、股票和銀行投資業(yè)務的交易員從業(yè)人數(shù)下降了20%以上,而這一趨勢還在繼續(xù)。
交易員逐漸被替代,說明華爾街的傳奇景象已成為歷史,而這只是金融領域變革的一個縮影而已。新聞寫作在人工智能技術的影響下,也發(fā)生了翻天覆地的變化。大多數(shù)人不知道的是,絕大部分新聞是可以用一些固定的模板來寫作的。比如,股市行情、政府新聞發(fā)布會的內容、足球比賽的結果等。它可能會比財務數(shù)據(jù)要復雜一些,不過文字信息的數(shù)據(jù)化不會太難,計算機通過閱讀大量的新聞報道,再加上人工監(jiān)督修正,就可以快速掌握即時新聞的寫作技巧。而且,計算機寫作速度極快,人類新聞記者根本無法企及。
早在2014年,美聯(lián)社與提供自動化寫作服務的公司“自動洞察(AutomatedInsights) ”達成合作協(xié)議,讓機器人“文字工匠”(Word Smith)讀取公司的新聞稿,分析報告和股票表現(xiàn)等信息,按照編輯預先提供的構架,自動生成偏于數(shù)據(jù)分析的財經新聞。經過3 個月的訓練,AI 技術便掌握了新聞寫作的基本規(guī)范,并且比人類寫作錯誤率更低,極大地提高了新聞文章的質量。
騰訊公司所開發(fā)的自動化新聞撰寫程序“夢想寫作者”(Dreamwriter)在不到一分鐘的時間內就可以撰寫一篇商業(yè)文章(包括分析師的評論)。2017年,“夢想寫作者”在財經領域以及科技領域的發(fā)稿量超過2000 篇/ 天,體育稿件500 篇/ 天,內容涉及每天行情報盤、上市公司公告精要報道以及體育賽事每輪每場的消息。如今,人工智能已經能夠代替20% 的傳統(tǒng)新聞寫作工作,其主要代替領域集中在金融和體育新聞領域,并還在迅速擴展中。
金融交易、財務會計和新聞寫作領域的進展及其差異體現(xiàn)了新一代人工智能技術的特點:人工智能替代人類工作的能力,并不是由這項工作中的智力勞動含量所決定的,而主要是由這項工作的可重復程度和數(shù)字化程度所決定的。
即使是一些看上去很簡單的勞動,如果數(shù)字化程度不高,人工智能在該領域的推廣就會遇到極大阻礙,比如照顧老人的家政服務;而一些看上去很復雜的工作,如果能實現(xiàn)高度的數(shù)字化,人工智能就會很容易通過深度學習來掌握技巧代替人類,比如金融交易。
人類眼中的簡單工作和復雜工作的差異,在計算機強大的運算能力面前其實微不足道,只要不包括創(chuàng)新能力,年薪百萬的工作和年薪十萬的工作所需要的計算量幾乎沒有差別,只需要滿足兩個條件,人工智能就可能實現(xiàn)替代。
第一,此項工作是可重復的,不需要創(chuàng)造性。
第二,工作的所有環(huán)節(jié)都可以數(shù)據(jù)化,可以提供海量的人類操作歷史數(shù)據(jù)供計算機進行深度學習。
第一條是本輪人工智能革命的技術上限,即人類的創(chuàng)造性思維仍不可被替代。第二條則需要通過物聯(lián)網和大數(shù)據(jù),并配合5G 技術來實現(xiàn)。
跟5G 革命一樣,這一輪人工智能革命差不多已經進入下半場——底層算法基本趨于完善,接下來最重要的就是比拼應用場景的數(shù)字化能力。誰能夠快速地在具體領域實現(xiàn)全環(huán)節(jié)高質量大數(shù)據(jù)提取,誰就最有可能在該領域的智能化浪潮中取得先機。
負責大數(shù)據(jù)提取的,就是物聯(lián)網建設。
基于物聯(lián)網的大數(shù)據(jù)采集,是當下產業(yè)變革的基石。
物聯(lián)網的關鍵技術,除了5G,就是傳感器,也就是在各種物體上感知動作、圖像、速度、力度、溫度、味道、形變等各種信息的終端芯片。
在當下的產業(yè)革命中,物聯(lián)網傳感器就好像人的末梢神經,5G 就是人的傳輸神經,第四代人工智能就是中樞神經。傳感器將萬物的多維度特征通過5G 輸送給大腦——高速運轉的人工智能,進行決策和控制。同時,人工智能還可以根據(jù)控制的反饋結果來進行深度學習,改進自己的決策模式,從而變得更“聰明”, 并不斷提高控制效率。
從物聯(lián)網衍生出來的是產業(yè)技術概念非常龐雜,如大數(shù)據(jù)、數(shù)字孿生、虛擬現(xiàn)實等。物聯(lián)網傳感芯片將萬事萬物的狀態(tài)轉變成為數(shù)據(jù)信息,通過網絡上傳到服務器,然后由電腦進行分析。這個數(shù)據(jù)量非常龐大,早在2011年,人類剛剛步入4G 時代的時候,81 天內所產生的數(shù)據(jù)量,就已經超過人類幾千年文明的所有信息數(shù)據(jù)總量。
在物聯(lián)網時代,所產生的數(shù)據(jù)量將會是指數(shù)級增長,每兩年翻一番。這些數(shù)據(jù)在人工智能完善以前,大部分很難發(fā)揮作用,因為人類沒有時間和精力來對它們做詳細的分析,發(fā)現(xiàn)其規(guī)律和意義。
在人工智能技術全面成熟后,大數(shù)據(jù)就可以幫助我們建立一個與現(xiàn)實世界對應的“孿生”數(shù)字化世界。在這個“孿生世界”中,一切都會遵照現(xiàn)實世界的規(guī)律運行,我們可以借此來預判現(xiàn)實世界的發(fā)展,進行不限次數(shù)和幾乎無成本的實驗。例如,我們可以在機器出現(xiàn)故障之前就發(fā)現(xiàn)隱患,提前維修或替換……現(xiàn)實世界造出來的汽車、飛機、火箭、宇宙飛船等,都可以在這個“世界”里進行測試,確保安全以后再進行實測,從而降低成本。這就是“數(shù)字孿生”技術。
人工智能通過對大數(shù)據(jù)的深度學習,可以發(fā)現(xiàn)很多人類目前的研究手段無法找到的聯(lián)系。比如,人工智能在分析了大量X 光片以后,可以計算一個人在未來一年猝死的概率,準確度高于人類的頂級專家。尤其是一些在人類專家看起來根本沒問題,人工智能卻發(fā)現(xiàn)其中存在問題的X 光片。事后證明,人工智能的分析是正確的,但我們并不知道它到底是依據(jù)什么做出的判斷。有了深度學習人工智能的幫助,人類只需要提供足夠數(shù)量且正確的數(shù)據(jù),很多難題就能得到解決,比如,通過對氣候和地殼的數(shù)字孿生場景模擬,精確的天氣預報和地震預測將不再是難題。
“5G+ 第四代人工智能+ 物聯(lián)網”,構成了一個完善的新一代人類社會神經系統(tǒng),智能化從感知到傳輸?shù)經Q策的鏈條完全被打通了。目前,這三大樞紐型技術的關鍵難題都已經被突破,而且開始了產業(yè)化應用,這也意味著,我們討論多年的智能化時代真的要來了。受制于第四代人工智能的技術局限,我們不應該把它想象得太科幻,但顛覆性的變革一定會在各個領域顯示出來。在這個過程中,很多產業(yè)會被顛覆,很多人的工作也可能會被“顛覆”,如果無法跟上這股時代的潮流,個人可能會失去眾多機遇,國家則可能失去一個時代。
例如,在教育行業(yè),很多傳統(tǒng)意義上的教師可能會失業(yè)——遠程教育早已變成現(xiàn)實,山區(qū)或偏遠地區(qū)的兒童也可以享受頂級名師教學。人工智能會把所有學生的學習情況進行分析,然后推薦給最適合他水平的老師進行遠程教育,甚至這個老師也可能是人工智能模擬出來的虛擬人物——現(xiàn)在人工智能模擬人類的表情和發(fā)音已無技術性上的困難。
并且,人工智能還能監(jiān)督學生在聽老師講課的時候有沒有專心聽講,這個技術通過圖像識別已經得到實踐應用:一個班,一個攝像頭,就能統(tǒng)計所有人在上課時有多長時間在開小差。然后,人工智能會根據(jù)每個人的學習水平布置不一樣的作業(yè),以確保難度和強度合適,還可以負責批改作業(yè)和一對一講解習題。在未來,體育老師可能比語文、數(shù)學老師更多,因為對人工智能而言,體育教學的難度更大。
在廣州,自動駕駛的出租車已經開始試運營;在美國波士頓,四條腿的、能翻跟頭的機器狗已經開始取代警察進行日常巡邏;在北京和杭州,海底撈、五芳齋等企業(yè)的“智慧餐廳”開業(yè)了,從配菜到上菜的大量勞動力已經被機器人取代。
在華為和小米手機的生產線上,完全無人的“熄燈工廠”正在以每秒鐘一部的速度生產著最新的手機,而且還是不同型號的手機混合生產,不需要跟傳統(tǒng)流水線一樣只能規(guī)模化而犧牲個性化。要看到,智能制造的前景并不是機器換人,而是機器人換機器——人工智能控制的機器人可以像人類一樣,隨時根據(jù)工藝、材料、設計的不同,變換工作方式,生產不同類型的產品,而不是像機器一樣,只能重復一套固定的動作。
行業(yè)變革的新聞每天都在發(fā)生,科技進步的速度太快,本書中的案例注定是在它剛一出版的時候就落后了。未來還會有什么更新奇的東西?我們無法知道。但現(xiàn)在,我們最應該做的并非毫無邊際地放飛想象力,暢談人類命運,而是認真地思考“怎么辦”。
作者簡介:李曉鵬,經濟學博士,中興大城首席經濟學家。著有《中國崛起的經濟學分析》《城市戰(zhàn)略家》《中國的產業(yè)政策》《中國的產業(yè)規(guī)劃》《從黃河文明到“一帶一路”》(第1-3卷)等書。
文章摘自:《人工智能5G和物聯(lián)網時代的中國產業(yè)革命》
出版社:天津科學技術出版社有限公司
銷售鏈接: