張偉娜,黃 蕾,張 箴
(工業(yè)和信息化部中小企業(yè)發(fā)展促進中心 數據智能研究部,北京 100082)
目前,以人工智能、區(qū)塊鏈、大數據、云計算等為代表的新一代信息技術正在成為推動中國數字經濟發(fā)展的新動能。人工智能作為新一輪產業(yè)革命的重要引擎,是推動實體經濟發(fā)展的重要驅動力,其開放創(chuàng)新已經上升到國家戰(zhàn)略。區(qū)塊鏈自2016 年首次被列入《“十三五”國家信息化規(guī)劃》以來,其技術發(fā)展持續(xù)推動產業(yè)創(chuàng)新,并不斷提高區(qū)塊鏈新興領域產業(yè)優(yōu)勢??梢?,區(qū)塊鏈和人工智能是兩種技術趨勢,并具有各自的顯著特征及開拓性,且其發(fā)展側重點各有不同:區(qū)塊鏈的重心在于保持記錄、認證和執(zhí)行的準確,而人工智能則助力于決策、評估和理解某些模式和數據集,最終產生自主交互[1]。一方面,兩者具有的主要共同特點和需求,將是其融合發(fā)展的關鍵;另一方面,兩者都有助于提高對方的能力,同時也提供了更好的監(jiān)督和問責的機會,如果將兩種技術融合使用,可能是對整個技術(甚至人類)的重新定義。
數據、算力、算法是人工智能的三大核心要素,大量數據為機器學習提供模型訓練的“原料”,多來源、實時、大量、多類型的數據是保障人工智能訓練出高質量模型的基礎支撐;算力是實現人工智能大規(guī)模計算的“助推器”,集群等計算力的提速是助推人工智能訓練和推理效率提升的重要基礎設施;算法是實現人工智能的“動力”,算法的迭代是從技術層面的創(chuàng)新到思維方式的轉變,意味著人工智能乃至社會生態(tài)的無限可能。因此,數據、算力和算法被稱為人工智能的“三駕馬車”。當前,隨著人工智能平臺的落地應用,人工智能技術已在很多行業(yè)領域開始有所應用。
從本質上講,區(qū)塊鏈技術是一個共享數據庫,存儲于其中的數據或信息,具有“去中心化”、“可追溯”、“不可偽造”等特征[2]。區(qū)塊鏈技術利用塊鏈式數據結構來驗證與存儲數據、利用分布式節(jié)點共識算法來生成和更新數據、利用密碼學的方式保證數據傳輸和訪問的安全、利用由自動化腳本代碼組成的智能合約來編程和操作數據,是一種全新的分布式基礎架構與計算范式[3]。區(qū)塊鏈的核心關鍵技術包括共識機制、網絡協議、加密算法、隱私保護、智能合約等。
區(qū)塊鏈技術最初應用在金融行業(yè),作為底層技術與基礎架構應用于比特幣。當前,其巨大的應用價值已經從金融行業(yè)向交通、醫(yī)療、傳媒等其他行業(yè)擴展和延伸。
人工智能以數據為基礎,而區(qū)塊鏈本質上是一種數據存儲方式,或者叫“超級賬本”,體現了數據智能[4]。因此,兩種均與數據息息相關的技術可進行有效結合,互相取長補短,實現技術提升。
區(qū)塊鏈技術具有分布式、公開透明、可追溯、難以篡改等特征,同時結合數據分布式存儲、點對點傳輸、共識機制、加密算法等多種技術,能夠提升人工智能使用數據的真實性、關聯性和有效性,從數據、算力和算法三個層面,提升人工智能技術水平,創(chuàng)新人工智能的協作模式和計算范式,構建人工智能新生態(tài)。
人工智能以其智能化、自動化的特點,通過AI 算法的優(yōu)化以及模擬,可以促進區(qū)塊鏈的自然進化、數據整理,并且有效地防止區(qū)塊鏈節(jié)點分叉的出現,能夠更加有效地處理好區(qū)塊鏈的運轉,智能化提高效率。例如,人工智能可將傳統智能合約改造為智慧合約,有效解決智能合約存在的安全性、易用性、可靠性等問題。同時,人工智能引入的“聯合學習”等去中心化的學習系統,可用來解決區(qū)塊鏈上信息量冗余的問題,能夠提升區(qū)塊鏈延展性,提高系統效率。
當前,人工智能產業(yè)中的海量數據缺乏統一高效的共享機制及管理方式,開源數據集維護性較差導致數據質量參差不齊,數據存在不集中、不統一等問題。此外,人工智能訓練所需的大量數據主要集中在政府和大公司內部[5],監(jiān)管及商業(yè)門檻等條件制約導致數據流通性差、獲取困難,嚴重制約了中小企業(yè)發(fā)展人工智能的步伐。此外,在智能個體做出決策時,需要獲取盡可能多的實時數據作為參考,如果沒有足夠的實時數據或者數據不夠實時,那么這種人工智能也只能是有限智能。
區(qū)塊鏈分布式數據庫將各個節(jié)點進行高效數據共享,使得該網絡上的每個參與者都可以訪問數據,可為人工智能提供更廣泛的數據訪問以及更有效的數據貨幣化機制。首先,依托區(qū)塊鏈技術可搭建去中心化的數據共享平臺,該平臺是基于區(qū)塊鏈網絡信息數據溝通平臺,它的更新和信息記錄由分布式主體共同交互完成,并非由某個權威機構執(zhí)行[6];其次,區(qū)塊鏈數據驗證將促進更干凈、更有組織的個人數據的建立,進而提供更加順暢的數據集成,形成新的數據市場;最后,更多可供分析的開放、共享、實時數據將使機器做出的預測和評估更加準確,生成更加可靠的算法模型,進而提升整個人工智能的技術水平。
算力成本是當前人工智能行業(yè)的一大痛點。隨著網絡數據幾何倍數增長以及算法模型復雜度和精度的提升,人工智能已達千億參數、萬億的訓練數據集規(guī)模,這無疑需要更大更強的運算量。普通人工智能科技公司需要百萬元以上的資金購置GPU 等硬件資源建設計算中心,這對大部分中小型企業(yè)來說成本極高,導致“算力不充足、成本昂貴、難獲取”的現狀普遍存在。在OpenAI 發(fā)布的一份關于AI 計算能力增長趨勢的分析報告[7]中稱,自2012 年以來,創(chuàng)建最先進系統所需的計算量每年增加10 倍,算力已成為人工智能發(fā)展需要從成本效益等方面考慮的一大瓶頸。
區(qū)塊鏈分布式計算能夠將大型GPU 或FPGA 服務器集群、中小型企業(yè)閑散的空閑GPU 以及個人閑置GPU作為計算節(jié)點,共享計算資源,為人工智能提供算力供給。例如,在迅雷的區(qū)塊鏈技術中,用戶通過迅雷玩客云設備,可以分享帶寬、存儲和計算能力等閑置資源[8],雖然每個設備的算力很小,但當設備數量達到一定基數時,累計算力也是巨大的。
此外,如果能將專門為區(qū)塊鏈挖礦機器設計的專用型集成電路芯片ASIC 算力的一部分提供給人工智能,在POW 共識機制中引入對人工智能ASIC 芯片友好支持的矩陣運算和卷積運算,可在使用ASIC 芯片挖礦的同時進行人工智能的分布式加速計算[9]?;蛘卟捎脤θ斯ぶ悄蹵SIC 芯片友好型POW 算法,使得礦機在閑置或被淘汰后,可被用于AI 加速[10]。例如初創(chuàng)公司鈦星區(qū)塊鏈擁有的為算力而生的礦機,在比特幣暴跌而慘遭遺棄后,經處理后繼續(xù)為AI 運算提供算力支持[11],為未來AI礦機的面世提供了可能。
當前,人工智能市場需求較大,但在算法層面,無論在技術方向還是專業(yè)領域上,人工智能算法研發(fā)門檻及對人才隊伍的要求都較高,當下算法僅能滿足少數企業(yè)的需求,而對多數企業(yè)來說,開發(fā)個性化的產品具有很高的技術壁壘和資金壁壘,對于小企業(yè)獨立開發(fā)的難度極大。此外,多數企業(yè)基于開源社區(qū)獲取的開源軟件算法,在實際使用過程中卻有諸多規(guī)則或有版本適配等問題,嚴重限制了應用開發(fā)的靈活度和創(chuàng)新性。在基于開源社區(qū)進行代碼托管或進行貢獻時,管理自有知識產權代碼不當會造成產權泄漏的風險。
利用區(qū)塊鏈分布式協作的特性,可搭建發(fā)布機器學習任務的平臺,利用群體智慧優(yōu)化人工智能算法,并由多個人工智能專家更新維護,實現算法共享。此外,基于區(qū)塊鏈技術可構建算法交易市場,允許用戶在平臺上發(fā)布任務、購買算法模型,在保證知識產權和隱私的條件下激勵開發(fā)者并大大降低AI 使用門檻。
區(qū)塊鏈挖礦需要大量的算力資源和電力資源。目前比特幣每年消耗電量約25.5 億瓦,幾乎和一些小國家的全年耗電量一樣。將人工智能用于POW 共識機制和哈希運算,可大大提高計算效率,從而節(jié)省電力和能源。例如新創(chuàng)企業(yè)Matrix,利用AI 將POW 與POS 結合使用,采用分層的共識機制,首先利用隨機聚類算法在整個節(jié)點網絡中產生多個小型集群并主要基于POS 機制選舉出代表節(jié)點,再由選舉出的代表節(jié)點進行POW 競爭記賬權,相比全節(jié)點的競爭記賬方式,可大大減少能源的浪費。另一方面,智能系統能夠計算出特定節(jié)點優(yōu)先執(zhí)行任務的概率,從而提醒礦工找尋其他路徑并降低總運算成本。此外,人工智能在優(yōu)化能源消耗上的技術也可以應用在區(qū)塊鏈上,進而減少采礦硬件的投資。
與任何其他編程語言一樣,智能合約存在漏洞被黑客利用的安全性問題,且其去人為干預的特性使得漏洞無法線上修復,從而會引發(fā)更嚴重問題或連鎖反應[12],犯錯代價巨大,如The DAO 攻擊事件、以太坊Parity 錢包攻擊事件、美鏈BEC 攻擊事件等[13]。另一方面,智能合約的不可篡改性及升級特殊性,使其實際上僅是基于不同輸入而反饋的一系列確定性的復雜結果,在實際應用中缺乏靈活性,因此,當前的智能合約并不智能,易用性差。
安全性方面,在智能合約形成中,采用基于人工智能輔助的形式驗證技術及動態(tài)約束檢查的方法,能夠在代碼編寫時主動挖掘代碼與合約的漏洞,對智能合約的安全性進行自動化檢查[14]。此外,人工智能生成對抗網絡(GAN)具備博弈的特性,在智能合約中引入GANk 可生成對話網絡形式,在合約生效前不斷進行自我攻防測試來發(fā)現合約代碼是否存在漏洞,極大程度上提高智能合約的安全性。
易用性方面,通過引入人工智能引擎,在圖形界面和交互引導下,普通用戶便可通過自然語言(如中文)輸入交易目的及交易條件,由AI 把人類的自然語言轉換成對應的腳本語言來編寫智能合約程序,自動生成可用的智能合約。同時,通過AI 對更多合約樣本的深度學習,實現對更復雜合約的處理。如全球首個基于智能合約的AI 對話服務平臺Jarvis Plus[15],其初衷便是讓每個人可以用自然語言來使用區(qū)塊鏈和智能合約。
由于區(qū)塊鏈的加密特性,在計算機上使用區(qū)塊鏈數據進行操作需要大量的計算機處理能力(如比特幣挖礦),即使執(zhí)行最基本的任務所需的計算處理量也相當大。同時,為保證安全和去中心化,目前的區(qū)塊鏈技術很難實現性能、安全和去中心化同時兼得,共識機制的執(zhí)行導致了當前區(qū)塊鏈系統運行性能低、能耗高等缺點。
機器學習系統也可以實時記錄區(qū)塊鏈正在發(fā)生的事情,可以在存儲的數據類型及在特定的服務器上識別異常操作和模式,并在某個事件可能發(fā)生時提醒用戶。此外,人工智能可以引入新的分散式學習系統來解決區(qū)塊鏈上的數據冗余問題,擴展系統。分散式的學習系統,如聯邦學習、新的數據分片技術等,可以使系統運行更加有效。
憑借人工智能算法的優(yōu)化,結合POW 和POS 的共識機制,可節(jié)省區(qū)塊鏈的電力及能源的消耗,并通過提高計算能力更好地提高區(qū)塊鏈運行效率。此外,實踐證明,通過AI 模型和算法的優(yōu)化,還可實現區(qū)塊鏈的自然進化、動態(tài)調整,可有效地防止分叉的出現。因此,利用人工智能技術可以優(yōu)化區(qū)塊鏈的運行方式,以更聰明、更周到的方式管理區(qū)塊鏈運行任務,更加有效地管理好區(qū)塊鏈的自治組織,讓區(qū)塊鏈更安全、更可靠、更高效。
面對人工智能和區(qū)塊鏈領域的現存問題,兩大技術的融合能夠實現取長補短,當前已有部分應用案例將兩者融合在一起。值得一提的是,無論是從當前區(qū)塊鏈的技術指標,還是從大數據、人工智能的實際落地性來講,真正實現技術融合并落地實施仍需要面對諸多不確定性因素,其融合的潛在性結果也難以評估,因此在積極研究AI 與區(qū)塊鏈技術融合的同時也要理性看待、注重實踐落地,有機結合、靈活創(chuàng)新,真正實現人工智能和區(qū)塊鏈技術融合的實踐和探索。