2018年5月28日,由貴陽大數(shù)據(jù)戰(zhàn)略重點實驗室研究編著的最新理論成果《塊數(shù)據(jù)4.0:人工智能時代的激活數(shù)據(jù)學》正式發(fā)布。未來人類將進入超數(shù)據(jù)時代,超數(shù)據(jù)時代將是一個更加開放、更加復雜的巨系統(tǒng),對數(shù)據(jù)科學研究的思路與方法也應當發(fā)生相應的轉(zhuǎn)變?!秹K數(shù)據(jù)4.0》圍繞塊數(shù)據(jù)的理論架構開展深入研究,創(chuàng)新性地提出激活數(shù)據(jù)學,構建了基于復雜理論的應用模型,為大數(shù)據(jù)領域和人工智能領域的探索研究提供了一個嶄新的視角。
大數(shù)據(jù)時代的解決方案
我們沒有把大數(shù)據(jù)僅僅看作所謂的“大”的數(shù)據(jù),而是把大數(shù)據(jù)看作一種“活”的數(shù)據(jù),因為只有激活,大數(shù)據(jù)才有生命,才有社會屬性,才能成為未來世界人們賴以生存與發(fā)展的土壤和空氣。激活數(shù)據(jù)學的核心正是將人類認知能力與計算機快速運算和海量存儲的能力結合起來。一方面,提高智能系統(tǒng)的置信度,避免人工智能技術的局限性所造成的風險甚至危害;另一方面,建立人類參與的混合增強智能,將海量數(shù)據(jù)通過人機混合增強智能實現(xiàn)最佳釋放。這種形態(tài)是人工智能可行的、重要的成長模式。
超數(shù)據(jù)時代的數(shù)據(jù)擁堵
超數(shù)據(jù)時代,由數(shù)據(jù)短缺變?yōu)閿?shù)據(jù)過剩。信息爆炸與數(shù)據(jù)爆炸帶來海量信息、垃圾數(shù)據(jù)泛濫,使得人類被無邊界的數(shù)據(jù)層層包裹,最終形成認知障礙。我們把這種問題和困境稱為“數(shù)據(jù)擁堵”。在超數(shù)據(jù)時代,復雜性的、動態(tài)的思維方式將被樹立,人們的思維方式也將呈現(xiàn)復雜性的變化趨勢。人機物三元融合將使得數(shù)字科技沉浸式地滲透到實體經(jīng)濟和社會服務活動中,通過人機物閉環(huán)協(xié)作交互過程提升生產(chǎn)生活的智能化水平。
數(shù)據(jù)搜索:智能感知
數(shù)據(jù)搜索是激活數(shù)據(jù)學中的準備階段,是塊數(shù)據(jù)系統(tǒng)依據(jù)某種信號組織相關數(shù)據(jù)的一種行為。激活數(shù)據(jù)學中的數(shù)據(jù)搜索,實現(xiàn)了在關聯(lián)數(shù)據(jù)體系的基礎上從孤立的“數(shù)據(jù)”到全局數(shù)據(jù)的“匯聚”過程?;诩せ顢?shù)據(jù)學的數(shù)據(jù)搜索結合新一代人工智能技術,擺脫了傳統(tǒng)搜索引擎的局限性,更加智能化,更具主動性,提供多元化的搜索方式,為用戶提供個性化定制服務,更好地滿足用戶的個性需求。
關聯(lián)融合:智能聚合
在智能搜索獲得的數(shù)據(jù)集中,需要處理的數(shù)據(jù)可能來自不同數(shù)據(jù)域、不同數(shù)據(jù)源,同時還具有不同的數(shù)據(jù)形式。從人腦整合不同感官之間的信息模式出發(fā),激活數(shù)據(jù)學提出一種新的方法體系——數(shù)據(jù)跨界關聯(lián)融合。它通過對搜索出來的模糊結果數(shù)據(jù)集進行降維去噪、關聯(lián)識別、跨界重構,深度挖掘數(shù)據(jù)的顯性價值與隱性價值,形成相對精確的結果數(shù)據(jù)集。
激活數(shù)據(jù)學是一種新的數(shù)據(jù)科學理論與方法,其目的在于解決超大規(guī)模數(shù)據(jù)的獲取、篩選、融合、計算和分析問題。激活數(shù)據(jù)學是塊數(shù)據(jù)理論的升級版,它以塊數(shù)據(jù)為基礎數(shù)據(jù)資源層,以“數(shù)據(jù)共享、互聯(lián)互通、業(yè)務協(xié)同”為原則,匯聚海量跨行業(yè)、跨領域的數(shù)據(jù)并進行融合重構,構建自由流動、立體化的數(shù)據(jù)存儲體系,并以深度神經(jīng)網(wǎng)絡和人機交互接口為決策分析層,模仿人腦思考方式和群體智能,進行數(shù)據(jù)挖掘、預測分析與智能決策,提升決策與分析的智能化和準確率。
群體智能:智能碰撞
激活數(shù)據(jù)學中的智能碰撞是把傳統(tǒng)強調(diào)的專家智能模擬轉(zhuǎn)移到群體智能,智能體的構造從邏輯和單調(diào)走向開放和涌現(xiàn)。在人和智能體組成新型的智慧群體的過程中,智能碰撞能夠讓人類和人工智能相互學習,充分發(fā)揮各自優(yōu)勢,使得人機之間劣勢互補、優(yōu)勢增強,借助互聯(lián)網(wǎng)平臺,能夠高效重組群體,形成更廣泛、更精準的群體智能。
云腦時代:開啟數(shù)字文明新紀元
云腦時代是運用激活數(shù)據(jù)學這個新方法論推動人、智能機器和云計算等融合發(fā)展的新時代,也是新技術、新模式被激活應用的時代。未來的互聯(lián)網(wǎng),將不再只是部分領域的互聯(lián)網(wǎng),而是全人類共同享有的互聯(lián)網(wǎng),也是在實現(xiàn)了人的全面自由發(fā)展環(huán)境下的自由互聯(lián),推動全人類進入數(shù)字命運的共同體時代。
激活數(shù)據(jù)學的應用場景
人工智能時代是一個更加開放、更加復雜的巨大系統(tǒng),可以對不確定性和不可預知性實現(xiàn)更加精準的預測。激活數(shù)據(jù)學以發(fā)現(xiàn)塊數(shù)據(jù)內(nèi)海量復雜數(shù)據(jù)的潛在關聯(lián)和預測未來為目標,以復雜理論的系統(tǒng)思想為主要范式,探索其理論基礎和運行規(guī)律,并且嘗試用量化手段進行模型構建。對于城市而言,城市大腦可以將散落在各個角落的數(shù)據(jù)匯聚到一起,使用云計算大數(shù)據(jù)和人工智能技術,讓城市的各個“器官”協(xié)同工作,變成一個能夠自我調(diào)節(jié)、與人類良性互動的有機體。
熱點減量化:智能篩選
熱點減量化是超數(shù)據(jù)時代如何對海量數(shù)據(jù)進行有效取舍的一個重要途徑。熱點減量化通過自激活步驟,對數(shù)據(jù)單元活躍狀態(tài)進行清晰的層次劃分,并以此為依據(jù),挑選出更具價值的數(shù)據(jù)單元進行分析。通過模仿人腦篩選信息的遺忘機制,借鑒大數(shù)據(jù)信息取舍的方式方法,結合人工智能時代當下的需求,將遺忘因子作為熱點減量化的一個結構性要素納入分析系統(tǒng),從而尋求在數(shù)據(jù)分析中實現(xiàn)以自然遺忘為要件的信息取舍。
自激活:智能決策
自激活是激活數(shù)據(jù)學研究的核心環(huán)節(jié),是數(shù)據(jù)價值釋放的臨界點。在前期數(shù)據(jù)搜索和關聯(lián)融合的數(shù)據(jù)輸入下,數(shù)據(jù)仍然是一個潛在價值的狀態(tài),如何發(fā)揮其價值,將其變成相應的數(shù)據(jù)知識進行自主決策輸出是自激活自主決策過程中,甚至整個激活數(shù)據(jù)學系統(tǒng)中最關鍵之處。在當今數(shù)據(jù)膨脹的環(huán)境中,自激活將對數(shù)據(jù)運用進行更優(yōu)化、更有效的提升??萍荚诎l(fā)展,技術在進步,自激活階段的運行過程會不斷更新,而隨著人們對人腦的了解越來越深,自激活的輸出將會實現(xiàn)更大的價值,使人工智能更“增智”。