張樺
(中共廣州市委黨校信息網(wǎng)絡中心,廣州 510070)
深度偽造是“生成對抗網(wǎng)絡”的產(chǎn)物,具有智能化和高度的逼真性,使得非當事人很難分辨真假。加之,制作成本低、品質(zhì)高,這使得深度偽造愈發(fā)對社會、政治制度和商業(yè)構(gòu)成重大威脅。自2017年Reddit用戶發(fā)布Deepfake視頻[1]后,深度偽造對社會產(chǎn)生了廣泛的威脅。如深造偽造可以使新聞業(yè)面臨巨大的公眾信任問題;深度偽造可以通過傳播政治宣傳或破壞選舉活動來威脅國家安全;深度偽造可能會妨礙公民對政府或權(quán)威機構(gòu)發(fā)布信息的信任;深度偽造可以用于發(fā)布虛假信息進行市場操作;深度偽造還可進行身份欺詐等活動。
隨著網(wǎng)絡、信息技術(shù)的發(fā)展,人類生存除依賴于物理空間提供的基礎物質(zhì)外,愈發(fā)依賴于網(wǎng)絡、信息所構(gòu)建的網(wǎng)絡空間,網(wǎng)絡空間已經(jīng)成為人類賴以生存的除物理空間外的第二大空間[2]。當前,深度偽造已在國外引起了重視,特別是在政治民主安全、社會公眾安全、軍事安全等方面[3-7]。
國內(nèi)外對于深度偽造技術(shù)威脅的防御基本都處于起步階段。在技術(shù)層面,主張通過自動檢測技術(shù)(如基于深度學習的自動檢測)或新技術(shù)(如基于區(qū)塊鏈的驗證系統(tǒng))的方法檢測、防御深度偽造[8-11]。標稱深度偽造技術(shù)的檢測準確率在71%~95%之間。在社科層面,主張通過可靠平臺向社會科學研究人員發(fā)布大型社交媒體數(shù)據(jù)集,以研究錯誤虛假信息傳播的解決方案[12-13]。在管理層面,主要是主張加強深度偽造的有關(guān)立法,明確媒體平臺、創(chuàng)作者等的責任,制定切實可行的處罰措施[14-16]。
本文根據(jù)深度偽造生成的特點,結(jié)合目前最新研究成果,將技防和人防相結(jié)合,構(gòu)建了基于時空網(wǎng)眾包的深度偽造威脅防御體系。
參考文獻[17-19],定義如下:
定義1時空網(wǎng)眾包任務。一個時空網(wǎng)眾包任務被該任務的請求者發(fā)布,通常被定義為如下六元組的形式,記為,其中,lt表示該眾包任務的位置;pt為該任務的網(wǎng)絡地址(IP),st為該任務的發(fā)布時間;et為該任務的截止時間;rt為該任務發(fā)布的空間范圍,即在此范圍內(nèi)的眾包參與者才有機會接收到該任務;wt是完成該任務的權(quán)值(可以獲得的獎勵或效用,通常表示為任務的價格或獎金)。
對于任意的時空網(wǎng)眾包任務,上述六元組中的前四者應必須被包括以標記此任務的時空網(wǎng)屬性;是否包含后兩者視具體應用而定。例如,某些任務希望眾包平臺的每位眾包參與者都獲知,則可去除此空間范圍約束。另外,如果某些任務不為參與者帶來任何獎勵,也可刪除該項內(nèi)容。
此外,時空網(wǎng)眾包參與者定義如下。
定義2時空網(wǎng)眾包參與者。一位時空網(wǎng)眾包參與者也被稱為時空網(wǎng)眾包工人,通常被定義為如下七元組的形式,記為t=,其中,li表示該參與者當前的空間位置;pi為此參與者的網(wǎng)絡地址(IP),si為此參與者的抵達時空眾包平臺的時間;ei為該參與者預計離開時空眾包平臺的時間;ri為該參與者的空間服務范圍,即對于該范圍外的眾包任務,此參與者將不能提供服務;ci代表該參與者計劃承擔的眾包任務數(shù)量;qi度量該參與者提供服務的可信度,通常表示為歷史任務守信率或歷史累計失信率等形式。
與時空網(wǎng)眾包任務的定義相似,對于任意時空網(wǎng)眾包參與者的七元組,也是前五者應被包括,而后二者可視具體應用而定。注意:上述時空網(wǎng)眾包任務與時空網(wǎng)眾包參與者的定義皆為基礎性定義,根據(jù)不同的應用需求,可在上述兩個定義的基礎上進行擴展。因此,基于上述定義,可將時空眾包定義如下。
定義3時空網(wǎng)眾包。時空網(wǎng)眾包通常是指通過互聯(lián)網(wǎng)設備實時地在時空網(wǎng)絡空間眾包平臺上匯聚眾包任務與眾包參與者,并通過平臺對眾包任務進行分配調(diào)度與質(zhì)量控制,從而使眾包參與者在物理世界和網(wǎng)絡空間共同完成眾包任務并滿足任務約束條件的過程。
綜上所述,時空網(wǎng)眾包旨在通過整合物理世界和網(wǎng)絡空間中智能群體,組織其在網(wǎng)絡空間中完成機器難以解決的問題,從而有效地利用人群智能與硅基智能的資源。
在深度偽造防御網(wǎng)絡空間中,眾包具有脫“虛”向“實”的作用。時空網(wǎng)眾包的時、空、網(wǎng)屬性,強調(diào)了在深度偽造防御中的真實性、可信度性和可追溯性。因此,時空網(wǎng)眾包無論是在眾包任務上、眾包參與者,還是眾包平臺上都存在與傳統(tǒng)眾包的差異。
在眾包任務上,傳統(tǒng)眾包任務更多地在于在網(wǎng)絡空間中完成,而時空網(wǎng)的眾包更關(guān)注于任務發(fā)生的現(xiàn)實世界。因而基于時間、地點和網(wǎng)絡空間的任務使得第一現(xiàn)場成為辨別真?zhèn)蔚年P(guān)鍵。在眾包參與者方面,傳統(tǒng)眾包只需要在網(wǎng)絡空間上即可參與,而時空網(wǎng)眾包需要參與者跟眾包任務發(fā)包方在時、空、網(wǎng)三者上具有臨近約束或真相約束,參與渠道是使用平臺的工人或用戶。在眾包平臺上,傳統(tǒng)眾包無時空網(wǎng)約束,具有廣泛性,而時空網(wǎng)眾包平臺,具有篩選性,且需要平臺注重時空網(wǎng)數(shù)據(jù)的隱私處理。
在構(gòu)建時空網(wǎng)眾包的深度偽造防御時,首先注重深度偽造的使用者和典型的應用場景,然后著重從技術(shù)體系、社科體系和管理體系三個層面予以構(gòu)建。
深度偽造從定義上著重于偽造現(xiàn)實,其威脅強調(diào)通過逼真的“欺詐性”來達成,使得深度偽造安全防御不同于常規(guī)網(wǎng)絡安全防御,深度偽造安全防御更應該著重于“反欺詐性”。從深度偽造產(chǎn)生的源頭分析,產(chǎn)生于機器學習算法,具體是“生成對抗網(wǎng)絡”的產(chǎn)物,這使得其安全防御必須應對機器生成的“海量性”問題。
在構(gòu)建針對深度偽造威脅的防御體系時,除了借鑒一般網(wǎng)絡安全防御體系的構(gòu)建,在結(jié)合深度偽造的生態(tài)體系和典型場景后,還要特別專注于深度偽造的特性。針對“反欺詐性”,必須給予現(xiàn)實的、真實的、可信的應證,而現(xiàn)實的、真實的、可信的應證正是人類所長,在構(gòu)建深度偽造安全防御體系時,注重于“人的要素”的考慮,從社科層面和管理層面進行構(gòu)建;針對“海量性”,必須給予批量的、可規(guī)?;奶幚?,這正是機器所長,注重于“技的要素”,從技術(shù)層面進行構(gòu)建。三個層面相互融合,互為支撐,共同構(gòu)建深度偽造威脅防御體系。
構(gòu)建時空網(wǎng)眾包的深度偽造威脅防御體系,立足于人群群體智能計算對抗以硅基為基礎的“云機”智能計算。在進行網(wǎng)絡安全防御時,分別在管理層面、社科層面和技術(shù)層面進行可信眾包防御體系構(gòu)建。
2.2.1 時空網(wǎng)眾包防御模型
從深度偽造的生態(tài)構(gòu)成分析,不難發(fā)現(xiàn)深度偽造發(fā)生在網(wǎng)絡空間信息發(fā)布、流通環(huán)節(jié),如果深度偽造不借助網(wǎng)絡空間發(fā)布和流通,其威脅就無從談起。因此在構(gòu)建時空網(wǎng)眾包防御模型時,圍繞深度偽造信息發(fā)布流通環(huán)節(jié)進行。如圖1所示。
圖1 可信時空網(wǎng)眾包防御模型示意圖
(1)平臺用戶通過平臺渠道提交信息(該信息一定是未進行真假審核)。
(2)平臺在收到該用戶發(fā)布的信息后,進行基于時空網(wǎng)眾包的生成工作,完成后進入(3)。
(3)進行時空網(wǎng)眾包的任務分配,首先分配給“硅基”智能進行第一輪眾包。即在技術(shù)層面,基于“硅基”智能計算通過自動檢測技術(shù)或新技術(shù)等對時空網(wǎng)眾包任務中時間St、空間位置lt、網(wǎng)絡地址pt等信息按照一定的算法進行可信任務分配,在“硅基”智能對該信息進行判定后,將結(jié)果返回給平臺,進入(4)。
(4)平臺在收到“硅基”智能對該信息的判定結(jié)果后,對該信息進行分析,評估之前“硅基”智能對該類信息判定的可信度kt,把真實域中隨機去重抽取比例at的該類信息和偽造域中該類信息作為人群智能時空網(wǎng)眾包的輸入,進入社科層面(5)。
(5)在社科層面,同樣,平臺根據(jù)時空網(wǎng)眾包任務中時間St、空間位置lt、網(wǎng)絡地址pt和可信度qi等信息按照一定的算法向平臺工人用戶分配眾包任務,平臺工人用戶在領取任務后,通過“人群”智能計算進行判定,并將判定結(jié)果返回給平臺,進入(6)。
(6)平臺通過分析“人群”智能計算的結(jié)果,根據(jù)判定票數(shù)進行博弈判定。并根據(jù)判定結(jié)果修正、更新“硅基”智能計算樣本集。進入(7)。
(7)平臺判定結(jié)果,如果真實合規(guī),則完成該用戶請求發(fā)布該信息;如果是偽造合規(guī),同樣發(fā)布,但打上偽造標簽(可對用戶端透明,但平臺必須標注自己清楚);如果是偽造違約,則拒絕響應該用戶請求,拒絕發(fā)布。進入(8)。
(8)發(fā)布后的信息,進入用戶、公眾和管理層面的視野。
(9)管理層面的立法、行規(guī)監(jiān)督、檢查、指導平臺、用戶的網(wǎng)絡空間行為。
對于存量的網(wǎng)絡空間信息需要真?zhèn)螌徍说模瑥模?)進入(1)由平臺進行自動深度偽造防御流程。
2.2.2 任務生成及分配
任務分配是眾包模式的研究熱點問題之一,對于時空網(wǎng)眾包任務而言,平臺很容易獲得請求用戶的時空網(wǎng)屬性:用戶發(fā)起信息發(fā)布請求(稱為任務發(fā)包方)的位置信息lt、網(wǎng)絡地址(IP)信息pt,發(fā)起的時間St。根據(jù)任務發(fā)包方的時空網(wǎng)信息,構(gòu)建該任務的平臺眾包任務工人集合S=
假設構(gòu)建的m名該任務眾包工人之間沒有交互、相互獨立,所以每次博弈都可以被視為零和博弈(都是眾包工人對任務發(fā)包方真與假的判定)。對于任意工人si用zi表示該工人的博弈過程包含的總周期數(shù)。同時,用zij表示工人si的第j個博弈周期。眾包工人接受眾包任務需要激勵機制,即構(gòu)建任務權(quán)值wt。在社科領域?qū)τ谝粋€人對于某項工作的勝任,一般是看能力和忠誠度。在眾包任務權(quán)值時,引入工人的眾包能力因子poweri和可信度因子honi,則工人si第j個任務的能力因子表示為powerij,可信度為honij,其中:
工人si的可信度首次接受任務時默認都是完全可信的,其后,根據(jù)工人si累計失信的次數(shù)k和累計失信的能力poweri,j-1生成。工人si第j個任務的權(quán)值表示為gij,生成權(quán)值集合:
其中:
2.2.3 質(zhì)量控制
深度偽造時空網(wǎng)眾包任務的質(zhì)量控制,關(guān)鍵在于其眾包工人集S的生成質(zhì)量qg和判別質(zhì)量aq(可信度)。生成質(zhì)量依賴于眾包工人的能力因子power,設生成質(zhì)量控制閾值q0,power≥q0。判別質(zhì)量aq依賴于眾包工人的可信度hon,假設判別質(zhì)量控制閾值a0,hon≥a0。
由于眾包工人之間相互獨立,且眾包工人每次博弈結(jié)果只有兩種真與假,且眾包工人si判別正確的概率,即m個眾包工人發(fā)生的概率互斥且和為1,服從多項式分布。由多項式分布的期望E(Si)=nvi、方差var(si)=nvi(1-vi)和協(xié)方差Cov(si,sj)=-nvi vj,n為眾包工人n次博弈周期且對角線上的元素為各眾包工人的方差。由此可以以協(xié)方差矩陣的數(shù)值量化時空網(wǎng)眾包的任務質(zhì)量情況。
2.2.4 隱私保護
構(gòu)建時空網(wǎng)眾包深度防御,其隱私保護是內(nèi)在要求,既保護眾包參與者的時空網(wǎng)信息,又可根據(jù)眾包參與者保護后的時空網(wǎng)信息指導其有效地完成任務是眾包平臺自身的建設的內(nèi)在要求,其本質(zhì)是平臺信息隱私保護。有關(guān)信息隱私保護的研究眾多,技術(shù)上有各種加密算法、方法和處理模型,將信息進行脫敏處理;平臺和管理上有“數(shù)據(jù)合規(guī)”、網(wǎng)絡、數(shù)據(jù)安全法規(guī)。這是目前網(wǎng)絡空間隱私保護研究的話題。
在構(gòu)建時空網(wǎng)眾包深度偽造威脅防御時,本文已充分考慮了平臺對參與者時空網(wǎng)信息的有效利用,對于時空網(wǎng)信息的隱私保護,眾包平臺重在使用其價值,并非對時空網(wǎng)信息的擁有。因此對于眾包平臺時空網(wǎng)信息的隱私保護,在對時空網(wǎng)信息進行已有技術(shù)脫敏處理的同時,加大社科和管理層面制度建設構(gòu)建眾包平臺隱私保護的“黑匣子”,即基于時空網(wǎng)信息任務的生成、分配只能在“黑匣子”內(nèi)完成,將結(jié)果輸出至平臺,且“黑匣子”的開啟只能在平臺注冊的第三方數(shù)據(jù)局,平臺只管對其任務判定結(jié)果的使用。如圖2虛線方框內(nèi)為“黑匣子”部分所示。
圖2 時空網(wǎng)眾包平臺的“黑匣子”示意圖
居民垃圾投放是居民生活必不可少的日常行為,垃圾分類是居民垃圾投放的重要手段。最近對于垃圾分類的討論在各社區(qū)議論紛紛,有人發(fā)起圖文并茂的“偽垃圾分類說”——居民垃圾分類投放,而垃圾運輸車無分類,均是同一個車運走,垃圾分類只是給居民造成投遞麻煩,根本沒有分類的效果。為判定這類居民圖文的說話是否屬實——即是否是居民分類投放,而垃圾車運輸車卻無分類,同一車混裝運輸。擬采用本文的深度偽造判別法來對事實進行判別,以驗證本文時空網(wǎng)眾包深度偽造防御的有效性。
(1)該社區(qū)根據(jù)上級主管部門要求,垃圾分為兩類:餐廚垃圾和其他垃圾。
(2)垃圾運輸車分為兩類:餐廚垃圾運輸車和其他垃圾運輸車,車型、大小、外觀均相同,只是餐廚垃圾運輸車車廂側(cè)面有“餐廚垃圾”白色字樣,而其他垃圾運輸車則沒有任何提示字樣。
(3)該社區(qū)垃圾運輸車每天來2次,上午9:30~10:00,晚上9:30~10:00。
(4)該社區(qū)居民垃圾分類定時投放點和誤時投放點均在該社區(qū)同一個地方,且社區(qū)無其他垃圾分類投放點。居民定時投放時間是:上午7:00~9:00,晚上7:00~9:00,其他時間為誤時投放,定時投放時間有垃圾分類指導員,誤時投放則沒有指導員。
首先構(gòu)建該社區(qū)的偽垃圾分類時空網(wǎng)眾包平臺,3公里以內(nèi)的平臺眾包工人分布均勻。
將原圖文并茂的偽垃圾分類說進行偽造,換其他社區(qū)真實圖片10份,修改部分文字標點10份,總計21份任務。
平臺內(nèi)眾包工人的首次使用初始化時,眾包工人在注冊時均能獲取眾包工人的地理位置、網(wǎng)絡地址(IP)和注冊時間。根據(jù)3.4.2節(jié),剛開始平臺眾包工人的可信度均為hon=100,歸一化可信度為hon=100∕100=1,工作能力取簡單的歐幾里得距離。
△li為用戶注冊的位置與眾包任務中事件位置的空間距離差。△pi為用戶注冊的IP與眾包任務發(fā)布IP的地理位置空間距離差,△si為用戶最近一次登陸平臺的時間或在線時間與眾包任務的時間差。gij初始時取值工作能力的初始取值。如下:
通過平臺的計算的時空網(wǎng)眾包平臺,向任務發(fā)生位置3公里內(nèi)的用戶發(fā)布眾包任務——判定該社區(qū)表內(nèi)的圖文并茂的“偽垃圾分類說”是否屬實。向1050個用戶發(fā)出眾包任務,有759個用戶瀏覽了該任務,最后由178個用戶完成了眾包任務,其中有128位判定“偽垃圾分類說”為假,其眾包任務的權(quán)值之和WF=0.051;50位判定為真,其眾包任務的權(quán)值之和WT=0.083,由于眾包任務權(quán)值WT>W(wǎng)F,時空網(wǎng)眾包任務最終判定結(jié)果為該社區(qū)群“偽垃圾分類說”為假。事后實地考證,結(jié)果是餐廚垃圾和其他垃圾是分類運輸?shù)?,圖文偽造了其他垃圾車身,在其他垃圾車身PS了餐廚垃圾的車身字樣,差別細小,極具偽造性。
本著審查、可追溯和注重隱私保護的原則,探討了深度偽造防御問題,著重基于時空網(wǎng)眾包以人群智能的所長,應對機器智能深度偽造的所長,這對深度偽造的“欺詐性”做了很好的回應,將網(wǎng)絡空間脫實向虛發(fā)展和威脅防御需要的脫虛向?qū)嵃l(fā)展結(jié)合起來。設計的時空網(wǎng)眾包具有鮮明的地域特色,旨在平臺信息發(fā)布處就截住虛假的深度偽造信息,實驗論證具有良好的網(wǎng)絡效果。對于防御體系的管理層面,更多的是合規(guī)和立法方面的內(nèi)容,本文沒有做過多的探討,因為對于法條的實用性、針對性、可操作性和法學原理的論證、解釋、說明不是本文的重點。需要說明的是,在管理層面,在于法規(guī)的精準有效。在基于時空網(wǎng)眾包的防御體系中,法規(guī)需抓住如下幾個關(guān)鍵:
(1)各信息發(fā)布平臺、應用等發(fā)布信息都不得收集用戶隱私信息,對于任何含有隱私的信息都必須有獨立于平臺和應用的“黑匣子”的判定,該“黑匣子”的監(jiān)管獨立于平臺和應用,平臺和應用只有使用其輸出結(jié)果的權(quán)力和執(zhí)行共同監(jiān)督的權(quán)力。
(2)對于深度偽造的合規(guī)信息,必須有明確的標識,至少是在監(jiān)管視圖內(nèi)有明確標識,對于用戶視圖為了更好的娛樂性和經(jīng)濟效益,可以屏蔽該標識。
(3)對于實時性的把握,本文顯得不足。此外,多少量值的任務完成才使得任務有效和終止,是需要大量實驗的累計和實踐。因此,本文的防御體系暫時不宜發(fā)生在涉及國計民生的政府新聞媒體和宣傳、國防安全、應急管理等方面,但對于眾多普通網(wǎng)民防御深度偽造的威脅具有針對性。同時,在兼容社會效率和干凈可控的網(wǎng)絡空間如何找到合適的取舍也是下一步研究的重要內(nèi)容。