亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        互聯(lián)網(wǎng)內(nèi)容安全關(guān)鍵技術(shù)研究綜述

        2024-03-12 09:18:58王志昂魏子令陳曙暉
        信息安全研究 2024年3期
        關(guān)鍵詞:深度人工智能內(nèi)容

        廖 忠 王志昂 申 宇 魏子令 陳曙暉

        1(媒體融合內(nèi)容感知與安全湖南省重點(diǎn)實(shí)驗(yàn)室 長沙 410073)

        2(湖南日?qǐng)?bào)社 長沙 410073)

        3(國防科技大學(xué)計(jì)算機(jī)學(xué)院 長沙 410073)

        隨著智能設(shè)備的廣泛普及和社會(huì)信息化的高速發(fā)展,互聯(lián)網(wǎng)的構(gòu)成和用戶參與方式發(fā)生了極大的變化.首先,智能設(shè)備出現(xiàn)后迅速占領(lǐng)了互聯(lián)網(wǎng)用戶市場,移動(dòng)應(yīng)用APP成為用戶訪問網(wǎng)絡(luò)的主要入口.據(jù)第52次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,2023年上半年,我國移動(dòng)互聯(lián)網(wǎng)累計(jì)流量約142EB,同比增長14.6%.其次,隨著社交、網(wǎng)絡(luò)直播、社區(qū)共享、短視頻等支持內(nèi)容創(chuàng)作和內(nèi)容分享的應(yīng)用的完善和用戶下沉,內(nèi)容創(chuàng)作的門檻大大降低.互聯(lián)網(wǎng)用戶不再是信息的被動(dòng)接受者,而是成為內(nèi)容創(chuàng)作和內(nèi)容分享的深度參與者.因此催生了以文本、圖像、音頻、視頻為載體的多種自媒體形態(tài),給互聯(lián)網(wǎng)內(nèi)容安全治理帶來了極大的挑戰(zhàn).

        互聯(lián)網(wǎng)內(nèi)容安全包含2個(gè)層面的內(nèi)涵[1]:一是對(duì)信息內(nèi)容的保護(hù),涉及信息內(nèi)容的完整、知識(shí)產(chǎn)權(quán)保護(hù)、隱私保護(hù)等方面;二是保障信息內(nèi)容符合政治、法律、道德等層次的要求,該層面主要通過信息內(nèi)容分析實(shí)現(xiàn)不良信息檢測(cè)、內(nèi)容過濾、態(tài)勢(shì)感知等.當(dāng)前互聯(lián)網(wǎng)內(nèi)容的復(fù)雜性對(duì)內(nèi)容安全提出更為緊迫的需求.

        當(dāng)前的互聯(lián)網(wǎng)環(huán)境復(fù)雜,為傳統(tǒng)的以人工研判、簡單規(guī)則匹配等為主要手段的內(nèi)容安全治理帶來了諸多挑戰(zhàn),包括數(shù)據(jù)源豐富、監(jiān)測(cè)數(shù)據(jù)海量、數(shù)據(jù)形式多樣、對(duì)抗手段先進(jìn)等.目前互聯(lián)網(wǎng)內(nèi)容以文本、圖像、音頻及視頻為主要載體,使得在這些數(shù)據(jù)形式和大數(shù)據(jù)處理上具有天然優(yōu)勢(shì)的人工智能技術(shù)成為內(nèi)容安全治理的必要技術(shù)手段.

        在人工智能技術(shù)的依托下,當(dāng)前的互聯(lián)網(wǎng)內(nèi)容安全研究要素總結(jié)如圖1所示.其顯著特征為以多源異構(gòu)數(shù)據(jù)為監(jiān)測(cè)對(duì)象,以隱私保護(hù)、自然語言處理、音視圖識(shí)別分析等關(guān)鍵技術(shù)為核心的內(nèi)容保護(hù)和內(nèi)容分析.本文對(duì)內(nèi)容保護(hù)和內(nèi)容分析的主要任務(wù)總結(jié)為4大類,分別為多媒體內(nèi)容分析過濾、信息偽造檢測(cè)、輿情態(tài)勢(shì)感知和數(shù)據(jù)保護(hù).各類任務(wù)包含多種應(yīng)用目標(biāo),如敏感信息檢測(cè)、非法信息檢測(cè)、音圖視頻偽造檢測(cè)、輿論情感分析、數(shù)據(jù)加密等[2].

        圖1 互聯(lián)網(wǎng)內(nèi)容安全研究要素

        1 多媒體內(nèi)容分析過濾

        多媒體內(nèi)容分析過濾是指對(duì)各種形式的媒體內(nèi)容進(jìn)行分析,以識(shí)別其中存在的任何不良、違規(guī)或有害的內(nèi)容.由于涉及文本、圖片、音視頻各類媒體內(nèi)容,因此多媒體內(nèi)容分析過濾任務(wù)涵蓋關(guān)鍵字匹配、自然語言處理、音視圖分析技術(shù)等圖1中列舉的各類技術(shù).近年來,隨著人工智能技術(shù)的發(fā)展,多媒體內(nèi)容分析過濾主要研究都聚焦在面向機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的內(nèi)容過濾技術(shù)上.

        1.1 基于機(jī)器學(xué)習(xí)的內(nèi)容過濾技術(shù)

        隨著機(jī)器學(xué)習(xí)算法的發(fā)展,統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的方法被應(yīng)用到內(nèi)容過濾中.Sahami等人[3]提出一種基于貝葉斯的垃圾郵件過濾器,是早期將機(jī)器學(xué)習(xí)方法應(yīng)用于內(nèi)容過濾的重要工作之一.以該工作為基礎(chǔ),出現(xiàn)SpamBayes和Bogofilter等垃圾郵件過濾工具.Drucker等人[4]基于支持向量機(jī)(support vector machine, SVM)對(duì)垃圾郵件進(jìn)行檢測(cè)和過濾,并比較SVM與其他方法的性能,指出SVM在垃圾郵件分類方面具有更高的準(zhǔn)確率.Yang等人[5]對(duì)比了特征選擇、分類器選擇和文本表示等方法,提出一種基于互信息的特征選擇方法.

        1.2 基于深度學(xué)習(xí)的智能內(nèi)容過濾技術(shù)

        依托大數(shù)據(jù)背景和算力的提升,基于深度學(xué)習(xí)的智能內(nèi)容過濾技術(shù)近年取得了顯著的進(jìn)展.Hochreiter等人[6]提出的長短記憶網(wǎng)絡(luò)(long short-term memory, LSTM)已被廣泛應(yīng)用于文本分類、垃圾郵件過濾等任務(wù).Kim[7]首次將卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)應(yīng)用于文本分類,避免了傳統(tǒng)方法中需要手動(dòng)提取特征的問題.針對(duì)虛假新聞分類問題,Yang等人[8]將新聞文本轉(zhuǎn)化為2維矩陣進(jìn)行表示,并基于CNN實(shí)現(xiàn)虛假新聞分類.Oord等人[9]提出一種基于深度學(xué)習(xí)的音樂推薦方法.該方法使用CNN學(xué)習(xí)音樂的音頻信號(hào)特征,并進(jìn)行音樂推薦.與傳統(tǒng)的基于協(xié)同過濾的方法相比,該方法具有更好的推薦效果和更強(qiáng)的普適性.Jin等人[10]提出一種基于加權(quán)多實(shí)例學(xué)習(xí)的色情圖像識(shí)別方法.該方法將圖片分為多個(gè)圖像塊,并為每個(gè)圖像塊分配一個(gè)權(quán)重.然后使用分類器對(duì)每個(gè)圖像塊進(jìn)行分類,并將每個(gè)圖像塊的分類結(jié)果進(jìn)行加權(quán)得到整張圖片的分類結(jié)果.Yousaf等人[11]提出一種深度學(xué)習(xí)架構(gòu)用于檢測(cè)視頻中的不當(dāng)內(nèi)容.該架構(gòu)采用ImageNet預(yù)訓(xùn)練模型EfficientNet-B7提取視頻描述符,然后使用雙向LSTM學(xué)習(xí)有效的視頻表示并執(zhí)行多類視頻分類.該方法在YouTube卡通視頻集上的實(shí)驗(yàn)表明,雙向LSTM結(jié)合CNN可實(shí)現(xiàn)更好的視頻內(nèi)容檢測(cè).Alguliyev等人[12]提出一種過濾有害圖像內(nèi)容的ChildNet模型,該模型服務(wù)于兒童和青少年,避免他們成為有害圖像的受害者.

        2 信息偽造檢測(cè)

        深度偽造(DeepFake)技術(shù)主要基于人工智能生成內(nèi)容(artificial intelligence generated content, AIGC)實(shí)現(xiàn)對(duì)文本、音頻、視頻、圖片等數(shù)字媒體內(nèi)容的偽造,是信息偽造的主要手段.基于深度偽造技術(shù),惡意攻擊者可生成大量的虛假信息,并通過互聯(lián)網(wǎng)進(jìn)行大規(guī)模傳播,對(duì)互聯(lián)網(wǎng)內(nèi)容安全造成巨大的威脅,對(duì)用戶、民生、社會(huì)、政府等造成嚴(yán)重的危害.

        2.1 深度偽造技術(shù)

        隨著以生成式對(duì)抗網(wǎng)絡(luò)為代表的深度學(xué)習(xí)算法的出現(xiàn)和持續(xù)迭代,AIGC得到了極大的發(fā)展.AIGC指基于人工智能算法進(jìn)行數(shù)字內(nèi)容(如圖片、視頻、文本等)的生產(chǎn).其中最新的代表模型如OpenAI推出的ChatGPT[13]和DALL-E-2[14].

        中國信通院和京東探索研究院發(fā)布的AIGC白皮書中將AIGC的技術(shù)能力分為3個(gè)層次[15]:一是智能數(shù)字內(nèi)容孿生;二是智能數(shù)字內(nèi)容編輯;三是智能數(shù)字內(nèi)容創(chuàng)作.深度偽造主要基于AIGC中的生成模型實(shí)現(xiàn),可以視作是AIGC中3種層次能力的一種具體體現(xiàn).

        對(duì)于語言內(nèi)容,典型的生成模型包括GPT,BERT等.GPT采用Transformer解碼器中的多頭自注意力機(jī)制實(shí)現(xiàn)對(duì)自然語言的理解,完成對(duì)后續(xù)文本的生成任務(wù),屬于從左到右的語言理解模型.與GPT不同,BERT采用一種新的預(yù)訓(xùn)練目標(biāo),通過融合左右2側(cè)的語義從而實(shí)現(xiàn)一個(gè)深度雙向表示.

        對(duì)于視覺內(nèi)容,典型的生成模型包括生成對(duì)抗網(wǎng)絡(luò)、深度變分自編碼器、流模型和擴(kuò)散模型等.生成對(duì)抗網(wǎng)絡(luò)包括2個(gè)模塊:一個(gè)負(fù)責(zé)生成信息;另一個(gè)負(fù)責(zé)判別信息的真實(shí)程度并反饋給前者以此達(dá)到對(duì)抗的目的.深度偽造中,生成對(duì)抗網(wǎng)絡(luò)可通過不斷對(duì)抗來提高偽造的信息質(zhì)量.通過引入自注意力機(jī)制,SAGAN[16]可以使用來自所有位置的特征信息生成圖像細(xì)節(jié),具備長距離依賴性,解決了早期基于卷積的生成對(duì)抗網(wǎng)絡(luò)難以捕捉圖像結(jié)構(gòu)的問題.另一經(jīng)典模型StyleGAN[17]提出一種新的生成器,并基于潛碼和網(wǎng)絡(luò)噪聲來控制圖像的特征并使得圖像中的隨機(jī)屬性可更改.深度變分自編碼器則通過概率分布對(duì)潛在特征進(jìn)行描述,使其具有數(shù)據(jù)生成的能力.流模型基于可逆的非線性變換計(jì)算出模擬真實(shí)數(shù)據(jù)的似然函數(shù)并最大化以實(shí)現(xiàn)數(shù)據(jù)的生成,其典型模型包括NICE,Real NVP,Glow.隨著擴(kuò)散模型的提出,生成模型的主流研究已轉(zhuǎn)向擴(kuò)散模型,OpenAI,Google Brain等公司也先后基于擴(kuò)散模型提出多種文本生成圖像模型,例如DALL-E-2,stable-diffusion,Imagen.這些研究表明,相比生成對(duì)抗網(wǎng)絡(luò),擴(kuò)散模型的訓(xùn)練更穩(wěn)定,可生成精度更高、真實(shí)性更強(qiáng)的圖像.

        即使面向的數(shù)字內(nèi)容類型和采用的生成模型方案有所不同,最新的生成模型仍具備一些共性.首先,Transformer已經(jīng)成為生成模型的一種基礎(chǔ)網(wǎng)絡(luò)架構(gòu),它不僅在自然語言處理領(lǐng)域獲得了巨大的成功,也廣泛應(yīng)用于視覺領(lǐng)域.結(jié)合無監(jiān)督學(xué)習(xí)和Transformer,基于大規(guī)模預(yù)訓(xùn)練的模型成為主流,通過充分利用無標(biāo)注樣本進(jìn)行預(yù)訓(xùn)練,模型可以在小標(biāo)注、無標(biāo)注樣本的場景下也具備模型參數(shù)規(guī)模大、模型泛化能力強(qiáng)、模型綜合性能好的優(yōu)勢(shì).

        2.2 深度偽造檢測(cè)

        近年涌現(xiàn)出大量的深度偽造檢測(cè)技術(shù),主要工作可分為[18]:基于機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的方法;基于統(tǒng)計(jì)策略的方法;基于區(qū)塊鏈的方法.

        1) 基于機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的方法.基于傳統(tǒng)機(jī)器學(xué)習(xí)的方法通過分析信息是否符合真實(shí)情境下的數(shù)據(jù)特征判斷信息是否是偽造的.例如人物臉部表現(xiàn)是否具備一定的連續(xù)特征,生物符號(hào)在空間和時(shí)間上是否具有統(tǒng)一的行為、臉部特征標(biāo)點(diǎn)的運(yùn)動(dòng)過程是否符合生物學(xué)等.由于技術(shù)的不成熟,一些深度偽造的信息可能會(huì)出現(xiàn)異常的特征.例如,Habeeba等人[19]對(duì)視覺偽影進(jìn)行分析,檢測(cè)圖中不符合常理而出現(xiàn)的異常內(nèi)容.這類機(jī)器學(xué)習(xí)方法檢測(cè)深度偽造信息的準(zhǔn)確率可以達(dá)到極高的水平.然而,這種高準(zhǔn)確率完全依賴于數(shù)據(jù)集的類型、所選的特性以及訓(xùn)練集和測(cè)試集之間的相似程度.

        相較于傳統(tǒng)機(jī)器學(xué)習(xí)算法,深度學(xué)習(xí)采用的模型復(fù)雜度更高,其常用的模型包括生成對(duì)抗網(wǎng)絡(luò)GAN、深層卷積神經(jīng)網(wǎng)絡(luò)、R-CNN、膠囊神經(jīng)網(wǎng)絡(luò)等.此外,其特征來源也更多樣,例如連續(xù)特征、RGB數(shù)據(jù)甚至是心跳和呼吸等生物特征.深度學(xué)習(xí)模型的有效性通常依賴于大規(guī)模的訓(xùn)練數(shù)據(jù),并且模型可解釋性較差.

        2) 基于統(tǒng)計(jì)策略的方法.基于統(tǒng)計(jì)策略的方法從其他角度對(duì)信息進(jìn)行“非自然”的發(fā)掘.例如Koopman等人[20]通過檢測(cè)視頻幀中光響應(yīng)的不均勻性判斷信息是否是偽造的.該性質(zhì)是數(shù)字圖像中的一種獨(dú)特的噪聲,來自相機(jī)光敏傳感器的缺陷.除此之外,該類方法還常采用期望最大化、特征路徑等手段對(duì)信息進(jìn)行統(tǒng)計(jì)和測(cè)量.這些方法的主要思路是對(duì)圖像中的像素進(jìn)行統(tǒng)計(jì)、測(cè)量,以此從圖像本身的構(gòu)成上找到偽造的痕跡.

        3) 基于區(qū)塊鏈的方法.區(qū)塊鏈技術(shù)提供了高度可信、去中心化的交互環(huán)境.區(qū)塊鏈可支持檢驗(yàn)內(nèi)容的合法性和來源,因此被視為驗(yàn)證視頻或圖像真實(shí)性的可能解決方案.如果一個(gè)視頻或圖像的真實(shí)性被懷疑,則基于區(qū)塊鏈的網(wǎng)絡(luò)能夠給出這些視頻或圖像的準(zhǔn)確來源,并可以發(fā)現(xiàn)其是否被篡改.相比另2類方法對(duì)視頻和圖像的特征進(jìn)行分析,區(qū)塊鏈技術(shù)則是從根源上限制了深度偽造信息的傳播.然而,這一解決方案僅限于在區(qū)塊鏈環(huán)境下使用,其部署環(huán)境限制較大,因此目前該方法并未成熟地應(yīng)用于深度偽造的檢測(cè)中.

        實(shí)際上,深度偽造和深度偽造檢測(cè)是一個(gè)不斷對(duì)抗的過程.對(duì)于各種深度偽造檢測(cè)技術(shù),偽造者也會(huì)不斷地探索先進(jìn)的偽裝技術(shù)增強(qiáng)偽造信息的隱蔽性,例如基于微小擾動(dòng)技術(shù)避開偽造視頻的檢測(cè)[21].該方法通過在偽造視頻的每一幀上添加微小的擾動(dòng),使得它們能夠欺騙深度偽造視頻檢測(cè)器,同時(shí)又不影響人眼的感知質(zhì)量.相比視頻信息,偽造音頻的檢測(cè)更加困難.文獻(xiàn)[22]對(duì)偽造語音檢測(cè)的局限性進(jìn)行了說明,尤其是對(duì)高質(zhì)量的對(duì)抗神經(jīng)網(wǎng)絡(luò)合成語音的檢測(cè).其實(shí)驗(yàn)表明,對(duì)這類語音真?zhèn)闻袛嗟臏?zhǔn)確率接近于隨機(jī)猜測(cè).

        3 輿情態(tài)勢(shì)感知

        輿情是指涉及社會(huì)公眾關(guān)心的各種事件、現(xiàn)象、信息的集合.它可以反映社會(huì)熱點(diǎn)、民意變化和公眾關(guān)注度,對(duì)政府決策、企業(yè)經(jīng)營、社會(huì)穩(wěn)定等方面都有著重要影響.因此,輿情態(tài)勢(shì)感知是內(nèi)容安全在社會(huì)層面上的重要一環(huán).其中,輿情分析是輿情態(tài)勢(shì)感知的重要技術(shù),其旨在從海量信息中提取情感、態(tài)度和事件趨勢(shì)等關(guān)鍵信息.

        輿情分析技術(shù)起源于20世紀(jì)90年代互聯(lián)網(wǎng)早期.早期的研究主要關(guān)注文本挖掘、情感分析和情緒檢測(cè)等方面.隨著社交媒體的興起,互聯(lián)網(wǎng)數(shù)據(jù)規(guī)模劇增,數(shù)據(jù)的分析變得越來越重要,輿情分析技術(shù)得到了快速發(fā)展.輿情分析技術(shù)的發(fā)展經(jīng)歷了多個(gè)階段,包括初期階段、自動(dòng)化階段和深度學(xué)習(xí)階段.

        初期階段:此階段輿情分析主要依靠人工分析新聞媒體、報(bào)紙等傳統(tǒng)媒體中的信息,通過翻譯、編碼等手段進(jìn)行內(nèi)容分析,以獲取公眾對(duì)特定話題的態(tài)度和情感.這種方法存在效率低、可擴(kuò)展性差、主觀性強(qiáng)等問題.McCombs[23]研究了新聞媒體對(duì)公眾認(rèn)知和態(tài)度的影響,提出媒介效應(yīng)理論,認(rèn)為媒體的報(bào)道會(huì)影響公眾對(duì)現(xiàn)實(shí)世界的認(rèn)知和看法,從而對(duì)其行為產(chǎn)生影響.

        自動(dòng)化階段:隨著互聯(lián)網(wǎng)技術(shù)和自然語言處理技術(shù)的發(fā)展,輿情分析開始轉(zhuǎn)向自動(dòng)化和智能化.通過數(shù)據(jù)挖掘、文本挖掘、機(jī)器學(xué)習(xí)等技術(shù),將公眾在社交媒體等網(wǎng)絡(luò)平臺(tái)上的言論、評(píng)論等信息進(jìn)行收集、處理和分析,得到輿論的情感、態(tài)度、趨勢(shì)等信息.Pang等人[24]對(duì)情感分析和觀點(diǎn)挖掘技術(shù)進(jìn)行總結(jié),強(qiáng)調(diào)了情感分析在輿情自動(dòng)化分析中的重要作用.Liu等人[25]提出一種基于機(jī)器學(xué)習(xí)和語言分析的輿情分析方法.Wang等人[26]對(duì)社交媒體數(shù)據(jù)在自然災(zāi)害管理中的應(yīng)用進(jìn)行分析,并提出了一種基于機(jī)器學(xué)習(xí)的自動(dòng)化方法提取社交媒體中有關(guān)自然災(zāi)害的信息,并對(duì)自然災(zāi)害的影響范圍、人員需求和資源需求等方面進(jìn)行分析.Leskovec等人[27]提出一種社交網(wǎng)絡(luò)鏈接預(yù)測(cè)方法.該方法可以用于預(yù)測(cè)用戶之間的情感關(guān)系,以及發(fā)現(xiàn)可能引起用戶負(fù)面情緒的內(nèi)容和事件,有助于提高輿情分析的效率和準(zhǔn)確性.

        深度學(xué)習(xí)階段:隨著深度學(xué)習(xí)技術(shù)的發(fā)展,輿情分析的實(shí)現(xiàn)逐漸轉(zhuǎn)向深度學(xué)習(xí).基于卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等技術(shù),海量的文本、圖像等多媒體信息可以被分析,并得到更加精準(zhǔn)的輿論態(tài)勢(shì).Rakshit等人[28]對(duì)Twitter數(shù)據(jù)進(jìn)行情感分析.該工作采用包括卷積神經(jīng)網(wǎng)絡(luò)和長短期記憶網(wǎng)絡(luò)在內(nèi)的多種深度學(xué)習(xí)模型,并對(duì)它們的性能進(jìn)行比較.Davidson等人[29]提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,用于檢測(cè)冒犯性言論,并探討了言論檢測(cè)面臨的各種挑戰(zhàn)性問題.張琛等人[30]構(gòu)建了一種面向社交媒體評(píng)論文本數(shù)據(jù)的輿情分析方法框架,利用Single-Pass聚類算法和Louvain社團(tuán)發(fā)現(xiàn)算法,對(duì)媒體發(fā)布的新聞通報(bào)的微博評(píng)論進(jìn)行演變分析.這種框架為重大公共事件的輿情研究提供了理論支持和創(chuàng)新思路.劉忠寶等人[31]利用隨機(jī)場建立疫情時(shí)間畫像,并利用雙向長短期記憶網(wǎng)絡(luò)建立網(wǎng)民情緒畫像,對(duì)疫情事件與網(wǎng)民情緒進(jìn)行關(guān)聯(lián)分析.

        基于輿情分析結(jié)果,相關(guān)方可介入對(duì)輿情進(jìn)行引導(dǎo).輿情引導(dǎo)指通過某些技術(shù)實(shí)現(xiàn)輿情的控制和操控,例如監(jiān)測(cè)用戶言論情緒、制定引導(dǎo)策略等.

        4 用戶數(shù)據(jù)保護(hù)

        上述的多媒體內(nèi)容過濾、深度偽造檢測(cè)和輿情態(tài)勢(shì)感知是對(duì)互聯(lián)網(wǎng)內(nèi)容進(jìn)行分析的技術(shù).除內(nèi)容分析外,內(nèi)容安全還涵蓋對(duì)內(nèi)容的保護(hù).隱私保護(hù)技術(shù)是保護(hù)用戶數(shù)據(jù)的主要技術(shù),包括加密、數(shù)據(jù)脫敏、差分隱私和零知識(shí)證明等技術(shù).基于隱私保護(hù)技術(shù),可實(shí)現(xiàn)身份驗(yàn)證、匿名化、數(shù)據(jù)安全傳輸和數(shù)據(jù)安全存儲(chǔ)等方面的數(shù)據(jù)保護(hù)需求.

        針對(duì)隱私保護(hù)技術(shù),本節(jié)重點(diǎn)對(duì)加密技術(shù)、數(shù)據(jù)脫敏技術(shù)、差分隱私和零知識(shí)證明技術(shù)的前沿進(jìn)展進(jìn)行介紹.

        1) 加密技術(shù).隨著量子計(jì)算和人工智能等技術(shù)的發(fā)展,內(nèi)容安全的加密技術(shù)也在不斷進(jìn)化.基于量子計(jì)算的加密技術(shù)起源于20世紀(jì)80年代末,由Shor[32]提出的分解質(zhì)因數(shù)的算法及Grover[33]提出的搜索算法引發(fā)了對(duì)傳統(tǒng)加密方法安全性的重新評(píng)估.此后,人們開始探索使用量子現(xiàn)象來保證信息的安全性,例如,基于量子密鑰分發(fā)協(xié)議的BB84協(xié)議、E91協(xié)議等[34].同時(shí),基于量子計(jì)算的公鑰密碼學(xué)方法也隨之產(chǎn)生,例如McEliece密碼算法[35].近年來,隨著量子計(jì)算機(jī)的發(fā)展和應(yīng)用,基于量子計(jì)算的加密技術(shù)也在不斷發(fā)展和完善,例如,基于量子糾纏的QKD協(xié)議、基于磁體量子效應(yīng)的密碼算法等.

        除基于量子計(jì)算的加密技術(shù)外,人工智能技術(shù)也為內(nèi)容安全的加密帶來了新的方法.傳統(tǒng)的加密方法面臨著許多挑戰(zhàn),如密鑰管理和保護(hù)、加密效率、數(shù)據(jù)存儲(chǔ)和傳輸?shù)?因此,研究人員開始探索如何利用人工智能技術(shù)來提高加密技術(shù)的性能和安全性.其中,同態(tài)加密、深度學(xué)習(xí)和生成對(duì)抗網(wǎng)絡(luò)等方法在內(nèi)容安全的加密技術(shù)中得到了廣泛應(yīng)用.

        同態(tài)加密是一種允許對(duì)密文進(jìn)行運(yùn)算并得到密文結(jié)果的加密方法,可以保護(hù)數(shù)據(jù)隱私性的同時(shí)提供計(jì)算服務(wù).基于不同數(shù)學(xué)原理,當(dāng)前研究者們已提出多種同態(tài)加密方案,如基于多項(xiàng)式的同態(tài)加密、基于IDEA算法的同態(tài)加密、基于置換群的同態(tài)加密等[36].這些方案在多種應(yīng)用場景下能夠提供高效、安全的加密服務(wù).

        深度學(xué)習(xí)和生成對(duì)抗網(wǎng)絡(luò)可以用于加密算法的自動(dòng)化設(shè)計(jì)和密碼分析.此外,近年來一些研究利用相關(guān)算法提高加密密鑰的質(zhì)量和安全性.文獻(xiàn)[37]探討了基于生成對(duì)抗網(wǎng)絡(luò)的神經(jīng)密碼學(xué)的概念.通過這種方法,2種神經(jīng)網(wǎng)絡(luò)模型可以在沒有傳統(tǒng)密鑰交換的情況下建立共享密鑰.

        2) 數(shù)據(jù)脫敏技術(shù).數(shù)據(jù)脫敏技術(shù)是一種刪除或替換數(shù)據(jù)中的敏感信息的方法.該技術(shù)可以有效地保護(hù)個(gè)人隱私,同時(shí)保留數(shù)據(jù)的基本特征.Zhang等人[38]提出一種基于身份的格式預(yù)加密在數(shù)據(jù)脫敏技術(shù)中應(yīng)用的通用模型,其將傳統(tǒng)的格式保留加密方案與改進(jìn)的密鑰生成功能結(jié)合,通過增加對(duì)分段數(shù)據(jù)的處理意見,實(shí)現(xiàn)數(shù)據(jù)在完整性、安全性、效率等多方面效果提升的通用模型.對(duì)于大型企業(yè)局域網(wǎng)和內(nèi)部數(shù)據(jù)的數(shù)據(jù)保護(hù),Wang等人[39]提出一種企業(yè)局域網(wǎng)數(shù)據(jù)脫敏方案.通過相應(yīng)的脫敏方法,使數(shù)據(jù)全過程都安全可追溯.

        3) 差分隱私.差分隱私是一種廣泛應(yīng)用于數(shù)據(jù)隱私保護(hù)的技術(shù).該技術(shù)通過差分的方法對(duì)數(shù)據(jù)進(jìn)行脫敏處理.它通過添加一定量的噪聲保護(hù)數(shù)據(jù)隱私,確保不會(huì)泄露任何關(guān)于單個(gè)數(shù)據(jù)點(diǎn)的敏感信息.Dwork[40]在2006年首次提出差分隱私的概念,并提出Laplace機(jī)制和指數(shù)機(jī)制等實(shí)現(xiàn)方法.Abadi等人[41]將深度學(xué)習(xí)技術(shù)與隱私保護(hù)技術(shù)相結(jié)合,提出一種基于差分隱私的神經(jīng)網(wǎng)絡(luò)訓(xùn)練方法,表明了深度學(xué)習(xí)在差分隱私方面應(yīng)用的有效性.

        4) 零知識(shí)證明技術(shù).零知識(shí)證明技術(shù)旨在證明某個(gè)聲明的真實(shí)性,同時(shí)不泄露任何關(guān)于該聲明的具體信息.該技術(shù)已有廣泛的應(yīng)用,例如數(shù)字身份認(rèn)證、數(shù)字貨幣交易驗(yàn)證、在線投票等.

        自零知識(shí)證明技術(shù)提出以來,其理論基礎(chǔ)、實(shí)現(xiàn)方法以及應(yīng)用場景成為研究熱點(diǎn).其中比較重要的研究成果包括:Goldwasser等人[42]的交互證明系統(tǒng)的知識(shí)復(fù)雜度分析;Blum等人[43]提出的零交互式證明技術(shù)及其應(yīng)用;Ben-Or等人[44]針對(duì)非加密式的容錯(cuò)分布式計(jì)算問題提出的完備性定理;Fiat等人[45]提出的解決身份驗(yàn)證和簽名問題的實(shí)際方案等.

        5 結(jié) 語

        面對(duì)互聯(lián)網(wǎng)中海量的數(shù)據(jù)規(guī)模和多源異構(gòu)數(shù)據(jù),可預(yù)見人工智能技術(shù)將是未來互聯(lián)網(wǎng)內(nèi)容安全治理首要解決方案.本文對(duì)未來的內(nèi)容安全研究關(guān)鍵問題從宏觀層面展望如下:

        1) 內(nèi)容安全標(biāo)準(zhǔn)體系和數(shù)據(jù)集標(biāo)準(zhǔn)構(gòu)建.

        雖然互聯(lián)網(wǎng)內(nèi)容安全已獲得政府、企業(yè)、科研工作者的高度關(guān)注,但各方的研究自成體系.內(nèi)容安全的評(píng)估方法、內(nèi)容安全指標(biāo)體系、內(nèi)容安全應(yīng)用需求分類等方面仍缺乏統(tǒng)一的標(biāo)準(zhǔn).這導(dǎo)致各方數(shù)據(jù)融合、內(nèi)容安全保障能力評(píng)估、技術(shù)快速遷移和整合等方面存在困難.因此,推進(jìn)建立內(nèi)容安全標(biāo)準(zhǔn)體系對(duì)于內(nèi)容安全領(lǐng)域的研究有十分重要的意義.此外,數(shù)據(jù)集是人工智能技術(shù)發(fā)揮效用的基礎(chǔ),尤其是有標(biāo)簽的數(shù)據(jù)集.為促進(jìn)領(lǐng)域的發(fā)展、相關(guān)技術(shù)的交流,建立文本、圖片、音頻、視頻的分類標(biāo)準(zhǔn)體系和使用體系對(duì)數(shù)據(jù)集的共享與融合具有重要的作用.

        2) 基于人工智能的內(nèi)容安全深度縱橫分析.

        當(dāng)前的內(nèi)容安全治理呈現(xiàn)的主要特點(diǎn)是按點(diǎn)治理,即針對(duì)特定問題采用特定技術(shù)解決.例如對(duì)于暴力圖片檢測(cè)需求,基于圖片識(shí)別技術(shù)構(gòu)建暴力場景檢測(cè)模型;針對(duì)涉政信息檢測(cè),基于自然語言處理技術(shù)構(gòu)建涉政言論分類模型.其重點(diǎn)在于不斷革新人工智能技術(shù),以保持具備解決特定問題的能力.與此同時(shí),未來的研究中,可基于人工智能解決特定問題的結(jié)果實(shí)現(xiàn)縱向和橫向的深度內(nèi)容安全分析.首先,縱向?qū)用嫔舷嚓P(guān)結(jié)果可以為更上層的應(yīng)用服務(wù),例如網(wǎng)絡(luò)威脅情報(bào)的利用,從而將內(nèi)容安全治理化被動(dòng)為主動(dòng).橫向?qū)用嫔?可基于特定問題的輸入、輸出構(gòu)建大規(guī)模知識(shí)庫和知識(shí)圖譜,實(shí)現(xiàn)跨域數(shù)據(jù)挖掘和知識(shí)推理.

        3) 人工智能模型安全.

        內(nèi)容安全治理中,除不斷革新人工智能算法以提高模型的問題解決能力外,人工智能算法和模型的安全性和魯棒性正在引起廣泛的關(guān)注.當(dāng)前人工智能模型在安全方面存在的主要安全隱患包括:首先,其易于遭受數(shù)據(jù)投毒攻擊[46].該類攻擊通過注入精心偽造的數(shù)據(jù)或?qū)颖緮?shù)據(jù)添加擾動(dòng)來污染訓(xùn)練樣本和影響模型的可用性,使得人工智能模型對(duì)數(shù)據(jù)產(chǎn)生錯(cuò)誤的判斷.其次,模型提取類攻擊[47]可通過持續(xù)的數(shù)據(jù)詢問來推測(cè)模型的參數(shù)甚至完成對(duì)模型的復(fù)制,從而實(shí)現(xiàn)繞開模型的檢測(cè).最后,當(dāng)前人工智能模型可解釋性差,使得其安全性存疑.因此人工智能模型的安全性和可解釋性等問題仍有待深入研究.

        猜你喜歡
        深度人工智能內(nèi)容
        內(nèi)容回顧溫故知新
        深度理解一元一次方程
        深度觀察
        深度觀察
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        深度觀察
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        下一幕,人工智能!
        主要內(nèi)容
        臺(tái)聲(2016年2期)2016-09-16 01:06:53
        日韩在线看片| 日本熟妇hdsex视频| 日本黄页网站免费观看| 久久精品国产99精品九九| 久久久亚洲女精品aa| 国产一区二区三区在线视频观看| 日本久久久久亚洲中字幕| 亚洲色欲久久久久综合网| 亚洲熟女av中文字幕网站| 国产亚洲日本精品二区| 中文字幕 亚洲精品 第1页| 免费国产黄网站在线观看| 欧美刺激午夜性久久久久久久| 白白色福利视频在线观看| 香蕉成人伊视频在线观看| 亚洲а∨天堂久久精品2021| 日本a在线播放| 丰满巨臀人妻中文字幕| 伊甸园亚洲av久久精品| 8888四色奇米在线观看| 亚洲精品美女久久久久网站| 国产亚洲女在线线精品| 极品av在线播放| 中文字幕人妻互换av| 猫咪av成人永久网站在线观看| 国产精品视频一区国模私拍| 日韩女优中文字幕在线| 精品一区二区三区亚洲综合| 狠狠噜狠狠狠狠丁香五月 | 国产成+人+综合+亚洲 欧美| 人妻少妇精品视频一区二区三区| 国产日产一区二区三区四区五区| 久久精品国产亚洲av麻豆| 日日噜噜夜夜爽爽| caoporon国产超碰公开| 国产一级黄色录像大片| 东京热人妻无码一区二区av| 国产精品爆乳在线播放| 亚洲一区域二区域三区域四| 婷婷综合另类小说色区| 富婆如狼似虎找黑人老外|