郭云
【摘?要】近年來(lái),經(jīng)濟(jì)的發(fā)展,促進(jìn)我國(guó)科技水平的提升。當(dāng)前,隨著計(jì)算能力的大幅提升和數(shù)據(jù)規(guī)模的暴增,人工智能技術(shù)獲得快速發(fā)展,成為全球各國(guó)高度重視和競(jìng)相發(fā)展的帶有“頭雁”效應(yīng)的引領(lǐng)型技術(shù) . 與此同時(shí),數(shù)據(jù)作為人工智能技術(shù)發(fā)展的重要資源,其重要價(jià)值進(jìn)一步凸顯,但也由此引發(fā)了一系列對(duì)于數(shù)據(jù)安全和隱私保護(hù)的擔(dān)憂,數(shù)據(jù)安全問(wèn)題已然成為人工智能全面發(fā)展的重要制約瓶頸和亟需突破的關(guān)鍵挑戰(zhàn)。本文就人工智能數(shù)據(jù)安全治理與技術(shù)發(fā)展展開(kāi)探討。
【關(guān)鍵詞】人工智能;數(shù)據(jù)安全;隱私保護(hù);全球治理
引言
隨著越來(lái)越多智能應(yīng)用的出現(xiàn),而形成了海量數(shù)據(jù),這些數(shù)據(jù)又在人們的生產(chǎn)、生活場(chǎng)景中不斷被收集與利用,在此過(guò)程中如何兼顧數(shù)據(jù)安全和人工智能技術(shù)發(fā)展,并探尋人工智能數(shù)據(jù)安全影響因素逐漸成為了當(dāng)前國(guó)內(nèi)外研究的焦點(diǎn)。
1全球人工智能數(shù)據(jù)安全治理國(guó)家戰(zhàn)略層面
2017年7月,國(guó)務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》,在人工智能數(shù)據(jù)安全治理方面提出了多項(xiàng)要求,包括“強(qiáng)化數(shù)據(jù)安全與隱私保護(hù),為人工智能研發(fā)和廣泛應(yīng)用提供海量數(shù)據(jù)支撐”“開(kāi)展與人工智能應(yīng)用相關(guān)的民事與刑事責(zé)任確認(rèn)、隱私和產(chǎn)權(quán)保護(hù)等法律問(wèn)題研究,建立追溯和問(wèn)責(zé)制度”“加大對(duì)數(shù)據(jù)濫用、侵犯?jìng)€(gè)人隱私、違背道德倫理等行為的懲戒力度”“打造人工智能基礎(chǔ)數(shù)據(jù)與安全檢測(cè)平臺(tái),建設(shè)面向人工智能的公共數(shù)據(jù)資源庫(kù)、標(biāo)準(zhǔn)測(cè)試數(shù)據(jù)集、云服務(wù)平臺(tái)”。在國(guó)家人工智能發(fā)展戰(zhàn)略的指引下,我國(guó)相關(guān)部門在金融科技、智慧城市、自動(dòng)駕駛等應(yīng)用領(lǐng)域紛紛出臺(tái)了相應(yīng)的規(guī)范性文件,強(qiáng)調(diào)要加強(qiáng)人工智能的相關(guān)數(shù)據(jù)安全研究和管控。如在金融科技場(chǎng)景,2018年4月,中國(guó)人民銀行、中國(guó)銀監(jiān)會(huì)、中國(guó)證監(jiān)會(huì)和國(guó)家外匯管理局共同發(fā)布了《關(guān)于規(guī)范金融機(jī)構(gòu)資產(chǎn)管理業(yè)務(wù)的指導(dǎo)意見(jiàn)》,在第23條對(duì)運(yùn)用人工智能技術(shù)開(kāi)展投資業(yè)務(wù)進(jìn)行了相應(yīng)規(guī)定,要求金融機(jī)構(gòu)應(yīng)當(dāng)向金融監(jiān)督管理部門報(bào)備人工智能模型的主要參數(shù)以及資產(chǎn)配置的主要邏輯,并向投資者充分提示人工智能算法的固有缺陷和使用風(fēng)險(xiǎn)。2019年8月,中國(guó)人民銀行發(fā)布《金融科技(FinTech)發(fā)展規(guī)劃(2019— 2021年)》,提出要“加強(qiáng)金融領(lǐng)域人工智能應(yīng)用潛在風(fēng)險(xiǎn)研判和防范,確保把人工智能金融應(yīng)用規(guī)制在安全可控范圍內(nèi)”。整體來(lái)看,我國(guó)目前尚未形成體系完善的人工智能數(shù)據(jù)安全法律法規(guī)。雖然《數(shù)據(jù)安全法(草案)》和《個(gè)人信息保護(hù)法(草案)》已發(fā)布,但其落實(shí)尚需要一系列配套法規(guī)、部門規(guī)章和規(guī)范性文件提供支撐。同時(shí)由于上位法尚未出臺(tái),人工智能場(chǎng)景化立法的步伐也相對(duì)滯后,數(shù)據(jù)安全并未在相關(guān)人工智能應(yīng)用行業(yè)的規(guī)范性文件中得到足夠的重視和明確的規(guī)制要求。未來(lái),我國(guó)還需要在《網(wǎng)絡(luò)安全法》《數(shù)據(jù)安全法(草案)》和《個(gè)人信息保護(hù)法(草案)》的體系框架下,加快生物特征識(shí)別、工業(yè)互聯(lián)網(wǎng)、智能網(wǎng)聯(lián)汽車、數(shù)字內(nèi)容精準(zhǔn)推送等人工智能重點(diǎn)應(yīng)用領(lǐng)域的場(chǎng)景化立法,構(gòu)建完備的人工智能數(shù)據(jù)安全法律體系。
2人工智能技術(shù)自身面臨的數(shù)據(jù)安全風(fēng)險(xiǎn)
(1)訓(xùn)練數(shù)據(jù)污染可導(dǎo)致人工智能決策錯(cuò)誤。數(shù)據(jù)投毒通過(guò)在訓(xùn)練數(shù)據(jù)里加入偽裝數(shù)據(jù)、惡意樣本等破壞數(shù)據(jù)的完整性,進(jìn)而導(dǎo)致訓(xùn)練的算法模型決策出現(xiàn)偏差。隨著人工智能與實(shí)體經(jīng)濟(jì)深度融合,醫(yī)療、交通、金融等行業(yè)訓(xùn)練數(shù)據(jù)集建設(shè)需求迫切,為惡意、偽造數(shù)據(jù)注入提供機(jī)會(huì),使得從訓(xùn)練樣本環(huán)節(jié)發(fā)動(dòng)攻擊潛在危害增大。例如,在對(duì)話機(jī)器人領(lǐng)域,訓(xùn)練數(shù)據(jù)投毒可導(dǎo)致機(jī)器人發(fā)表歧視性、攻擊性的不當(dāng)言論;在自動(dòng)駕駛領(lǐng)域,訓(xùn)練數(shù)據(jù)投毒可導(dǎo)致車輛違反交通規(guī)則甚至造成交通事故。(2)運(yùn)行階段的數(shù)據(jù)異??蓪?dǎo)致智能系統(tǒng)運(yùn)行錯(cuò)誤。一是人為構(gòu)造對(duì)抗樣本攻擊,導(dǎo)致智能系統(tǒng)產(chǎn)生錯(cuò)誤的決策結(jié)果。例如在生物特征識(shí)別應(yīng)用場(chǎng)景中,對(duì)抗樣本攻擊可欺騙基于人工智能技術(shù)的身份鑒別、活體檢測(cè)系統(tǒng)。二是動(dòng)態(tài)環(huán)境的非常規(guī)輸入可導(dǎo)致智能系統(tǒng)運(yùn)行錯(cuò)誤。人工標(biāo)記數(shù)據(jù)覆蓋不全、訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)同質(zhì)化等會(huì)導(dǎo)致人工智能算法泛化能力不足,智能系統(tǒng)在動(dòng)態(tài)環(huán)境實(shí)際使用中決策可能出現(xiàn)錯(cuò)誤。(3)模型竊取攻擊可對(duì)算法模型的數(shù)據(jù)進(jìn)行逆向還原。攻擊者可通過(guò)公共訪問(wèn)接口對(duì)算法模型的輸入和輸出信息映射關(guān)系分析,構(gòu)造出與目標(biāo)模型相似度非常高的模型,實(shí)現(xiàn)算法模型竊取,進(jìn)而還原出模型訓(xùn)練和運(yùn)行過(guò)程中的數(shù)據(jù)以及相關(guān)隱私信息。(4)開(kāi)源學(xué)習(xí)框架安全風(fēng)險(xiǎn)可導(dǎo)致人工智能系統(tǒng)數(shù)據(jù)泄露。人工智能開(kāi)源學(xué)習(xí)框架集成了大量的第三方軟件包和依賴庫(kù)資源,相關(guān)組件缺乏嚴(yán)格的測(cè)試管理和安全認(rèn)證,存在未知安全漏洞。360、騰訊等企業(yè)安全團(tuán)隊(duì)曾多次發(fā)現(xiàn) TensorFlow、Caffe、Torch 等深度學(xué)習(xí)框架及其依賴庫(kù)的安全漏洞,攻擊者可利用相關(guān)漏洞篡改或竊取人工智能系統(tǒng)數(shù)據(jù)。
3技術(shù)發(fā)展策略
3.1標(biāo)準(zhǔn)制定與監(jiān)管
人工智能安全標(biāo)準(zhǔn)制定。人工智能安全標(biāo)準(zhǔn),是與人工智能安全、倫理、隱私保護(hù)等相關(guān)的標(biāo)準(zhǔn)規(guī)范。從廣義來(lái)說(shuō),人工智能安全標(biāo)準(zhǔn)涉及人工智能本身、平臺(tái)、技術(shù)、產(chǎn)品和應(yīng)用相關(guān)的安全標(biāo)準(zhǔn)。國(guó)內(nèi)外對(duì)人工智能標(biāo)準(zhǔn)化工作也越來(lái)越重視。中國(guó)也應(yīng)針對(duì)技術(shù)應(yīng)用風(fēng)險(xiǎn),嚴(yán)格人工智能標(biāo)準(zhǔn)制定和行業(yè)監(jiān)管,確保人工智能良性發(fā)展。加強(qiáng)人工智能安全監(jiān)管與預(yù)警。加強(qiáng)人工智能安全的研究與監(jiān)管,全面審查、分析人工智能技術(shù)及系統(tǒng)的安全性,包括審查民用人工智能產(chǎn)品的安全性和穩(wěn)定性,特別是涉及人身安全的人工智能產(chǎn)品;審查人工智能在軍事應(yīng)用中的風(fēng)險(xiǎn),以及軍事智能化對(duì)國(guó)際法的影響;審查人工智能在國(guó)家安全和國(guó)防中的倫理道德問(wèn)題。建立人工智能安全預(yù)警機(jī)制,對(duì)人工智能安全風(fēng)險(xiǎn)進(jìn)行監(jiān)控和掃描,識(shí)別脆弱點(diǎn)、風(fēng)險(xiǎn)與威脅,建立風(fēng)險(xiǎn)數(shù)據(jù)庫(kù)。重點(diǎn)關(guān)注人工智能技術(shù)的新發(fā)展與新應(yīng)用,維護(hù)國(guó)家總體安全。
3.2基于差分隱私的隱私保護(hù)技術(shù)
在許多人工智能應(yīng)用中,機(jī)器學(xué)習(xí)需要基于敏感數(shù)據(jù)開(kāi)展訓(xùn)練,例如照片等。在理想情況下,機(jī)器學(xué)習(xí)模型參數(shù)代表的應(yīng)該是通用模式,而不是關(guān)于特定個(gè)人數(shù)據(jù)主體的信息。在這種情況下,差分隱私作為一種隱私保護(hù)技術(shù)可以提供有效的隱私保護(hù)。差分隱私是在統(tǒng)計(jì)和機(jī)器學(xué)習(xí)分析的背景下對(duì)隱私的一個(gè)強(qiáng)有力的數(shù)學(xué)定義。當(dāng)基于隱私數(shù)據(jù)進(jìn)行訓(xùn)練時(shí),差分隱私能夠保證模型不會(huì)學(xué)習(xí)或記住任何特定數(shù)據(jù)主體的細(xì)節(jié)信息。
3.3推動(dòng)高質(zhì)量數(shù)據(jù)資源建設(shè),降低數(shù)據(jù)濫用泄露帶來(lái)的安全隱患
高質(zhì)量數(shù)據(jù)集是提升人工智能算法準(zhǔn)確性、模型合理性至關(guān)重要的因素,只有當(dāng)人工智能系統(tǒng)獲取更為準(zhǔn)確、及時(shí)、一致的高質(zhì)量數(shù)據(jù),才能提供更高效、更可靠的智慧化服務(wù),因此推進(jìn)高質(zhì)量數(shù)據(jù)資源建設(shè)是解決人工智能數(shù)據(jù)安全的重要手段之一。
結(jié)語(yǔ)
人工智能數(shù)據(jù)安全挑戰(zhàn)會(huì)隨著人工智能技術(shù)的發(fā)展突破、應(yīng)用行業(yè)的不斷深入擴(kuò)大等因素加快演變,其對(duì)于人類現(xiàn)實(shí)社會(huì)的外溢和威脅將是一個(gè)復(fù)雜的長(zhǎng)期過(guò)程。因此,我國(guó)必須要在人工智能的動(dòng)態(tài)發(fā)展中實(shí)現(xiàn)對(duì)數(shù)據(jù)安全風(fēng)險(xiǎn)整體的可知可控,確保人工智能數(shù)據(jù)在采集、標(biāo)注、處理、存儲(chǔ)、流動(dòng)、共享和場(chǎng)景應(yīng)用的全生命周期安全,不斷提高人工智能企業(yè)的數(shù)據(jù)安全能力,增強(qiáng)人工智能數(shù)據(jù)安全供給鏈的連續(xù)性和可用性。
參考文獻(xiàn):
[1]朱天清,何木青,鄒德清 . 基于差分隱私的大數(shù)據(jù)隱私保護(hù)[J]. 信息安全研究,2018,1(3).
[2]郝英好.人工智能安全風(fēng)險(xiǎn)分析與治理[J].中國(guó)電子科學(xué)研究院學(xué)報(bào),2020(6):501-505.
[3]魏薇,景慧昀,牛金行.人工智能數(shù)據(jù)安全風(fēng)險(xiǎn)及治理[J].中國(guó)信息安全,2020(3):82-85.