南冰冰
(浙江警察學院 浙江杭州 310051)
個人信息是指與特定個人相關聯(lián)的、反映個體特征的具有可識別性的符號系統(tǒng),包括個人身份、工作、家庭、財產(chǎn)、健康等各方面的信息[1]。自2017 年6 月1日起實施的《網(wǎng)絡安全法》中的第七十六條里,也明確界定了個人信息的概念。個人信息是指以電子或者其他方式記錄的能夠單獨或者與其他信息結(jié)合識別自然人身份的各種信息,這是以法律的形式明確對于個人信息的一種保護,也是我國法律法規(guī)中第一次明確界定了個人信息。當今社會正處于大數(shù)據(jù)時代中,海量的數(shù)據(jù)每天都在被產(chǎn)生、記錄、使用,個人信息成為大數(shù)據(jù)時代最為重要的資源[2],但隨之而來的個人信息泄露事件也頻頻發(fā)生,如何在開發(fā)信息價值的同時保障個人信息的合理利用[3]成為了一大難題。
目前,隨著互聯(lián)網(wǎng)與大數(shù)據(jù)技術的發(fā)展,個人信息被收集、處理(使用、存儲、加工、傳輸、提供、公開等)已經(jīng)成為不可逆轉(zhuǎn)的趨勢[4]。數(shù)據(jù)挖掘、數(shù)據(jù)預測以及更全面的監(jiān)控,造就更具可能性的數(shù)據(jù)[5],為個人信息保護問題帶來了巨大的風險。雖然大數(shù)據(jù)帶來了新的安全問題,它自身卻也是解決問題的重要手段[6]。國內(nèi)外已有相當一部分學者從技術層面對個人信息進行研究,然而目前在個人信息保護方面技術仍未起到其應有的作用,技術發(fā)展的步伐仍然滯后[7]。現(xiàn)階段,我國保護個人信息的立法雖多,但相關規(guī)定是零散的、不系統(tǒng)的[8],歐盟在個人信息領域采用“統(tǒng)一立法”,美國則通過“分散立法”和“行業(yè)立法”兩種方式[9],但僅憑立法無法對個人信息起到有效保護,還需要技術、法律法規(guī)等的結(jié)合。
同時,隨著社會的發(fā)展,個人信息也將起到越來越重要的作用。做好大數(shù)據(jù)背景下個人信息的保護,有利于實現(xiàn)私權的全面保護,有利于助推公權的有效實施[10]。因此,加強大數(shù)據(jù)背景下個人信息相關研究有其必要性與重要性。
而個人信息相關研究雖已受到學術界與社會的廣泛關注,但對于大數(shù)據(jù)背景下個人信息保護研究的整體認識,以及如何更好地推進個人信息保護缺乏深入認識?;诖?,本文借助文獻計量法,基于CNKI 和Web of Science 數(shù)據(jù)庫,對其中的相關文獻分別進行計量分析,以期探究出該領域國內(nèi)與國際的研究概況、研究熱點。
文獻計量分析是利用文獻計量學原理對相關文獻進行分析的一種文獻分析方法,通過采用數(shù)學、統(tǒng)計學等計量方法,研究文獻的分布結(jié)構、數(shù)量關系、變化規(guī)律[11]。繪制科學知識圖譜即可視化圖形,更加直觀地反映各項數(shù)據(jù)間的復雜關系,便于分析不同領域的研究熱點、發(fā)展動態(tài)等。當前,一些繪制科學知識圖譜以用于文獻計量分析的軟件已被研發(fā)出來,如CiteSpace、VOSviewer、Pajeck、bibexcel等,本文主要采用CiteSpace和VOSviewer 等軟件進行文獻計量分析。CiteSpace 是由美國德雷克賽爾大學(Drexel University)信息科學與技術學院的陳超美教授開發(fā)研制的科學文獻計量自動化軟件[12],可以提供共線分析、類分析、突變詞檢測等功能。VOSviewer 是由荷蘭萊頓大學的Nees Jan van Eck 和Ludo Waltman 共同開發(fā)的[13],可用于繪制密度視圖等圖像。
本文利用文獻計量法,對大數(shù)據(jù)背景下個人信息領域的研究進行分析,制定基本框架。以不同數(shù)據(jù)庫集的文獻數(shù)據(jù)為研究對象,按照文獻計量學的分析邏輯和方法,對文獻中蘊含的信息進行挖掘和量化分析,進而通過數(shù)學和統(tǒng)計分析的角度,考察文獻之間的外部特征和相互關系[14],揭示該領域的研究概況、研究熱點,并分析其發(fā)展方向。
本文選取CNKI和Web of Science數(shù)據(jù)庫作為數(shù)據(jù)來源。對CNKI數(shù)據(jù)庫進行高級檢索,以“大數(shù)據(jù)”和“個人信息”為主題,設定發(fā)表時間為2012年1月1日到2022年1月1日,成功檢索6 520篇文獻,剔除不相關文獻(會議、新聞等),最終檢索文獻5 946篇;在Web of Science核心合集(WoS)數(shù)據(jù)庫中以“Big Data”“Personal Information”為主題,發(fā)布時間為2012年1月1日至2022年1月1日,最終檢索文獻308篇。
2.1.1 發(fā)文量
大數(shù)據(jù)背景下個人信息相關問題逐年受到重視,發(fā)文量呈上升趨勢,本文對中國知網(wǎng)數(shù)據(jù)庫檢索出的文獻進行統(tǒng)計,結(jié)果見圖1??擅黠@看出:發(fā)文量于2018年出現(xiàn)大幅增長,2018年前后,增長均較為穩(wěn)定。圖1中2022年為預測發(fā)文量,因2021年《民法典》的實施以及《數(shù)據(jù)安全法》和《個人信息保護法》的出臺,社會對于個人信息有了進一步關注,故相較于2021 年,2022 年的發(fā)文量有一個較大的增幅,也說明了近年來,個人信息相關問題越來越被國家與社會所重視,該領域的相關研究也受到學術界越來越多的關注。
圖1 CNKI中2012—2022年大數(shù)據(jù)背景下個人信息安全研究領域發(fā)文量
2.1.2 作者
本文統(tǒng)計了該研究領域的發(fā)文情況(如表1 所示),約有7 450 名作者,發(fā)文量位居前5 位的是陳兵(南開大學,10篇)、張濤(清華大學,10篇)、王利明(中國人民大學,7篇)、李儀(重慶理工大學,7篇)、張建文(西南政法大學,7篇)。
表1 CNKI中大數(shù)據(jù)背景下個人信息研究領域作者發(fā)文量排名前6的作者
為進一步分析作者之間的合作關系,本文制作了作者之間的合作關系網(wǎng)絡圖,發(fā)文量最高的9 個作者聚類團合作網(wǎng)絡圖譜如圖2 所示。網(wǎng)絡譜圖中,每個研究團體分布都較為分散,多為3~6 人的小團體。且經(jīng)進一步分析發(fā)現(xiàn)同一類團中的成員多為同一機構的,如宋慈團隊中的5人均為中國礦業(yè)大學的,相麗玲團隊中的3 人均為山西大學的?,F(xiàn)階段,國內(nèi)學者在該領域的研究多局限于同機構內(nèi)的合作,且合作對象以及小組內(nèi)人數(shù)較為固定,即組內(nèi)聯(lián)系較為緊密。但是從全局來看,普遍缺乏組間合作。
圖2 CNKI中該研究領域作者間合作網(wǎng)絡圖譜
2.1.3 關鍵詞
關鍵詞可以很好地體現(xiàn)論文主題,一個關鍵詞出現(xiàn)的頻次等于附有該關鍵詞的學術論文的總數(shù),關鍵詞出現(xiàn)的頻次越高,說明相關的研究成果數(shù)越多,研究內(nèi)容的集中性就越強[15]。
首先,利用VOSviewer 進行分析,發(fā)現(xiàn)有效關鍵詞13 650個,表2中為出現(xiàn)次數(shù)最多的關鍵詞。繪制關鍵詞密度視圖(見圖3),顏色由深至淺表示關鍵詞共現(xiàn)的頻次越來越高,即相關熱度較高,由此可以看出,大數(shù)據(jù)背景下個人信息研究領域的研究熱點主要集中在個人信息、大數(shù)據(jù)、個人信息保護隱私權、被遺忘權、大數(shù)據(jù)時代、信息安全等方面上。
表2 大數(shù)據(jù)背景下個人信息安全領域頻次排名前15位的關鍵詞
圖3 CNKI中大數(shù)據(jù)背景下個人信息研究領域關鍵詞密度視圖
隨著大數(shù)據(jù)背景下個人信息研究領域的熱度不斷提升,“大數(shù)據(jù)”“個人信息”逐漸成為研究熱點。個人信息的保護則又涉及多項權利,如隱私權、個人信息權、被遺忘權等,在當今大數(shù)據(jù)時代里,如何合理有效保護個人信息也是我國大多數(shù)學者所探討研究的問題,其中,法律相關的保護是研究中呼聲最高也是討論熱度最高的。
其次,利用CiteSpace 對關鍵詞進行聚類,根據(jù)網(wǎng)絡結(jié)構和聚類的清晰度,提供模塊值(Q值)和平均輪廓值(S值)兩個指標,它可以作為評判圖譜繪制效果的一個依據(jù)。一般而言,Q>0.3就意味著劃分出來的社團結(jié)構是顯著的;當S值在0.7時,聚類是高效率令人信服的;若在0.5 以上,聚類一般認為是合理的[16]。繪制聚類圖譜,如圖4所示。該聚類圖的模塊值為0.891 4>0.3,平均輪廓值為0.966 1>0.7,說明該網(wǎng)絡聚類結(jié)構合理,效果較為顯著。對聚類信息進行整理(見表3),容量代表了節(jié)點個數(shù),剪影度即為緊密程度,代表了節(jié)點之間的聯(lián)系程度。由表3 可知,此聚類內(nèi)部緊密程度均在0.7 以上,且有22 個超過了0.9,說明聚類效果較好。
表3 關鍵詞聚類一覽表
圖4 CNKI中大數(shù)據(jù)背景下個人信息研究領域關鍵詞聚類圖譜
從聚類結(jié)果來看,該領域的研究主要包括了對于大數(shù)據(jù)與個人信息理論的探討,由個人信息涉及的隱私與人格權等問題、法律保護、個人信息泄漏原因、疫情防控中的權利讓渡、保護原則等方面。繼續(xù)進行進一步分類,可分為三大類,與大數(shù)據(jù)背景、信息相關、保護措施相關。
為了研究關鍵詞之間的相互關系,本文運用VOSviewer對關鍵詞進行了共現(xiàn)分析,并利用CiteSpace對關鍵詞的中心度進行計算,中心度排名前8 位的見表4?!霸朴嬎恪薄按髷?shù)據(jù)”“個人信息”3個關鍵詞的中心度排名為前三,其中心度分別為0.41、0.39、0.34。這些詞是較為關鍵的樞紐節(jié)點,在該領域的研究中也多次起到中介的作用?!皞€人信息”“大數(shù)據(jù)”等核心關鍵詞之間聯(lián)系較為緊密,在網(wǎng)絡中占據(jù)核心地位。關鍵詞共現(xiàn)圖譜見圖5。
表4 CNKI中大數(shù)據(jù)背景下個人信息研究領域中心度排名前8的關鍵詞
圖5 CNKI中大數(shù)據(jù)背景下個人信息安全研究領域關鍵詞共現(xiàn)圖譜
為更清晰地了解該領域不同階段的研究趨勢,利用CiteSpace 尋找其突變詞。突現(xiàn)性關鍵詞也稱突現(xiàn)詞,一定程度上可以反映一段時間內(nèi)影響力較大的研究領域,即學界在一段時間內(nèi)高度關注的研究主題[17]。隨時間的發(fā)展,不同階段研究的關鍵詞是在不斷變化的,關鍵詞突現(xiàn)度則可以反映出一段時間內(nèi)影響力較大的研究領域。圖6為20個突變詞列表。
圖6 基于CNKI的20個突變詞
由圖6 可知:算法、隱私保護、云計算等關鍵詞在2012—2022 年間不斷成為突變關鍵詞;仍在進行的研究熱點有疫情防控、數(shù)字經(jīng)濟、算法、公共利益、算法歧視。大數(shù)據(jù)背景下個人信息研究領域檢測出的突變詞較多,體現(xiàn)該領域主題方向較多,較為多元、發(fā)散,研究熱度也較高。
2012—2016 年,該階段云計算、隱私、信息安全、互聯(lián)網(wǎng)、社交網(wǎng)絡、信息、隱私保護等詞開始在該領域出現(xiàn),該階段是大數(shù)據(jù)背景下個人信息研究領域興起的階段,學者更多聚焦于該研究本身,對概念進行探討,研究何為個人信息,大眾常提的隱私與個人信息又有何種聯(lián)系。另外,結(jié)合當時社會環(huán)境,開始關注互聯(lián)網(wǎng)、社交網(wǎng)絡對個人信息保護的影響。
2016—2020 年,新型網(wǎng)絡犯罪開始興起,電信詐騙等利用個人信息進行犯罪的案例層出不窮,國家出行相關法律進行保護。2017年10月1日實行的《民法總則》中第111 條規(guī)定“自然人的個人信息受法律保護”。傳統(tǒng)的民法沒有單獨承認個人信息保護,只承認隱私權,這是民法第一次對個人信息進行保護,指出公民享有信息權。這一法律的出臺將公眾對于個人信息的相關討論推上了高潮,因此,在此階段電信詐騙、民法總則、信息權等詞突現(xiàn)。
2020—2022 年,出現(xiàn)的突變關鍵詞有疫情防控、數(shù)字經(jīng)濟、算法、公共利益、算法歧視。在這一階段里,疫情暴發(fā),為更好監(jiān)控疫情,公民的個人信息權需要讓渡,這也引起了更多學者的研究。例如:在疫情防控的背景下,個人信息保護的邊界究竟在哪里,即雖然大數(shù)據(jù)在以新冠肺炎疫情為代表的突發(fā)公共衛(wèi)生事件治理方面發(fā)揮了不可或缺的作用,但如何進行個人信息的有序采集和管理依舊懸而未決[18]。另外,此階段也有學者開始研究算法在個人信息保護方面的應用以及對個人信息安全的一些影響。
2.2.1 發(fā)文量
通過統(tǒng)計Web of Science 數(shù)據(jù)庫中2012—2022 年發(fā)表的關于大數(shù)據(jù)背景下個人信息研究領域的相關文獻(如圖7 所示)發(fā)現(xiàn)。隨著時間的推移,該領域熱度逐漸提升,受到全球越來越多的學者的關注,發(fā)文量越來越多,在后期發(fā)文量逐漸保持穩(wěn)定。
圖7 WOS中大數(shù)據(jù)背景下個人信息安全研究領域發(fā)文量
2.2.2 國家
一個國家或者一個機構在某一個學術研究領域的地位取決于它的發(fā)文量和文章質(zhì)量[19]。本文利用VOSviewer對大數(shù)據(jù)背景下個人信息研究領域的相關文獻進行統(tǒng)計,繪制知識圖譜(見圖8),圖中結(jié)點大小與頻數(shù)成正比,結(jié)點與連線顏色對應不同年份,連線粗細代表合作強度。
圖8 國家合作關系共線圖
發(fā)文量排名前7 的國家如表5 所示。美國、中國、英國為研究的核心國家。發(fā)文量最多的是美國(103篇),其次是中國(50篇)、英國(29篇);被引次數(shù)最多的是美國(1 778篇),其次為英國(537篇)、中國(497篇),充分展現(xiàn)這些國家在該領域的研究較為深入,影響力也較大。美國在該領域的研究中占據(jù)著重要地位,其發(fā)文量及被引次數(shù)均最大,且中心性最高為0.71。中國發(fā)文量位居第二,但中心性僅0.15,說明國內(nèi)學者在國際合作方面略有欠缺,需加強國際合作以進一步增強國際影響力。此外,英國的中心性也較高(0.33),在該領域的國際合作方面較為積極,有一定的影響力。
表5 發(fā)文量排名前7的國家
從整體來看,在研究早期,“美國-英國”“美國-意大利”是主要合作體,而在研究后期,“中國-美國”成為該領域研究的主要合作體,新加坡、印度等國家也逐漸加入到該領域的國際合作中去。
2.2.3 作者
本文統(tǒng)計了Web of Science 核心合集(WoS)數(shù)據(jù)庫中該研究領域的發(fā)文情況(表6),由表6 可知,發(fā)文量最多的是澳大利亞的Deborah Lupton,總計發(fā)表5篇文章。作者合作關系共線圖見圖9。國內(nèi)外共有953個學者在該領域發(fā)表過相關文章,作者人數(shù)高于發(fā)文量,由此可知,該領域?qū)W者多通過合作完成研究。與其他研究人員聯(lián)系緊密的作者主要是英國的Patty Kostkova,其余研究人員主要通過Patty Kostkova 進行聯(lián)系。同時,近幾年Li Lan(英國)、David Novillo-Ortiz(丹麥)、Natasha Azzopardi-Muscat(馬爾他)等人組成的合作團體逐漸形成。
表6 WOS中發(fā)文量排名前3的作者
圖9 WOS中作者合作關系共線圖
作者被引頻次最高的為Deborah Lupton(澳大利亞),其次是Haejung Yun(美國)。由此可見,這些學者在該領域的國際研究方面的影響力較大,對大數(shù)據(jù)背景下個人信息研究領域做出了重要的貢獻。而我國學者在國際研究上的影響力略有欠缺,在國際研究方面無明顯領軍人物。
2.2.4 關鍵詞
對檢索出的文獻進行關鍵詞分析,其中有效關鍵詞共1 858個,出現(xiàn)頻次較高的8個關鍵詞列于表7中。同時,繪制出關鍵詞的密度視圖(見圖10)。其中“big data”出現(xiàn)頻次最多,共計148 次。該領域在國際研究中的熱點主要集中在“big data”“privacy”“information”“trust”“management”等詞上。
表7 大數(shù)據(jù)背景下個人信息安全領域頻次排在前8位的關鍵詞
圖10 WOS中大數(shù)據(jù)背景下個人信息研究領域關鍵詞密度視圖
基于前期分析,為進一步判斷不同階段的研究前沿,利用CiteSpace檢測2012—2022年該領域研究的突變詞(見圖11),至今仍在進行的研究熱點有artificial intelligence。突現(xiàn)詞的出現(xiàn)周期普遍不長,說明這幾類熱點更迭較快。
圖11 基于WOS的5個突變詞
在當今社會,大數(shù)據(jù)背景下個人信息受到越來越多人的關注,國內(nèi)外學者對其的研究也是呈不斷上升之勢。進行基于WOS數(shù)據(jù)庫核心合集的檢索,可得早在20世紀30年代,便有了與“個人信息”相關的學術方面的研究,但個人信息研究真正受到大眾關注卻是在21 世紀。近10 年,大數(shù)據(jù)相關技術蓬勃發(fā)展,國內(nèi)外學者開始研究大數(shù)據(jù)時代下個人信息的保護問題。2018年,全球公開披露的數(shù)據(jù)泄露事件達到6 500起,共涉及50 億條數(shù)據(jù)記錄。同年,GDPR 等個人隱私數(shù)據(jù)保護法出臺,個人信息保護受到更多人的關注,國內(nèi)外相關研究的發(fā)文量都于該年有一個明顯的增長。
美國在大數(shù)據(jù)背景下個人信息研究領域中一直占據(jù)著核心地位,其總發(fā)文量、被引次數(shù)、中心性均位居第一。而我國在大數(shù)據(jù)背景下個人信息研究領域發(fā)文量與世界影響力不一致問題較為突出:一方面是發(fā)布的相關文章被引次數(shù)較少,另一方面是研究前期,我國在該領域的研究中參與的國際合作較少。作者層面,國內(nèi)學者缺少具有顯著影響力的人物即領軍人物,且國內(nèi)學者在研究時需突破機構的限制,因現(xiàn)階段在該研究領域中,國內(nèi)學者與國外相比,總體上研究較為獨立,并多局限于同機構內(nèi)的合作,且國內(nèi)學者合作對象以及小組內(nèi)人數(shù)較為固定,缺乏組間合作、國際合作,不利于日后該領域研究的交流與深入發(fā)展。
該領域的研究熱點主要集中在“大數(shù)據(jù)”“信息”“保護”等方面,且中國與國際的研究熱點較為一致,即大體方向相同。3個主要研究方面延伸出了較多的具體研究內(nèi)容,其中包括了“隱私”“信息安全”“互聯(lián)網(wǎng)”以及各個主要方面之間的關系等,而在不同的階段,其具體的內(nèi)容略有不同,研究前沿隨著社會的發(fā)展不斷變化。而在國內(nèi)外各自的研究中,也存在著具體內(nèi)容上的差異。以保護措施為例,國內(nèi)在法律對于個人信息保護方面的研究較為深入,探究個人信息的界定,敏感個人信息,建立監(jiān)管、救濟與合規(guī)制度[20];反觀國際,在此研究方向上卻沒有太高的熱度。就國內(nèi)而言,研究熱點貼合我國國情,將個人信息相關研究融于社會現(xiàn)象之中去探索,且開始從宏觀的問題轉(zhuǎn)向特性、具體的研究,不僅是局限于對概念的探討。
大數(shù)據(jù)背景下個人信息保護是一項重要且困難的工作,現(xiàn)有的研究也無法完全解決實際中遇到的各類問題。在學術方面,首先需加強學術交流,擴展視野,從合作中提供出更多思路,以進一步完善、深入各自的研究;其次,需探索更多的研究方向,不斷拓展研究內(nèi)容,即拓展廣度與深度。在落實研究方面,需考慮多個方面,深入感受時代背景、大數(shù)據(jù)技術、個人信息的具體含義,善于學習他國經(jīng)驗。例如:有部分學者就在研究中提出,借鑒新西蘭個人隱私保護制度加強多方保護[21];也有部分學者主張考察歐盟的數(shù)據(jù)保護立法改革進展與美國隱私保護相關法規(guī)[22]。另外,個人信息保護不僅要從立法入手,社會、企業(yè)、個人、政府等的努力也缺一不可,單一路徑是無法為個人信息提供完善的保護[23]。另外,需結(jié)合實際,隨著社會變化靈活調(diào)整政策。
本文以CNKI數(shù)據(jù)庫和Web of Science數(shù)據(jù)庫為研究對象,利用CiteSpace、VOSviewer 等可視化工具繪制可視化圖譜,以進行文獻計量法分析,研究結(jié)論如下。
(1)個人信息相關研究越來越受到國內(nèi)外的關注,關于大數(shù)據(jù)背景下個人信息研究領域的發(fā)文量總體上呈上升趨勢,2018年于國內(nèi)外學者而言都是一個轉(zhuǎn)折點,我國大體上能夠跟上國際研究趨勢。
(2)澳大利亞的Deborah Lupton 在該領域中有著突出貢獻;美國在大數(shù)據(jù)背景下個人信息研究領域占據(jù)重要地位;我國的發(fā)文量較高但中心性不高,在國際上的地位有待加強。在研究前期,“美國-英國”“美國-意大利”是主要合作體;而在研究后期,我國向國際靠攏,“中國-美國”逐漸成為該領域研究的主要合作體。
(3)近10 年,大數(shù)據(jù)背景下個人信息研究熱點主要集中在“大數(shù)據(jù)”“信息”“保護”等方面,如何在大數(shù)據(jù)背景下更好地保護個人信息是研究的主要目的。國內(nèi)相關研究大致分為3個階段:第一階段是宏觀的、較為理論的探討;第二階段是對于對策以及相關法律層面的探討;第三階段是聚焦于疫情防控下的相關研究。