朱 光 卞淑瑩 楊健清
(1.南京信息工程大學管理工程學院,江蘇 南京 210044; 2.南京信息工程大學自貿(mào)區(qū)研究院,江蘇 南京 210044)
隨著無線通信技術(shù)的發(fā)展以及移動終端設(shè)備的廣泛應(yīng)用,微博、抖音、Instagram、Twitter等社交媒體類APP為用戶提供了網(wǎng)絡(luò)交際和信息分享的渠道,成為大眾日常生活中必不可少的一部分。然而,社交媒體APP為提供精準的個性化服務(wù)和廣告營銷,需獲取用戶手機的諸多權(quán)限(如錄音、攝像、地理位置)并長期采集用戶的使用行為,導致用戶不知曉也未授權(quán)的個人數(shù)據(jù)被采集和使用等問題,增加了隱私泄露的風險[1]。
為防止APP過度索取無關(guān)權(quán)限、惡意訪問用戶隱私數(shù)據(jù)等行為,各國(地區(qū))都出臺了相關(guān)法律法規(guī),對個人信息使用的途徑、范圍、目的進行了明確規(guī)定。2013年,我國發(fā)布的《電信和互聯(lián)網(wǎng)用戶個人信息保護規(guī)定》指出,電信業(yè)務(wù)經(jīng)營者、互聯(lián)網(wǎng)信息服務(wù)提供者應(yīng)制定隱私政策,其內(nèi)容應(yīng)當包括收集、使用信息的目的、方式和范圍,查詢、更正信息的渠道以及拒絕提供信息的后果等事項[2]。2018年,歐盟出臺的《通用數(shù)據(jù)保護條例》(General Data Protection Regulation,GDPR)在賦予用戶處理自身數(shù)據(jù)更多權(quán)限的同時,也提升了企業(yè)對用戶數(shù)據(jù)收集、存儲和使用的標準[3]。2020年,網(wǎng)信辦發(fā)布了《常見類型移動互聯(lián)網(wǎng)應(yīng)用程序(APP)必要個人信息范圍(征求意見稿)》,對各類互聯(lián)網(wǎng)平臺和APP的個人信息收集范圍做出界定,以保障公民個人信息安全[4]。在此背景下,眾多社交媒體類APP紛紛制定了個人信息保護政策、個人信息使用說明、隱私保護協(xié)議、隱私保護指引等隱私政策[5-6]。
然而,現(xiàn)實情境下的隱私政策仍存在主題缺失、內(nèi)容隱晦、結(jié)構(gòu)混亂等問題,用戶為了APP的正常使用通常不會仔細閱讀隱私政策,并不真正了解哪些個人信息會被搜集與使用[7]。2021年5月,網(wǎng)信辦發(fā)現(xiàn)有33款A(yù)PP在出臺隱私政策的同時,仍會違規(guī)收集個人隱私信息[8]。2022年1月,工信部指出30余款社交媒體類APP的隱私政策存在內(nèi)容表述不清、晦澀難懂等問題[9]。因此,如何完善隱私政策的規(guī)范性、全面性和可讀性成為業(yè)界和學界越發(fā)關(guān)注的問題。
基于上述背景,本文以社交媒體類APP隱私政策為研究對象,引入技術(shù)接受模型(Technology Acceptance Model,TAM)從感知易用性和感知有用性兩個維度研究社交媒體類APP隱私政策的文本內(nèi)容并提出優(yōu)化建議。首先從感知易用性角度,對隱私政策的文本可讀性進行測度,探尋其對用戶閱讀意愿的影響。進一步從感知有用性角度,運用LDA(Latent Dirichlet Allocation)模型識別隱私政策主題,歸納成類別條目與國內(nèi)外相關(guān)法律對比,找出存在的問題,提出優(yōu)化建議。
隱私政策是指互聯(lián)網(wǎng)環(huán)境下各類網(wǎng)站、軟件以及APP就如何收集和使用個人信息所做出的說明與解釋,其制定與完善對規(guī)范個人信息利用有著重要的意義[10]。然而,皮尤研究中心的調(diào)查顯示,只有約9%的用戶表示在使用APP或軟件之前會閱讀隱私政策[11]。針對隱私政策的閱讀意愿問題,Steinfeld N[12]發(fā)現(xiàn),當隱私政策全文顯示時,用戶會選擇花費較多時間閱讀全文;而當政策以折疊選項的方式呈現(xiàn)時,用戶并不傾向于點開鏈接自愿閱讀。Singh R I等[13]從隱私政策的外觀呈現(xiàn)方面,發(fā)現(xiàn)字體大小、排版格式、背景顏色等因素會影響用戶閱讀意愿。Vail M W等[14]從文本結(jié)構(gòu)維度,發(fā)現(xiàn)層次化的隱私政策內(nèi)容比其他表現(xiàn)形式更能提升用戶的閱讀意愿。朱侯等[15]從個人信息搜集、信息安全、用戶權(quán)利、聯(lián)系與申訴途徑等方面對社交媒體隱私政策內(nèi)容的可讀性特征進行了統(tǒng)計,驗證了可讀性對用戶閱讀意愿會產(chǎn)生正向影響的結(jié)論。朱光等[16]基于技術(shù)接受模型和自我效能理論,從用戶主觀感知和隱私政策的內(nèi)容特征兩個維度分析主觀規(guī)范、信息質(zhì)量、信息過載、自我效能、感知易用性、感知有用性、經(jīng)驗等因素對社交媒體隱私政策閱讀意愿的影響。張玥等[17]基于認知負荷理論,采用虛擬實驗和多因素方差分析測評了用戶在閱讀不同類型隱私政策時的主觀認知負荷以及客觀成績,從而進一步研究信息表征對移動醫(yī)療APP隱私政策閱讀意愿和閱讀效果的影響。
為提升用戶的閱讀意愿,研究學者運用內(nèi)容分析法和比較分析法,分析不同類型隱私政策的文本特征,比較主題差異,提出優(yōu)化方案。袁紅等[18]以政務(wù)APP的隱私政策文本為研究對象,運用內(nèi)容分析法從外部特征和文本內(nèi)容兩個維度分析其存在的問題。儲節(jié)旺等[19]以美國政府開放數(shù)據(jù)的相關(guān)政策文本為數(shù)據(jù)來源,運用NVivo文本分析工具,對政策文本進行內(nèi)容多層編碼分析,梳理美國政府開放數(shù)據(jù)隱私保護框架。何培育等[20]以微信、淘寶等10款常用的APP為研究對象,對其隱私政策內(nèi)容進行定性梳理與歸納,并提出完善建議。嚴煒煒等[21]以在線學術(shù)社區(qū)的隱私政策框架內(nèi)容為研究對象,從信息管理、技術(shù)安全、用戶權(quán)利、責任意識、基礎(chǔ)功能和高級功能等維度提出了完善思路和優(yōu)化路徑。Martiny K等[22]運用文本挖掘技術(shù)分析上百個隱私政策的摘要內(nèi)容,幫助用戶了解其結(jié)構(gòu)與主題。Kaur J等[23]收集2 000多例不同類型的網(wǎng)站、軟件和APP的隱私政策,運用LDA模型對政策文本進行主題識別,結(jié)果顯示,所在地的法律法規(guī)對隱私政策的術(shù)語和關(guān)鍵詞具有顯著影響。Strahilevitz L J等[24]從隱私政策的語言描述和句法結(jié)構(gòu)層面,分析了法官和消費者在法律層面對于隱私政策理解的差異性。
針對隱私政策的規(guī)范性、友好性、全面性等測評指標,趙楊等[25]以醫(yī)療健康A(chǔ)PP的隱私政策文本為研究對象,綜合運用卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)和長短期記憶人工神經(jīng)網(wǎng)絡(luò)進行隱私政策合規(guī)性的測評。張艷豐等[26]以10款短視頻APP為研究對象,從政策表征、信息收集與存儲、信息使用與分享、用戶權(quán)利、隱私保護這5個維度構(gòu)建隱私政策的評價指標體系,進一步利用灰色加權(quán)關(guān)聯(lián)分析法對隱私政策的閱讀感知性進行關(guān)聯(lián)度計算。姚勝譯等[27]以電子商務(wù)類APP的隱私政策文本為研究對象,運用層次分析法,從內(nèi)容可讀性和交互友好性兩個維度構(gòu)建了多層級的隱私政策的友好度評價指標體系。周林興等[28]以我國78個檔案網(wǎng)站為研究對象,對其是否設(shè)有隱私政策以及隱私政策的形式、內(nèi)容進行調(diào)研。調(diào)研結(jié)果顯示,我國檔案網(wǎng)站的隱私政策規(guī)范性不足,內(nèi)容有待進一步健全。Chang Y等[29]提出了隱私邊界評價模型,從信息公平等5個維度評估用戶對隱私政策的感知有用性和感知易用性。A?meur E等[30]從隱私政策的個性化結(jié)構(gòu)和文本內(nèi)容兩個維度,分析了網(wǎng)站隱私政策與用戶信任之間的關(guān)系。
整體來看,現(xiàn)有研究大多關(guān)注隱私政策的閱讀行為、內(nèi)容分析及評價指標等方面,少有研究結(jié)合呈現(xiàn)形式和主題類別兩個層面對隱私政策進行內(nèi)容分析,也缺少與國內(nèi)外相關(guān)法律制度的對比分析。基于此,本文引入TAM模型綜合考慮隱私政策的感知易用性和感知有用性,運用文本可讀性分析和LDA主題識別,從呈現(xiàn)形式和內(nèi)容主題兩方面研究社交媒體隱私政策的優(yōu)化問題。
TAM模型用來研究用戶接受信息系統(tǒng)或IT技術(shù)的影響因素,主要從感知有用性和感知易用性兩個維度分析行為態(tài)度、使用意愿和實際行為三者之間的關(guān)系[31]?;诖?,一方面,若社交媒體類APP的隱私政策內(nèi)容全面、主題規(guī)范,可以滿足用戶的隱私保護、心理感知及社交匿名等需求,則用戶的感知有用性較強,隱私政策發(fā)揮的效果更好;另一方面,若隱私政策內(nèi)容邏輯清晰,簡明易懂,則用戶感知易用性較強,可以引導用戶深入閱讀,讓其了解其個人信息采集和使用的準則。
基于上述分析,本文從感知有用性和感知易用性兩個維度對隱私政策內(nèi)容進行分析。一方面,利用LDA模型識別隱私政策主題,并與國內(nèi)外知名法規(guī)進行對比以分析其感知有用性;另一方面,設(shè)計政策可讀性指標對感知易用性進行測評。在此基礎(chǔ)上,提出社交媒體類APP的隱私政策優(yōu)化方案。
本文基于小米應(yīng)用商店排行榜(2022年2月28日),選擇累計下載量在1億次以上的33款社交媒體類APP(包括微博、微信、知乎、抖音等)作為研究樣本,采用網(wǎng)絡(luò)爬蟲與人工下載相結(jié)合的方式獲取隱私政策文本。剔除文本內(nèi)容相似和未能正確采集的部分,最終得到30款社交媒體類APP隱私政策文本,如表1所示,文本總字數(shù)約46萬字。
表1 30款社交媒體類APP隱私政策概況
圖1 研究流程
為便于后續(xù)LDA主題識別和文本可讀性分析,需要對采集文本進行預(yù)處理,步驟如下:
1)數(shù)據(jù)清洗。對隱私政策文本中的標點、無意義數(shù)字和符號進行清洗過濾,如標題序號“一”“(1)”“1.1”等。
2)文本分詞。采用Jieba分詞包對隱私政策文本進行分詞處理,并依據(jù)《中華人民共和國個人信息保護法》《中華人民共和國網(wǎng)絡(luò)安全法》以及《信息安全技術(shù) 個人信息安全規(guī)范》(GB/T35273-2020)中的術(shù)語解釋構(gòu)建詞典,對分詞結(jié)果進行停用詞處理。
3)特征提取。對分詞后的隱私政策文本進行TF和TF-IDF特征提取,選取相對較優(yōu)的特征作為LDA主題模型的輸入?yún)?shù)。
4)文本向量化處理。采用Gensim包中封裝的Doc2bow方法進行文本向量化處理,過濾文本中出現(xiàn)頻率過高或過低的詞語,以保證LDA主題識別的效果。
在隱私政策文本中,突出重點的標題設(shè)置、條理清晰的段落劃分以及便于閱讀的整體排版都將大幅提升用戶的閱讀體驗,從而提升用戶對隱私政策的閱讀意愿[32]。結(jié)合前人關(guān)于文本可讀性的研究以及隱私政策文本結(jié)構(gòu)的獨特性[33],本文選取命名方式、小標題數(shù)量、導語、文本篇幅、術(shù)語密度、平均句長6個指標對社交媒體類APP隱私政策的可讀性進行測評,以探究隱私政策的感知易用性情況。指標描述如表2所示。
表2 隱私政策文本可讀性測評指標
表2(續(xù))
其中,術(shù)語密度的計算公式如下:
(1)
平均句長的計算公式如下:
(2)
與傳統(tǒng)文本分析方法相比,LDA主題模型克服了文本矩陣稀疏、語義缺失等諸多缺陷,常用來識別各類文本中隱含的主題狀況[34]。基于此,本文利用LDA主題模型對社交媒體類APP的隱私政策文本進行主題識別,并將結(jié)果作為與國內(nèi)外知名法規(guī)進行主題對比的依據(jù),以探尋現(xiàn)有社交媒體隱私政策文本的感知有用性。
LDA模型認為文檔到主題服從多項式分布,主題到關(guān)鍵詞也服從多項式分布,其核心結(jié)構(gòu)是由詞、主題和文檔組成的3層貝葉斯模型[35],如圖2所示。
圖2 LDA主題模型結(jié)構(gòu)
其中,θ表示主題分布,φ表示關(guān)鍵詞分布,α是主題分布θ的Dirichlet分布參數(shù),β是關(guān)鍵詞分布φ的先驗分布參數(shù),w表示模型最終生成的關(guān)鍵詞,z表示模型生成的主題。LDA主題模型的聯(lián)合概率分布如式(3)所示[36]:
(3)
對30款社交媒體類APP的隱私政策文本進行分詞,排序前20的關(guān)鍵詞詞頻統(tǒng)計如表3所示,得到4 499個詞匯共出現(xiàn)106 178次。“信息”“個人信息”“服務(wù)”“提供”“收集”等關(guān)鍵詞出現(xiàn)的頻率最高,反映出現(xiàn)有APP隱私政策大多針對用戶個人信息的收集進行規(guī)定和解釋。此外,“第三方”“設(shè)備”“授權(quán)”“設(shè)置”“權(quán)限”等高頻詞說明了APP對用戶移動設(shè)備通話、錄音、攝像、存儲等權(quán)限的獲取,若隱私政策含糊其詞或用戶沒有仔細閱讀,極有可能造成未經(jīng)授權(quán)的隱私泄露。
表3 詞頻統(tǒng)計結(jié)果
為分析社交媒體類APP隱私政策的感知易用性,在關(guān)鍵詞統(tǒng)計的基礎(chǔ)上,對政策文本的可讀性進行測評,部分結(jié)果如表4所示。具體分析如下:
表4 社交媒體類APP隱私政策可讀性分析結(jié)果(部分)
1)命名方式。共有14款社交媒體類APP直接以“隱私政策”作為標題,占比達46.7%;7款社交媒體類APP的隱私政策標題為“隱私保護指引”,占比23.3%,主要為騰訊系應(yīng)用;3款社交媒體類APP的隱私政策相關(guān)內(nèi)容以“個人信息保護政策”為標題,占比10%;此外還有部分隱私政策的命名為“隱私權(quán)政策”(3款)、“個人信息保護指引”(1款)、“隱私權(quán)保護政策”(1款)、“用戶隱私政策”(1款)。整體來看,有26款社交媒體類APP的隱私政策在標題表述中直接提及了“隱私”字樣,占比超過86.7%。由于在標題中突出了“隱私保護”“隱私策略”“個人信息保護”等關(guān)鍵字樣,用戶能夠較為直觀地定位閱讀入口,并初步了解隱私政策的作用。
2)小標題數(shù)量。小標題可以體現(xiàn)隱私政策文本的層次結(jié)構(gòu),但小標題數(shù)量過多也會增加用戶的閱讀負擔,降低感知易用性[37]。從小標題數(shù)量上看,社交媒體類APP隱私政策的小標題數(shù)量均在10個左右,其中最少的是8個,包括“淘特”“京喜”“平安健康”“優(yōu)酷”“抖音”“釘釘”6款應(yīng)用,最多的應(yīng)用是“嗶哩嗶哩”,共有13個小標題。
3)導語。導語的設(shè)置便于用戶第一時間獲得隱私政策的總體信息,本文選取的30款社交媒體類APP隱私政策均在開頭設(shè)置了導語,但在導語的具體內(nèi)容上存在很大差異,“微信”“QQ”等騰訊系應(yīng)用在導語中對隱私政策的全文內(nèi)容進行了概括,方便用戶及時獲取所關(guān)注的相關(guān)信息,而“秒拍”等APP只是簡單地進行了目錄和框架介紹。
4)文本篇幅。隱私政策的文本篇幅如果過短則難以傳達完整的信息,過于冗長又會增加用戶的閱讀難度。不同社交媒體類APP隱私政策的篇幅差異較大,篇幅最短的是“QQ空間”,政策全文共6 560字;篇幅最長的是“芒果TV”,隱私政策全文達到26 755字。總體上看,大多數(shù)社交媒體類APP隱私政策的文本篇幅都超過1萬字(93.3%),這與朱侯等關(guān)于社交媒體隱私政策篇幅集中在4 000~8 000字的結(jié)論差別較大[38]。該分析結(jié)果表明,隨著個人信息保護法律法規(guī)的不斷完善,以及公眾隱私保護意識的提高,社交媒體運營商在制定隱私政策條款時內(nèi)容更加具體,完整性較之前有了較大提升。
5)術(shù)語密度。30款社交媒體類APP隱私政策的術(shù)語密度均集中在4%~10%之間,其中密度較高的是“QQ空間”(9.596%)和“陌陌”(9.474%)?!癚Q空間”由于文本篇幅較短,導致術(shù)語密度高,而“陌陌”的文本篇幅在1萬字以上,專業(yè)術(shù)語密度明顯偏多,會顯著降低用戶的感知易用性。“抖音”(4.024%)和“釘釘”(4.439%)的術(shù)語密度較低,而下載量和使用度最高的“微信”的術(shù)語密度為5.385%。
6)平均句長。相關(guān)研究表明,漢語單句的最佳長度應(yīng)控制在12字以內(nèi),超過此長度則會帶來閱讀上的困難[39]。本文選取的30款社交媒體類APP隱私政策的平均句長在5~11字,沒有出現(xiàn)明顯長難句的情形。值得注意的是,“陌陌”的術(shù)語密度(9.474%)和平均句長(10.290)兩項均較高,其隱私政策可讀性較低。
整體來看,30款社交媒體類APP的隱私政策在命名方式上均做到直觀明了,便于用戶快速定位,也設(shè)置了導語和一定數(shù)量的小標題,使得隱私政策的重點突出、結(jié)構(gòu)分明。然而,不同APP的隱私政策可讀性還存在較大差異,部分隱私政策存在導語內(nèi)容敷衍、文本篇幅不妥、術(shù)語占比較高等問題,導致了政策文本可讀性和用戶閱讀意愿的下降。
3.3.1 停用詞去除
從表3看出,“信息”“個人信息”“服務(wù)”“提供”“收集”等高頻詞屬于隱私政策文本中的常見詞匯,廣泛存在于隱私政策全文各處。若直接提取其向量特征作為LDA模型的輸入?yún)?shù),易導致出現(xiàn)大量的重復(fù)、無效詞匯,影響主題識別效果。因此,為盡量減少常見高頻詞對LDA主題識別的干擾,本文首先采用去除局部停用詞的方法,將隱私政策文本中的常見高頻詞去除。
3.3.2 向量特征提取與主題數(shù)確定
LDA主題模型是一種無監(jiān)督學習模型,本文選用主題一致性(Coherence)得分作為衡量模型優(yōu)劣和確定主題數(shù)的依據(jù),主題一致性得分越高,表示該主題模型效果越好。設(shè)定模型迭代次數(shù)為200,分別基于TF和TF-IDF特征繪制的主題一致性得分分布圖,結(jié)果如圖3所示,其中橫坐標表示主題數(shù),縱坐標表示主題一致性得分。可以看出,將TF-IDF特征作為LDA模型的輸入?yún)?shù),其識別效果在不同主題數(shù)下均好于TF特征。因此,本文基于TF-IDF特征進行LDA主題識別,并根據(jù)主題一致性得分的極大值點設(shè)定最優(yōu)主題數(shù)為13。
圖3 TF/TF-IDF方法對LDA建模影響
3.3.3 可視化與結(jié)果分析
基于最優(yōu)主題數(shù),利用可視化工具包pyLDAvis對所構(gòu)建的LDA主題模型進行可視化建模,結(jié)果如圖4所示。圖4左側(cè)以二維坐標的形式展示了不
圖4 LDA模型的可視化建模
同主題之間的相關(guān)程度,圓圈大小表示包含該主題的文本在整篇文檔之中的占比。右側(cè)條形圖是展示當前主題下前30個關(guān)鍵詞的頻率分布情況,其中藍色條塊體現(xiàn)為整篇文檔中的關(guān)鍵詞頻率,紅色條塊體現(xiàn)為當前主題中的關(guān)鍵詞頻率。主題識別及關(guān)鍵詞分布結(jié)果如表5所示。結(jié)合圖4的可視化結(jié)果,本文將13個政策主題進行歸納與合并,整理得到6個類別,分別是隱私政策概述、用戶權(quán)利、運營商義務(wù)、運營商行為、數(shù)據(jù)存儲與共享、法律保護和監(jiān)管。
表5 社交媒體類APP隱私政策的主題識別結(jié)果及關(guān)鍵詞分布
表5(續(xù))
1)類別1——用戶權(quán)利。在圖4中,主題1與主題6、主題10之間存在一定的重疊。從關(guān)鍵詞分布來看,主題1的主要內(nèi)容是對用戶權(quán)利主體進行界定,偏向于對用戶權(quán)利的概述性說明。主題6的關(guān)鍵詞包括“麥克風”“相冊”“照片”等,主要是對APP所需權(quán)限的說明與解釋,體現(xiàn)用戶知情權(quán)。主題10的關(guān)鍵詞體現(xiàn)了用戶對APP的拒絕權(quán)利,如“注銷”“取消”“拒絕”等詞,對應(yīng)用戶拒絕權(quán)。因此,主題1、主題6和主題10可合并概括為用戶權(quán)利。
2)類別2——隱私政策概述。從圖4可以看出,主題2與主題3、主題11存在一定的重疊。從關(guān)鍵詞分布來看,上述3個主題都屬于隱私政策的概括性表述,但在具體內(nèi)容上又各有側(cè)重。主題2對要獲取的數(shù)據(jù)進行了簡單概述,關(guān)鍵詞包括“請求”“業(yè)務(wù)功能”“手機號碼”等。主題3側(cè)重于爭端出現(xiàn)與解決方面,關(guān)鍵詞包括“違反”“爭議”“地址”等。主題11對未來可能發(fā)生的變更與修改進行了概述性說明,關(guān)鍵詞包括“修改”“發(fā)生變化”“通知”等。各主題雖然側(cè)重點不同,但在具體內(nèi)容上均呈現(xiàn)概述形式,較少涉及細節(jié),因此,將主題2、主題3和主題11合并以隱私政策概述作為概括。
3)類別3——運營商行為。從可視化結(jié)果上看,主題5較獨立,單獨處于一個區(qū)間,關(guān)鍵詞包括“人臉”“指紋”“身份證”“匿名化”等,均是指向性非常明確的細節(jié)詞語,與用戶敏感數(shù)據(jù),尤其是生物特征數(shù)據(jù)緊密關(guān)聯(lián)。從圖4上看,主題7和主題12存在一定重疊,主題7的內(nèi)容偏向于網(wǎng)絡(luò)服務(wù)、Cookie、登錄賬號等,主題12的關(guān)鍵詞偏向個性化服務(wù)(訪問、視頻、分享等),二者都屬于運營商主體下的行為活動,而主題5對敏感數(shù)據(jù)的訪問和使用處理同樣也可以歸至運營商行為。因此,將主題5、主題7和主題12合并概括為運營商行為。
4)類別4——數(shù)據(jù)存儲與共享。從可視化結(jié)果來看,主題8和主題9同處于一個區(qū)間。主題8的關(guān)鍵詞包括“境內(nèi)”“備份”“跨境”等,屬于數(shù)據(jù)共享的主題內(nèi)容,偏向?qū)?shù)據(jù)跨境流動做出規(guī)定。主題9的關(guān)鍵詞“第三方”“合作方”“保存”“存儲”等,更多涉及數(shù)據(jù)在運營商與第三方之間的共享。因此,將主題8和主題9合并為數(shù)據(jù)存儲與共享。
5)類別5——法律保護和監(jiān)管。主題13的關(guān)鍵詞多涉及法律和制度層面,包括“法律法規(guī)”“國家”“遵守”等,因此,將其歸至法律保護和監(jiān)管類別。
6)類別6——運營商義務(wù)。主題4的關(guān)鍵詞包括“記錄”“查詢”“用途”等,與運營商應(yīng)承擔的義務(wù)相關(guān),因此將其歸至運營商義務(wù)類別。
為分析社交媒體類APP隱私政策在主題上的全面性和規(guī)范性,本文將政策文本的主題識別結(jié)果與國內(nèi)外知名法律法規(guī)進行對比,以期找出現(xiàn)有隱私政策的疏漏與不足之處。對比分析的對象選取《中華人民共和國個人信息保護法》(下稱《個人信息保護法》)和歐盟頒布的《通用數(shù)據(jù)保護條例》(General Data Protection Regulation,GDPR)。
3.4.1 與《個人信息保護法》的對比結(jié)果
《個人信息保護法》于2021年11月1日正式施行,對處理個人信息主體的權(quán)責、信息跨境流動規(guī)則、個人信息保護與監(jiān)管等方面都做出了頂層設(shè)計,具體內(nèi)容主要包括信息處理規(guī)則、信息跨境流動規(guī)則、用戶權(quán)利、運營商義務(wù)、部門監(jiān)管和法律責任6個綱目。本文選取的30款社交媒體類APP的隱私政策主題與《個人信息保護法》內(nèi)容綱目的對比結(jié)果如圖5所示。可以看出,《個人信息保護法》所規(guī)定的相關(guān)內(nèi)容在隱私政策中均有所涉及,但在內(nèi)容完整性和規(guī)范性上還有所差異,具體分析如下:
圖5 社交媒體類APP的隱私政策主題與《個人信息保護法》內(nèi)容綱目的對比
1)從具體內(nèi)容上來看,《個人信息保護法》對個人信息處理和使用的多個情境都進行了具體說明和規(guī)則限制,而本文識別的隱私政策主題關(guān)于這部分內(nèi)容沒有詳細的闡述,部分政策文本也沒有提及有關(guān)同意撤回、緊急情況下信息使用等方面的信息處理規(guī)則。
2)在信息跨境流動規(guī)則方面,《個人信息保護法》對個人隱私數(shù)據(jù)跨境流動的安全評估及信息保護均做出了明確的規(guī)定,并列舉了不得提供信息的情境,而現(xiàn)有隱私政策主題中在信息跨境流動方面仍屬于概述型描述,缺少詳細說明。
3)在個人用戶權(quán)利界定方面,現(xiàn)有隱私政策對用戶權(quán)利的界定和描述大多還停留在概述性文字上,但《個人信息保護法》對用戶知情權(quán)、拒絕權(quán)等眾多權(quán)利都有著詳細的定義和描述,并且就個人向信息使用者和信息處理者提出合理要求的各種情況也有詳細闡述,上述內(nèi)容在現(xiàn)有隱私政策中還處于嚴重欠缺狀態(tài),這也是導致社交媒體隱私泄露和監(jiān)管不力的根本原因。
4)在信息處理者的義務(wù)方面,現(xiàn)有社交媒體類APP的隱私政策依然存在內(nèi)容完整性不足的問題。比如《個人信息保護法》對個人信息保護評估的需求和內(nèi)容均做出了明確的闡釋,但大部分的隱私政策卻鮮有體現(xiàn)。此外,《個人信息保護法》對個人信息泄露、篡改以及丟失時所需要采取的補救措施做出了明確要求,并規(guī)定必須落實到責任人或責任部門,而現(xiàn)有隱私政策在此方面大多為概述性文字,沒有針對性的操作解釋。
5)在法律責任與處罰方面,《個人信息保護法》的內(nèi)容綱目與30款社交媒體類APP的隱私政策主題大體相同,考慮到法律法規(guī)和隱私政策的發(fā)布主體不同,這里不做詳細對比分析。
3.4.2 與GDPR的對比結(jié)果
GDPR對用戶數(shù)據(jù)收集、存儲、保護和使用的標準進行了界定,賦予了用戶對自身數(shù)據(jù)更大的操作權(quán)限,其內(nèi)容綱目包括條例原則、數(shù)據(jù)處理權(quán)利、數(shù)據(jù)處理者、數(shù)據(jù)分享與跨境流動、監(jiān)管機構(gòu)體系、責任與處罰措施等內(nèi)容。本文選取的30款社交媒體類APP的隱私政策主題與GDPR內(nèi)容綱目的對比結(jié)果如圖6所示,可以看出GDPR對生命周期視角下數(shù)據(jù)處理的全流程進行了清晰而詳細的規(guī)定,對應(yīng)主題上現(xiàn)有隱私政策雖有涉及,但在內(nèi)容闡述和表現(xiàn)形式上仍有較大差異,具體分析如下:
圖6 社交媒體類APP的隱私政策主題與GDPR內(nèi)容綱目的對比
1)在數(shù)據(jù)主體權(quán)利方面,GDPR詳細規(guī)定了如何行使數(shù)據(jù)主體權(quán)利的步驟和模式,并具體闡述了訪問權(quán)、更正權(quán)、收集權(quán)、擦除權(quán)、限制處理權(quán)、數(shù)據(jù)攜帶權(quán)等各項權(quán)利的詳細內(nèi)容與適用情境。在隱私政策主題中,對用戶權(quán)利的具體劃分遠不如GDPR清晰、詳細,這也導致了用戶社交數(shù)據(jù)的使用失控及隱私侵犯。
2)在數(shù)據(jù)處理者方面,GDPR規(guī)定數(shù)據(jù)處理者所“操作”的數(shù)據(jù)范圍并非控制者所擁有的全部數(shù)據(jù),而是其中為滿足使用目的所必須的部分數(shù)據(jù),需滿足最小特權(quán)原則。因此,在數(shù)據(jù)控制者未明確授權(quán)處理全部數(shù)據(jù)的前提下,數(shù)據(jù)處理者不得對任何逾越使用目的的其他數(shù)據(jù)進行任何處理。然而,現(xiàn)有社交媒體類APP的隱私政策對數(shù)據(jù)使用范圍與時限甚少涉及,即使有所介紹,但用戶不同意該規(guī)則便無法正常使用APP,導致政策并無實際效果。
3)在數(shù)據(jù)分享與跨境流動方面,用戶身份、地理位置、網(wǎng)絡(luò)習慣等社交媒體數(shù)據(jù)的嚴格管控和合理利用對國家數(shù)據(jù)安全十分重要。GDPR對數(shù)據(jù)主權(quán)、數(shù)據(jù)本地化及數(shù)據(jù)出入境均做出了明確的規(guī)定,并對特殊情形進行了補充說明,而現(xiàn)有社交媒體類APP的隱私政策在這一部分幾乎是空白。
4)在監(jiān)管機構(gòu)體系、責任與處罰措施方面,考慮到監(jiān)管主體及適用法律的差異性,這里不做詳細對比。
3.5.1 存在問題
通過對30款社交媒體類APP隱私政策的可讀性分析與主題識別,可以發(fā)現(xiàn)當前隱私政策的制定總體上呈現(xiàn)不斷完善的趨勢,但仍存在諸如完整性不足、針對性不強、可讀性不高等問題。
1)完整性不足。從LDA主題識別與相關(guān)法律法規(guī)的對比結(jié)果來看,現(xiàn)有社交媒體類APP隱私政策所涵蓋的主題比較全面,但在具體的文字表述和內(nèi)容解釋上,仍存在完整性不足的情況。①用戶權(quán)利淪為“查改刪”。用戶權(quán)利保障作為個人信息保護的重要組成部分,部分隱私政策只提及“查閱”“更正”“復(fù)制”“刪除”的權(quán)利,而對用戶知情權(quán)、決定權(quán)以及轉(zhuǎn)移權(quán)等缺乏相關(guān)說明,在何種情形下可要求運營商刪除個人信息也缺乏場景列舉;②運營商的數(shù)據(jù)保護義務(wù)“空口無憑”。大多數(shù)社交媒體類APP隱私政策都會提及“保證用戶的信息安全”,卻鮮有提出針對性的解決方案和措施,內(nèi)部管理制度和操作規(guī)程不透明,需要采用的安全技術(shù)措施也缺少詳細說明,部分隱私政策甚至對可能發(fā)生的個人信息泄露等安全事件無預(yù)案說明;③信息存儲和共享機制不夠透明。信息存儲的類型、地點、期限缺少詳細說明,哪些用戶數(shù)據(jù)會被第三方共享、哪些數(shù)據(jù)涉及跨境流動缺少具體列舉,隱私政策中的信息存儲共享相關(guān)內(nèi)容總體還停留在文字性概述。
2)針對性不強。從主題識別結(jié)果來看,不同類型社交媒體類APP的隱私政策主題大同小異,缺乏針對性。比如聊天社交類APP(如“微信”)、社區(qū)社交類APP(如“豆瓣”)、自媒體平臺類APP(如“嗶哩嗶哩”)缺乏基于自身平臺特點的差異化表述,隱私政策的主題內(nèi)容和文本表述相似度較高,部分段落、語句甚至出現(xiàn)明顯雷同。
3)可讀性不高。隱私政策可讀性不高會導致其感知易用性大大降低,并影響用戶的閱讀意愿。部分社交媒體APP(如“芒果TV”“嗶哩嗶哩”)隱私政策的篇幅明顯過長,需要耗費用戶大量的閱讀時間。此外,部分APP(如“秒拍”)隱私政策的導語部分流于形式,未能起到幫助用戶快速掌握全文要點以及輔助閱讀的效果。還有部分APP(如“陌陌”)隱私政策的專業(yè)術(shù)語過多,給用戶理解政策內(nèi)容帶來較大難度。
3.5.2 優(yōu)化策略
針對上述問題,本文從內(nèi)容完整性、條款針對性和文本可讀性3個方面提出優(yōu)化建議。
1)對標法律法規(guī),改進內(nèi)容完整性。我國在個人信息保護方面已陸續(xù)制定了相關(guān)法律制度,立法層面的不斷完善為社交媒體類APP的隱私政策改進提供了權(quán)威參照。①用戶權(quán)利層面。結(jié)合《個人信息保護法》與GDPR的對比結(jié)果,現(xiàn)有隱私政策首先要在用戶權(quán)利層面予以明確和充實,隱私政策中應(yīng)將法律規(guī)定的用戶在個人信息活動中所擁有的各項權(quán)利均予以明確說明,并同時給出情境列舉,使用戶通過閱讀隱私政策,不僅能夠全面了解自身有哪些權(quán)利,更能夠清晰認識到自身在何種情況下可使用這些權(quán)利對個人信息進行保護;②運營商義務(wù)層面。運營商義務(wù)和用戶權(quán)利應(yīng)具有對等篇幅,需要在隱私政策文本中體現(xiàn)“權(quán)責對等”以及運營商履行義務(wù)的詳細步驟,比如社交媒體運營方的內(nèi)部管理制度和操作規(guī)程、發(fā)生信息安全問題時的應(yīng)急方案、以及因個人信息保護出現(xiàn)問題時責任承擔與處罰賠償?shù)确矫娴木唧w措施。同時考慮到文本可讀性和邏輯結(jié)構(gòu)的要求,在適當位置應(yīng)用小標題突出標注;③數(shù)據(jù)共享與跨境流動層面。隨著互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能和實體經(jīng)濟的深度融合,數(shù)據(jù)作為基礎(chǔ)性戰(zhàn)略資源的重要性地位日益凸顯,監(jiān)管層對個人身份、地理位置、網(wǎng)絡(luò)行為等信息的采集、利用以及跨境流動等方面已重點關(guān)注,相關(guān)法律和規(guī)定也在這方面做出了詳細規(guī)定和要求,社交媒體類APP的隱私政策有必要對這一部分加以詳細標注,在內(nèi)容上明確闡述個人信息的存儲和使用規(guī)則,以及有可能發(fā)生的信息共享和跨境流動情形,以保障用戶對自身信息流動的知情權(quán)。
此外,考慮到社交媒體用戶分布的全球性,隱私政策除了對標國內(nèi)法律法規(guī)外,也需要借鑒多個國家(地區(qū))的個人信息保護條款,進一步完善其內(nèi)容的規(guī)范性和全面性。
2)立足應(yīng)用特點,加強條款針對性。社交媒體類APP隱私政策的優(yōu)化與完善要避免“泛泛而談”的情形,參考國內(nèi)外相關(guān)法律制度并不表示文本主題一定要趨同。社交媒體類APP根據(jù)其用途,可進一步劃分為聊天類、博客類、問答社區(qū)類、社交電商類和短視頻社交類等諸多領(lǐng)域,隱私政策應(yīng)結(jié)合其應(yīng)用領(lǐng)域加強條款針對性,力求重點突出。例如,針對聊天類APP,聊天記錄的存儲與信息安全有必要重點說明;針對短視頻社交APP,隱私條款需要對人物圖像等生物信息的安全保護進行針對性說明。社交電商類APP對支付賬戶、用戶資產(chǎn)等隱私數(shù)據(jù)的利用與保護應(yīng)著重闡述。
3)創(chuàng)新外在形式,提高文本可讀性。隱私政策文本可讀性的提升涉及多方面內(nèi)容,主要包括:①隱私政策在篇幅上要做到合理控制,對無關(guān)內(nèi)容(如產(chǎn)品介紹、功能特點等)應(yīng)做到應(yīng)減盡減,將篇幅留給隱私政策的主體內(nèi)容,盡可能減少文字冗余;②避免導語內(nèi)容流于形式。導語設(shè)置應(yīng)立足于幫助用戶快速領(lǐng)悟全文要點,并輔助用戶快速查找自身關(guān)注信息,因此導語長度不宜過長,應(yīng)做到簡潔明確、重點突出;③盡量減少專業(yè)術(shù)語的使用,對確實有必要使用術(shù)語的段落,應(yīng)在易于查找的部分標注,并予以詳細的名詞解釋,最大程度降低用戶的閱讀難度。
本文基于TAM模型,從感知易用性和感知有用性兩個維度對30款社交媒體類APP的隱私政策進行文本分析。針對隱私政策的感知易用性,從命名方式、小標題數(shù)量、文本篇幅等方面對隱私政策文本的可讀性進行測評。針對隱私政策的感知有用性,運用LDA主題模型識別出用戶權(quán)利、隱私政策概述、運營商行為、數(shù)據(jù)存儲與共享、法律保護、監(jiān)管與運營商義務(wù)6個類別的主題,并與國內(nèi)外法律法規(guī)進行對比。研究結(jié)果發(fā)現(xiàn),現(xiàn)有社交媒體類APP隱私政策存在完整性不足、針對性不強、可讀性不高等問題,需要在用戶權(quán)利、運營商業(yè)務(wù)、數(shù)據(jù)流動與跨境共享層面進一步完善內(nèi)容,創(chuàng)新外在呈現(xiàn)形式,并根據(jù)APP類型的細分定位制定差異化的隱私政策。
本文選取下載量靠前的30款社交媒體類APP隱私政策文本作為研究對象,并沒有涵蓋使用人數(shù)較少的冷門社交媒體平臺,在未來的研究中可以擴大樣本范圍。在研究方法層面,未來可以結(jié)合情境實驗法、實證分析法對隱私政策的閱讀意愿及規(guī)范性評價進行交叉比較研究。