周慶山 趙菲菲 董立峰
摘 要:[目的/意義]通過對(duì)個(gè)人信息保護(hù)政策的網(wǎng)絡(luò)評(píng)價(jià)文本進(jìn)行分析挖掘,可為政府相關(guān)部門了解個(gè)人信息保護(hù)政策具體政策評(píng)價(jià)提供重要參考維度。[方法/過程]本文結(jié)合半結(jié)構(gòu)訪談、網(wǎng)絡(luò)媒體傳播及公眾社交平臺(tái)評(píng)論數(shù)據(jù),采用定性和定量研究相結(jié)合的方法,從政策完善度、政策效果、政策宣傳、政府信任等多個(gè)維度入手,構(gòu)建個(gè)人信息保護(hù)政策的網(wǎng)民評(píng)價(jià)計(jì)算框架。[結(jié)果/結(jié)論]在計(jì)算框架中,本文創(chuàng)新性地提出“議程設(shè)置匹配度”“政策各維度正負(fù)面占比”等核心指標(biāo),以及網(wǎng)絡(luò)主題抽取模型,最終對(duì)6項(xiàng)個(gè)人信息保護(hù)政策進(jìn)行了量化實(shí)證計(jì)算,基于對(duì)實(shí)驗(yàn)結(jié)果的分析,為提高個(gè)人信息保護(hù)政策的公眾認(rèn)可度提出參考建議。
關(guān)鍵詞:網(wǎng)絡(luò)評(píng)價(jià)數(shù)據(jù);公共政策評(píng)價(jià);計(jì)算框架;個(gè)人信息保護(hù)政策
DOI:10.3969/j.issn.1008-0821.2022.06.001
〔中圖分類號(hào)〕G203 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2022)06-0003-14
Abstract:[Purpose/Significance]By analyzing and mining the network evaluation text of personal information protection policy,it can provide an important reference dimension for relevant government departments to understand the specific policy evaluation of personal information protection policy.[Method/Process]Based on the data of semi-structured interviews,online media communication and users comments on social platforms,this paper used a combination of qualitative and quantitative research method,to build a netizen evaluation and calculation framework of personal information protection policies from multiple dimensions such as policy perfection,policy effect,policy publicity,government trust in the calculation framework.[Result/Conclusion]This paper innovatively puts forward core indicators as“matching degree of agenda setting”,“proportion of positive and negative aspects of policy dimensions”and network topic extraction model,and finally realizes the ?quantitative empirical calculation of six personal information protection policy evaluations.Based on the analysis of the experimental results,some suggestions are put forward to improve the public acceptance of personal information protection policy.
Key words:network comment data;public policy evaluation;calculation framework;personal information protection policy
在數(shù)據(jù)驅(qū)動(dòng)的決策范式下,基于網(wǎng)絡(luò)民意數(shù)據(jù)的公共政策過程研究逐漸成為熱點(diǎn)領(lǐng)域。按照Leslie Alexander Pal的觀點(diǎn),公共政策是指公共權(quán)威組織所選擇的行動(dòng)綱領(lǐng)或做出決定,以解決某一既定的或者一系列相關(guān)的問題[1]。在公共政策過程的發(fā)現(xiàn)問題、制定政策、實(shí)施政策、評(píng)估政策等各個(gè)階段,政府都需要參考民眾的意見[2]。公共政策的制定和完善應(yīng)建立在廣泛的網(wǎng)民評(píng)價(jià)基礎(chǔ)上,唯有公民規(guī)范、理性、均衡地參與公共政策制定,才能確保公共政策輸出的合法性和科學(xué)性。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)統(tǒng)計(jì)顯示,截至2021年6月,中國網(wǎng)民規(guī)模達(dá)10.11億。互聯(lián)網(wǎng)普及率為71.6%,較2020年12月提升1.2個(gè)百分點(diǎn)[3]。隨著以社交媒體為代表的互聯(lián)網(wǎng)媒體在政府部門和公眾中廣泛普及,政府部門與公眾之間可以實(shí)現(xiàn)跨越時(shí)空限制的信息互動(dòng)?;ヂ?lián)網(wǎng)以其扁平化、交互式、快捷性的優(yōu)勢(shì),不僅可以使政府部門在收集有關(guān)社會(huì)問題信息的深度、廣度以及時(shí)效性方面得到空前提高,而且為公眾參與公共政策過程提供了技術(shù)保障和支持。利用大數(shù)據(jù)、人工智能等技術(shù)對(duì)公共政策的網(wǎng)絡(luò)媒體及網(wǎng)民評(píng)論數(shù)據(jù)進(jìn)行建模計(jì)算,將成為新時(shí)期支撐政府部門政策過程的重要手段。近年來,我國政府已有意識(shí)地利用網(wǎng)民評(píng)價(jià)數(shù)據(jù),為公共政策提供決策參考,而且在公共決策時(shí)廣泛利用社會(huì)媒體、網(wǎng)絡(luò)調(diào)查和抽樣調(diào)查,實(shí)時(shí)、定期收集公民對(duì)特定政策的意見建議。
隨著大數(shù)據(jù)和人工智能地廣泛應(yīng)用,個(gè)人信息的收集日益密集和隱蔽,其安全問題引發(fā)廣泛關(guān)注,針對(duì)個(gè)人信息保護(hù)問題,我國前期出臺(tái)了多項(xiàng)法律、法規(guī)及標(biāo)準(zhǔn)規(guī)范政策[4],但仍然存在政策法規(guī)體系不夠系統(tǒng)、完善,出現(xiàn)多頭監(jiān)管、執(zhí)法缺乏依據(jù)、懲罰力度不足、行業(yè)自律制度難以發(fā)揮作用等系列問題[5],為此,全國人大常務(wù)委員會(huì)于2021年8月20日通過《個(gè)人信息保護(hù)法》,并于2021年11月1日起施行。通過對(duì)個(gè)人信息保護(hù)政策的網(wǎng)絡(luò)評(píng)價(jià)文本進(jìn)行分析挖掘,可為政府相關(guān)部門了解個(gè)人信息保護(hù)政策相關(guān)網(wǎng)民評(píng)價(jià),并確保個(gè)人信息保護(hù)政策的順利推行提供重要參考維度。然而,現(xiàn)階段政府在政策的網(wǎng)絡(luò)民眾意見分析利用方面,多將其等同于傳統(tǒng)網(wǎng)絡(luò)輿情分析;6816A859-14DE-4471-AE49-F887F905D427
在分析方法方面,政策意見提取和網(wǎng)民政策情感傾向分析多采用通用文本聚類和情感傾向分析技術(shù);在指標(biāo)選擇方面,多借鑒輿情分析中曝光量、網(wǎng)民的情感傾向等輿情類指標(biāo)。公共政策尤其是廣受大眾關(guān)注熱議的個(gè)人信息保護(hù)政策網(wǎng)民評(píng)價(jià)計(jì)算,不同于普通輿情分析計(jì)算,其具有較強(qiáng)政策屬性特征,利用現(xiàn)存的輿情分析技術(shù)、分析指標(biāo)等不能滿足公共政策網(wǎng)絡(luò)民意分析現(xiàn)實(shí)需求。基于此,本文構(gòu)建基于個(gè)人信息保護(hù)政策的網(wǎng)絡(luò)評(píng)價(jià)文本計(jì)算框架,通過對(duì)公共政策的多維、量化計(jì)算,從政策完備性、政策擴(kuò)散、政策效果、政府信任等多個(gè)維度對(duì)個(gè)人信息保護(hù)政策進(jìn)行客觀量化的評(píng)價(jià)分析。
1 相關(guān)研究綜述
網(wǎng)絡(luò)民意是指以互聯(lián)網(wǎng)技術(shù)和信息化手段為基礎(chǔ),公民通過網(wǎng)絡(luò)平臺(tái)表達(dá)的、相對(duì)集中的意見和言論的匯總[6]。隨著Web2.0技術(shù)的發(fā)展,公眾通過網(wǎng)絡(luò)平臺(tái)參與公共政策的監(jiān)督和對(duì)政策的訴求表達(dá)愈發(fā)普遍,政策評(píng)估中的公眾參與日益成熟?,F(xiàn)有爬蟲、自然語言處理以及機(jī)器學(xué)習(xí)等技術(shù),為公共決策研究提供了新的思路與方法。Song M等[15]指出,社交媒體文本分析使政府能夠及時(shí)跟蹤事件的發(fā)生、消亡以及用戶對(duì)該事件的反應(yīng),確保政府可以進(jìn)行更加有效地分析,為政府管理提供新的研究視角。
面向公共政策學(xué)者們基于網(wǎng)絡(luò)媒體的網(wǎng)民評(píng)價(jià)指標(biāo)構(gòu)建及網(wǎng)絡(luò)民意分析挖掘方法進(jìn)行了豐富的研究。其中,在基于網(wǎng)絡(luò)媒體的網(wǎng)民評(píng)價(jià)指標(biāo)構(gòu)建方面,邱爾麗等[19]基于網(wǎng)絡(luò)數(shù)據(jù),將政策對(duì)公眾的吸引程度、公眾對(duì)政策的立場(chǎng)傾向以及政策推進(jìn)中輿論曝光或者投訴問題的情況進(jìn)行分析,構(gòu)建了公共政策評(píng)價(jià)的網(wǎng)絡(luò)民意指標(biāo)體系。何志武等[14,21]針對(duì)政策議程的不同模式,圍繞網(wǎng)絡(luò)網(wǎng)民評(píng)價(jià)的表達(dá)路徑與收集機(jī)制展開研究,并從主體性、科學(xué)性和傾向性3個(gè)維度開展網(wǎng)民評(píng)價(jià)分析,同時(shí)指出網(wǎng)民評(píng)價(jià)分析應(yīng)該是一個(gè)不斷變化的動(dòng)態(tài)過程。鄧莎莎等[20]構(gòu)建了由數(shù)據(jù)準(zhǔn)備和網(wǎng)絡(luò)民意建模兩部分構(gòu)成的面向公共決策的網(wǎng)絡(luò)民意建模系統(tǒng)及評(píng)價(jià)指標(biāo)體系框架,并以“健全醫(yī)療保健制度”為應(yīng)用案例,驗(yàn)證了系統(tǒng)框架的良好效果;在網(wǎng)絡(luò)民意分析挖掘方法方面,學(xué)者們基于網(wǎng)絡(luò)數(shù)據(jù)及政府公開數(shù)據(jù),利用大數(shù)據(jù)技術(shù)及系列分析挖掘方法,對(duì)公共決策中的網(wǎng)絡(luò)民意分析挖掘進(jìn)行了較多探索[7-13]。如Li Y等[16]針對(duì)互聯(lián)網(wǎng)事件抽取問題提出了基于分類空間模型和特征選擇策略的網(wǎng)絡(luò)輿情事件抽取框架,并在測(cè)試數(shù)據(jù)集合上得到了較好的驗(yàn)證。Zhou P等[17]提出基于關(guān)鍵詞抽取的網(wǎng)絡(luò)民意內(nèi)容聚合框架,通過對(duì)已抽取的網(wǎng)絡(luò)民意進(jìn)行聚合以豐富抽取結(jié)果的語義信息。Lu Z W[18]針對(duì)微博短文本提出了基于TF-IDF的短文本觀點(diǎn)挖掘系統(tǒng),但該系統(tǒng)在長(zhǎng)文本數(shù)據(jù)處理上的適用性還需進(jìn)一步加強(qiáng)。胡欣杰等[23]提出了基于聚類分析的網(wǎng)絡(luò)民意傾向性分析的距離模型和相關(guān)系數(shù)模型,提出了基于時(shí)間片的k中心點(diǎn)法聚類分析算法,經(jīng)試驗(yàn)驗(yàn)證模型能有效地提高提取的查全率,較大幅度提高了時(shí)間效率。
通過對(duì)國內(nèi)外相關(guān)研究進(jìn)行調(diào)研發(fā)現(xiàn),現(xiàn)有基于互聯(lián)網(wǎng)輿情數(shù)據(jù)進(jìn)行政策評(píng)價(jià)的相關(guān)研究,在數(shù)據(jù)源上主要集中于微博文本數(shù)據(jù)或搜索引擎數(shù)據(jù),網(wǎng)絡(luò)數(shù)據(jù)來源較為單一。在指標(biāo)選擇方面,面向公共政策,尤其是個(gè)人信息保護(hù)政策屬性的系統(tǒng)性指標(biāo)體系有待深入研究。此外,通過對(duì)網(wǎng)絡(luò)民意數(shù)據(jù)進(jìn)行全收集、精確統(tǒng)計(jì)、深度挖掘和量化分析的可操作性方法相對(duì)缺乏。已有分析挖掘方法存在挖掘結(jié)果有效性不高的問題,難以滿足政策決策機(jī)構(gòu)對(duì)個(gè)人信息保護(hù)政策精確量化評(píng)價(jià)的需求。因此,急需構(gòu)建基于個(gè)人信息保護(hù)政策的網(wǎng)民評(píng)價(jià)計(jì)算分析框架,為科學(xué)決策提供重要分析維度。
本文結(jié)合半結(jié)構(gòu)訪談、網(wǎng)絡(luò)媒體傳播及公眾社交平臺(tái)評(píng)論數(shù)據(jù),采用定性和定量研究相結(jié)合的方法,從政策完善度、政策效果、政策宣傳、政府信任等多個(gè)維度入手,構(gòu)建個(gè)人信息保護(hù)政策網(wǎng)民評(píng)價(jià)指標(biāo)體系,并結(jié)合專家智慧,利用層次分析法,對(duì)相關(guān)評(píng)價(jià)指標(biāo)進(jìn)行篩選和權(quán)重計(jì)算,構(gòu)建基于網(wǎng)絡(luò)評(píng)價(jià)文本的個(gè)人信息保護(hù)政策評(píng)價(jià)計(jì)算框架,并進(jìn)行了實(shí)證檢驗(yàn)。此外,本文還創(chuàng)新性地提出衡量民眾評(píng)論主題與主流媒體報(bào)道主題匹配度的核心指標(biāo)“議程設(shè)置匹配度”,在給出形式化的同時(shí)進(jìn)行了語義計(jì)算,提出了基于“主題—事件—互聯(lián)網(wǎng)信息—句子—詞語”的層次關(guān)系和多視角語義距離度量的網(wǎng)絡(luò)主題抽取模型,完成核心指標(biāo)中文本主題提取和網(wǎng)絡(luò)主題相似度的計(jì)算,提升了網(wǎng)絡(luò)議題抽取的有效性。
2 基于個(gè)人信息保護(hù)政策的網(wǎng)民評(píng)價(jià)文本計(jì)算框架構(gòu)建
2.1 計(jì)算框架構(gòu)建過程描述
基于網(wǎng)絡(luò)媒體數(shù)據(jù)的個(gè)人信息保護(hù)政策網(wǎng)民評(píng)價(jià)計(jì)算框架主要包括評(píng)價(jià)指標(biāo)提取、核心指標(biāo)計(jì)算、指標(biāo)權(quán)重計(jì)算和框架驗(yàn)證4個(gè)階段。其中,在評(píng)價(jià)指標(biāo)提取階段,為保證從公眾的視角入手,提取的公共政策評(píng)價(jià)指標(biāo)具有科學(xué)、合理且具備特定公共政策的獨(dú)特性,本文采用半結(jié)構(gòu)化訪談針對(duì)公眾對(duì)特定公共政策的評(píng)價(jià)維度進(jìn)行收集,并基于扎根理論對(duì)訪談?dòng)涗涍M(jìn)行文本編碼,抽象出概念和范疇,并最終構(gòu)建特定公共政策評(píng)價(jià)指標(biāo)體系。在核心指標(biāo)計(jì)算階段,基于已經(jīng)構(gòu)建的評(píng)價(jià)指標(biāo)體系,對(duì)“議程相似度”“政策各維度正負(fù)面占比”等核心指標(biāo)進(jìn)行形式化定義,并利用情感分析、主題識(shí)別等文本挖掘技術(shù)實(shí)現(xiàn)指標(biāo)計(jì)算;在指標(biāo)篩選和權(quán)重計(jì)算階段,利用層次分析法,通過邀請(qǐng)領(lǐng)域?qū)<覍?duì)指標(biāo)進(jìn)行兩兩比較打分,并將數(shù)據(jù)進(jìn)行歸一化處理,實(shí)現(xiàn)指標(biāo)的篩選和權(quán)重計(jì)算,最終得出特定政策評(píng)價(jià)計(jì)算模型;在實(shí)證階段,本文選取6項(xiàng)個(gè)人信息保護(hù)政策,通過收集和整理政策媒體報(bào)道數(shù)據(jù)和網(wǎng)民評(píng)論數(shù)據(jù),利用計(jì)算模型對(duì)相關(guān)政策進(jìn)行量化計(jì)算,并對(duì)試驗(yàn)結(jié)果進(jìn)行對(duì)比分析,提出個(gè)人信息保護(hù)政策建議,計(jì)算框架如圖1所示。
2.2 基于半結(jié)構(gòu)訪談的個(gè)人信息保護(hù)政策評(píng)價(jià)指標(biāo)體系構(gòu)建
為構(gòu)建個(gè)人信息保護(hù)政策評(píng)價(jià)指標(biāo)體系,本文隨機(jī)選取60人作為訪談對(duì)象進(jìn)行訪談。同時(shí),為了使被抽中的樣本所產(chǎn)生的研究結(jié)果能夠最大程度地覆蓋研究現(xiàn)象中各種不同的情況,本文結(jié)合“最大差異抽樣”的原則方法,盡量做到分別按照不同教育情況、地域分布、性別比例、年齡分布抽取一定數(shù)量的樣本進(jìn)行深度訪談?wù){(diào)研。其中,60名被訪者地域分布在12個(gè)省市,年齡主要集中在24~60歲之間;性別比例男性28人,女性32人;受教育情況博士10人,碩士30人,本科13人,高中2人,初中2人,小學(xué)2人,未接受教育1人;職業(yè)分布多樣。本文按照一個(gè)粗線條式的訪談提綱對(duì)受訪者進(jìn)行非正式訪談,如表1所示。了解受訪者對(duì)該主題的感受和看法,獲取細(xì)致、生動(dòng)的文本資料,并利用扎根理論抽象出概念、范疇。在訪談結(jié)束后,將訪談錄音資料轉(zhuǎn)化成文字信息,并隨機(jī)抽取40份(約2/3)的訪談?dòng)涗涍M(jìn)行文本編碼,剩余20份訪談?dòng)涗涀鳛槔碚擄柡投葯z驗(yàn)。6816A859-14DE-4471-AE49-F887F905D427
本文利用扎根理論研究方法對(duì)訪談內(nèi)容進(jìn)行編碼,編碼分為開放式編碼、主軸式編碼和選擇性編碼,在編碼完成后進(jìn)行理論飽和度驗(yàn)證。開放式編碼是對(duì)原始訪談資料所記錄的可用于編碼的句子或者片段進(jìn)行概念化和范疇化,是將原始資料分解、比較后再以新方式重新組合的過程[20]。本文采用逐字逐句編碼的方式將原始資料進(jìn)行概念化,再利用聚焦編碼的方式將相同或者相似的概念組合進(jìn)行范疇化。為避免編碼的主觀性,本文采用兩位編碼人員進(jìn)行預(yù)編碼,保證對(duì)編碼方式和相關(guān)概念的一致性,提取出初始概念用an表示,共得到49條初始概念。在進(jìn)行完初始概念提取后,通過主軸式編碼來實(shí)現(xiàn)編碼概念層面的內(nèi)在聯(lián)系,并進(jìn)行刪除、歸類和融合,進(jìn)行相似初始概念的合并和范疇化,共得到15個(gè)范疇,范疇用An表示。初始概念提取和范疇化示例如表2所示。
將15個(gè)開放式編碼進(jìn)行歸類、合并,最終得到5個(gè)主范疇。通過對(duì)留作理論飽和度檢驗(yàn)的20份訪談內(nèi)容進(jìn)行處理和分析后,未發(fā)現(xiàn)新的概念和范疇,說明上述扎根理論的分析是飽和的。提取的主范疇如表3所示。
同時(shí),結(jié)合訪談編碼提取內(nèi)容、網(wǎng)絡(luò)媒體傳播及社交平臺(tái)網(wǎng)民評(píng)論數(shù)據(jù)指標(biāo)維度的總體情況,本文提出了基于互聯(lián)網(wǎng)數(shù)據(jù)的個(gè)人信息保護(hù)政策評(píng)價(jià)指標(biāo)體系,如表4所示。
2.3 核心評(píng)價(jià)指標(biāo)
2.3.1 議程設(shè)置匹配度
本文的核心指標(biāo)“議程設(shè)置匹配度”是指網(wǎng)絡(luò)主流媒體報(bào)道主題與社交平臺(tái)上網(wǎng)民關(guān)注焦點(diǎn)重合程度。其形式化定義如式(1):
y=card(A∩B)card(A)*100%(1)
y:議程設(shè)置匹配度;A={x|x∈主流媒體報(bào)道主題};B={y|y∈網(wǎng)絡(luò)平臺(tái)網(wǎng)民評(píng)論主題}。
其計(jì)算流程如圖2所示,本文分別將主流媒體報(bào)道和網(wǎng)民評(píng)論數(shù)據(jù)進(jìn)行主題提取,形成主流媒體報(bào)道主題集合A和評(píng)論主題集合B,通過將集合A和B中的主題進(jìn)行兩兩比較計(jì)算相似度,如相似度在特定設(shè)置的閾值之上(本文設(shè)置為85%),則進(jìn)行計(jì)數(shù),通過式(1)計(jì)算議程設(shè)置匹配度。
議程設(shè)置匹配度計(jì)算關(guān)鍵是對(duì)主流媒體報(bào)道和社交平臺(tái)網(wǎng)民評(píng)論中的主題進(jìn)行提取。由于這兩個(gè)平臺(tái)中的數(shù)據(jù)具有異構(gòu)、量大和半結(jié)構(gòu)化等問題,為主題的有效抽取帶來了挑戰(zhàn)。此外,現(xiàn)行研究成果在網(wǎng)絡(luò)議程抽取方面存在著抽取結(jié)果語義信息不足、抽取結(jié)果有效性較差、抽取模型可擴(kuò)展性較差等問題,難以滿足公共決策機(jī)構(gòu)對(duì)于有效網(wǎng)絡(luò)議題抽取的需求。因此,本文提出了基于“主題—事件—互聯(lián)網(wǎng)信息—句子—詞語”的層次關(guān)系和多視角語義距離度量的主題抽取模型。模型首先識(shí)別互聯(lián)網(wǎng)信息集合中所包含的主題信息,然后抽取每個(gè)主題下所包含的主題詞信息。本文定義了可以從不同維度度量互聯(lián)網(wǎng)信息之間語義相似度的語義距離指標(biāo),語義距離可以實(shí)現(xiàn)從關(guān)鍵實(shí)體集合相似度、實(shí)體語義關(guān)系相似度、文本相似度等多個(gè)維度更加全面地衡量不同互聯(lián)網(wǎng)信息之間的語義相似度,進(jìn)而實(shí)現(xiàn)網(wǎng)絡(luò)主題的精確抽取,語義距離度量結(jié)構(gòu)圖如圖3所示。
在網(wǎng)絡(luò)主題檢測(cè)中,首先利用隱形狄利克雷分布(Latent Dirichlet Allocation,LDA)模型對(duì)互聯(lián)網(wǎng)信息集合中的潛在主題信息進(jìn)行提取,然后基于計(jì)算得到的主題分布向量使用DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚類算法對(duì)全部互聯(lián)網(wǎng)信息進(jìn)行聚類處理,聚類的結(jié)果就是互聯(lián)網(wǎng)信息數(shù)據(jù)集合中所涉及的全部主題以及各個(gè)主題所包含的互聯(lián)網(wǎng)信息。
抽取得到的網(wǎng)絡(luò)主題會(huì)存在多個(gè)抽取結(jié)果同指一個(gè)主題現(xiàn)象,假設(shè)兩條互聯(lián)網(wǎng)信息具備相同的時(shí)間、地點(diǎn)、人物等要素,且各實(shí)體之間的語義角色信息相同,則認(rèn)為上述兩條互聯(lián)網(wǎng)信息描述的是同一主題,即上述兩則互聯(lián)網(wǎng)信息隸屬于同一主題。本文利用哈工大中文語言技術(shù)平臺(tái)LTP中的命名實(shí)體識(shí)別庫[27],實(shí)現(xiàn)文本命名實(shí)體識(shí)別的功能。基于上述假設(shè),本文定義了一種描述互聯(lián)網(wǎng)信息之間語義相似度的距離度量。該距離度量綜合考慮了兩互聯(lián)網(wǎng)信息之間的實(shí)體相似度、實(shí)體語義角色相似度、文本相似度,以更加全面地度量?jī)蓜t互聯(lián)網(wǎng)信息之間的語義相似度。i、j兩則互聯(lián)網(wǎng)信息之間的語義距離度量定義如式(2):
distij=1simentityij+simsemanticij+simwordij(2)
其中,simentityij表示兩則互聯(lián)網(wǎng)信息之間的關(guān)鍵實(shí)體集合相似度,simsemanticij表示兩則互聯(lián)網(wǎng)信息之間各關(guān)鍵實(shí)體的語義角色相似度,simwordij表示兩則互聯(lián)網(wǎng)信息之間的文本相似度。
1)互聯(lián)網(wǎng)信息實(shí)體集合相似度計(jì)算
兩則信息之間所包含的時(shí)間、地點(diǎn)、人物等關(guān)鍵實(shí)體相似度較高則說明兩則信息之間描述同一主題的概率越大。因此,本方案使用Jaccard相似度方法對(duì)不同互聯(lián)網(wǎng)信息之間的實(shí)體相似度進(jìn)行度量,計(jì)算定義如式(3):
simentityij=Enti∩EntjEnti∪Entj(3)
其中,Enti∩Entj表示兩則信息之間公共實(shí)體的個(gè)數(shù),Enti∪Entj表示兩則信息出現(xiàn)的全部實(shí)體的個(gè)數(shù)。實(shí)體集合相似度取值介于0與1之間,數(shù)值越大表示兩者在時(shí)間關(guān)鍵實(shí)體上的相似度越高,越有可能描述的是同一網(wǎng)絡(luò)主題。
2)互聯(lián)網(wǎng)信息實(shí)體語義相似度計(jì)算
Sun W等[26]提出,語義角色標(biāo)注是淺層語義分析的一種,在一個(gè)句子中,謂詞是對(duì)主語的陳述或說明,指出“做什么”“是什么”或“怎么樣”,代表了一個(gè)事件的核心,與謂詞搭配的名詞稱為論元。語義角色是指論元在動(dòng)詞所指事件中擔(dān)任的角色,主要有:施事者、受事者、客體、經(jīng)驗(yàn)者、受益者、工具、處所、目標(biāo)和來源等。例如“小明昨天在公園遇到了小紅”,句子中“遇到”是謂詞,“小明”是施事者,“小紅”是受事者,“昨天”是事件發(fā)生的時(shí)間,“公園”是事件發(fā)生的地點(diǎn)。6816A859-14DE-4471-AE49-F887F905D427
互聯(lián)網(wǎng)信息中包含實(shí)體的語義角色相似度旨在度量不同的互聯(lián)網(wǎng)信息所含實(shí)體在各自文本中所扮演的語義角色的相似度,實(shí)體之間的語義角色相似度可以刻畫不同互聯(lián)網(wǎng)信息之間的實(shí)體在邏輯關(guān)系上的關(guān)聯(lián)關(guān)系。實(shí)體語義角色相似度度量步驟如下:
步驟一:使用Pyltp工具對(duì)互聯(lián)網(wǎng)信息中所含實(shí)體的語義角色進(jìn)行標(biāo)注。
步驟二:統(tǒng)計(jì)各個(gè)實(shí)體的語義角色以及作為該語義角色出現(xiàn)在文本中的頻數(shù);本文僅考慮施事、當(dāng)事、領(lǐng)事、感事、受事、客事、成事、源事、涉事、比較、屬事等20種語義角色。
步驟三:根據(jù)各個(gè)實(shí)體的語義角色以及各自角色出現(xiàn)的頻數(shù)為每個(gè)實(shí)體構(gòu)建一個(gè)長(zhǎng)度為20維的向量V,向量的分量表示該實(shí)體在第i個(gè)語義角色上的歸一化的頻率。
步驟四:使用JS(Jensen-Shannon Divergence)距離計(jì)算不同互聯(lián)網(wǎng)信息之間的實(shí)體交集中實(shí)體的語義角色向量之間的相似度。
步驟五:對(duì)交集中實(shí)體的語義角色相似度值按照實(shí)體出現(xiàn)的頻數(shù)進(jìn)行加權(quán)平均,得到新聞與事件實(shí)體交集的語義角色相似度值。
其中,JS距離的計(jì)算公式定義如式(4):
JS(P‖Q)=12KLP‖P+Q2+12KLQ‖P+Q2(4)
KL(P‖Q)=∑v∈VP(v)*logP(v)Q(v)(5)
其中,V表示語義角色集合,P為實(shí)體在互聯(lián)網(wǎng)信息i中的語義角色分布,Q為實(shí)體在互聯(lián)網(wǎng)信息j中的語義角色分布。
3)互聯(lián)網(wǎng)信息之間的文本相似度計(jì)算
similarity=veci·vecjveci·vecj(6)
其中,veci和vecj分別是互聯(lián)網(wǎng)信息i的特征向量(利用TF-IDF算法生成)和互聯(lián)網(wǎng)信息j的特征向量(由TF-IDF算法生成)。相似度度量算法采用余弦相似度算法進(jìn)行度量。
2.3.2 政策各維度正負(fù)面占比
本文基于公眾視角建立的個(gè)人信息保護(hù)政策評(píng)價(jià)指標(biāo)體系,其中的政策評(píng)價(jià)各維度正負(fù)面比例,主要是指網(wǎng)民關(guān)于特定維度的政策評(píng)論中正面情感評(píng)價(jià)的文本數(shù)量與負(fù)面情感評(píng)價(jià)的文本數(shù)量之比。政策評(píng)價(jià)各維度正負(fù)面比例包含政策內(nèi)容評(píng)價(jià)(用戶)正負(fù)面比例、政策程序評(píng)價(jià)(用戶)正負(fù)面比例、處罰力度評(píng)價(jià)(用戶)正負(fù)面比例、政策執(zhí)行評(píng)價(jià)(用戶)正負(fù)面比例和公眾信任評(píng)價(jià)(用戶)正負(fù)面比例。
其形式化定義為:G=(VT,VF,S,I),其中,G表示政策評(píng)價(jià)各維度評(píng)價(jià),VT表示政策的正向評(píng)價(jià)集合,VF表示政策的負(fù)向評(píng)價(jià)集合,S表示政策內(nèi)容,I表示政策評(píng)價(jià)維度集合。針對(duì)特定政策的某個(gè)政策評(píng)價(jià)維度即s∈S,i∈I:
rateTF=card(VT)card(VF)*100%(7)
以往相關(guān)輿情分析中通用文本情感傾向分析方法為本文的政策用戶評(píng)價(jià)情感計(jì)算提供了良好的基礎(chǔ),但公共政策相關(guān)用戶評(píng)價(jià)情感計(jì)算具有公共政策的特殊性。本文基于2.2節(jié)公眾對(duì)個(gè)人信息保護(hù)政策深度訪談數(shù)據(jù)分析,通過手工標(biāo)注的方式對(duì)個(gè)人信息保護(hù)政策公眾評(píng)價(jià)進(jìn)行了公共政策內(nèi)容、公共政策宣傳、公共政策執(zhí)行、公共政策效果等維度的劃分,并結(jié)合構(gòu)建的用于輔助挖掘政策輿論的評(píng)價(jià)詞表,對(duì)輸入訓(xùn)練模型評(píng)價(jià)特征進(jìn)行提取,其中,評(píng)價(jià)特征包括統(tǒng)計(jì)特征和評(píng)價(jià)極性分值兩種類型,通過將原貼—評(píng)論文本對(duì)和評(píng)價(jià)特征輸入Bert預(yù)訓(xùn)練模型,完成模型的訓(xùn)練,最后利用訓(xùn)練完的模型實(shí)現(xiàn)在社會(huì)化媒體下公眾對(duì)個(gè)人信息保護(hù)政策在不同政策維度下的評(píng)價(jià)判別,細(xì)粒度挖掘公眾評(píng)價(jià)傾向,詳細(xì)計(jì)算步驟如下:
1)數(shù)據(jù)預(yù)處理。通過文本預(yù)處理模塊將社交平臺(tái)網(wǎng)民評(píng)論中的表情符號(hào)、用戶名、非中文特殊符號(hào)、繁體字、各類鏈接等進(jìn)行過濾和處理。
2)公共政策分類標(biāo)注。通過訪談和手工標(biāo)注的方式,對(duì)網(wǎng)民關(guān)于個(gè)人信息保護(hù)政策評(píng)價(jià)進(jìn)行分類,分類維度如下:公共政策內(nèi)容、公共政策程序、處罰力度、公共政策執(zhí)行、公眾信任?;谡咴u(píng)價(jià)分類,對(duì)個(gè)人信息保護(hù)政策的網(wǎng)民微博評(píng)論數(shù)據(jù)進(jìn)行了人工標(biāo)注,標(biāo)注標(biāo)準(zhǔn)是根據(jù)公眾對(duì)原帖文本內(nèi)容在某一政策維度上的評(píng)價(jià)判別,即對(duì)某一政策維度是否支持或不相關(guān)。一條評(píng)論文本可能體現(xiàn)多個(gè)政策維度上的評(píng)價(jià)觀點(diǎn)。
3)評(píng)價(jià)詞表構(gòu)建。通過手工構(gòu)建公共政策社交平臺(tái)網(wǎng)民評(píng)價(jià)正負(fù)面評(píng)價(jià)情感詞表。
4)評(píng)價(jià)特征提取?;谠u(píng)價(jià)詞典分別采用統(tǒng)計(jì)特征和評(píng)價(jià)極性分值計(jì)算的方法抽取評(píng)論文本的特征。其中,統(tǒng)計(jì)特征包含評(píng)價(jià)詞在文本內(nèi)的占比、否定詞、程度副詞、有特殊符號(hào)反語成分占比等。評(píng)價(jià)分值計(jì)算采用基于詞典的評(píng)價(jià)詞權(quán)值累乘得出的評(píng)價(jià)極性分值。首先對(duì)文本進(jìn)行斷句和預(yù)處理,針對(duì)文本中出現(xiàn)的評(píng)價(jià)詞、否定詞、程度副詞、特殊標(biāo)點(diǎn)符號(hào)進(jìn)行詞典匹配,若存在詞典相對(duì)應(yīng)字詞,則賦以不同的權(quán)重值,并利用權(quán)值累計(jì)相乘計(jì)算評(píng)價(jià)極性分值,然后把子句的極性分值相加得到文本的評(píng)價(jià)分值。利用上述兩種方法,最終將抽取評(píng)價(jià)特征。
5)基于Bert[28]訓(xùn)練模型構(gòu)建。本文基于Bert模型的雙文本任務(wù),進(jìn)行公眾評(píng)論文本對(duì)個(gè)人信息保護(hù)政策相關(guān)內(nèi)容的評(píng)價(jià)判別模型構(gòu)建。Bert使用雙向Transformer兼顧上下文,將循環(huán)神經(jīng)網(wǎng)絡(luò)的隱藏層進(jìn)行拼接,并分別表示政策原帖與公眾評(píng)論文本的雙向特征表示。對(duì)于每一個(gè)輸入的文本,它的表征由其對(duì)應(yīng)的詞表征、段表征和位置表征拼接產(chǎn)生。特殊標(biāo)記符“[SEP]”代表分隔的句對(duì),且句對(duì)輸入會(huì)有兩種段表征。本研究采用了BaseBERT模型,在句對(duì)表征后又拼接了公眾評(píng)價(jià)特征向量作為模型的輸入,對(duì)特定公共政策的公眾評(píng)價(jià)進(jìn)行“支持”“不支持”“中立”三分類判別,如圖4所示。
6)情感計(jì)算輸出。將個(gè)人信息保護(hù)政策的社交平臺(tái)網(wǎng)民評(píng)論數(shù)據(jù)作為輸入,通過模型計(jì)算,對(duì)政策評(píng)價(jià)各維度“支持”“不支持”“中立”進(jìn)行判斷和輸出。通過BERT+情感詞表進(jìn)行情感模型訓(xùn)練后相關(guān)情感傾向判定在不同政策維度上的精確率、召回率如表5所示。6816A859-14DE-4471-AE49-F887F905D427
關(guān)于政策各維度用戶評(píng)價(jià)情感計(jì)算的詳細(xì)模型參數(shù)設(shè)置和計(jì)算精度提升效果參見作者此前發(fā)表的另一篇文獻(xiàn)[24]。
2.4 基于評(píng)價(jià)指標(biāo)的計(jì)算模型設(shè)計(jì)
為組織專家對(duì)評(píng)價(jià)指標(biāo)體系進(jìn)行論證,采用層次模糊邏輯方法[25]對(duì)專家意見進(jìn)行綜合,主要思路是首先確定專家委員會(huì)各專家的投票權(quán)重,然后針對(duì)建立的指標(biāo)體系,專家對(duì)每?jī)蓚€(gè)指標(biāo)的重要關(guān)系進(jìn)行打分,采用5維度比較標(biāo)度法進(jìn)行打分參考,可用來衡量各評(píng)估指標(biāo)的相對(duì)重要程度,根據(jù)打分結(jié)果計(jì)算得到每一層級(jí)指標(biāo)的相對(duì)權(quán)重,最終得到指標(biāo)體系的權(quán)重矩陣。根據(jù)權(quán)重矩陣,上層指標(biāo)的定量值可根據(jù)下層指標(biāo)的定量值加權(quán)得到。
2.4.1指標(biāo)評(píng)分專家
政策評(píng)分專家信息如表6所示。
2.4.2 處理計(jì)算流程
步驟一:制作打分表。依據(jù)5維度比較標(biāo)度法制作專家打分表。
步驟二:專家打分。邀請(qǐng)11位專家通過衡量各評(píng)估指標(biāo)對(duì)評(píng)估目標(biāo)的相對(duì)重要程度,將指標(biāo)進(jìn)行兩兩比較打分。
步驟三:權(quán)重矩陣。根據(jù)打分結(jié)果計(jì)算得到每一層級(jí)指標(biāo)的相對(duì)權(quán)重,最終得到評(píng)價(jià)指標(biāo)體系的權(quán)重矩陣。
步驟四:數(shù)據(jù)預(yù)處理。得到指標(biāo)權(quán)重后,通過政策實(shí)際采集數(shù)據(jù)發(fā)現(xiàn),由于指標(biāo)項(xiàng)之間數(shù)據(jù)存在數(shù)量級(jí)的差異,為避免由于量綱不同使某些指標(biāo)形成主導(dǎo)作用,影響評(píng)價(jià)結(jié)果,因此,需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,其中歸一化處理計(jì)算如式(8)所示。
CFvali=dri-drmindrmax-drmin(8)
其中,dri是指第i個(gè)指標(biāo)值。
dri=log2(vali+1)(9)
其中,CFvali是指第i個(gè)指標(biāo)值歸一化后的結(jié)果。
drmin和drmax分別是指同類指標(biāo)中dr得分最小和最大的指標(biāo)值。
步驟五:計(jì)算指標(biāo)得分。級(jí)別i的第j個(gè)指標(biāo)權(quán)重為CWeightij,歸一化后的級(jí)別i的第j個(gè)指標(biāo)的值為CFvalij,則指標(biāo)得分CValueij為:
CValueij=CFvalij*CWeightij(10)
步驟六:計(jì)算綜合得分。將各級(jí)指標(biāo)匯聚后乘以準(zhǔn)則層指標(biāo)權(quán)重,則得到綜合得分計(jì)算公式(11)。
Score綜合=∑k(∑j∈kCValueij)*BWeihgtk*θi(11)
BWeihgtk指第k行的基準(zhǔn)指標(biāo)權(quán)重。
θi是指調(diào)節(jié)系數(shù),以相同倍數(shù)的變大或縮小,使Score值域處在一個(gè)規(guī)定可比區(qū)間。依據(jù)計(jì)算出各層級(jí)指標(biāo)的權(quán)重,即可計(jì)算得出個(gè)人信息保護(hù)政策評(píng)價(jià)計(jì)算模型,指標(biāo)權(quán)重如表7所示。
3 個(gè)人信息保護(hù)政策網(wǎng)民評(píng)價(jià)文本計(jì)算分析
3.1 政策案例選取
本文選取2018年以來發(fā)布的6項(xiàng)個(gè)人信息保護(hù)政策作為實(shí)證研究,具體政策如表8所示,以上政策發(fā)布之后在各類網(wǎng)絡(luò)媒體平臺(tái)得到廣泛的傳播和討論,政策信息的網(wǎng)民評(píng)價(jià)具備代表性。
3.2 政策網(wǎng)民評(píng)價(jià)數(shù)據(jù)收集
本文借助中科院自動(dòng)化研究所產(chǎn)業(yè)化平臺(tái)中科聞歌推出的“聞?!遍_源大數(shù)據(jù)平臺(tái)下載6項(xiàng)個(gè)人信息保護(hù)政策在微博、微信和主流媒體渠道的相關(guān)數(shù)據(jù)。其中,主流媒體包括1 579個(gè)新聞網(wǎng)站、1 079家電子報(bào)紙,新聞網(wǎng)站包括國內(nèi)主流媒體、省市級(jí)媒體、地方級(jí)媒體和行業(yè)媒體;電子報(bào)紙包括國家級(jí)報(bào)刊、省級(jí)報(bào)刊和部分地方級(jí)報(bào)紙的電子版;微信平臺(tái)數(shù)據(jù)是指微信公眾號(hào)數(shù)據(jù),收集到的政策相關(guān)數(shù)據(jù)量如表8所示。伴隨著個(gè)人信息保護(hù)立法及相關(guān)政策的出臺(tái),由于該政策與個(gè)人隱私密切相關(guān),成為當(dāng)時(shí)的網(wǎng)絡(luò)熱點(diǎn)話題,因此受眾在微博、微信等社交平臺(tái)上對(duì)相關(guān)政策話題關(guān)注度極高,參與的受眾較多,在本研究選擇的6個(gè)政策上引發(fā)的受眾最大閱讀數(shù)近1億,最小閱讀數(shù)也達(dá)到90多萬,因此本研究的網(wǎng)絡(luò)評(píng)價(jià)數(shù)據(jù)具有一定的有效性。
3.3 政策評(píng)價(jià)數(shù)據(jù)計(jì)算結(jié)果及分析
通過處理計(jì)算流程步驟六,將各案例政策的各級(jí)指標(biāo)得分匯聚后乘以準(zhǔn)則層指標(biāo)權(quán)重,得到各案例政策的綜合得分如表11所示。
從各案例政策的綜合整體評(píng)價(jià)方面看,得分越高,說明政策的宣傳推廣和網(wǎng)民評(píng)價(jià)越好;從6個(gè)政策的評(píng)價(jià)得分看,《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》獲得的評(píng)分最高。而《個(gè)人金融信息(數(shù)據(jù))保護(hù)試行辦法(初稿)》政策獲得的評(píng)分最低。排在評(píng)價(jià)效果排名第二位的是《兒童個(gè)人信息網(wǎng)絡(luò)保護(hù)規(guī)定》政策;排在評(píng)價(jià)效果排名第三位的是《信息安全技術(shù)個(gè)人信息安全規(guī)范》政策;《快遞暫行條例》和歐盟《通用數(shù)據(jù)保護(hù)條例》分別排在第四位和第五位。
具體從政策各維度評(píng)價(jià)計(jì)算得分上分析,公眾對(duì)于歐盟《通用數(shù)據(jù)保護(hù)條例》政策內(nèi)容評(píng)價(jià)最高,對(duì)《兒童個(gè)人信息網(wǎng)絡(luò)保護(hù)規(guī)定》政策內(nèi)容評(píng)價(jià)次之,而對(duì)《快遞暫行條例》政策內(nèi)容方面的評(píng)價(jià)負(fù)面情緒較多,表明公眾對(duì)該政策的內(nèi)容不認(rèn)可度較高。在政策程序網(wǎng)民評(píng)價(jià)方面,計(jì)算結(jié)果均大于1,說明公眾對(duì)于6個(gè)政策在政策程序方面正面評(píng)價(jià)數(shù)量均高于負(fù)面評(píng)價(jià),表明公眾比較認(rèn)可個(gè)人信息保護(hù)政策的政策程序。在處罰力度網(wǎng)民評(píng)價(jià)方面,公眾對(duì)《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》政策的評(píng)價(jià)得分最高,從6個(gè)政策評(píng)價(jià)上看,只有《快遞暫行條例》在此維度上出現(xiàn)了小于1的計(jì)算結(jié)果,表明公眾在處罰力度方面的評(píng)價(jià)負(fù)面情緒高于正面情緒。在政策效果評(píng)價(jià)方面,公眾對(duì)《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》政策的評(píng)價(jià)得分最高,公眾同樣對(duì)《快遞暫行條例》在政策效果方面不滿意情緒最多。
在政策傳播擴(kuò)散方面計(jì)算得分上分析,在微信平臺(tái)上,《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》政策引發(fā)的傳播量最大,傳播范圍最廣,從其引發(fā)的閱讀數(shù)99 415 740可見一斑,其次是《兒童個(gè)人信息網(wǎng)絡(luò)保護(hù)規(guī)定》和《信息安全技術(shù)個(gè)人信息安全規(guī)范》,《兒童個(gè)人信息網(wǎng)絡(luò)保護(hù)規(guī)定》政策在微信平臺(tái)引發(fā)的總閱讀數(shù)為22 967 415,《信息安全技術(shù)個(gè)人信息安全規(guī)范》政策在微信平臺(tái)上引發(fā)的總閱讀數(shù)為48 022 758。在微信平臺(tái)上傳播效果最差的是《個(gè)人金融信息(數(shù)據(jù))保護(hù)試行辦法(初稿)》,因其屬于特定領(lǐng)域政策,其受眾具有一定的領(lǐng)域特性,所以其引發(fā)的傳播量并不大,總體比前兩個(gè)政策差兩個(gè)數(shù)量級(jí)。在微博平臺(tái)上,《兒童個(gè)人信息網(wǎng)絡(luò)保護(hù)規(guī)定》法規(guī)政策引發(fā)的發(fā)文量、點(diǎn)贊量、轉(zhuǎn)發(fā)量最大,《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》引發(fā)的傳播量次之,但《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》在微博平臺(tái)上引發(fā)的公眾討論最多。在微博平臺(tái)上,傳播情況最差的是《個(gè)人金融信息(數(shù)據(jù))保護(hù)試行辦法(初稿)》,這也與政策的行業(yè)屬性有非常大的關(guān)系。6816A859-14DE-4471-AE49-F887F905D427
通過對(duì)6項(xiàng)政策在網(wǎng)站和電子報(bào)紙兩個(gè)傳統(tǒng)傳播渠道的計(jì)算得分進(jìn)行對(duì)比分析,發(fā)現(xiàn)相關(guān)政策在網(wǎng)站與電子報(bào)紙上的傳播量成正相關(guān),即特定政策如果在電子報(bào)紙上報(bào)道量比較大,那么相應(yīng)的在網(wǎng)站上引發(fā)的傳播量也較高。在網(wǎng)站、電子報(bào)紙上傳播量最大的是《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》,傳播量最小的是《個(gè)人金融信息(數(shù)據(jù))保護(hù)試行辦法(初稿)》。
在議程匹配度方面,網(wǎng)絡(luò)主流媒體報(bào)道主題與社交平臺(tái)上網(wǎng)民關(guān)注焦點(diǎn)重合度最高的是《信息安全技術(shù)個(gè)人信息安全規(guī)范》,其次是《個(gè)人金融信息(數(shù)據(jù))保護(hù)試行辦法(初稿)》,值得注意的是兩個(gè)政策都具有領(lǐng)域?qū)傩?,利用社交平臺(tái)的開放性了解網(wǎng)民關(guān)切,同時(shí)借助主流媒體的權(quán)威性及公信力,達(dá)到了較好的傳播效果。
在政府信任方面,《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》在政策執(zhí)行和公眾信任評(píng)價(jià)方面都取得了較好的網(wǎng)民評(píng)價(jià),而《快遞暫行條例》在政策執(zhí)行和公眾信任評(píng)價(jià)方面網(wǎng)民評(píng)價(jià)負(fù)面情緒最多。
4 個(gè)人信息保護(hù)政策建議
通過對(duì)實(shí)驗(yàn)結(jié)果地分析,為提高個(gè)人信息保護(hù)政策的公眾認(rèn)可度,本文提出如下建議:
1)提高公眾對(duì)政策認(rèn)可的前提是公眾對(duì)相關(guān)公共政策的知悉和了解,通過對(duì)《關(guān)于開展APP違法違規(guī)收集使用個(gè)人信息專項(xiàng)治理的公告》《兒童個(gè)人信息網(wǎng)絡(luò)保護(hù)規(guī)定》《信息安全技術(shù)個(gè)人信息安全規(guī)范》3個(gè)政策的量化計(jì)算發(fā)現(xiàn),這3個(gè)政策在政策傳播擴(kuò)散方面均取得較好的傳播效果,在社交平臺(tái)上引起了網(wǎng)民的廣泛關(guān)注和討論,但是具有行業(yè)屬性的公共政策,雖然在社交平臺(tái)上有人討論,但是由于專業(yè)性較強(qiáng),不容易引起廣泛的關(guān)注和傳播,因此針對(duì)具有行業(yè)屬性的公共政策,如果按常規(guī)的傳播手段進(jìn)行政策傳播,難以取得理想效果,需首先借鑒科普傳播的形式,將專業(yè)術(shù)語進(jìn)行轉(zhuǎn)述,再廣泛借助主流媒體和社交平臺(tái)的交互融合,拓寬公共政策信息的傳播渠道,提高公共政策的覆蓋度。
2)通過借助社交平臺(tái)了解網(wǎng)民對(duì)于特定公共政策的關(guān)注焦點(diǎn)及負(fù)面評(píng)價(jià),尤其是針對(duì)政策不同維度(政策內(nèi)容、處罰力度、政策執(zhí)行等)的負(fù)面評(píng)價(jià),如本文中的《快遞暫行條例》政策處罰力度方面的負(fù)面評(píng)價(jià)較多。一方面,可以對(duì)政策進(jìn)行有針對(duì)性的調(diào)整;另一方面,可借助主流媒體的權(quán)威性及公信力,調(diào)整主流媒體報(bào)道的議程,持續(xù)回應(yīng)公眾關(guān)切,并通過收集相關(guān)網(wǎng)民評(píng)論數(shù)據(jù),實(shí)時(shí)計(jì)算網(wǎng)民負(fù)面評(píng)價(jià)情況,對(duì)回應(yīng)策略及效果進(jìn)行實(shí)時(shí)分析,提高公眾認(rèn)可度。
3)提高公共政策程序和執(zhí)行的透明度,比如本文中公眾對(duì)《快遞暫行條例》的處罰力度和處罰結(jié)果討論存在較多不滿,進(jìn)一步影響到了公眾對(duì)政策制定和執(zhí)行者的信任。因此,有必要將公共政策程序和政策執(zhí)行結(jié)果,通過社交平臺(tái)的官方賬號(hào)進(jìn)行及時(shí)的公布和報(bào)道,提高公眾對(duì)政府的信任水平。
5 結(jié) 語
本文從網(wǎng)民評(píng)價(jià)視角入手,以個(gè)人信息保護(hù)政策為具體研究對(duì)象,構(gòu)建基于網(wǎng)絡(luò)媒體的公共政策網(wǎng)民評(píng)價(jià)計(jì)算框架,實(shí)現(xiàn)對(duì)網(wǎng)民關(guān)于公共政策意見的及時(shí)、多維、量化計(jì)算,并針對(duì)具體公共政策展開實(shí)證分析。本文構(gòu)建的個(gè)人信息保護(hù)政策網(wǎng)民評(píng)價(jià)文本計(jì)算框架,支持從政策內(nèi)容、政策執(zhí)行、政府信任等維度對(duì)網(wǎng)民評(píng)價(jià)進(jìn)行細(xì)粒度分析,能夠精準(zhǔn)定位個(gè)人信息保護(hù)政策過程中的網(wǎng)民關(guān)注的具體問題,可作為政府相關(guān)部門了解個(gè)人信息保護(hù)政策相關(guān)網(wǎng)絡(luò)民意的重要維度,為包括個(gè)人信息保護(hù)政策在內(nèi)的其他公共政策評(píng)價(jià)提供了有效補(bǔ)充。但本研究也有不足之處,如本研究所涉及的網(wǎng)民只代表了可以上網(wǎng)的大眾,存在幸存者偏差。此外,本研究提出的基于網(wǎng)絡(luò)評(píng)論的計(jì)算框架不能完全替代基于文獻(xiàn)、調(diào)查等方式的傳統(tǒng)公共政策評(píng)價(jià)方式,將網(wǎng)絡(luò)評(píng)價(jià)文本挖掘和傳統(tǒng)訪談、調(diào)查等方法相結(jié)合,進(jìn)一步增大訪談樣本的數(shù)量,并對(duì)兩類分析結(jié)果進(jìn)行交叉驗(yàn)證和相互補(bǔ)充,將是本研究下一步研究方向。
參考文獻(xiàn)
[1]Leslie Alexander Pal.Public Policy Analysis:An Introduction[M].Nelson Canada,1992.
[2]張焱,戴楷然,支宇珩.媒體對(duì)公共政策過程影響研究綜述:“傳統(tǒng)媒體”框架的失靈與“社交媒體”框架的缺失[J].西華大學(xué)學(xué)報(bào):哲學(xué)社會(huì)科學(xué)版,2018,(5):102-108.
[3]中國互聯(lián)網(wǎng)絡(luò)信息中心.第48次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[R].北京:中國互聯(lián)網(wǎng)絡(luò)信息中心,2021.
[4]鄭志峰.網(wǎng)絡(luò)社會(huì)的被遺忘權(quán)研究[J].法商研究,2015,32(6):50-60.
[5]周慶山.完善我國個(gè)人信息保護(hù)管理制度的思考[J].社會(huì)治理,2018,21(1):34-41.
[6]王楠.網(wǎng)絡(luò)民意與公共決策關(guān)系探究[D].西安:西北大學(xué),2014.
[7]Rao K,Dey S.Decision Support for E-Governance:A Text Mining Approach[J].International Journal of Managing Information Technology,2011,3(3):73-91.
[8]Kalampokis E,Hausenblas M,Tarabanis K.Combining Social and Government Open Data for Participatory Decision-Making[M].Electronic Participation.Springer Berlin Heidelberg,2011.
[9]Huang X Y.Internet Public Opinion Analysis:Intelligence Services for Government Decision-making[J].Journal of Modern Information,2012.6816A859-14DE-4471-AE49-F887F905D427
[10]Chung K S K,Chatfield A T.An Empirical Analysis of Online Social Network Structure to Understand Citizen Engagement in Public Policy and Community Building[J].International Journal of Electronic Governance,2011,4(1/2):85-103.
[11]Alfaro C,Cano-Montero J,Gómez J,et al.A Multi-stage Method for Content Classification and Opinion Mining on Weblog Comments[J].Annals of Operations Research,2016,236(1):197-213.
[12]Ceron A,Negri F.The“Social Side”of Public Policy: Monitoring Online Public Opinion and Its Mobilization During the Policy Cycle[J].Policy & Internet,2016,8(2):131-147.
[13]Chung W,Zeng D.Social-media-based Public Policy Informatics:Sentiment and Network.Analyses of U.S.Immigration and Border Security[J].Journal of the Association for Information Science & Technology,2016,67(7):1588-1606.
[14]何志武,陳呈.網(wǎng)絡(luò)民意的表達(dá)路徑與收集機(jī)制研究——基于政策議程設(shè)置的視角[J].中州學(xué)刊,2019,(11):165-172.
[15]Song M,Kim M C,Jeong Y K.Analyzing the Political Landscape of 2012 Korean Presidential Election in Twitter[J].IEEE Intelligent Systems,2014,29(2):18-26.
[16]Li Y,Dai G,Zhu Y,et al.A High-Performance Extraction Method for Public Opinion on Internet[J].Wuhan University Journal of Natural Sciences,2007,13(5):902-906.
[17]Zhou P,Cai S Q,Shi S Y,et al.Content Aggregation of Microblogging Public Opinion Events Based on Keyword Extraction[J].Journal of Intelligence,2014.
[18]Lu Z W.The Design of Public Opinion Analysis System Based on Micro-Blog[C]//International Conference on Information System & Artificial Intelligence.IEEE,2017.
[19]邱爾麗,張競(jìng),王雨舟,等.基于網(wǎng)絡(luò)輿情大數(shù)據(jù)的公共政策評(píng)價(jià)研究[J].領(lǐng)導(dǎo)科學(xué),2021,(8):118-121.
[20]鄧莎莎,張朋柱,李欣苗.政府公共決策領(lǐng)域中網(wǎng)絡(luò)民意建模方法研究[J].現(xiàn)代圖書情報(bào)技術(shù),2012,(9):69-74.
[21]何志武,陳呈.公共決策視域下的網(wǎng)絡(luò)民意分析:主體性、科學(xué)性與傾向性[J].電子政務(wù),2020,(2):66-75.
[22]張敬偉,馬東俊.扎根理論研究法與管理學(xué)研究[ J ].現(xiàn)代管理科學(xué),2009,(2):115-117.
[23]胡欣杰,路雨楠,路川.基于聚類分析的網(wǎng)絡(luò)輿情傾向性分析研究[J].兵器裝備工程學(xué)報(bào),2019,40(5):115-118.
[24]趙菲菲,王宇琪,周慶山,等.個(gè)人信息保護(hù)政策網(wǎng)絡(luò)評(píng)價(jià)的文本分析建模研究[J].情報(bào)雜志,2020,39(8):154-159.
[25]Saaty T L.How to Make a Decision:The Analytic Hierarchy Process[J].European Journal of Operational Research,1994,24(6):19-43.
[26]Sun W,Sui Z,Wang M,et al.Chinese Semantic Role Labeling with Shallow Parsing[C]//Conference.on Empirical Methods in Natural Language Processing.Association for Computational Linguistics,2009.
[27]Liu M Y,Tu Z Y,Wang Z J,et al.LTP:A New Active Learning Strategy for Bert-crf Based Named Entity Recognition[J].arXiv Preprint arXiv:2001.02524,2020.
[28]Devlin J,Chang M W,Lee K,et al.Bert:Pre-training of Deep Bidirectional Transformers for Language.Understanding[J].arXiv Preprint arXiv:1810.04805,2018.
(責(zé)任編輯:郭沫含)6816A859-14DE-4471-AE49-F887F905D427