摘 要:個體層面的個人信息權(quán)益與企業(yè)數(shù)據(jù)財產(chǎn)建構(gòu)的主張不足以解釋數(shù)據(jù)資源背后的群體性權(quán)益,恰如用戶標簽不僅描述了自然人的個體屬性,還反映了被學者們所忽視的自然人群體的共同屬性,當前學術(shù)討論存在簡化用戶標簽承載多元法益的誤區(qū)。用戶標簽包含了個體性權(quán)益和社會關(guān)系權(quán)益的數(shù)據(jù)要素,因為在數(shù)據(jù)關(guān)系理論框架下,數(shù)據(jù)經(jīng)濟價值不單是數(shù)據(jù)本身,還包括數(shù)據(jù)所反映的群體性偏好、社交關(guān)系等信息內(nèi)容。數(shù)據(jù)處理者精細劃分用戶標簽數(shù)量和類型,其目的是更精準、更全面地獲取不同用戶群體之間的社會關(guān)系,而這正是以用戶群體而非用戶個體為基礎,延伸數(shù)據(jù)安全保障義務內(nèi)容的正當性依據(jù),即數(shù)據(jù)處理活動應當以有利于數(shù)據(jù)資源再生產(chǎn)和預防數(shù)據(jù)群權(quán)益損害的方式進行。
關(guān)鍵詞:用戶標簽;個人信息;數(shù)據(jù)關(guān)系理論;社會關(guān)系權(quán)益
中圖分類號:DF523.9 文獻標志碼:A
DOI:10.3969/j.issn.1001-2397.2022.06.07 開放科學(資源服務)標識碼(OSID):
基金項目:國家重點研發(fā)計劃“智慧司法科學理論與司法改革科技支撐技術(shù)研究”(2020YFC0832400)階段性成果
作者簡介:
趙精武(1992),男,河北黃驊人,北京航空航天大學法學院副教授,法學博士,工業(yè)和信息部工業(yè)和信息化法治戰(zhàn)略與管理重點實驗室研究員,北京科技創(chuàng)新中心研究基地研究員。
一、問題的提出
用戶標簽是指信息處理者為了方便發(fā)現(xiàn)和識別自然人基本特征而對自然人個體的特定屬性(如消費偏好、行為軌跡、生活習慣等)高度提煉而形成的特征標識。用戶標簽數(shù)量越多,信息處理者對特定用戶情況了解得就越充分。簡言之,用戶畫像是由多個用戶標簽構(gòu)成的。法學領域的研究成果大多傾向于將用戶標簽與用戶畫像、個性化推薦視為同一法律議題予以討論,原因在于用戶標簽不過是用戶畫像和個性化推薦服務中的“客觀技術(shù)過程”,其法律規(guī)制仍然需要回歸算法治理框架之內(nèi)。然而,前述觀點僅關(guān)注到了用戶標簽在形成用戶畫像過程中的輔助作用,忽視了對用戶標簽自身經(jīng)濟價值來源的考察。從商業(yè)實踐來看,用戶標簽的應用還涉及平臺用戶之間的相互識別、建立用戶關(guān)系群等與客戶關(guān)系管理(CRM)相關(guān)的業(yè)務活動(參見圖1)。因此,與用戶標簽應用相關(guān)的制度探討顯然不能僅限于算法安全治理層面,還應當從數(shù)據(jù)治理層面來解釋用戶標簽所包含的“雙重法益”。因為用戶標簽既包含對個體用戶行為特征的描述,還包括對用戶群體性特征的描述,而這種群體性特征恰恰是用戶標簽自身的經(jīng)濟價值所在。誠然,算法治理體系確實能夠解決用戶標簽技術(shù)濫用的問題,但這種治理的立足點是以保障用戶個體權(quán)益為基礎,無法回應用戶標簽內(nèi)被忽視的“群體性權(quán)益”,故而有必要從數(shù)據(jù)安全治理層面重新審視用戶標簽治理領域是否存在遺漏保護的“權(quán)益”。
從現(xiàn)階段的業(yè)務模式來看,用戶標簽技術(shù)應用的目的,首先是建構(gòu)用戶群體的共同特征,然后是對不同用戶群體特征進行層層疊加,最后才是建構(gòu)同時滿足數(shù)個用戶群體特征的用戶畫像。更為重要的是,數(shù)據(jù)處理者利用數(shù)據(jù)資源獲取經(jīng)濟利益的主要方式,除了識別特定自然人基本情況之外,還包括對用戶群體的精細化分類,以便及時發(fā)現(xiàn)市場需求走向和風險水平。因此,在回答如何規(guī)制用戶標簽技術(shù)應用之前,有必要厘清用戶標簽法律性質(zhì)的三個理論問題:第一,用戶標簽的法律性質(zhì)是什么?盡管用戶標簽之間相互組合能夠間接識別特定自然人,但對于這種“可識別性”與《中華人民共和國個人信息保護法》(以下簡稱《個人信息保護法》)第4條規(guī)定的“可識別性”之間的落差又應當如何解釋?第二,用戶標簽背后的群體性特征的利益歸屬如何在現(xiàn)有的權(quán)利體系中予以定位和解釋?來自于用戶的用戶標簽為數(shù)據(jù)處理者創(chuàng)造了經(jīng)濟利益,最終的信息服務卻存在侵害用戶個體權(quán)益的可能性,這明顯存在數(shù)據(jù)處理者與自然人之間的權(quán)利義務關(guān)系失衡的問題。第三,用戶標簽技術(shù)濫用問題歸根結(jié)底表現(xiàn)為數(shù)據(jù)使用方式不恰當,但這種數(shù)據(jù)處理行為又無法機械地套用既有權(quán)利架構(gòu),那么,又應當設置何種規(guī)則將其安置于數(shù)據(jù)安全體系之中?總體而言,用戶標簽在精準營銷、用戶群體分類、市場需求分析等領域的應用,使得標簽技術(shù)的法律意義遠超純粹中立的技術(shù)方案和企業(yè)經(jīng)營自主權(quán)的概念范疇,因此,需要在理論層面重新解釋和建構(gòu)用戶標簽承載的多元法益結(jié)構(gòu)。
二、用戶標簽與個人信息的關(guān)系
(一)用戶標簽的基本概念和技術(shù)特征
學界對于用戶標簽法律性質(zhì)的忽視,本質(zhì)上是對用戶標簽技術(shù)特征的忽視,并不是所有的用戶行為模式特征都可以成為“用戶標簽”。用戶標簽的數(shù)量和內(nèi)容設置往往需要以一定的商業(yè)目的或分析內(nèi)容為依據(jù),確保每一個用戶標簽彼此之間能夠相互區(qū)分。通常而言,用戶標簽大致可分為“統(tǒng)計類標簽”“規(guī)則類標簽”和“機器學習挖掘類標簽”三大類。統(tǒng)計類標簽最為常見,主要是對用戶基本情況進行統(tǒng)計;規(guī)則類標簽則是為了發(fā)現(xiàn)用戶行為的基本模式或總體趨勢;機器學習挖掘類標簽則是由算法所形成的用戶標簽,但該類標簽因形成周期較長而較為少見。進一步而言,通常被認為是商業(yè)經(jīng)營模式或技術(shù)方案的用戶標簽,實際上也是解決數(shù)據(jù)財產(chǎn)權(quán)益歸屬的重要依據(jù),所謂的數(shù)據(jù)資產(chǎn)并不純粹是個人信息處理者所持有或控制的數(shù)據(jù)集合,而是一整套圍繞數(shù)據(jù)資源開發(fā)的技術(shù)、設備和信息資源體系。數(shù)據(jù)資產(chǎn)經(jīng)濟價值的形成有一部分來自于用戶標簽,以及標簽類目體系,因為這些標簽能夠?qū)?shù)據(jù)資產(chǎn)真正轉(zhuǎn)化為常見的各類信息服務,以標簽形式形成的數(shù)據(jù)資源或數(shù)據(jù)集合也被視為“數(shù)據(jù)資產(chǎn)的最佳表現(xiàn)形式”。因此,用戶標簽并不純粹屬于用戶畫像的技術(shù)環(huán)節(jié),其自身的經(jīng)濟價值毋庸置疑。
用戶標簽是包括個性化推薦、廣告推送、智能運營系統(tǒng)等諸多數(shù)據(jù)產(chǎn)品在內(nèi)的基礎類數(shù)據(jù)。設置合理且維度多元化的用戶標簽體系,能夠幫助企業(yè)直觀地分析用戶群體的消費行為特征,明確目前與未來的市場需求發(fā)展趨勢。如果僅是針對個人偏好設置標簽并提供類似的服務,那么,這種標簽實際上屬于傳統(tǒng)商業(yè)活動中的同類產(chǎn)品推薦,而非前文提及的“標簽算法”。從目前的用戶標簽技術(shù)應用情況來看,用戶標簽主要表現(xiàn)為三方面特點:第一,通常不具有唯一識別性。用戶標簽形成的用戶畫像并不當然等同于可識別的個人信息,倘若用戶標簽數(shù)量不足、內(nèi)容不具代表性,最終形成的用戶畫像并不能實現(xiàn)精準營銷的功能,反而有可能成為“用戶分群”的依據(jù)。第二,設置規(guī)則具有唯一性和簡潔性。為了充分了解個體用戶的行為特征或個人偏好,個人信息處理者所設置的用戶標簽內(nèi)容雖然簡潔但極具概括性,其目的是細分營銷市場、判斷用戶群體的消費特征,增加不同用戶群體的可辨識度。第三,設置目的具有明顯的業(yè)務導向性。如二手車交易平臺不會選擇將“偏好管弦樂”作為自身標簽類型體系的內(nèi)容之一,因為這不符合其促成二手車交易之目的。
每一個用戶標簽描述的僅僅是與自然人相關(guān)的一個特征,因此,針對同一自然人的不同用戶標簽之間內(nèi)容并不重疊,傳達的信息內(nèi)容也各不相同。而且,隨著用戶標簽類型和數(shù)量的增加,有關(guān)自然人的信息將會越來越詳細,乃至能夠精準定位到特定自然人。從大數(shù)定律
的角度理解,網(wǎng)絡平臺為了預測用戶的消費需求和習慣,傾向于收集有關(guān)用戶各方面的行為數(shù)據(jù),故而,用戶標簽的整合、聚合很大程度上能夠傳達有關(guān)用戶職業(yè)類型、收入水平、消費偏好等詳細的信息內(nèi)容,這也是創(chuàng)造數(shù)據(jù)資產(chǎn)經(jīng)濟價值的關(guān)鍵所在。正如德國憲法法院在“人口普查案”中提及的“現(xiàn)代社會不存在與個人完全不相關(guān)的信息”,雖然單一的用戶標簽并不屬于個人信息,但是,數(shù)量龐大且聚合的用戶標簽完全有可能成為個人信息,甚至能夠達到敏感個人信息的程度。
(二)用戶標簽并不當然是個人信息
用戶標簽是否屬于個人信息需要判斷用戶標簽的間接識別可能性是否與《個人信息保護法》第4條中的“可識別性”一致。用戶標簽實現(xiàn)間接識別特定自然人存在諸多限制,解除限制的前提是要滿足“有充足數(shù)量的其他用戶標簽進行結(jié)合分析”和“采用相同的標簽類目體系和標簽設置標準”,以及“企業(yè)內(nèi)部特定的算法”三個條件。盡管用戶標簽和用戶畫像早已成為普及性的商業(yè)模式,但是,零星或數(shù)量有限的用戶標簽類目具有鮮明的企業(yè)經(jīng)營戰(zhàn)略導向,不同企業(yè)所設置的用戶標簽無法與其他企業(yè)的用戶標簽結(jié)合起來確定特定用戶身份信息。企業(yè)內(nèi)部標簽類目體系設置不合理,會影響到用戶標簽定位用戶特征的準確性。更為重要的是,用戶標簽具有機器可讀性,而非人的可讀性,因而,如果不能放置在特定數(shù)據(jù)分析算法中,則
無從談及用戶標簽的間接識別能力。而《個人信息保護法》第4條中的“可識別性”標準顯然不能解讀為“關(guān)聯(lián)個人的信息即是個人信息”。囿于商業(yè)實踐的復雜性和技術(shù)更新周期性等現(xiàn)實原因,立法者并沒有選擇詳細具體的概念界定模式,而是將“可識別性”標準的解釋方式交由法官結(jié)合個案予以判斷。與一般數(shù)據(jù)處理活動相比,用戶標簽結(jié)合識別特定用戶明顯具有“異?!钡募夹g(shù)難度和前期成本要求,并不屬于第4條意欲防范的“可識別性”風險。
更準確地說,在形成精準用戶畫像之前,與其說用戶標簽具有識別特定自然人的可能性,倒不如說用戶標簽具有“推測”“預測”自然人群體特征和行為趨勢的可能性。與部分國外學者所提出的“過度推測”風險的治理論斷所揭示的情形類似,企業(yè)在從事大規(guī)模數(shù)據(jù)分析之前,應當證明數(shù)據(jù)源和預期推理的合理性,針對諸如“從非歧視數(shù)據(jù)推斷敏感信息內(nèi)容”“用于推測行為的數(shù)據(jù)源是否具有隱私侵犯性”等事項進行評估。事實上,用戶標簽的使用并非數(shù)字經(jīng)濟的全新產(chǎn)物。在過去,企業(yè)會建構(gòu)客戶關(guān)系管理系統(tǒng)實現(xiàn)用戶的存量管理,基于“老顧客”“新顧客”等簡單標簽體系進行商業(yè)營銷;而現(xiàn)在,企業(yè)收集用戶個人信息的目的與過去并無差異,唯一的區(qū)別是后者是從個性化定制和群體性定制兩個層面達到業(yè)務營銷的目的。
三、用戶標簽承載法益的結(jié)構(gòu)關(guān)系
(一)用戶標簽承載的多元法益
既然用戶標簽并不當然等同于個人信息,那么,就有必要重新審視用戶標簽的法律性質(zhì),法律性質(zhì)解釋方案的不同,決定了立法是否需要規(guī)制用戶標簽,以及以何種方式規(guī)制用戶標簽技術(shù)應用。技術(shù)中立并不是個人信息處理者可以任意使用用戶標簽技術(shù)的正當性事由,標簽技術(shù)應用的最終目的還是為了精準識別特定自然人的特定需求,如若放任該項技術(shù)濫用,則
不可避免地會發(fā)生“技術(shù)規(guī)訓人類”的風險。國家網(wǎng)信辦等四部門發(fā)布的《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》第10條規(guī)定了算法推薦服務提供者的用戶標簽管理義務,即不得將違法、不良關(guān)鍵詞納入用戶標簽。該規(guī)定雖未明確解釋用戶的具體權(quán)利,但是,從條款內(nèi)容來看,用戶標簽技術(shù)應用確實關(guān)系到個人信息權(quán)益的行使,因為在信用評定、電子支付等領域,用戶標簽內(nèi)容設置的準確性和完整性直接關(guān)系到用戶申請貸款等實體性權(quán)利能否實現(xiàn)。由此觀之,用戶標簽作為信息服務內(nèi)容的組成部分,對其合理設置、精準設置亦是信息服務合同權(quán)利的應有之義。除此之外,用戶標簽同時還具有社會公共利益的屬性,標簽內(nèi)容設置不合理有可能導致網(wǎng)絡違法信息的泛濫,如未能對用戶標簽增加“未成年人”的相關(guān)標簽,未成年人則有可能頻繁接收到不良信息的推送。所以,用戶標簽所承載的權(quán)益具有多元特征,雖然無法以明確的標準將這些復合型權(quán)益涇渭分明地區(qū)隔,但是,這并不妨礙從個體性權(quán)益和群體性權(quán)益兩個層面解構(gòu)用戶標簽的法益特征。
在個體性權(quán)益層面,用戶標簽越多,個人識別性越強,用戶標簽存在轉(zhuǎn)化為“個人信息”的趨勢?!秱€人信息保護法》所規(guī)定的個人信息是以信息要素組合為基礎,如單獨的“姓名”“身份證號”“年齡”等信息根本無法稱得上是“個人信息”,但“姓名+身份證號”“姓名+年齡+電話”等信息要素組合則構(gòu)成了“個人信息”。但是,對于不包含特定信息要素的用戶標簽,繼續(xù)沿用個人信息保護規(guī)則將會出現(xiàn)保護客體不匹配的問題。本文所強調(diào)的“用戶標簽”主要是以單一的用戶標簽或者信息要素組合不具有識別效果的用戶標簽為論證對象,用戶標簽所承載的“個體性權(quán)益”是以單一用戶標簽之間的關(guān)聯(lián)性為基礎。用戶標簽的技術(shù)功能與個人行為特征識別密切相關(guān),并且,用戶標簽的提取與設置也是基于業(yè)已收集的個人信息,故而用戶標簽所承載的個體性權(quán)益與個人信息權(quán)益存在體系上的部分關(guān)聯(lián),關(guān)聯(lián)的核心則是基于個人信息而設置的用戶標簽可能會對個人其他權(quán)益產(chǎn)生負面影響,而預防或消除這些負面影響的制度僅與《個人信息保護法》存在部分內(nèi)容的交叉。第一,在知情權(quán)和決定權(quán)層面,自然人有權(quán)限制或拒絕個人信息的處理方式,當然也有權(quán)限制或拒絕不合理的用戶標簽行為,只不過,這種限制或拒絕的前提條件僅限于“不合理”或“不適當”。第二,在更改權(quán)和補充權(quán)層面,個人信息權(quán)益的法理基礎是保障個人信息的完整性和準確性,目的則是為了預防個人信息處理活動對個人其他權(quán)益造成不當影響。相對地,用戶標簽作為個人信息處理活動的重要環(huán)節(jié),內(nèi)容的篩選和設置同樣會對個人其他權(quán)益造成實質(zhì)性影響,故而用戶有權(quán)要求更改不合理、不適當?shù)挠脩魳撕?。第三,在解釋說明權(quán)層面,用戶標簽設置顯然屬于《個人信息保護法》第48條規(guī)定的“個人信息處理規(guī)則”,因而,用戶有權(quán)要求個人信息處理者對標簽內(nèi)容設置規(guī)則進行解釋說明。第四,在未成年人保護層面,用戶標簽與未成年人所能觸及的網(wǎng)絡信息范圍和信息服務類型相關(guān),個人信息處理者有義務根據(jù)《個人信息保護法》第31條制定包括用戶標簽管理規(guī)則在內(nèi)的專門的未成年人個人信息處理規(guī)則。最后,至于查閱復制權(quán)、刪除權(quán)等其他個人信息權(quán)益,由于涉及對個人信息“原件”的直接處理,故而其行使規(guī)則和法理基礎無法延伸至用戶標簽。
在群體性權(quán)益層面,用戶標簽的技術(shù)應用應當是以促成數(shù)據(jù)資源再生產(chǎn)和避免數(shù)據(jù)社會損害為合法性邊界,其承載的群體性權(quán)益則是公正合理處理數(shù)據(jù)行為的基礎。這并非筆者臆想,已有學者提出“群體信息可能帶來所謂的群體個人信息保護或群體隱私問題”,并且,這些問題是否完全按照個人信息保護方式予以解決存有爭議。盡管從信息服務合同的角度觀之,用戶標簽技術(shù)應用的方式主要是以合同權(quán)利義務為限,但是,用戶標簽類目體系的設置卻是數(shù)據(jù)使用價值的實現(xiàn)方式。數(shù)據(jù)商業(yè)化使用的基本邏輯是企業(yè)通過對業(yè)已收集的個人信息進行加工處理,并按照企業(yè)經(jīng)營理念和營銷策略設置標簽管理體系,最終獲得企業(yè)希望發(fā)現(xiàn)的信息。因此,個人信息處理者的用戶標簽管理規(guī)則和設置體系背后的群體性權(quán)益,應當以有利于社會群體共同利益的形式存在:一是個人信息處理者所獲得的數(shù)據(jù)經(jīng)濟價值應當來源于公正合理的數(shù)據(jù)處理活動;二是個人信息處理者所挖掘的數(shù)據(jù)關(guān)系不應當侵擾到社會公共利益和個體的私密生活空間。在商業(yè)實踐中,這種群體性權(quán)益最直觀的表現(xiàn)形式是基于用戶標簽所確定的營銷策略侵害消費者群體利益,尤其是在自動化推送服務模式下,部分用戶標簽重合的用戶群體往往只能接收到有限類型的信息。誠然,用戶標簽體系的設置屬于平臺經(jīng)營自主權(quán)的范疇,但設置方式可能會對個體權(quán)益和群體性權(quán)益造成損害,有的平臺試圖獲取超出正常營銷范圍的用戶群體信息,如用戶群體之間的社交關(guān)系、基于用戶群體的歧視性再分類等。
(二)用戶標簽群體權(quán)益的理論基礎
前述用戶標簽多元法益并存狀態(tài)早已為學者們所關(guān)注。在論及數(shù)據(jù)權(quán)屬問題時,學者們試圖將同一數(shù)據(jù)集合上的個人信息權(quán)益、企業(yè)數(shù)據(jù)財產(chǎn)權(quán)益,乃至潛在社會公共利益按照法律主體身份予以區(qū)分。但實際結(jié)果顯而易見,在理論層面上,這些權(quán)益彼此之間的區(qū)分方式雖然能自圓其說,但在實踐層面,卻無法解釋數(shù)據(jù)集合內(nèi)部不同類型數(shù)據(jù)權(quán)益的具體邊界,也無法解釋企業(yè)利用數(shù)據(jù)集合獲得的經(jīng)濟利益,且當這些數(shù)據(jù)集合是以不同方式組合個人信息而形成時,自然人是否有權(quán)獲得其中的部分經(jīng)濟利益等問題并未明確。這些
理論困境的形成,源于學者們普遍忽視了數(shù)據(jù)關(guān)系對于多元法益并存狀態(tài)的影響方式。用戶標簽的間接識別特征不僅表現(xiàn)為能夠間接識別到與標簽相關(guān)的特定自然人,還包括能夠間接識別到與特定自然人具有社會關(guān)系的其他自然人。簡單地說,用戶的消費行為被貼上標簽后,學界主流觀點大多傾向于分析這種標簽行為是否會有可能重新識別到這個用戶,但用戶標簽內(nèi)容描述的不僅是該用戶的個人屬性,同時還是一定范圍的群體性特征。這種個體性特征與群體性特征之間的映射關(guān)系,并不能依循法律主體的不同而劃分出相對應的權(quán)利體系架構(gòu),進一步而言,這種技術(shù)層面的映射關(guān)系本質(zhì)上是社會關(guān)系的數(shù)據(jù)化描述,即既表現(xiàn)為“具有A類特征的用戶群體可能同樣具有B類特征”,也表現(xiàn)為“A類用戶與B類用戶因為工作內(nèi)容、消費行為等社會交往活動而構(gòu)成了‘A+B’類特征”。
用戶標簽內(nèi)容所包含的社會關(guān)系是用戶標簽兼具個體性權(quán)益和群體性權(quán)益的根本原因,美國學者薩洛梅(Salome)也基于數(shù)據(jù)關(guān)系的社會性特征提出數(shù)據(jù)治理的關(guān)系理論,用以解釋“數(shù)據(jù)關(guān)系如何產(chǎn)生超越個人的權(quán)益”。薩洛梅并沒有選擇從信息自決權(quán)等主流視角探討數(shù)據(jù)保護的必要性,而是將數(shù)據(jù)權(quán)益置于政治經(jīng)濟領域剖析數(shù)據(jù)的社會屬性和關(guān)系屬性。因為互聯(lián)網(wǎng)巨頭收集數(shù)據(jù)的經(jīng)濟動機并不純粹是為了盡可能全面地描述個體用戶的用戶畫像,也是為了盡可能發(fā)現(xiàn)“數(shù)據(jù)主體與他人關(guān)系的所有信息”,常見的好友推送信息可得優(yōu)惠、拉入新用戶即贈福利等營銷活動亦是出于此種目的。在薩洛梅看來,“數(shù)據(jù)主體—數(shù)據(jù)處理者”和“數(shù)據(jù)主體—數(shù)據(jù)主體”均是數(shù)據(jù)處理活動需要考量的實踐基礎。前者反映的是信息服務提供者與信息服務接受者之間的權(quán)利義務關(guān)系,后者反映的則是數(shù)據(jù)經(jīng)濟價值創(chuàng)造來源,如對群體行為特征的總結(jié)與預測。由于數(shù)據(jù)經(jīng)濟價值常常被理解為企業(yè)通過技術(shù)、人力、資金等前期投入而獲得的價值,“數(shù)據(jù)主體-數(shù)據(jù)主體”所反映的社會關(guān)系也被默認為企業(yè)的“數(shù)字勞動”所得。然而,數(shù)字時代下的社會關(guān)系并非純粹客觀的社會現(xiàn)象,以往隱藏于實踐活動中的社會關(guān)系被平臺挖掘和發(fā)現(xiàn),將可能獲取用戶的現(xiàn)實好友關(guān)系等私密信息,或可能因技術(shù)缺陷導致挖掘的社會關(guān)系被異化?!皵?shù)據(jù)主體—數(shù)據(jù)主體”所反映的社會關(guān)系承載的是消極性權(quán)益,即特定社會關(guān)系不得被擅自披露或惡意加工?!吨腥A人民共和國民法典》選擇將個人信息納入人格尊嚴的保護范疇,原因是個人信息乃是法律主體身份的數(shù)字化;而用戶標簽作為群體行為模式特征的概括,本質(zhì)上是法律主體身份數(shù)字化的社會交往活動的延伸,因而,其多元法益并存的解釋顯然需要以數(shù)據(jù)所反映的社會關(guān)系為核心。
薩洛梅在理論層面最大的貢獻在于發(fā)現(xiàn)數(shù)據(jù)生產(chǎn)業(yè)務中最核心環(huán)節(jié)是數(shù)據(jù)關(guān)系的識別,這是解釋用戶標簽群體權(quán)益存在的理論基礎?,F(xiàn)有的個人信息保護研究成果普遍以個性化服務所面向的特定自然人為核心,卻忽視了商業(yè)邏輯層面數(shù)據(jù)真正的經(jīng)濟價值來源是社會關(guān)系和共同特征。在過去,企業(yè)也會收集和處理消費者的個人信息,其目的是維護客戶存量和發(fā)現(xiàn)市場需求;在當下,消費者個人消費情況固然重要,但這種重要性卻被集體的共同特征所涵蓋。換言之,企業(yè)完全可以根據(jù)特定自然人是否屬于某幾類群體范疇,評估該自然人可能的消費偏好和行為軌跡,這也被薩洛梅歸結(jié)為企業(yè)能夠從“行為定位、預測任務、規(guī)模風險評估和可調(diào)節(jié)反饋系統(tǒng)”中獲利的根源所在。所以,用戶標簽的群體權(quán)益來源并不完全是學者們所設想的算法透明義務等建構(gòu)性理論,還包括數(shù)據(jù)經(jīng)濟價值的形成機理。對于數(shù)據(jù)關(guān)系的忽視將會導致“風險—收益”的失衡:一是個人授權(quán)收集個人信息所承擔的信息安全風險與所享受的信息服務比例失衡;二是個人信息處理者通過收集個人信息獲得集體的共同特征等利益
與其承擔的經(jīng)營風險比例失衡,如用戶提交了自己的消費記錄、薪資水平等信息,卻被用戶標簽定位為“缺乏足夠消費能力”,用戶實際能夠獲得信息服務的內(nèi)容和類型受到限制,明顯屬于薩洛梅所提及的“不公平的數(shù)據(jù)處理活動”。
(三)用戶標簽群體權(quán)益的基本內(nèi)容
用戶標簽的群體權(quán)益與傳統(tǒng)意義上的社會公共利益存在一定的差異性,相較于后者而言,群體權(quán)益在內(nèi)容和正當性基礎層面更為具體。用戶標簽的群體權(quán)益的正當性基礎是數(shù)據(jù)之間的關(guān)系或者結(jié)構(gòu)化數(shù)據(jù)所能映射的社會關(guān)系以及經(jīng)濟價值?;仡檱鴥?nèi)學者有關(guān)數(shù)據(jù)財產(chǎn)權(quán)益歸屬問題的探討,有一個問題未能得到圓滿的解釋,即個人信息處理者處理個人信息集合并獲得經(jīng)濟利益,自然人作為原始數(shù)據(jù)的提供者,是否應當獲得相應的經(jīng)濟利益?從經(jīng)濟利益的實際來源看,如果自然人拒絕提供個人信息,個人信息處理者確實未必能夠得到足以盈利的信息內(nèi)容和數(shù)據(jù)資產(chǎn)。但是,一旦承認自然人享有部分的數(shù)據(jù)收益權(quán),無疑會對所有的數(shù)據(jù)處理活動施加龐大的額外成本。從經(jīng)濟利益的實際創(chuàng)造者來看,個體層面的個人信息并不足以形成具有商業(yè)價值的數(shù)據(jù)資產(chǎn),經(jīng)濟利益的真正來源是企業(yè)自身運用信息技術(shù)、原始數(shù)據(jù)收集等勞動所產(chǎn)出的數(shù)據(jù)資產(chǎn)。類似的問題是,一旦承認企業(yè)數(shù)據(jù)財產(chǎn)權(quán)的正當性基礎是企業(yè)的技術(shù)處理活動,又會陷入企業(yè)以加工后的數(shù)據(jù)不屬于個人信息為由規(guī)避義務履行的困境。這一權(quán)益歸屬難題置于數(shù)據(jù)治理關(guān)系理論框架下,則被轉(zhuǎn)化為如何解釋個體性的經(jīng)濟利益與個人信息權(quán)益之間的內(nèi)容銜接問題。
可以確定的是,針對由個人信息衍生而來的數(shù)據(jù)資產(chǎn),自然人享有部分權(quán)益。不過,這種權(quán)益并非通常意義上歸屬于特定個人的具體權(quán)利,而是被融入群體權(quán)益之中。客觀上,單一個體乃至小范圍群體的個人信息本身并無多大商業(yè)經(jīng)濟價值,在無法收集自然人全部的個人信息的預設前提下,個人信息處理者完全可以選擇用其他自然人個人信息集合予以替代,獲得經(jīng)營活動所需的群體性共同特征信息。因此,在立法層面建構(gòu)歸屬特定個人的數(shù)據(jù)收益權(quán)缺乏足夠的正當性基礎,現(xiàn)行立法也未曾規(guī)定基于“可能促成收益”事由的具體權(quán)利。換言之,歸屬型數(shù)據(jù)權(quán)利的內(nèi)在邏輯是個人信息處理者利用個人信息獲得經(jīng)濟利益,但實踐中經(jīng)濟利益的獲得方式并不是完全利用個人信息所得,有關(guān)自然人數(shù)據(jù)收益權(quán)的討論一開始就存在方向性偏差,誤將客觀的社會身份關(guān)系當作個體數(shù)據(jù)的經(jīng)濟價值來源,以至于徘徊在“數(shù)據(jù)資產(chǎn)經(jīng)濟價值主要來自于企業(yè)內(nèi)部加工,還是自然人提供原始數(shù)據(jù)”的邏輯誤區(qū)中難尋出路。在法理層面,承認自然人對數(shù)據(jù)流動中形成的數(shù)據(jù)資產(chǎn)享有部分權(quán)益并無不當,但關(guān)鍵是這種權(quán)益并不是歸屬于個人,而是以群體權(quán)益的形式為群體乃至社會公眾所共同享有,其行使方式則是一種強制性義務規(guī)范,即要求個人信息處理者不得將集體共同特征以不恰當?shù)姆绞綐撕灮⑾拗萍w范圍內(nèi)個體權(quán)利的行使。
具體而言,用戶標簽可以視為社會關(guān)系的數(shù)字化,而這種社會關(guān)系足以讓網(wǎng)絡平臺或信息服務提供者發(fā)現(xiàn)潛在的市場需求或評估風險程度。所以,用戶標簽承載的群體權(quán)益可以理解為社會關(guān)系權(quán)益,即用戶標簽應當以有益于社會關(guān)系發(fā)展或數(shù)據(jù)資產(chǎn)再生產(chǎn)的方式予以設置和使用,但由于社會關(guān)系權(quán)益并不專屬于特定自然人,因此,該權(quán)益的存在形式主要是以強制性義務規(guī)范為限。詳細而言,社會關(guān)系權(quán)益包括三個層面的內(nèi)容:第一,并不是所有的社會關(guān)系都適合設置為用戶標簽的具體樣態(tài)。在商業(yè)實踐中,個人信息處理者所關(guān)注的“社會關(guān)系”無外乎與精準營銷、拓展客戶范圍和規(guī)避經(jīng)營風險相關(guān),涉及到國家安全、個人私密生活狀態(tài)的社會關(guān)系則不適宜作為用戶標簽。例如,頻繁購買皮膚病藥品的人群可以設置“購買皮膚病藥品”的用戶標簽,但不宜設置“購買A類皮膚藥品”的用戶標簽,因為后一類用戶標簽可能揭示“患有特定皮膚病者”這一私密群體,明顯超出了精準營銷或擴大客戶范圍的合理性。第二,用戶標簽不得用于歧視性的群組劃分。創(chuàng)造數(shù)據(jù)經(jīng)濟價值的基礎是客觀性的社會關(guān)系,而不是具有歧視性或偏見性的社會關(guān)系。常見的大數(shù)據(jù)歧視等問題在一定程度上可以理解為,網(wǎng)絡平臺未能正確使用用戶標簽劃分恰當?shù)娜航M類別,如果簡單地按照過往消費記錄劃分“高端消費、中端消費、低端消費”群組類別只會誤導數(shù)據(jù)資產(chǎn)再生產(chǎn)方向,使得原本發(fā)現(xiàn)市場需求的用戶標簽異化為精細評估消費者能夠接受的最高價格水平的歧視性標簽。第三,用戶標簽的使用目的應當與用戶標簽所反映的社會關(guān)系具有關(guān)聯(lián)性。因為個人提供個人信息的目的是享受更優(yōu)質(zhì)的信息服務,如果根據(jù)用戶使用行為信息形成的用戶標簽被用于分析其他群體共同特征,顯然已經(jīng)超出了用戶標簽設置的必要限度。例如,用戶標簽所反映的是A類用戶群體的消費需求,用戶標簽所形成的用戶畫像也是為了滿足A類用戶群體的消費需求,但如果用戶標簽被用于挖掘和分析A類用戶群體的生活狀況,則屬于社會關(guān)系權(quán)益所排斥的非合理數(shù)據(jù)處理活動。
四、多元法益結(jié)構(gòu)下用戶標簽技術(shù)濫用的治理模式
(一)用戶標簽技術(shù)濫用的外觀特征
目前,商業(yè)實踐中用戶標簽技術(shù)濫用主要表現(xiàn)為標簽內(nèi)容設置不合理、標簽使用目的不合理、標簽設置不透明三個特征?!皹撕瀮?nèi)容設置不合理”是指標簽內(nèi)容具有明顯歧視性、偏見性的主觀判讀。用戶標簽的技術(shù)邏輯僅是為了說明用戶某一個屬性,而這個屬性雖然預先經(jīng)過商業(yè)營銷策略的篩選和評估,但終究是對用戶屬性的客觀性描述。標簽內(nèi)容設置不合理不僅包括標簽內(nèi)容未能選擇中立性屬性特征進行描述,而且還包括標簽內(nèi)容未能涵蓋用戶相關(guān)的重要屬性?!皹撕炇褂媚康牟缓侠怼笔侵笜撕炘O置目的超出經(jīng)營活動的必要限度,過度侵蝕用戶的隱私空間或其正當性權(quán)益。網(wǎng)絡平臺通過用戶標簽應用挖掘用戶的興趣愛好和消費偏好,本屬于合理的經(jīng)營行為,可如果網(wǎng)絡平臺將用戶標簽用于識別用戶的個人健康狀況、資產(chǎn)水平、日常出行路線等目的時,即便這些目的在一定程度上與精準營銷、挖掘客戶相關(guān),但對于用戶而言,其所享受的個性化服務要以犧牲自身的隱私權(quán)益為代價?!皹撕炘O置不透明”是指用戶并不知曉用戶標簽設置和管理的基本規(guī)則。用戶標簽不當然是個人信息,但是,其設置邏輯是以用戶的操作行為為基礎,本質(zhì)上屬于個人信息處理者對自然人具體行為的記錄,并且這種記錄結(jié)果最終可能會影響到自然人能夠獲得的信息產(chǎn)品和服務。對于這些能夠?qū)嵸|(zhì)性影響自身權(quán)益的技術(shù)應用,用戶理所當然地有權(quán)知悉用戶標簽的設置和管理規(guī)則。當然,從知情目的來考慮,并不是所有的用戶都能夠理解復雜的用戶標簽技術(shù)方案,且用戶標簽的具體設置方式也屬于商業(yè)秘密的范疇,故而這里的“知情”也僅限于“用戶標簽的設置對用戶權(quán)益產(chǎn)生何種影響”“用戶標簽的內(nèi)容在何時收集”等基本事實。
有必要說明的是,薩洛梅的數(shù)據(jù)治理關(guān)系理論是以數(shù)據(jù)關(guān)系所涵攝的社會意義為基礎,該理論與用戶標簽所涵攝的社會意義存在些許差異:第一,用戶標簽所描述的是個體化的屬性,其內(nèi)含的社會關(guān)系指向的是不同群體之間共同特征的關(guān)聯(lián)性。網(wǎng)絡平臺之所以在經(jīng)營活動層面?zhèn)戎亟?gòu)用戶標簽背后的標簽關(guān)系模型,是因為不同群體之間的共同特征一旦存在某種關(guān)聯(lián)性,網(wǎng)絡平臺便可發(fā)現(xiàn)潛在的市場需求和未來的消費趨向。第二,用戶標簽所反映的社會關(guān)系還表現(xiàn)為社會群體行為模式變動對經(jīng)濟社會的影響,這里的社會關(guān)系主要還是以群體行為模式特征對屬于該群體的潛在用戶消費需求進行評估和預測。進一步而言,前者的重心在于發(fā)現(xiàn)和評估市場營銷活動中可能存在的風險,后者則重在將屬于特定群體的其他自然人納入網(wǎng)絡平臺的用戶群體中,拓展用戶存量。第三,用戶標簽所反映的社會關(guān)系還表現(xiàn)為不同社會群體之間的差異性特征。對于網(wǎng)絡平臺而言,共同特征是為了吸引同類消費者和預測市場需求總量,差異性特征則是為了說明不同群體在容忍個性化推送、主要營銷信息接收渠道、消費習慣等層面的關(guān)鍵性差異,以便針對不同社會群體提供符合其消費特征的精細化營銷活動和信息服務。
用戶標簽的核心價值是為了輔助數(shù)據(jù)分析、精細劃分用戶群體類型,以及作為信息產(chǎn)品的組成部分,而用戶標簽技術(shù)濫用則是將這些技術(shù)目標簡化為全方位分析用戶個人身份信息,以及相關(guān)的社會交往活動。這種社會關(guān)系異化的后果是網(wǎng)絡平臺與用戶之間的權(quán)利義務關(guān)系失衡,以定制化服務、個性化推送服務優(yōu)化為目標的用戶標簽,淪為網(wǎng)絡平臺鞏固自身數(shù)據(jù)資源競爭優(yōu)勢的技術(shù)工具。在商業(yè)實踐中,優(yōu)質(zhì)數(shù)據(jù)越多,經(jīng)濟價值越大?;谶@種數(shù)據(jù)規(guī)?;?,網(wǎng)絡平臺逐利的本質(zhì)會促使其盡可能收集更多的個人信息和業(yè)務數(shù)據(jù),但這些業(yè)已收集的數(shù)據(jù)還需要進行數(shù)據(jù)分析和挖掘才可能成為企業(yè)的市場競爭優(yōu)勢和經(jīng)濟價值。與此同時,用戶標簽的精細化程度日趨加深,有利于今后數(shù)據(jù)經(jīng)濟價值的挖掘,網(wǎng)絡平臺利用用戶標簽所獲得經(jīng)濟價值和詳細的用戶群體偏好與其提供的個性化服務明顯不成比例,而自然人的個體性權(quán)益僅限于人格尊嚴保護,社會關(guān)系權(quán)益則難尋救濟的法律依據(jù)。
(二)用戶標簽技術(shù)濫用的治理邏輯
在明確了用戶標簽技術(shù)濫用是社會關(guān)系異化之后,其治理邏輯顯然應當以矯正這種技術(shù)功能異化為核心,實現(xiàn)在引導用戶標簽的設置和管理在符合用戶標簽承載的個體性權(quán)益訴求的同時,保障用戶標簽所承載的社會關(guān)系權(quán)益。有意思的是,國內(nèi)學者論及用戶標簽的治理模式或規(guī)制方案時,傾向于將用戶標簽、用戶畫像以及個性化推送視為一個整體性論證對象,進而分化出兩種治理體系:一種是基于算法公正的算法推送服務監(jiān)管體系,要求用戶標簽的設置與管理不得侵害用戶個人權(quán)益;另一種則是基于個人信息權(quán)益體系框架的數(shù)據(jù)安全規(guī)制體系,重點規(guī)制個人信息處理者在設置用戶標簽之前應當遵守的個人信息保護規(guī)則。在算法治理邏輯下,與其說是對用戶標簽設置或管理行為的治理,倒不如說用戶標簽與用戶畫像在法益層面并沒有顯著區(qū)別,均屬算法技術(shù)應用的組成環(huán)節(jié)。算法技術(shù)已經(jīng)成為平臺運行的核心,但算法治理邏輯并不關(guān)注具體技術(shù)方案是如何實現(xiàn)的,僅僅關(guān)注用戶直接受到影響的服務內(nèi)容或能夠直接接觸到的業(yè)務環(huán)節(jié),這也是將用戶標簽妥善管理義務安排在《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》第17條的理論根源。
此外,前述兩種治理邏輯之所以否認獨立規(guī)制用戶標簽技術(shù)應用的必要性,是因為這兩類治理邏輯將用戶標簽視為正常經(jīng)營策略或純粹中立的技術(shù)方案,并且認為,用戶標簽技術(shù)對用戶權(quán)益的負面影響完全可以在具體業(yè)務層面予以控制。在算法治理邏輯下,算法問責機制涵蓋了從用戶標簽的內(nèi)容設置到標簽算法模型的建構(gòu),因為這些事項本身是判斷算法服務提供者是否存在主觀過錯、算法推送服務是否正當合理的客觀依據(jù)。借由對這些事項的事后問責可以促使算法服務提供者在事前階段,即對用戶標簽技術(shù)應用模式進行調(diào)整,并且,用戶標簽作為算法推送服務的一部分,也屬于《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》第16條要求告知或公示的算法推薦服務的“基本情況”或“主要運行機制”,故而也就沒有必要專門建構(gòu)一整套用戶標簽規(guī)制體系。在個人信息保護治理邏輯下,內(nèi)容設置不合理、重要標簽遺漏等網(wǎng)絡標簽技術(shù)濫用問題,則可通過事前階段的個人信息收集、處理的告知義務,事中的個人信息保護影響評估以及事后的侵權(quán)責任予以解決。用戶標簽與個性化服務在業(yè)務邏輯上均是以數(shù)據(jù)收集活動為起點,按照“個人信息—用戶標簽—數(shù)據(jù)分析—用戶畫像—個性化推送”的業(yè)務流程實現(xiàn)數(shù)據(jù)經(jīng)濟價值的創(chuàng)造,規(guī)制用戶標簽和個性化推送在保護對象和保護方式上并沒有明顯區(qū)別,兩者之間緊密的業(yè)務關(guān)聯(lián)性無法在制度層面予以分隔。
總之,前述兩種治理邏輯均是以個體權(quán)益的保障為制度目標,規(guī)制用戶標簽技術(shù)應用方式的直接依據(jù)是用戶與網(wǎng)絡平臺之間的信息服務合同中的權(quán)利義務內(nèi)容。歸根結(jié)底,這兩種治理邏輯在個體層面所要保障的個體性權(quán)益是自然人在網(wǎng)絡空間的行為自主權(quán),分別對應的是算法推薦服務適用自主權(quán)和個人信息自決權(quán)。但這種行為自主權(quán)并不能解釋用戶標簽所承載的社會關(guān)系權(quán)益保護問題,這也是現(xiàn)行立法在社會公共利益保障層面所遺漏的內(nèi)容。無論是算法治理框架對算法應用模式的限制,還是部分學者所主張的“在信息整合和用戶畫像階段,個人信息處理者需要履行數(shù)據(jù)安全保障義務”,均普遍缺乏對用戶標簽群體權(quán)益的回應。如若繼續(xù)在此層面探討用戶標簽的治理問題,客觀上不可能滿足現(xiàn)行立法所要求的“權(quán)利內(nèi)容具體且明確”的要求,這也是需要從數(shù)據(jù)安全治理層面保護用戶標簽群體權(quán)益的根本原因。
在立法層面,專門規(guī)制用戶標簽的必要性表現(xiàn)為:由個人數(shù)據(jù)關(guān)系延伸而來的群體性數(shù)據(jù)關(guān)系需要專門保護,后一種數(shù)據(jù)關(guān)系所傳達的社會關(guān)系權(quán)益不歸某一個特定自然人所有,而是由用戶群體所有。因為群體性數(shù)據(jù)關(guān)系本身兼具個體化經(jīng)濟價值和集體性經(jīng)濟價值,個體化經(jīng)濟價值是指群體性數(shù)據(jù)關(guān)系能夠幫助網(wǎng)絡平臺準確定位市場需求和及時規(guī)避經(jīng)營風險;集體性經(jīng)濟價值則是指群體性數(shù)據(jù)關(guān)系反映的是社會群體之間的社會關(guān)系以及群體所組成的社會結(jié)構(gòu)運行狀態(tài)。在數(shù)據(jù)治理關(guān)系理論中,群體性數(shù)據(jù)關(guān)系的社會意義在于,不同群體的分組可能導致群體之間的差別化待遇,如“黑人”群體相比于其他社會群體可能會遭受更多的社會歧視。因而,群體性數(shù)據(jù)關(guān)系所傳達的社會意義實際是指不同用戶群體背后的用戶標簽是否能夠以客觀中立的內(nèi)容予以表達。用戶標簽技術(shù)濫用的治理邏輯,除了需要為個體性權(quán)益提供法律救濟之外,還需要在社會層面明確用戶標簽技術(shù)應用的合理邊界。在現(xiàn)代社會的風險分配邏輯中,風險的承擔應當與可能獲得的經(jīng)濟利益保持一致,網(wǎng)絡平臺在享受群體性數(shù)據(jù)關(guān)系經(jīng)濟價值的同時,也應當承擔相應的法定義務,即保障用戶標簽技術(shù)應用的公平性和合理性。
(三)個體與集體層面的強制性義務規(guī)范
有關(guān)用戶標簽法律性質(zhì)的理解可以從其規(guī)制方式的角度出發(fā)。由于用戶標簽技術(shù)濫用的治理邏輯是以預防社會關(guān)系異化使用為基本目標,保障的是群體權(quán)益,那么,具體的規(guī)制方式顯然不能從用戶權(quán)利增設和補強的角度進行制度建構(gòu),而是需要從強制性義務規(guī)范的角度設置用戶標簽承載的社會關(guān)系權(quán)益保護路徑。
誠然,用戶標簽與個人信息的概念外延并不完全重合。二者承載了不同的權(quán)益類型,從一般的制度保護邏輯來看,似乎需要選擇“另起爐灶”的方式解決濫用用戶標簽技術(shù)的現(xiàn)實問題。但也正如前文所表述,用戶標簽承載了個體與群體層面的兩種法益,個體層面的法益保護不可避免地需要延續(xù)個人信息保護的基本邏輯。但是,群體層面的法益保護強調(diào)了數(shù)據(jù)處理者以“社會可信任方式”處理用戶標簽,所以,“強制性義務規(guī)范”的內(nèi)容應當與現(xiàn)有的數(shù)據(jù)安全保護規(guī)范銜接,置于廣義層面的“數(shù)據(jù)安全”目標之下予以解釋。因此,《中華人民共和國網(wǎng)絡安全法》《中華人民共和國數(shù)據(jù)安全法》和《個人信息保護法》所規(guī)定的“數(shù)據(jù)安全保障義務”既包括個人信息處理者為保障數(shù)據(jù)安全持續(xù)狀態(tài)應當采取的措施,還包括需要確保數(shù)據(jù)處于合法的利用狀態(tài)。這種“合法利用”狀態(tài)包括兩層含義:一是與個人信息權(quán)益或其他數(shù)據(jù)權(quán)益相對應,確保數(shù)據(jù)按照權(quán)利人的請求進行收集和處理;二是與社會公共利益相對應,應履行法定數(shù)據(jù)保護義務,確保數(shù)據(jù)的利用方式符合法律法規(guī)和公序良俗?;诖朔N考量,在立法層面顯然沒有必要專門增設用戶標簽技術(shù)應用的規(guī)則體系,真正需要的是補強對數(shù)據(jù)安全保障義務內(nèi)容的解釋,明確社會關(guān)系權(quán)益所對應的數(shù)據(jù)安全保障義務應當以何種方式履行。因此,用戶標簽相關(guān)的強制性義務規(guī)范應當從以下三個層面予以建構(gòu):
第一,禁止設置歧視性用戶標簽或?qū)⒂脩魳撕炗糜趦r格歧視、區(qū)域歧視等不公平的消費活動。誠然,《個人信息保護法》第24條規(guī)定了個人信息處理者不得利用自動化決策實行不合理的差別待遇,《互聯(lián)網(wǎng)信息服務算法推薦管理規(guī)定》第10條規(guī)定了算法推薦服務提供者應當加強用戶標簽管理,但這些義務性規(guī)定并沒有直接提出對用戶標簽內(nèi)容設置的具體要求,僅以“違法信息關(guān)鍵詞”和“不良信息關(guān)鍵詞”作為禁止性事項。此種立法邏輯忽視了歧視性決策結(jié)果的形成原因并不僅僅是用戶標簽本身的不合理性,還包括數(shù)個用戶標簽組合后所反映的歧視性社會要素。例如,“購買商品價位在第一檔(便宜)”和“當月投訴5次”兩個標簽本身并沒有歧視屬性,但這兩個標簽組合可能會讓企業(yè)得出“符合這兩類特征的用戶比較難纏”的歧視性結(jié)論。因此,“禁止設置歧視性用戶標簽”既指向個體的用戶標簽內(nèi)容應當符合社會公序良俗和強制性規(guī)范要求,也指向數(shù)據(jù)處理者應當預防數(shù)個用戶標簽組合可能產(chǎn)生的歧視性自動化決策結(jié)果。
第二,保障用戶標簽體系的完整性,禁止信息處理者故意遺漏或刪減涉及用戶個體權(quán)益的標簽內(nèi)容。用戶標簽體系的商業(yè)價值在于較為全面和客觀地分析用戶的消費偏好,以及群體消費趨勢,所以,單純遵循“限制用戶標簽設置數(shù)量和內(nèi)容可以保障個人信息安全”的規(guī)制邏輯過于粗糙。類似個人信息權(quán)利體系中的更正權(quán)的邏輯,強調(diào)用戶標簽體系的完整性則是為了保障用戶的其他合法權(quán)益。在社會信用體系建設過程中,有關(guān)社會信用的用戶標簽直接關(guān)系到用戶是否能夠享受現(xiàn)實生活中的社會公共服務,用戶標簽體系部分內(nèi)容的缺失或失實均會間接導致用戶遭致不公平待遇。
第三,禁止信息處理者根據(jù)用戶標簽分析和挖掘特定用戶的社交關(guān)系網(wǎng)絡,不得濫用用戶標簽中具有社交屬性的信息內(nèi)容?!秱€人信息保護法》將“個人信息”的范疇限定在已識別或可識別的特定自然人信息,其默認的立法邏輯是“相關(guān)信息內(nèi)容是與特定自然人相關(guān)的”,忽視了在識別特定自然人的過程中對其他具有社交關(guān)系的自然人“牽連性”的識別風險。正如前述所提及的數(shù)據(jù)關(guān)系理論,A類信息既能夠識別到特定的自然人A,但是,也有可能識別到具有社交關(guān)系的特定自然人B。這種社交關(guān)系所具有的“間接識別”可能性顯然也屬于個人信息保護的基本范疇,故而有必要在立法層面限制數(shù)據(jù)處理者借助用戶標簽數(shù)量疊加的識別范圍。換言之,法律所允許的數(shù)據(jù)關(guān)系經(jīng)濟價值的挖掘,僅限于與服務目的或產(chǎn)品功能密切相關(guān)者
,數(shù)據(jù)處理者不得主動分析和挖掘特定自然人的現(xiàn)實社交網(wǎng)絡。
前述制度建構(gòu)方向主要是以數(shù)據(jù)處理者的法定義務為起點,但同樣不能忽視用戶標簽所承載的數(shù)據(jù)關(guān)系的經(jīng)濟價值,這種財產(chǎn)性權(quán)益是在數(shù)據(jù)安全立法中建構(gòu)“數(shù)據(jù)公平處理原則”的現(xiàn)實基礎。用戶標簽所承載的社會關(guān)系權(quán)益不能直接為“社會公共利益”的抽象法益所涵蓋,因為此種立法安排只會弱化社會關(guān)系權(quán)益的實際保護力度。從權(quán)益平衡的角度考量,數(shù)據(jù)處理者在通過用戶標簽所反映的數(shù)據(jù)關(guān)系或社會關(guān)系而獲取市場競爭優(yōu)勢或經(jīng)濟利益時,應當確保其數(shù)據(jù)處理行為符合“數(shù)據(jù)公平處理原則”,即數(shù)據(jù)處理活動應當符合特定用戶群體的群體性利益,數(shù)據(jù)處理者采取的數(shù)據(jù)保護技術(shù)措施,應當與其數(shù)據(jù)關(guān)系經(jīng)濟價值保持同等水平。在體系定位層面,不同于個體權(quán)益所采用的具體義務規(guī)則,針對用戶標簽承載的社會關(guān)系權(quán)益的保障方式實際上更傾向于以兜底性條款的形式進行保障,確認數(shù)據(jù)處理者是否合理履行數(shù)據(jù)安全保障義務,以防范個體性義務規(guī)范所無法回應的標簽技術(shù)更新、應用方式創(chuàng)新可能產(chǎn)生的未知風險。
五、結(jié)語
數(shù)據(jù)分析技術(shù)的更新迭代加速了網(wǎng)絡社會互聯(lián)互通的轉(zhuǎn)型進程,個人信息乃至個體數(shù)據(jù)的經(jīng)濟價值從傳統(tǒng)層面的個體基本情況分析延伸至個體與個體之間的社會關(guān)系分析,而用戶標簽作為自然人基本情況和使用行為的屬性描述,其經(jīng)濟價值更是延伸至社會群體之間的共同特征、差異特征以及社會關(guān)系的分析。盡管用戶標簽確屬個人信息處理者自行選擇數(shù)據(jù)處理方式的“意思自治”范疇,但同樣需要注意的是,用戶標簽在創(chuàng)造數(shù)據(jù)經(jīng)濟價值的同時,也存在技術(shù)濫用風險,內(nèi)容設置不合理、超目的識別社會關(guān)系,以及關(guān)鍵缺漏等問題,直接影響到用戶群體的群體權(quán)益。在我國數(shù)據(jù)治理體系的建構(gòu)過程中,既要關(guān)注個體層面的個人信息及數(shù)據(jù)財產(chǎn)權(quán)保護,也要重視用戶標簽背后的社會關(guān)系權(quán)益保障。從邏輯上看,自然人個體權(quán)益的實現(xiàn),除了需要個人信息處理者在數(shù)據(jù)全生命周期各個環(huán)節(jié)采取法定措施予以保障外,還需要在群體權(quán)益層面規(guī)定個人信息處理者在設置和使用用戶標簽等數(shù)據(jù)處理活動中應當遵循的基本原則,因為數(shù)據(jù)的“合法利用狀態(tài)”意味著合理恰當?shù)臄?shù)據(jù)處理活動需要兼顧用戶標簽背后的個體性權(quán)益和群體性權(quán)益,而不是僅限于特定的人格權(quán)或狹隘的數(shù)據(jù)財產(chǎn)權(quán)。
The Legal Character and Governance Logic of User Tags
ZHAO Jing-wu
(The Law School of Beihang University, Beijing 100191, China)
Abstract:The individual-level personal information rights and interests and enterprise-data property construction claims are insufficient to explain the group rights and interests behind data resources. As user tags not only describe the individual attributes of natural persons, but also reflect the common attributes of natural person groups that are ignored by scholars. And the current theory has the misconception of simplifying user tags to carry multiple legal interests. User tags contain data elements of individuality and social relationship interests. Because under the data relationship theory, the economic value of data is not only the data itself, but also the information content of group preferences and social relationships reflected by the data. The purpose of data processors to finely divide the number and type of user tags is to obtain the social relationship between different user groups more precisely and comprehensively. And this is the justification basis for extending the content of data security protection obligations based on user groups rather than individual users. Data processing activities should be carried out in a way that is conducive to the reproduction of data resources and the prevention of the interests damage of data groups.
Key Words:user tags; personal information; the data relationship theory; rights and interests of social relations
本文責任編輯:林士平
青年學術(shù)編輯:孫 瑩