摘 要:數(shù)據(jù)不平等是數(shù)據(jù)不公正的關鍵因素,它包括數(shù)據(jù)可及不平等、數(shù)據(jù)代表不平等和數(shù)據(jù)控制不平等,其中數(shù)據(jù)控制不平等引發(fā)和促進數(shù)據(jù)可及不平等和數(shù)據(jù)代表不平等,是數(shù)據(jù)不平等的集中體現(xiàn)。數(shù)據(jù)控制不平等直接導致數(shù)據(jù)所有權(quán)的不平等,進而引發(fā)與數(shù)據(jù)相關的人格權(quán)和民主權(quán)的不平等。當算法與不公正的數(shù)據(jù)結(jié)合時,便產(chǎn)生算法的分配不公正、承認不公正和代表不公正等問題。因而,應構(gòu)建基于數(shù)據(jù)平等的算法公正論,倡導數(shù)據(jù)化平等、數(shù)據(jù)訪問平等和數(shù)據(jù)共享,追求數(shù)據(jù)可及平等;堅持數(shù)據(jù)代表在質(zhì)和量上的平等和最小傷害原則,追求數(shù)據(jù)代表平等;從基于數(shù)據(jù)權(quán)利和規(guī)范數(shù)據(jù)權(quán)力兩條進路著手,追求數(shù)據(jù)控制平等,引入原則主義和社會實驗的方法促進數(shù)據(jù)平等。
關鍵詞:算法倫理;數(shù)據(jù)倫理;算法不公正;數(shù)據(jù)不公正
基金項目:國家社會科學基金重大項目(17ZDA023)
作者簡介:李倫,哲學博士,大連理工大學人文學院教授、博士生導師,大數(shù)據(jù)與人工智能倫理法律與社會研究中心主任,主要從事科技倫理研究;張曉燕,女,大連理工大學人文學院博士生。
中圖分類號:TP18;D922.17 文獻標識碼:A 文章編號:1000-2359(2025)01-0099-09 "收稿日期:2024-05-04
算法在人類的生產(chǎn)生活中扮演著日益重要的角色,算法通過助推、引導、控制和約束等方式,對人的行為和社會發(fā)展產(chǎn)生深遠影響。身處算法社會的人們能夠享受算法帶來的諸多益處,如更高效、智能的決策和服務,也可能面臨算法壓迫、算法自動化決策的不平等以及算法暴政等潛在風險。算法逐漸成為一種權(quán)力的運作模式,自動處理和分析大量數(shù)據(jù),形成某種結(jié)論或預測,并據(jù)此自動對用戶進行資源方面的獎勵或懲罰。然而,這種未經(jīng)正當程序就對人們進行獎勵或懲罰的方式,影響整個社會的資源分配,甚至重構(gòu)社會秩序,極易引發(fā)不公正問題。因此,深入探究算法不公正的成因,全面揭示其背后的邏輯機制,并構(gòu)建一種與之相適應的算法公正理論,將有助于推動算法的公正設計與使用,充分發(fā)揮算法在促進社會公正方面的積極作用。
一、數(shù)據(jù)不平等:算法不公正的生成邏輯
薩斯坎德認為,算法不公正是指“算法的應用會產(chǎn)生不公正的結(jié)果”" 杰米·薩斯坎德:《算法的力量:人類如何共同生存?》,李大白譯,北京日報出版社,2022年,第231頁。,他將算法不公正劃為兩類:基于數(shù)據(jù)的不公正和基于規(guī)則的不公正?;跀?shù)據(jù)的算法不公正是指算法依賴的數(shù)據(jù)集存在不良數(shù)據(jù),這些數(shù)據(jù)導致不公正的結(jié)果?;谝?guī)則的算法不公正包括顯性不公正和隱性不公正兩種類型,前者是指由表面看起來不公正的規(guī)則引發(fā)的不公正,后者是指間接地使某些群體受到不如其他群體的待遇。薩斯坎德還提出算法規(guī)則的“中立謬誤”,認為設計的中立算法會隨著時間的推移習得人類身上的不公正,可能重復和鞏固世界上已經(jīng)存在的不公正,并將其加以制度化" 杰米·薩斯坎德:《算法的力量:人類如何共同生存?》,李大白譯,北京日報出版社,2022年,第233-242頁。 。
(一)數(shù)據(jù)不公正:算法不公正的關鍵因素
從薩斯坎德的分析可以看出,算法不公正的原因可歸結(jié)為數(shù)據(jù)不公正、算法規(guī)則不公正和社會不公正三大成因。
其一,數(shù)據(jù)不公正會對算法公正產(chǎn)生深遠影響。數(shù)據(jù)不公正不僅涉及不良數(shù)據(jù),更重要的是它還包括因社會不公正導致的數(shù)據(jù)本身的不公正。換言之,數(shù)據(jù)的構(gòu)造性質(zhì)可能使不公正因素嵌入數(shù)據(jù)本身,從而影響算法的公正性。具體而言,一方面,技術設計和部署不當導致的不公正對數(shù)據(jù)的影響最為顯著。例如,因為沒有在某地部署數(shù)據(jù)化技術導致未納入數(shù)據(jù)集的人或事物往往被忽略,這些未能被充分涵蓋的數(shù)據(jù)為扭曲的分析和誤解提供了土壤。另一方面,人類潛意識中蘊含的不公正對數(shù)據(jù)的影響更為隱蔽。例如,人類語言本身就存在偏見,這種偏見深深地植根于我們的潛意識之中,以至于記錄在互聯(lián)網(wǎng)上的語言也難以避免其影響" Caliskan A, Bryson J J, Narayanan A. Semantics Derived Automatically from Language Corpora Contain Human-like Biases. Science,2017(356).,使用這些包含偏見的數(shù)據(jù)可能引發(fā)算法不公正。其二,算法規(guī)則不公正是引發(fā)算法不公正的重要因素之一。算法設計主體可能存在偏見或不當意圖影響到算法規(guī)則的公正性;同時,數(shù)據(jù)不公正可能通過算法的學習滲透到算法規(guī)則中導致其變得不公正。即使設計的算法規(guī)則是中立的,由于數(shù)據(jù)集中存在不公正的數(shù)據(jù),仍可能在使用過程中引發(fā)不公正的結(jié)果。其三,社會不公正是導致算法不公正的另一個重要因素。社會不公正影響數(shù)據(jù)的產(chǎn)生和使用方式,并進一步影響算法的設計和使用方式。社會不公正會通過算法設計主體和數(shù)據(jù)不公正滲透到算法規(guī)則中,引發(fā)算法的不公正。如果社會不公正,那么算法設計主體和數(shù)據(jù)也很難保持公正。
算法規(guī)則不公正是導致算法不公正的直接因素。這種在設計上就存在缺陷或惡意的算法會直接引發(fā)算法不公正。對于這種不公正,我們可以通過規(guī)范算法設計在一定程度上得到改善" Kleinberg J, Ludwig J, Mullainathan S. Discrimination in the Age of Algorithms. Journal of Legal Analysis, 2018(10).。一方面,如果我們可以考察設計人員的多樣性并采用技術手段測試算法規(guī)則,就有可能判斷其可能蘊含的價值傾向是否公正" 雅各布·特納:《機器人現(xiàn)代法則》,朱體正譯,中國人民大學出版社,2023年,第338-339頁。;另一方面,出于主觀惡意設計的算法也很容易引發(fā)爭議和遭到社會群體的廣泛抵制或禁止。因此,一個主觀設計是惡的算法難以在社會上得到廣泛的支持和認同。盡管如此,算法設計仍然“不可避免地充斥著價值判斷”,我們應該認識到消除價值判斷的困難要比規(guī)范算法設計大得多,相對容易的做法是根據(jù)不同情境設計和部署適合當?shù)貍惱韮r值的算法。
社會不公正是導致數(shù)據(jù)不公正和算法不公正的根源。社會不公正會影響算法設計主體的價值取向,導致算法規(guī)則不公正。社會不公正也會影響數(shù)據(jù)化技術的部署和安排,從而影響數(shù)據(jù)化過程,導致數(shù)據(jù)不公正。同時社會不公正還會在數(shù)據(jù)中鏡像出來,導致數(shù)據(jù)本身存在不公正因素。此外,社會不公正是一個廣泛存在的問題,涵蓋了社會、經(jīng)濟、政治等多個領域,表現(xiàn)為貧富差距、教育不公、性別歧視、種族問題等。這些不公正不僅體現(xiàn)在個人或群體之間的差異上,還體現(xiàn)在社會結(jié)構(gòu)和制度的不合理上。
數(shù)據(jù)不公正不僅是導致算法不公正的關鍵因素,而且是連接算法規(guī)則不公正和社會不公正的紐帶?;谏疃葘W習的算法只有與數(shù)據(jù)相結(jié)合才能發(fā)揮作用,如果沒有數(shù)據(jù),算法就無法正常運行。當算法與數(shù)據(jù)結(jié)合時,即使設計的規(guī)則是中立的,其運行結(jié)果也可能由于數(shù)據(jù)集里的不公正因素而變得不公正。同時,社會不公正引發(fā)的算法不公正在很大程度上也是通過數(shù)據(jù)化將社會不公正映射在數(shù)據(jù)集中,進而影響到算法的運行結(jié)果。
算法不公正的三大成因既相互獨立又相互交織,共同構(gòu)成了算法不公正生成的復雜邏輯。算法規(guī)則不公正,作為影響算法不公正的直接因素,可被視為算法不公正的頂層生成邏輯;社會不公正深藏在社會背景之中,既是數(shù)據(jù)不公正的催生者,又是算法規(guī)則不公正的土壤,可被視為算法不公正的底層生成邏輯;數(shù)據(jù)不公正猶如一根紐帶,緊密地連接著社會不公正與算法規(guī)則不公正,成為算法不公正的中層生成邏輯。一旦數(shù)據(jù)存在不公正,算法便難以實現(xiàn)公正。因此,對數(shù)據(jù)不公正進行全面深入的分析,是理解算法不公正并確保算法公正的重要一環(huán)。
(二)數(shù)據(jù)不平等:從數(shù)據(jù)不公正到算法不公正
考慮到數(shù)據(jù)不僅是導致算法不公正的關鍵因素,而且是連接導致算法不公正的另外兩大因素——算法規(guī)則不公正和社會不公正的紐帶,為了更好地理解算法不公正的生成機制和治理算法不公正,我們需要對數(shù)據(jù)不公正進行更深入的研究。關于數(shù)據(jù)不公正的研究主要涉及“數(shù)據(jù)公正論”和“數(shù)據(jù)平等論”兩大進路。通過研究這兩個進路,我們可以更全面地理解數(shù)據(jù)在算法不公正中的復雜作用,以及如何通過改進數(shù)據(jù)實踐來推動算法公正。
數(shù)據(jù)公正論關注的是不同社會群體和社區(qū)中數(shù)據(jù)的產(chǎn)生、收集、分析和使用過程中是否存在不公正的現(xiàn)象。梅特卡夫等人認為,數(shù)據(jù)不公正主要源于兩個因素:一是社會結(jié)構(gòu)中的不平等現(xiàn)象,二是社會不公正現(xiàn)象在數(shù)據(jù)化過程中的體現(xiàn)" Metcalfe P, Dencik L.The Politics of Big Borders: Data (in)Justice and the Governance of Refugees.https://firstmonday.org/ojs/index.php/fm/article/download/9934/7749.。丹席克等人強調(diào)數(shù)據(jù)控制不平等對社會公正的影響,并探討了數(shù)字基礎設施和數(shù)據(jù)驅(qū)動流程對社會公正的影響,認為實現(xiàn)數(shù)據(jù)公正,不僅需要技術參與,更需要政治參與" Dencik L, Hintz A, Cable J. Towards Data Justice?The Ambiguity of Anti-surveillance Resistance in Political Activism.Big Data amp; Society,2016(2).。此外,丹席克等人還特別關注社會邊緣群體的數(shù)據(jù)隱私和代表權(quán)問題 Dencik L, Hintz A, Redden J. Exploring Data Justice:Conceptions,Applications and Directions.Information,Communication amp; Society,2019(7).。??怂沟忍岢鼋Y(jié)構(gòu)數(shù)據(jù)公正的理論框架,指出治理數(shù)據(jù)不公正的關鍵是社會應包含和支持實現(xiàn)美好生活中所包含的價值所必需的與數(shù)據(jù)相關的機構(gòu)、關系和知識系統(tǒng),應當將數(shù)據(jù)所有權(quán)、可及權(quán)和代表權(quán)視為公正的基礎內(nèi)容 Heeks R, Renken J. Data Justice for Development:What would it Mean. Information Development, 2018(1)." 。與??怂沟仍诤暧^層面構(gòu)建數(shù)據(jù)公正的理論框架不同,泰勒則從人類普遍的需求出發(fā),提出了更具社會實踐意義的全球數(shù)據(jù)治理框架,認為數(shù)據(jù)公正性包括三個方面:可見性,涉及代表權(quán)和信息隱私,關注社會邊緣群體的代表權(quán)和隱私風險;技術參與,涉及共享數(shù)據(jù)紅利和技術選擇中的自由,關注數(shù)據(jù)紅利分配和使用或不使用特定技術的自主權(quán);不歧視,涉及應對偏見和預防歧視的能力,關注數(shù)據(jù)生產(chǎn)和處理中的偏見以及人們應有不受歧視的自由 Taylor L. What is Data justice?The Case for Connecting Digital Rights and Freedoms Dlobally.Big Data amp; Society,2017(2)." 。上述研究為數(shù)據(jù)不公正的理論探索和實踐方案提供了寶貴的借鑒。
數(shù)據(jù)平等論主要關注在數(shù)據(jù)的生產(chǎn)、積累和分析過程中,由于各種實際操作導致的機會和傷害的不平等。數(shù)據(jù)平等論致力于發(fā)現(xiàn)、減少和解決與數(shù)據(jù)相關的不平等模式。數(shù)據(jù)平等論將導致數(shù)據(jù)不平等的原因聚焦在兩個方面:第一,數(shù)據(jù)主體與公司之間存在的數(shù)據(jù)流控制不平等導致數(shù)據(jù)不平等;第二,對與數(shù)據(jù)相關的基礎設施的控制不平等導致數(shù)據(jù)不平等。辛納蒙認為,數(shù)據(jù)不平等表現(xiàn)為數(shù)據(jù)可及不平等、數(shù)據(jù)代表不平等和數(shù)據(jù)控制不平等三個數(shù)據(jù)鴻溝。這些不平等基本上可以運用數(shù)字鴻溝這一概念來分析,即采用“水平”“鏡像”和“貧困”的隱喻來分析。其中,數(shù)據(jù)控制不平等是最為重要的數(shù)據(jù)鴻溝,是指“個人行為數(shù)據(jù)的不平等積累,以及數(shù)據(jù)主體無法控制數(shù)據(jù)如何在數(shù)據(jù)控制者和數(shù)據(jù)受益者之間流動”。這種不平等可能導致機構(gòu)用“有偏見的、部分的數(shù)據(jù)代表世界”,同時引發(fā)隱私侵犯、數(shù)據(jù)濫用、分析傷害等有害影響 Cinnamon J. Data Inequalities and Why They Matter for Development.Information Technology for Development,2020(2).。費舍爾則認為,數(shù)據(jù)不平等是“對生成、塑造、處理、存儲、傳輸和使用數(shù)據(jù)的基礎設施的不平等控制所產(chǎn)生的”,并提出收回基礎設施管制,要求提高透明度、匯集數(shù)據(jù)和議價能力、發(fā)展差異化和有條件的數(shù)據(jù)可及機制等治理方案 Fisher A, Streinz T. Confronting Data Inequality. Columbia Journal of Transnational Law, 2022(3).。實際上,辛納蒙將數(shù)據(jù)不平等視為數(shù)字不平等在大數(shù)據(jù)時代的新形態(tài),其實質(zhì)是數(shù)據(jù)鴻溝,目的是通過構(gòu)建數(shù)據(jù)不平等的研究框架評估一切與數(shù)據(jù)相關的不平等實踐。然而,費舍爾對數(shù)據(jù)不平等的看法更為具體與深刻,認為與數(shù)據(jù)相關的基礎設施控制不平等是導致與數(shù)據(jù)相關的不平等實踐的根本原因。
數(shù)據(jù)公正論和數(shù)據(jù)平等論在研究內(nèi)容上存在顯著區(qū)別。數(shù)據(jù)公正論主要關注數(shù)據(jù)化進程中可能引發(fā)的社會壓迫、統(tǒng)治以及不平等問題,不僅關注由數(shù)據(jù)引發(fā)的危害以及可能的補救措施,而且將數(shù)據(jù)公正視為揭示社會不公正的指示器。它強調(diào)數(shù)據(jù)在實踐中的倫理維度,旨在確保數(shù)據(jù)的使用不會加劇社會不平等或侵犯個人權(quán)益。數(shù)據(jù)平等論則側(cè)重于將與數(shù)據(jù)有關的實踐活動視為可能引發(fā)不平等問題的關鍵領域,認為數(shù)據(jù)的構(gòu)造性質(zhì)本身即蘊含不公正性,數(shù)據(jù)不平等具體表現(xiàn)在數(shù)據(jù)的生成、收集、處理和使用等各個環(huán)節(jié)中存在的不平等現(xiàn)象,這些不平等現(xiàn)象可能催生多種形式的社會不平等,從而進一步加劇整體的社會不平等狀況。因此,數(shù)據(jù)平等論致力于發(fā)現(xiàn)和解決與數(shù)據(jù)緊密相關的各種不平等模式,以促進與數(shù)據(jù)相關實踐的公正性和平等性。簡言之,數(shù)據(jù)公正論提供宏觀的社會視角,關注數(shù)據(jù)對社會公正的影響,數(shù)據(jù)平等論則從微觀層面入手,具體分析數(shù)據(jù)實踐中的不平等問題。
同時,數(shù)據(jù)公正論和數(shù)據(jù)平等論在研究內(nèi)容上又存在共性,都聚焦于數(shù)據(jù)問題,并將數(shù)據(jù)視為決策和采取行動的基礎。二者都認為與數(shù)據(jù)有關的實踐活動將引發(fā)社會不公正或不平等問題。在治理策略上,二者都主張從社會結(jié)構(gòu)和制度層面著手,以消除數(shù)據(jù)的不公正與不平等現(xiàn)象。這意味著需要改革數(shù)據(jù)生產(chǎn)、收集和處理的方式,確保數(shù)據(jù)的代表性、質(zhì)量和透明度,同時加強數(shù)據(jù)監(jiān)管和治理機制,確保數(shù)據(jù)的合法使用和保護隱私。此外,數(shù)據(jù)的可及性、代表性以及數(shù)據(jù)控制權(quán)構(gòu)成的數(shù)據(jù)不平等也是二者共同關心的問題。數(shù)據(jù)的普遍可及性有助于打破數(shù)據(jù)鴻溝、數(shù)據(jù)孤島,促進社會公正和平等。數(shù)據(jù)的代表性則要求數(shù)據(jù)能夠真實反映社會各階層的利益和需求,避免數(shù)據(jù)偏見和歧視。數(shù)據(jù)的控制權(quán)則是最為關鍵的問題,二者都認為數(shù)據(jù)控制不平等是引發(fā)數(shù)據(jù)不公正和數(shù)據(jù)不平等的核心因素,即個人與機構(gòu)在控制數(shù)據(jù)方面的不平等引發(fā)了一系列基于數(shù)據(jù)開展的實踐活動的不公正、不平等。
如果繼續(xù)追問數(shù)據(jù)不平等的根源,我們會發(fā)現(xiàn)其來源于經(jīng)濟、政治、文化結(jié)構(gòu)和制度的不公正。首先,數(shù)據(jù)控制權(quán)的不公正往往源于社會經(jīng)濟地位的不平等。由于社會資源和權(quán)力的不均衡分布,掌握更多資源的個體或團體就可以更好地主導數(shù)據(jù)的生成、傳播和使用過程,從而在數(shù)據(jù)領域占據(jù)優(yōu)勢地位。這種情況下的數(shù)據(jù)所有權(quán)的不公正便體現(xiàn)了社會經(jīng)濟地位的不平等。其次,數(shù)據(jù)可及權(quán)的不公正可能與社會政治體制的不平等有關。不同政治體制對與數(shù)據(jù)相關的基礎設施和數(shù)據(jù)的生產(chǎn)、傳播和使用的限制各不相同,這直接影響了公眾對數(shù)據(jù)的獲取和使用權(quán)利。在有些情況下,可能存在與數(shù)據(jù)有關的基礎設施的部署不公正、不平等和對數(shù)據(jù)的過度監(jiān)管或限制,使得公眾無法平等地獲取和使用數(shù)據(jù),這便體現(xiàn)了數(shù)據(jù)可及權(quán)的不公正。最后,數(shù)據(jù)代表權(quán)的不公正主要源于社會文化價值的不公正。由于社會價值觀的差異和不平等的權(quán)力(利)關系,某些數(shù)據(jù)可能被視為更具代表性和權(quán)威性,而其他數(shù)據(jù)則可能被忽視或邊緣化。這種不公正不僅體現(xiàn)了社會文化價值的不公正,也影響了數(shù)據(jù)的公正性和平等性。因此,數(shù)據(jù)公正論和數(shù)據(jù)平等論都認為,治理數(shù)據(jù)不公正和不平等問題的關鍵在于社會結(jié)構(gòu)和制度層面。
二、數(shù)據(jù)不平等導致算法不公正的生成機制
通過對數(shù)據(jù)公正論和數(shù)據(jù)平等論的分析,我們認為數(shù)據(jù)不平等,包括數(shù)據(jù)的可及不平等、代表不平等以及數(shù)據(jù)控制不平等,是導致數(shù)據(jù)不公正的關鍵因素,并因此構(gòu)成算法不公正的生成邏輯。其中,數(shù)據(jù)控制不平等尤為突出,它引發(fā)并加劇數(shù)據(jù)的可及不平等和代表不平等。鑒于數(shù)據(jù)控制不平等的核心地位,我們將在后續(xù)探討中聚焦于它,討論數(shù)據(jù)不平等導致算法不公正的生成機制。在此之前,我們需要明確數(shù)據(jù)類型,以界定討論范圍和對象。數(shù)據(jù)種類繁多,大致可以分為兩大類:一類是由人類實體產(chǎn)生的數(shù)據(jù),可稱為“屬人數(shù)據(jù)”,這類數(shù)據(jù)與人類的生活、行為、思想和感情等密切相關;另一類是由非人類實體產(chǎn)生的數(shù)據(jù),比如關于動物、植物、自然現(xiàn)象等的數(shù)據(jù),這類數(shù)據(jù)主要反映的是自然界的規(guī)律和現(xiàn)象,與人類的直接相關性較小。屬人數(shù)據(jù)與公正問題更加直接相關,我們在此以屬人數(shù)據(jù)為例,探討數(shù)據(jù)不平等導致算法不公正的機制。
為了更好地理解和探討數(shù)據(jù)與算法在現(xiàn)實生活中的應用和影響,我們將屬人數(shù)據(jù)進一步細化為兩類:一類是與個人直接相關的數(shù)據(jù)——“個人數(shù)據(jù)”,它涵蓋從生物特征信息到網(wǎng)絡行為等各種現(xiàn)實或現(xiàn)象,這些現(xiàn)實或現(xiàn)象經(jīng)過轉(zhuǎn)化和記錄后就成為個人數(shù)據(jù)。例如,個人在網(wǎng)絡環(huán)境中的瀏覽記錄、在線購物行為,以及在現(xiàn)實生活中產(chǎn)生的交通出行、消費習慣等各種行為數(shù)據(jù)都屬于個人數(shù)據(jù)的范疇。另一類是“群體數(shù)據(jù)”,與個人間接相關的數(shù)據(jù),它主要反映個人與他人之間的關系以及相似性等特征。這些數(shù)據(jù)通常在數(shù)據(jù)集里以“類型”“模式”或“群體特征”的形式出現(xiàn)。
數(shù)據(jù)控制不平等包括兩個方面:一是主體對數(shù)據(jù)本身的控制不平等;二是主體對基礎設施的控制不平等。費舍爾認為,掌握“生成、塑造、處理、存儲、傳輸和使用數(shù)據(jù)的基礎設施”的主體就掌握了數(shù)據(jù)化權(quán)力 Fisher A, Streinz T. Confronting Data Inequality. Columbia Journal of Transnational Law, 2022(3).。這種數(shù)據(jù)化權(quán)力的不平等是導致數(shù)據(jù)控制不平等的關鍵所在。然而,這種觀點并不全面。機構(gòu)雖然通過控制基礎設施確實可以獲得數(shù)據(jù)化權(quán)力,但數(shù)據(jù)控制不平等的關鍵并非僅僅在于對基礎設施的控制不平等,而更在于對數(shù)據(jù)本身的控制不平等。機構(gòu)通過對數(shù)據(jù)本身的控制獲得了掌握被數(shù)據(jù)化的人的能力、追求利潤的“原材料”,以及進一步鞏固其權(quán)力的力量。換言之,不論機構(gòu)是以什么方式控制數(shù)據(jù),只要機構(gòu)控制了數(shù)據(jù),就可能存在個人與機構(gòu)之間對數(shù)據(jù)控制的不平等,導致個人與機構(gòu)之間的權(quán)力不對稱,從而出現(xiàn)數(shù)據(jù)不平等現(xiàn)象。實質(zhì)上,這是一個關乎數(shù)據(jù)所有權(quán)的問題,即數(shù)據(jù)應該屬于誰。準確地說,這個問題涉及數(shù)據(jù)是屬于掌握基礎設施的主體,還是屬于被數(shù)據(jù)化的個人或群體。我們認為,數(shù)據(jù)權(quán)不能僅僅屬于掌握基礎設施的主體。具體而言,如果我們將數(shù)據(jù)按類型劃分為個人數(shù)據(jù)、企業(yè)數(shù)據(jù)和公共數(shù)據(jù),數(shù)據(jù)的所有權(quán)應根據(jù)數(shù)據(jù)類型進行區(qū)分。這些權(quán)利不應僅歸屬于掌握基礎設施的主體,而應按數(shù)據(jù)類型進行分配。如果我們將屬人數(shù)據(jù)分為個人數(shù)據(jù)和群體數(shù)據(jù),數(shù)據(jù)的所有權(quán)應根據(jù)數(shù)據(jù)的類型以及掌握數(shù)據(jù)化基礎設施的主體在數(shù)據(jù)化過程中的貢獻進行配置。
(一)生成要素與動機
數(shù)據(jù)不公正來源于兩方面,一方面源自人的數(shù)據(jù)化引發(fā)的不公正,即將與人相關的現(xiàn)實或現(xiàn)象轉(zhuǎn)化為數(shù)據(jù)時,人的行為或潛意識的不公正現(xiàn)象映射在數(shù)據(jù)中,導致數(shù)據(jù)不公正。這種不公正是由人的數(shù)據(jù)化引發(fā)的不公正。另一方面,數(shù)據(jù)不公正源于數(shù)據(jù)化技術的設計和部署引發(fā)的不公正。這是指對數(shù)據(jù)采集、處理、加工、編碼等流程的設計和使用的不公正引發(fā)的數(shù)據(jù)不公正。這種不公正是數(shù)據(jù)化技術的不恰當設計和部署引發(fā)的數(shù)據(jù)不公正。這種情況下,數(shù)據(jù)可能重現(xiàn)已有社會結(jié)構(gòu)的不公正,同時也可能因為不恰當?shù)脑O計和部署引發(fā)新的不公正,例如沒有數(shù)據(jù)化的人不會出現(xiàn)在數(shù)據(jù)中,不完整的數(shù)據(jù)會影響算法對未被數(shù)據(jù)化的人的判斷,從而引發(fā)不公正的結(jié)果。
數(shù)據(jù)化技術在確保數(shù)據(jù)公正中具有重要作用?,F(xiàn)實或現(xiàn)象不是一開始就是數(shù)據(jù),現(xiàn)實或現(xiàn)象需經(jīng)數(shù)據(jù)化才會轉(zhuǎn)變?yōu)閿?shù)據(jù),數(shù)據(jù)化技術是實現(xiàn)數(shù)據(jù)化的基礎和前提,沒有數(shù)據(jù)化技術就無法將現(xiàn)實或現(xiàn)象轉(zhuǎn)化為數(shù)據(jù)形式。如果數(shù)據(jù)化技術的設計和部署中存在不公正,那么數(shù)據(jù)很難公正。數(shù)據(jù)化技術“不僅是‘社會’嵌入的,而且是有目的地銘刻在具有明確方向和后果的政治設計中的”" Masiero S, Das S. Datafying Anti-poverty Programmes: Implications for Data Justice. Information, Communication amp; Society, 2019(7).,這表明數(shù)據(jù)化技術的設計和部署通常體現(xiàn)了它背后的利益訴求、政治和意識形態(tài),而這通常是由機構(gòu)之間的利益妥協(xié)決定的。
機構(gòu)重視利用數(shù)據(jù)化技術,在于將人作為數(shù)據(jù)化技術的對象,因為人的數(shù)據(jù)具有幫助機構(gòu)實現(xiàn)目標的功能。機構(gòu)設計和部署數(shù)據(jù)化技術總是為了達成某種目的,例如追求利益、控制和效率等,這就不可避免地涉及機構(gòu)設計和部署數(shù)據(jù)化技術的對象——人。如果這個對象并不希望被轉(zhuǎn)變?yōu)閿?shù)據(jù),機構(gòu)就無法實現(xiàn)自己的目的。這個時候,人是否同意自身成為一個幫助機構(gòu)實現(xiàn)某種目的的手段就十分關鍵。如果人希望保持對自己數(shù)據(jù)的控制,不希望自己的數(shù)據(jù)與自己分離,那么就可以要求不接受數(shù)據(jù)化技術的部署。然而,在現(xiàn)實中,機構(gòu)設計和部署數(shù)據(jù)化技術卻往往未經(jīng)過人的同意。機構(gòu)自行設計和部署數(shù)據(jù)化技術,然后將其釋放到社會中,在這一過程中往往導致人與數(shù)據(jù)的逐漸分離。這種分離使個人逐漸失去對自己數(shù)據(jù)的直接控制,最終導致數(shù)據(jù)控制不平等的出現(xiàn)。
算法的出場意味著對數(shù)據(jù)的深度分析和挖掘。作為數(shù)據(jù)處理和價值轉(zhuǎn)化之間的橋梁,算法發(fā)揮核心作用。由于大量數(shù)據(jù)僅具有潛在價值而無法直接產(chǎn)生價值,只有使用特定算法才能從中獲得真正的價值。由此,作為具有交互性質(zhì)的技術系統(tǒng)的核心,算法實現(xiàn)了數(shù)據(jù)與價值的連接。同時,機構(gòu)在設計和部署算法技術方面具有控制權(quán),算法如何訓練數(shù)據(jù)、設計何種算法模型、如何應用和部署等個人無法參與決策。當機構(gòu)控制的算法處理由機構(gòu)控制的數(shù)據(jù)時,機構(gòu)可以借助算法對數(shù)據(jù)化的人任意進行分析、預測和決策。機構(gòu)借助算法,通過干預、引導和操控的方式,將數(shù)據(jù)中得出的觀點滲透在社會中,從而對人們的思想和行為產(chǎn)生影響,加劇社會不公正。
具體而言,機構(gòu)通過設計和部署數(shù)據(jù)化技術,導致個人與其數(shù)據(jù)的分離。這種分離使機構(gòu)能夠占有并控制這些數(shù)據(jù)。隨后,機構(gòu)利用算法分析這些數(shù)據(jù)時,導致數(shù)據(jù)中的不公正滲透到算法中。如果個人能夠始終控制數(shù)據(jù),那么個人就能夠及時地糾正和調(diào)整數(shù)據(jù)中的不公正問題,使數(shù)據(jù)真實地反映個人狀況。但現(xiàn)實是,機構(gòu)占有數(shù)據(jù),個人根本無法及時修改和調(diào)整數(shù)據(jù)中的錯誤與不公。通過擁有數(shù)據(jù)和算法,機構(gòu)獲得難以估量的權(quán)力,這不僅損害了個人權(quán)利,還侵蝕了民主的基礎。無論是算法設計上的不公正,還是使用算法導致的不公正,其根源都在于數(shù)據(jù)被機構(gòu)控制和占有,個人在此過程中喪失了與機構(gòu)抗衡的能力和機會。個人與機構(gòu)之間的權(quán)力鴻溝正不斷擴大,要彌補這一裂痕,實現(xiàn)公正平等,就需要實現(xiàn)數(shù)據(jù)平等。只有當個人能夠掌控自己的數(shù)據(jù)時,我們才有足夠的籌碼要求機構(gòu)合理對待個人數(shù)據(jù),從而獲得應有的公正待遇。
(二)生成過程與結(jié)果
數(shù)據(jù)所有權(quán)的不平等導致算法在利益、資源和機會上的分配不公正。屬人數(shù)據(jù)本應屬于被數(shù)據(jù)化的人所有,卻被機構(gòu)控制和占有,形成個人與機構(gòu)之間的數(shù)據(jù)所有權(quán)不平等。機構(gòu)利用數(shù)據(jù)化技術將人與數(shù)據(jù)分離,掌握了對數(shù)據(jù)的控制權(quán),它們決定哪些人能被數(shù)據(jù)化,哪些人不能;哪些數(shù)據(jù)能被認定為有效數(shù)據(jù),哪些不能。隨后,機構(gòu)利用算法對數(shù)據(jù)進行深入分析,從中獲取巨大利益。然而,機構(gòu)認為數(shù)據(jù)屬于機構(gòu)而非被數(shù)據(jù)化的人所有,因此他們獨占這些利益,并未與被數(shù)據(jù)化的人共享,導致共享數(shù)據(jù)和算法紅利的分配不公正。由于數(shù)據(jù)所有權(quán)的不平等,機構(gòu)可以隨意使用這些數(shù)據(jù),個人對此無法掌控,只能聽任機構(gòu)的擺布,引發(fā)算法在資源和機會上的分配不公正。例如,當機構(gòu)使用算法分析個人數(shù)據(jù)時,個人失去對數(shù)據(jù)的控制就無法及時發(fā)現(xiàn)數(shù)據(jù)中的錯誤,如果算法依托這些錯誤數(shù)據(jù)進行資源和機會的分配,就容易引發(fā)算法在機會和資源的分配不公正。當機構(gòu)使用算法分析群體數(shù)據(jù)時,群體特征成為決策的關鍵依據(jù)。如果群體特征涉及偏見和歧視,那么基于這個群體特征做出的預測和決策將影響整個算法類別中的群體在獲得資源和機會上的公正性。
數(shù)據(jù)人格權(quán)的不平等導致算法在尊嚴、信任和權(quán)利上的承認不公正。數(shù)據(jù)作為人的身份和人格的延伸,本應體現(xiàn)人的獨特性和自主性。然而,機構(gòu)利用算法對數(shù)據(jù)進行深度分析,揭露人的人格特質(zhì)或潛意識,并操控其思考和行動,形成個人與機構(gòu)之間的數(shù)據(jù)人格權(quán)不平等。當機構(gòu)利用算法分析屬人數(shù)據(jù)時,人不再是目的,也不再被視為具有獨特個性的存在,而是被當作發(fā)現(xiàn)新知識、新洞見的工具和機構(gòu)獲取利益的原材料,導致算法在人的尊嚴上的承認不公正。此外,機構(gòu)對數(shù)據(jù)的處理和分析也導致算法在信任和權(quán)利上的承認不公正。機構(gòu)更容易相信算法分析出的人物形象,而非現(xiàn)實中的真實個人,這使得機構(gòu)與個人之間以及人與人之間的認識關系和信任關系變得不公正。同時,對群體數(shù)據(jù)的分析可能導致對整個群體的需求和利益的誤解或不公正對待,這種誤解或不公正對待可能引發(fā)并加劇對少數(shù)或邊緣群體的歧視、偏見和壓迫,從而損害這些少數(shù)群體或邊緣群體的權(quán)利??紤]到算法被廣泛應用于公共管理的行政決策中,這種對群體數(shù)據(jù)的分析所引發(fā)的在權(quán)利承認上的不公正,可能會對每個人產(chǎn)生有害影響。
數(shù)據(jù)民主權(quán)利的不平等導致算法在身份、決策、行動上的代表不公正。機構(gòu)通過利用算法對數(shù)據(jù)進行深度分析,獲得了巨大的權(quán)力,使他們在民主生活中擁有更多的話語權(quán),從而造成個人與機構(gòu)之間的數(shù)據(jù)民主權(quán)的不平等??刂茩C構(gòu)的人能夠為自己或機構(gòu)定制所需的身份以獲取特定利益,相比之下,那些被數(shù)據(jù)化的普通人則可能面臨被錯誤代表的風險,導致算法在身份代表的不公正。機構(gòu)可以通過算法對人們的思考產(chǎn)生影響,從而影響他們的決策和行動。人們在參與民主決策和采取民主行動時,極易受到各類算法的引導和誤導,無法進行深入的思考,無法準確表達自身的利益和需求。一些少數(shù)群體在算法的數(shù)據(jù)中可能只有微不足道的少量數(shù)據(jù),或者他們的數(shù)據(jù)根本不會出現(xiàn)在數(shù)據(jù)中,這意味著算法無法捕捉到他們的需求和利益,加劇社會的分化和不平等。
綜上所述,我們可以看到數(shù)據(jù)控制不平等是如何導致算法不公正的。當機構(gòu)利用數(shù)據(jù)化技術將個人與數(shù)據(jù)分離時,它們實際上占有了這些數(shù)據(jù)。這種數(shù)據(jù)控制的不平等直接導致數(shù)據(jù)所有權(quán)的不平等,進而引發(fā)數(shù)據(jù)人格權(quán)和數(shù)據(jù)民主權(quán)的不平等。當算法與不公正的數(shù)據(jù)結(jié)合時,便產(chǎn)生算法的分配不公正、承認不公正和代表不公正等問題。這些不公正現(xiàn)象不僅加劇了現(xiàn)有的不平等,還不斷創(chuàng)造出新的不公正,為社會公正帶來了巨大的挑戰(zhàn)。
三、算法公正要基于數(shù)據(jù)平等
數(shù)據(jù)不平等導致了算法不公正,偏離了人類核心價值。為了實現(xiàn)算法公正,最終實現(xiàn)社會公正,擺脫算法不公正,構(gòu)建一種基于數(shù)據(jù)平等的算法公正論勢在必行?;跀?shù)據(jù)平等的算法公正要求從數(shù)據(jù)不平等回歸數(shù)據(jù)平等,從算法不公正回歸算法公正,主張以數(shù)據(jù)平等的框架審視社會不公正與算法不公正之間的相互影響,通過不斷切近數(shù)據(jù)平等,促進算法公正,最終促進社會公正,增進人類福祉。
(一)數(shù)據(jù)可及平等
基于數(shù)據(jù)平等的算法公正論主張數(shù)據(jù)可及平等。數(shù)據(jù)可及平等主要包含數(shù)據(jù)化平等、數(shù)據(jù)訪問平等和數(shù)據(jù)共享規(guī)范。數(shù)據(jù)化平等是指個體或機構(gòu)在數(shù)據(jù)化過程中應享有平等的權(quán)利和機會。這要求數(shù)據(jù)化技術、平臺和服務的提供者遵循公平、公正的原則,不因種族、性別、地域、經(jīng)濟狀況等因素而歧視任何個人或機構(gòu)。數(shù)據(jù)化平等還意味著數(shù)據(jù)資源的分配和利用應基于合理的規(guī)則和機制,確保每個人都能從數(shù)據(jù)化進程中受益。具體而言,它要求數(shù)據(jù)化技術的設計和部署應公平,即確保城鄉(xiāng)之間、城市之間、國家之間的數(shù)字鴻溝、數(shù)據(jù)鴻溝差距不至于過大,使具有社會準入門檻的數(shù)據(jù)化技術的基礎設施能夠逐步覆蓋到更廣泛的地區(qū),從而在數(shù)據(jù)收集的設施上達到基本平等。同時,應注重對數(shù)字能力較弱的人群、社會邊緣人群和弱勢群體的關注,通過提供必要的培訓和支持,確保他們能夠平等地參與到數(shù)據(jù)化進程中。此外,數(shù)據(jù)化自由也是數(shù)據(jù)化平等的應有之義。數(shù)據(jù)化自由是指在數(shù)據(jù)化過程中,個人或機構(gòu)應享有自主決定其數(shù)據(jù)如何被收集、處理、存儲和使用的權(quán)利。這包括數(shù)據(jù)訪問的透明度、數(shù)據(jù)使用的控制權(quán),以及在必要時對數(shù)據(jù)刪除的權(quán)利。數(shù)據(jù)化自由強調(diào)的是個體或組織在數(shù)據(jù)化過程中的主動性和自主性,確保他們的數(shù)據(jù)權(quán)益得到充分尊重和保護。如果沒有數(shù)據(jù)化自由,個體或組織就無法自主決定其數(shù)據(jù)使用,從而無法實現(xiàn)真正的數(shù)據(jù)化平等。
數(shù)據(jù)訪問平等關注的是公共和非商業(yè)機密數(shù)據(jù)庫的可訪問性。它主張這些數(shù)據(jù)庫應向公眾提供平等的訪問權(quán)限,確保公眾在享有知情權(quán)的同時,機構(gòu)也能夠保護其合理的保密權(quán)。這種平衡的實現(xiàn)需要制定明確的數(shù)據(jù)訪問政策和規(guī)范,以確保數(shù)據(jù)的透明度和公正性。數(shù)據(jù)共享規(guī)范強調(diào)數(shù)據(jù)共享和流通的重要性。它要求數(shù)據(jù)不應被少數(shù)機構(gòu)所壟斷,而應在符合相關規(guī)范的前提下,促進數(shù)據(jù)共享和流通。各國各部門應根據(jù)各自國家民眾的利益需求和實現(xiàn)全人類繁榮的目標,制定具體的數(shù)據(jù)共享政策和規(guī)范,以確保數(shù)據(jù)資源的合理利用和價值最大化。2021年,國務院反壟斷委員會發(fā)布了《關于平臺經(jīng)濟領域的反壟斷指南》,對算法合謀、大數(shù)據(jù)殺熟等利用數(shù)據(jù)和算法實施的壟斷行為進行了規(guī)定 丁道勤:《產(chǎn)業(yè)鏈視角下生成式人工智能的競爭法規(guī)制研究》,《西北工業(yè)大學學報》(社會科學版),2024年第1期。。
此外,在追求數(shù)據(jù)可及平等的過程中,我們必須認識到現(xiàn)實社會不平等對數(shù)據(jù)可及平等的影響。這種影響可能導致數(shù)據(jù)收集的偏見和不均衡,從而影響到算法的公正性。因此,在數(shù)據(jù)集和算法設計上,我們需要特別關注這種不平等現(xiàn)象,并采取相應的措施進行糾正。例如,可以設計差異化的算法規(guī)則來彌補數(shù)據(jù)不平等帶來的負面影響,以實現(xiàn)算法的實質(zhì)平等。實際上,在資源有限的情況下,數(shù)據(jù)可及性的實現(xiàn)通常只能保證最低限度。盡管數(shù)據(jù)收集的不平等可能長期存在,但在實現(xiàn)算法公正的過程中,可以根據(jù)當時當?shù)氐木唧w情境設計符合該區(qū)域人民利益的算法,以實現(xiàn)具體的實質(zhì)性的算法公正。
(二)數(shù)據(jù)代表平等
基于數(shù)據(jù)平等的算法公正論主張數(shù)據(jù)代表平等。數(shù)據(jù)代表平等包括數(shù)據(jù)樣本在數(shù)據(jù)量和質(zhì)上的平等,并確立最小傷害原則。數(shù)據(jù)樣本的代表性平等意味著數(shù)據(jù)集中的數(shù)據(jù)應充分、準確、客觀地反映各群體的特征。在數(shù)據(jù)量上,需權(quán)衡少數(shù)人與多數(shù)人的代表性,以避免主流數(shù)據(jù)淹沒社會邊緣人群、弱勢群體和少數(shù)群體的數(shù)據(jù),從而防止對少數(shù)人的壓迫。因此,在設計算法規(guī)則和建模時,應充分考慮少數(shù)人的代表性,如通過計算并適當增大少數(shù)人群在數(shù)據(jù)樣本中的代表權(quán)重,來平衡不同群體的利益。在數(shù)據(jù)的質(zhì)上,代表性平等要求禁止偏見與歧視數(shù)據(jù),即剔除包含偏見與歧視的數(shù)據(jù),避免現(xiàn)實社會的不公正在數(shù)據(jù)中得到延續(xù)和反映。為了衡量數(shù)據(jù)平等的程度,應制定量化指標,明確何種情況下數(shù)據(jù)的代表性可能被視為不平等,以確保至少達到最低限度的數(shù)據(jù)代表平等。
確立最小傷害原則是將這一原則作為處理數(shù)據(jù)算法的基礎平衡指標。該原則意味著在不得不犧牲少數(shù)數(shù)據(jù)代表權(quán)益以維護公共利益和人類福祉時,將傷害降至最低。這有助于在保障公共利益的同時平衡不同利益主體之間的關系,減少對少數(shù)數(shù)據(jù)代表的傷害。最小傷害最低指標包含不影響少數(shù)人群的資源分配和機會發(fā)展。此外,要警惕暗數(shù)據(jù)的影響,以避免因錯誤和失誤分析引發(fā)的有害實踐。正如漢德所言,我們要不停地問自己“我們?nèi)笔Я耸裁磾?shù)據(jù)”" 戴維·漢德:《暗數(shù)據(jù)》,陳璞譯,中信出版社,2022年,第24頁。。識別暗數(shù)據(jù)是一項具有挑戰(zhàn)性的工作,漢德為我們總結(jié)了15種暗數(shù)據(jù),但對暗數(shù)據(jù)的研究還需要進一步探索。
(三)數(shù)據(jù)控制平等
基于數(shù)據(jù)平等的算法公正論主張數(shù)據(jù)控制平等。數(shù)據(jù)控制不平等是數(shù)據(jù)不平等的集中體現(xiàn),它在一定程度上導致數(shù)據(jù)可及不平等和數(shù)據(jù)代表不平等。數(shù)據(jù)控制不平等主要體現(xiàn)在數(shù)據(jù)所有權(quán)不平等、數(shù)據(jù)民主權(quán)不平等和數(shù)據(jù)人格權(quán)不平等上,這些不平等在上文的分析中已經(jīng)得到詳細探討。因此,數(shù)據(jù)控制平等對于促進數(shù)據(jù)可及平等和數(shù)據(jù)代表平等具有重要意義。數(shù)據(jù)控制平等意味著實現(xiàn)數(shù)據(jù)所有權(quán)平等、數(shù)據(jù)民主權(quán)平等和數(shù)據(jù)人格權(quán)平等。如何使數(shù)據(jù)控制達到平等,實際上是個人數(shù)據(jù)權(quán)利和機構(gòu)權(quán)力的平衡問題。目前主流的做法主要有兩種:一種是針對個人往往無法有效控制管理自己的數(shù)據(jù)這一問題,主要強調(diào)個人對自己數(shù)據(jù)的掌控權(quán)力,包括在數(shù)據(jù)生產(chǎn)、處理和使用等方面的自主控制,以及最終共享技術紅利的權(quán)利。這也是數(shù)據(jù)倫理治理的焦點之一,即將數(shù)據(jù)作為傳輸、保護、共享和利用的對象進行監(jiān)管,可以稱為基于權(quán)利的數(shù)據(jù)倫理進路。另一種做法是針對機構(gòu)(特別是企業(yè))由于掌握與數(shù)據(jù)相關的基礎設施,擁有數(shù)據(jù)化權(quán)力(即“決定把什么內(nèi)容轉(zhuǎn)化為數(shù)據(jù),哪些內(nèi)容可以成為或不可以成為數(shù)據(jù)的權(quán)力”" Fisher A, Streinz T. Confronting Data Inequality. Columbia Journal of Transnational Law, 2022(3).)的數(shù)據(jù)控制不平等現(xiàn)象,主要關注與數(shù)據(jù)相關的基礎設施的控制權(quán),規(guī)范數(shù)據(jù)權(quán)力的合理使用,可以稱為規(guī)范數(shù)據(jù)權(quán)力進路。因此,治理數(shù)據(jù)控制不平等,實現(xiàn)數(shù)據(jù)控制平等的措施應主要聚焦于加強個人數(shù)據(jù)的控制權(quán)和規(guī)范數(shù)據(jù)權(quán)力上。
基于權(quán)利的數(shù)據(jù)倫理,提倡以人的權(quán)利為本,而不是以數(shù)據(jù)的權(quán)力為本;它強調(diào)以人的自由為中心,而非以數(shù)據(jù)的自由為中心。這一進路主張有規(guī)范的數(shù)據(jù)共享和以人為本,要求尊重用戶的數(shù)據(jù)權(quán)、隱私權(quán)和算法的透明度 李倫:《“楚門效應”:數(shù)據(jù)巨機器的“意識形態(tài)”》,探索與爭鳴,2018年第5期。。它強調(diào)個人對個人數(shù)據(jù)的控制權(quán),以及數(shù)據(jù)處理過程中的透明度、可解釋和選擇權(quán),即個人能夠根據(jù)自己的意愿和需求來控制數(shù)據(jù)的收集、使用和共享的方式。例如,在《中華人民共和國民法典》中,關于隱私權(quán)和個人信息保護的侵害免責事由均明確提及權(quán)利人的知情同意。其中,侵害隱私權(quán)的免責事由要求必須經(jīng)過“權(quán)利人明確同意”,而個人信息處理的免責事由則要求自然人或其監(jiān)護人“同意”,盡管對同意的強度要求有所不同,但都凸顯個人控制的核心地位。同時,立法還規(guī)定信息處理者應遵循合法、正當、必要的原則,并賦予自然人“查閱復制權(quán)”“更正權(quán)”和“刪除權(quán)”,以確保其能夠?qū)ψ约旱膫€人信息進行有效的管理。
規(guī)范數(shù)據(jù)權(quán)力進路則主張直接對通過掌握數(shù)據(jù)而獲得權(quán)力的機構(gòu)提出要求,通過制定有關數(shù)據(jù)實踐的機制設計,規(guī)范數(shù)據(jù)權(quán)力以促進數(shù)據(jù)平等。這一進路認為個人與機構(gòu)之間的知識和權(quán)力不對稱是客觀存在的,因此僅僅賦予個人數(shù)據(jù)權(quán)利并不足以保證個體能夠在數(shù)據(jù)收集、存儲、使用、交易和利益分配上作出符合自身利益和社會利益的行為選擇。因而,它倡導構(gòu)建一種機制設計平衡個人和機構(gòu)的數(shù)據(jù)控制。例如,可以構(gòu)建數(shù)據(jù)信托制度,這主要包含兩種形式,一種是信息受托人,在傳統(tǒng)信托的基礎上,巴爾金提出了將數(shù)據(jù)收集者視為信息受托人的見解,從而展開數(shù)據(jù)信托的討論和構(gòu)建。信息受托人的主體包括個人數(shù)據(jù)主體和企業(yè),強調(diào)在二者之間建立信賴關系,企業(yè)需承擔數(shù)據(jù)信托的責任,對個人數(shù)據(jù)主體有信義義務 Balkin J M. Information Fiduciaries and the First Amendment. UC Davis Law Review,2016(4).。與此不同,另一種是第三方數(shù)據(jù)信托。德拉克洛瓦等人指出信息受托人中并不尋求獨立信托,在企業(yè)與數(shù)據(jù)主體之間會存在利益沖突和義務沖突,因而,他們“要求任命受信托宗旨和條款約束的獨立受托人”即第三方數(shù)據(jù)信托。其主體包括個人數(shù)據(jù)主體、企業(yè)和第三方數(shù)據(jù)信托機構(gòu),強調(diào)第三方介入來平衡企業(yè)與數(shù)據(jù)主體之間的權(quán)力不對稱 Delacroix S, Lawrence N D. Bottom-up Data Trusts: Disturbing the ‘One Size Fits All’ Approach to Data Governance. International Data Privacy Law,2019(4).。同時,構(gòu)建以保護數(shù)據(jù)主體為中心的制度規(guī)則,將審慎、誠實、保護和忠誠等價值觀嵌入建立或使用數(shù)據(jù)技術的機構(gòu)的實踐中 尼爾·理查茲:《為什么隱私很重要》,朱悅、嵇天樞譯,上海人民出版社,2022年,第257頁。。這些制度安排和規(guī)則的制定應綜合考慮萊斯格構(gòu)建的法律、市場、社會規(guī)范和架構(gòu)等人文和物理因素的多元規(guī)制分析框架。例如,我們可以將技術手段引入制度規(guī)則安排中,利用這些技術手段來開展數(shù)據(jù)保護實踐。一方面,可以強調(diào)數(shù)據(jù)保護的純技術進路,即技術解決主義方案,其核心聚焦于設計安全和隱私增強技術;另一方面,作為純技術進路的補充,可以強調(diào)數(shù)據(jù)保護的價值敏感設計進路,這種進路聚焦于數(shù)據(jù)保護設計和隱私保護設計。這些設計理念旨在確保在技術應用的過程中,數(shù)據(jù)的安全性和隱私性得到充分的考慮和保護。
這兩種進路并不沖突,只是側(cè)重點不同,基于權(quán)利的數(shù)據(jù)倫理是以權(quán)利作為限制權(quán)力的方式進行的制度安排,它引發(fā)什么是個人數(shù)據(jù)、數(shù)據(jù)權(quán)利對個人而言究竟是何種權(quán)利、是人格權(quán)還是財產(chǎn)權(quán)的爭論,從而促進權(quán)利的細致安排以防范機構(gòu)權(quán)力的侵入。而規(guī)范數(shù)據(jù)權(quán)力認識到權(quán)利進路的缺陷,主張數(shù)據(jù)從根本上來說是關于權(quán)力的,對數(shù)據(jù)保護的制度安排實際上是對數(shù)據(jù)所賦予機構(gòu)權(quán)力的限制,因而,直接要求數(shù)據(jù)權(quán)力方審慎使用數(shù)據(jù),對其進行一定的規(guī)則限制,使基于數(shù)據(jù)的實踐能夠促進人類價值。二者可以相互補充,共同推動基于數(shù)據(jù)平等的算法公正論的實踐。
基于數(shù)據(jù)平等的算法公正論在追求三種平等的基礎上,需要運用原則主義的細化和平衡策略指導數(shù)據(jù)平等倫理原則在具體情境中的實際應用,解決原則的沖突等問題,確保算法設計和運行過程中的公正性。在實踐檢驗中,我們可以引入“社會實驗”這一重要手段,來觀察和評估算法公正在社會中的實際運行是否達到預期的理想狀態(tài),以及是否還存在不足或欠缺。通過不斷的調(diào)試和修正,及時發(fā)現(xiàn)并修正算法中的不公正之處,以實驗的角度持續(xù)審視數(shù)據(jù)平等與算法公正之間的相互影響,從而確保算法的公正性和準確性。同時,基于數(shù)據(jù)平等的算法公正論要求機構(gòu)必須審慎使用數(shù)據(jù),謹慎設計算法規(guī)則,將人類價值嵌入算法規(guī)則中,實現(xiàn)算法規(guī)則公正。此外,基于數(shù)據(jù)平等的算法公正論還特別注重現(xiàn)實社會不公正對數(shù)據(jù)收集、處理和使用的影響。這將使數(shù)據(jù)平等本身成為反映現(xiàn)實社會不公正、不平等的放大鏡,即通過數(shù)據(jù)平等發(fā)現(xiàn)社會不公正,通過基于數(shù)據(jù)平等的算法公正矯正社會不公正,從而形成算法公正促進社會公正的正向公正迭代。
四、結(jié)語
在決策算法化日益盛行的當下,數(shù)據(jù)與算法作為兩大核心要素,不斷使社會數(shù)據(jù)化和算法化,塑造著社會的基礎形態(tài),對公正社會的構(gòu)建起著舉足輕重的作用。數(shù)據(jù)不平等通過影響社會公正、數(shù)據(jù)公正和算法規(guī)則公正構(gòu)成了算法不公正的生成邏輯。因此,實現(xiàn)算法公正的關鍵便在于實現(xiàn)數(shù)據(jù)平等。深入剖析數(shù)據(jù)不平等如何導致算法不公正的機制,進而構(gòu)建基于數(shù)據(jù)平等的算法公正論,已成為社會公眾的共同責任和應有之義?;跀?shù)據(jù)平等的算法公正是一個綜合社會公正、數(shù)據(jù)公正和算法規(guī)則公正的綜合議題,為治理算法不公正提供數(shù)據(jù)與算法治理并重的研究框架,涉及數(shù)據(jù)的收集、處理、使用、算法規(guī)則的設計、應用、評估和數(shù)據(jù)、算法與社會相互構(gòu)建等多個實踐環(huán)節(jié),需要我們不斷深入研究和探討。人與數(shù)據(jù)和算法的公正關系,或基于數(shù)據(jù)和算法的人與人之間的公正關系,是數(shù)據(jù)和算法倫理的核心議題?;跀?shù)據(jù)的算法公正倡導從數(shù)據(jù)不平等回歸數(shù)據(jù)平等,從算法不公正回歸算法公正,主張以數(shù)據(jù)平等的框架審視社會不公正與算法不公正之間的相互影響,通過不斷切近數(shù)據(jù)平等,促進算法公正,最終促進社會公正,增進人類福祉。
Algorithmic Justice Theory Based on Data Equality
Li Lun,Zhang Xiaoyan
(Dalian University of Technology,Dalian 116024,China)
Abstract:
Data inequality is a key factor of data injustice, encompassing inequalities in data accessibility, data representation, and data control. Among them, data control inequality triggers and promotes inequalities in data accessibility and representation, representing the concentrated embodiment of data inequality. Unequal data control directly leads to unequal ownership of data and subsequently leads to unequal personality and democratic rights related to data. When algorithms are combined with unfair data, problems such as unfair allocation, unfair recognition, and unfair representation of algorithms arise. Therefore, it is necessary to establish an algorithmic justice theory based on data equality, which advocates for data equality, data access equality and data sharing, to pursue data accessibility equality, advocates for equality in both quality and quantity of data representation and the principle of minimum harm, to pursue data representation equality, and advocates for a two-pronged approach based on data rights and regulating data power, to pursue data control equality, while introducing principles-based and social experimental methods to promote data equality.
Key words:algorithm ethics; data ethics; algorithmic injustice; data injustice[責任編校 劉 科,段玲玲]