●周樨平
我國高度重視數據經濟的發(fā)展,明確提出了“國家實施大數據戰(zhàn)略”“鼓勵和支持數據在各行業(yè)、各領域的創(chuàng)新應用”?!?〕我國《數據安全法》第14條第1款規(guī)定:“國家實施大數據戰(zhàn)略,推進數據基礎設施建設,鼓勵和支持數據在各行業(yè)、各領域的創(chuàng)新應用?!睌祿鳛樾滦偷纳a要素,在推動傳統(tǒng)產業(yè)轉型升級、培育新興產業(yè)和商業(yè)模式以及推動高效精準決策上的作用愈發(fā)重要。依據收集和控制的主體來分,數據主要有政府數據和企業(yè)數據兩類。政府等公共部門在履行公共職能過程中獲取的數據,產生于國家財政資金,具有社會共享的公共屬性,開放政府數據已為普遍共識;而企業(yè)等私營部門在生產經營過程中收集的數據,產生于私人投資,與個人信息有著千絲萬縷的聯(lián)系,其權屬和利用規(guī)則具有復雜性。我國《民法典》雖將數據納入保護范圍,但對具體規(guī)定作了留白處理,《數據安全法》也僅指出國家保護與數據有關的權益,給權屬規(guī)則留下了探索空間。
從近年的實踐看,頻發(fā)的數據權屬爭議已經對法律制度供給提出了更高的要求。例如,在菜鳥網絡與順豐快遞的物流數據之爭中,菜鳥網絡在幾個快遞公司上搭建數據系統(tǒng),菜鳥的快遞柜、順豐的物流快遞、淘寶的購物平臺共同促成了物流數據的生成,這些數據究竟應該屬于誰?又如,蟻坊公司作為一家從事互聯(lián)網大數據分析的企業(yè),未經微夢公司的許可采集、使用了該公司的新浪微博數據進行數據分析,微夢公司認為蟻坊公司的行為構成了不正當競爭,而蟻坊公司則認為微夢公司拒絕數據許可構成壟斷,請求法院判令微夢公司以合理條件允許其使用微博數據,其中所涉的數據抓取爭議雖看似反不正當競爭和反壟斷問題,實則反映的是企業(yè)數據權益的范圍和邊界問題,凸顯出企業(yè)數據控制和共享之間的緊張關系。
在對企業(yè)數據權屬的理論討論中,觀點分歧亦十分明顯。一類觀點主張賦予數據業(yè)者對合法收集的數據享有絕對性和排他性權利;〔2〕參見程嘯:《論大數據時代的個人數據權利》,載《中國社會科學》2018年第3期,第102頁;龍衛(wèi)球:《數據新型財產權構建及其體系研究》,載《政法論壇》2017年第4期,第63-76頁?;蛘呤羌骖櫤罄m(xù)利用者的利益,為大數據集合設置有限排他權?!?〕參見崔國斌:《大數據有限排他權的基礎理論》,載《法學研究》2019年第5期,第6頁。一類觀點依據數據本身的特點,認為不宜進行絕對化與排他性的財產權設計,而應通過行為規(guī)制的方法,如商業(yè)秘密、競爭法、〔4〕參見丁曉東:《論企業(yè)數據權益的法律保護——基于數據法律性質的分析》,載《法律科學》2020年第2期,第90-99頁。侵權法、〔5〕參見王鐳:《電子數據財產利益的侵權法保護》,載《法律科學》2019年第1期,第38-47頁。管制性法律〔6〕參見梅夏英:《在分享與控制之間——數據保護的私法局限和公共秩序構建》,載《中外法學》2019年第4期,第863-864頁。或數據利用和分享的準則〔7〕參見姚佳:《企業(yè)數據的利用準則》,載《清華法學》2019年第3期,第114頁。等,進行反向保護。一類觀點基于企業(yè)數據上存在的多元利益主體,認為應創(chuàng)建數據原發(fā)者擁有所有權,數據處理者擁有用益權的二元結構;〔8〕參見申衛(wèi)星:《論數據用益權》,載《中國社會科學》2020年第11期,第120頁?;蛘呤菙祿黧w擁有名義所有權,數據控制人擁有實質所有權的數據信托關系。〔9〕參見馮果、薛亦颯:《從“權利規(guī)范模式”走向“行為控制模式”的數據信托》,載《法學評論》2020年第3期,第76頁??梢钥闯?,企業(yè)數據“權利”抑或“權益”之爭仍是理論爭鳴的主旋律,即便是主張通過行為規(guī)制的方法進行反向保護的學者,對行為規(guī)制的方法及強度也依然莫衷一是。
數據權屬的明確是數據廣泛應用和數據市場建立的前提,只有解決這一前提問題,才能展開后續(xù)相關利用規(guī)則的構建工作。2021年深圳市和上海市相繼出臺了數據立法,對數據權屬進行了有益的開創(chuàng)性探索,即明確表明市場主體對合法取得的數據享有“財產權益”,〔10〕《深圳經濟特區(qū)數據條例》第4條規(guī)定:“自然人、法人和非法人組織對其合法處理數據形成的數據產品和服務享有法律、行政法規(guī)及本條例規(guī)定的財產權益。但是,不得危害國家安全和公共利益,不得損害他人的合法權益。”《上海市數據條例》第12條規(guī)定:“本市依法保護自然人對其個人信息享有的人格權益。本市依法保護自然人、法人和非法人組織在使用、加工等數據處理活動中形成的法定或者約定的財產權益,以及在數字經濟發(fā)展中有關數據創(chuàng)新活動取得的合法財產權益?!辈捎谩皺嘁妗倍恰皺嗬钡谋硎稣f明立法以法益保護的進路替代了權利創(chuàng)設,〔11〕在《深圳經濟特區(qū)數據條例》制定過程中,征求意見稿曾規(guī)定了“數據權”,其中對“自然人、法人和非法人組織依據法律、法規(guī)和本條例的規(guī)定享有數據權,任何組織或者個人不得侵犯”的規(guī)定引起了爭議,最終出臺的條例改為了“財產權益”。參與條例的立法者指出,以法益保護而非確定權屬體現了深圳在數據立法上的務實態(tài)度。參見劉雪妮:《深圳數據立法若干問題述評》,載《深圳法治評論》2021年第3期,第19頁。體現出對數據流通價值的追求,避免了絕對化權利對數據流通和利用的阻礙。法規(guī)通過確認市場主體對數據使用、收益等權益,為數據要素的有效流動奠定了法律基礎,但存在權益保護的范圍和邊界不清晰、數據利用規(guī)則未能進一步明確等不足,仍難以有效回應實踐中發(fā)生的數據爭議?!?2〕例如,《深圳經濟特區(qū)數據條例》規(guī)定“不得使用非法手段獲取其他市場主體的數據”,“非法”的涵義過于寬泛,對其理解不同,既有可能造成保護過度,也有可能造成保護不足。又如,《上海市數據條例》則將數據利用規(guī)則交由“反壟斷、反不正當競爭、消費者權益保護等法律、法規(guī)”進行調整,而未給予直接規(guī)定。參見《深圳經濟特區(qū)數據條例》第68條、《上海市數據條例》第52條第2款。
在地方性立法對企業(yè)數據采用法益保護的趨勢下,我們需要進一步論證和探究的工作便是為何要采用法益保護?法益保護與權利保護有何區(qū)別?企業(yè)的數據權益如何體現、排他性范圍又該如何?基于此,本文擬從大數據時代企業(yè)數據的特點出發(fā),分析企業(yè)數據的權利化困境,嘗試對企業(yè)數據權益保護的相關理論作進一步的論證,以期為構建保護和共享相平衡的制度提供建議。
進入大數據時代后,企業(yè)數據的全新樣態(tài)對傳統(tǒng)法律制度提出了挑戰(zhàn)。大數據是一種規(guī)模大到在獲取、存儲、管理、分析方面遠遠超出傳統(tǒng)數據庫軟件工具能力范圍的數據集合?!?3〕[美]詹姆斯· R.卡利瓦斯、邁克爾· R.奧弗利:《大數據商業(yè)應用:風險規(guī)避與法律指南》,陳婷譯,人民郵電出版社2016年版,第4頁。人的行為、機器的運行、環(huán)境產生的數據都可以成為數據分析的對象,通過對這些原始數據的分析和挖掘,可讓我們洞察以前無法查知的現象,從而成為商業(yè)創(chuàng)新和公共決策的基礎和源泉。
傳統(tǒng)的知識產權只是在創(chuàng)新過程中起作用,在創(chuàng)新之前是否應該對原始數據進行排他性保護則是大數據時代出現的新問題,而且隨著數據作為關鍵性生產要素的爭奪,這一問題也成了數字經濟的核心問題。關于數據權利,最具代表性的觀點是由Herbert Zech教授提出的數據生產者權,他認為為了防止數據持有者通過機器以一種難以讀出的方式設計,或者創(chuàng)建其他機制來維持事實上的排他性,應賦予產生數據的設備運營商排他性專有權,以此提高數據的可交易性?!?4〕See Herbert Zech, A Legal Framework for a Data Economy in the European Digital Single Market: Rights to Use Data, 11 J.Intell. Prop. L. & Prac. 460, 470 (2016).歐盟委員會也將數據生產者權作為解決數據權屬及數據可用性和流通性問題的方案,并就此提出了公眾咨詢?!?5〕See European Commission, Builing a European Data Economy, COM(2017) 9 final, https://ec.europa.eu/newsroom/just/itemdetail.cfm?item_id=34617, last visit on August 14, 2021.但是,“數據權利化”觀點還是遭到了質疑,即便是數據行業(yè)的利益相關者也不贊成一種新的“數據所有權”類型的權利,認為企業(yè)數據的關鍵問題不在所有權,而在如何組織數據的訪問?!?6〕See European Commission,Towards a Commom European Data Space, COM(2018) 232 final, https://ec.europa.eu/jrc/sites/jrcsh/files/23112...ial_intelligence-rizzi_en.pdf, last visit on August 14, 2021.所有權甚至被認為是一種不符合數據經濟需要的概念。〔17〕2016年,在盧森堡舉辦的一個工業(yè)4.0部門代表的聽證會上,代表們一致強調,他們能夠依靠合同法實現數據共享的商業(yè)模式,所有權甚至被認為是一種不符合數字經濟需要的概念。See Josef Drexl, Designing Competitive Markets for Industrial Data-Between Propertisation and Access, 8 JIPITEC 257, 2017, para. 1.“數據權利化”觀點之所以遭遇困境,與大數據特點及數字經濟對數據共享的需求有著密切關系,總結起來主要基于以下原因。
企業(yè)數據的形態(tài)隨著互聯(lián)網的發(fā)展而不斷發(fā)展。在以信息靜態(tài)、單向傳輸為主的網絡時代,企業(yè)數據主要表現為企業(yè)自行收集創(chuàng)建的數據庫,數據量較為有限,充其量只算是“小數據”而不能稱之為大數據。當以分享為特征的實時網絡出現,用戶可以參與互聯(lián)網內容的生成時,才帶來了數據生產的極大繁榮。
大數據時代的企業(yè)數據從其構成和來源看,大體可分為以下幾種:(1)“用戶提交的網頁數據”,互聯(lián)網內容服務提供者將內容生產向用戶開放,用戶將各種數字資源上傳至互聯(lián)網企業(yè)搭建的服務平臺,直接展示在網頁上成為網站內容的組成部分,如新浪微博數據、大眾點評數據、抖音短視頻數據等。(2)“平臺生成的個人數據”,當平臺經濟商業(yè)模式發(fā)展起來后,平臺經營者向用戶提供搜索、社交、電子商務等服務,用戶則在使用平臺服務過程中產生了大量的數據,包括系統(tǒng)自動記錄的消費、搜索、行動軌跡等用戶各種行為信息,也包括用戶提供的姓名、年齡、職業(yè)等身份信息,這些信息成為平臺數據的組成部分,如網絡購物平臺交易數據、網約車平臺出行數據等。(3)“機器生成的非個人數據”,隨著信息傳感器等裝置與技術在工農業(yè)機器設備、汽車和家電等電子產品中的廣泛應用,被動采集數據融入生產經營和日?;顒?,傳感器采集的數據可通過物聯(lián)網進行連接,越來越多的數據可遠程訪問。隨著工業(yè)4.0時代的到來,機器生成的數據(machine-generated data)日益成為數字經濟的核心生產要素,如智慧工廠大數據、智慧農場大數據、智慧交通大數據等。
由企業(yè)數據的構成可見,大量的數據不是有意識生產的,而是工商業(yè)活動或人們進行日?;顒訒r產生的數字尾氣或副產品?!?8〕參見[美]拉塞爾·沃克:《從大數據到巨額利潤》,王正林譯,南方出版?zhèn)髅焦煞萦邢薰?019年版,第83頁。申言之,“平臺生成的個人數據”和“機器生成的非個人數據”是大數據的主要形態(tài),這些數據是通過計算機程序、應用或服務,或通過傳感器從設備、軟件或機器接收的人的行為、物體移動、環(huán)境改變等信息,由于未經人力加工,是“沒有直接干預的數據”。而企業(yè)獲取的數據只是生產經營活動的痕跡和記錄,是其經營活動的副產品,大數據的價值更像是企業(yè)額外獲得的財富?!坝脩籼峤坏木W頁數據”雖然與痕跡和記錄等原始數據有差別,更多地與傳統(tǒng)數據庫保護的對象相似,但對獲得數據的互聯(lián)網企業(yè)而言,數據的收集和經營仍不是其主營業(yè)務,如微博是“分享簡短實時信息的廣播式社交媒體”,大眾點評是“提供商戶信息、消費點評及消費優(yōu)惠等信息服務,與團購、訂餐、外賣等交易服務”的第三方消費點評網站,數據對其而言仍是經營活動的副產品。數據是副產品的事實使傳統(tǒng)的知識產權,甚至是產生于小數據時代的數據庫權利都難以將其視為保護的對象。
激勵理論是知識產權正當化的主要依據,但是作為副產品的大數據并不需要知識產權的激勵。機器產生的數據幾乎是自動發(fā)生的,生成這些數據是企業(yè)商業(yè)模式的重要組成部分,沒有證據表明數字經濟中生產和分析數據的動機不足,他們有足夠的動力生產數據?!?9〕See Josef Drexl, Designing Competitive Markets for Industrial Data- Between Propertisation and Access, 8 JIPITEC 257, 2017,para. 1.數據商業(yè)化也不需要產權的激勵,數據受到技術措施的保護,不會透露給貿易伙伴,即使直接交易,其價值也存在于實時供應中,這涉及反復的交互,幾無免費“搭便車”的空間?!?0〕See W. Kerber, A New (Intellectual) Property Right for Non-Personal Data? An Economic Analysis, (2016)GRUR Int. 989, 997.民法學者往往采用勞動財產理論(或自然權利理論)來論證數據權利化的正當性,認為企業(yè)投入了大量的技術、資金和人力成本,理應獲得相應的數據財產權利,〔21〕參見龍衛(wèi)球:《再論企業(yè)數據保護的財產權化路徑》,載《東方法學》2018年第3期,第50-51頁。但在大數據為副產品的情形下,企業(yè)勞動和資金的投入并不是直接用于生產數據,而是用于企業(yè)的主營業(yè)務,這些投入已經通過生產經營的利潤獲得了回報,企業(yè)數據難言是企業(yè)一方勞動的成果,多數情況下大數據的生成都有用戶的參與,是用戶參與和算法互動的結果,所以其最多只能算是企業(yè)與用戶共同“勞動”之結果。在數據是機器自動收集的情形下,就更難言是數據企業(yè)投入了“大量”的勞動。歐盟為了保護“額頭上的汗水”(勞動和資金投入)的數據庫特別權利,也認為并不能為機器生成的數據提供保護,〔22〕See Hugenholtz, P. B., Data Property in the System of Intellectual Property Law: Welcome Guest or Misfit?, In S. Lohsse, R.Schulze & D. Staudenmayer (Eds.), Trading Data in the Digital Economy: Legal Concepts and Tools: Münster Colloquia on EU Law and the Digital Economy III, Baden-Baden: Nomos, 2017, p. 75-99,其數據庫權利旨在保護數據庫企業(yè)在“獲取、校驗、展現”數據庫上的投資,這種投資是指用于“尋找現有材料并將其收集到數據庫中”的資源投入,不包括用于創(chuàng)建構成數據庫內容的材料的投入,因此若投資是用于產生數據的經營活動,是不能滿足數據庫保護要求的?!?3〕See Bundesgerichtshof (Federal Supreme Court), 1 December 2010, Case I ZR 196/08.
但不可否認的是,大數據雖為副產品,企業(yè)仍然為收集數據以及使原始數據能夠被利用做了一定的投入,盡管這種投入不足以使其獲得一種具有強大排他性的財產權利,但給予一定程度的保護仍屬必要,這便是采用法益保護路徑的依據(容后詳述)。
若對企業(yè)大數據進行權利保護,就必須由法律確定權利主體,這無疑難度頗大,因為大數據的生成可能涉及多個主體的貢獻,數據的所有權無論分配給誰都不合適。
用戶參與生成的企業(yè)數據集至少涉及用戶與企業(yè)兩個參與者。在大數據時代,作為數據主體的個人從根本上缺乏占有支配數據的能力,因此由個人擁有所有權不具現實性。而一個大數據集若由無數個個人享有所有權,難免導致權利的碎片化,使大數據無法被正常利用。所以當今主流觀點也認為,個人對數據并不享有全面絕對的支配權,而是個人信息保護權?!?4〕參見高富平:《個人信息保護:個人控制到社會控制》,載《法學研究》2018年第3期,第85-101頁。個人信息保護權主要是人格權益,包括隱私利益不受侵犯,以及對其個人信息處理的知情決定、刪除、更正等權利。由企業(yè)對來自個人的數據集享有絕對化的所有權同樣不合適,因為企業(yè)利用數據須受到數據保護制度的制約,要尊重數據主體的權利和利益,對數據的利用要取得數據主體的同意,所以不可能享有完全的支配權。
機器生成的非個人數據也常常會涉及不同環(huán)節(jié)相關者的貢獻,分配數據的權屬亦非常困難。設備制造商將傳感器內建在機器中,設備使用人的使用行為會觸發(fā)數據的生成,而被收集數據的環(huán)境物體可能屬于另一個主體。例如,對于農場主租用農機設備收割農場的莊稼所產生的數據,主張權利的可能有設備制造商、設備所有人、農場主三個主體。若多個參與者都要求分配數據所有權,則從概念上幾乎不可能確定一個或多個所有者,如果大家都同意對每個可以分配特定數據的人都擁有所有權,那么結果將是相同數據的多重所有權。〔25〕See OECD, Data-Driven Innovation: Big Data for Growth and Well-Being (2015), https://www.oecd.org/sti/data-driveninnovation-9789264229358-en.htm, last visit on August 14, 2021.面對如此復雜之情形,即便是支持數據所有權的學者也認為通常很難確定是誰在數據的創(chuàng)建和分析方面進行了投資,也很難評估誰是數據的最有效使用者。〔26〕See Wiebe, A., Protection of Industrial Data-A New Property Right for the Digital Economy?, 12 Journal of Intellectual Property Law & Practice 1, 2016, p. 62-71.
對立法者來說,還需要充分慮及數字經濟中高度多樣化部門的大量潛在利益相關者的利益,界定權利主體的基本權利和具體權利將是一個相當大的挑戰(zhàn)。故此,明智之舉在于立法機構應從一開始就避免創(chuàng)造這樣一種權利。
個人占有數據并不會影響其他人的占有,同時個人使用數據也不會影響另一個人使用的效用,這就是數據的非競爭和非排他性,也就是說,數據是可以多方共享的,其本身具有公共屬性。同樣的數據可由不同的人通過各自的途徑收集,例如,智能汽車裝置的傳感器收集路面信息,凡是行使過相同路面的汽車都會產生同樣的數據。如果在數據上設定絕對權,那么意味著只能有一個所有者,這勢必會造成信息壟斷。
有學者認為,應僅在數據文件上設定絕對權,而不是對數據文件蘊含的信息設定絕對權,這樣可避免信息壟斷?!?7〕參見紀海龍:《數據的私法定位與保護》,載《法學研究》2018年第6期,第72頁。Zech教授和歐盟委員會在提出數據生產者權時,也認為該權利只應該涵蓋語法,即數據、代碼級別,而不包括語義(編碼所代表的思想或信息)。如此區(qū)分看似有意義,但語義與語法是否真的可以分割呢?數據的價值存在于語義層面,如果抽離了語義信息,那么語法數據將變得毫無意義,而對語法數據的保護也必然及于語義信息。例如,假設A擁有一份數據文件,如果其只在語法層面享有所有權而不在語義層面享有所有權,那么意味著若B盜取數據文件后將該文件轉換成另一種代碼方式再利用,則不會侵犯A對原數據文件的所有權。因此,僅在語法層面設置數據所有權似無太大意義。
如要在非競爭、非排他的數據上設定絕對權,那就是類似于專利權的制度。專利制度的設計是以申請人公開其發(fā)明創(chuàng)造為代價,換取對該項發(fā)明創(chuàng)造的壟斷性權利。專利制度是促進成果產生和共享的精密的制度安排,但在數據上設定專有權無法達到同樣的效果:數據的收集不同于智力成果的創(chuàng)造,數據通常是自動產生的,不需要通過專有權促進數據的收集;數據可通過不同的渠道收集,設定權利反而不利于數據的采集和利用,而且專有權也無法促進數據的共享。與其設置專有權,不如承認并且保護數據收集者對其收集的數據享有一定的權益,可以禁止他人對數據的非法盜取,這正是一種權益保護的模式。
由人的行為痕跡、位置、機器運行、環(huán)境數據等聚合而成原始數據的最初形態(tài)可能并無價值,價值在于其未來的潛在用途。大數據是進行分析的原材料,并不是被直接利用,其價值難被估量。不同使用者能使數據產生不同的價值,對有些人來說數據是黃金,對另一些人來說數據可能只是無用的數據垃圾,所以對其我們并不能以傳統(tǒng)物品的價值觀念來理解。
大數據的價值需要通過提煉和萃取來顯現,對數據的分析和挖掘才是最需要保護的部分,對數據分析來說,原始數據越多越好。為了某個特定目的而生成的數據,還可以重新用于另一個目的,使其從基本用途移動到二級用途,并隨著與其他數據源的連接和聚合變得更有價值。兩個具有互補數據的數據集合會比將它們分開產生更多的見解,這就是數據分析中的范圍經濟。〔28〕聯(lián)合學習比單獨學習會產生更多的見解,如研究微觀經濟學和宏觀經濟學會比單獨研究產生更多的見解,經濟學家將這一特征稱為“范圍經濟”。See Rosen, S., Specialization and Human Capital, Journal of Labor Economics, 1983 (1), p. 43-49.例如,手機數據可與地圖、商店等疊加在一起,產生更有洞察力的見解。由數據分析的這些特征可知,保護原始數據的所有權并不利于數據的利用,共享才是發(fā)揮數據價值的最有效途徑。
數據權利化會導致私人鎖定數據的價值,反對數據權利化的學者因此擔心這種保護會造成不利于競爭的環(huán)境,使增值產品和服務更難進入市場,導致信息產品更加昂貴,從而損害消費者和整個社會?!?9〕See Peter K. Yu , Data Producer’s Right and the Protection of Machine-Generated Data, 93 Tul. L. Rev. 859.數據是數字經濟增長的主要驅動力,需要采取措施來促進數據的訪問和數據挖掘,而不是通過建立數據產權來實現數據的商品化。除非具備廣泛的例外和安全閥門,否則引入一種新的數據產權可能會造成不受歡迎的數據壟斷?!?0〕See Max Planck Institute for Innovation and Competition, ‘Data Ownership and Access to Data’, Position Statement of the Max Planck Institute for Innovation and Competition, Max Planck Institute for Innovation & Competition Research Paper, 2016(2).
大數據不宜設置絕對權,數字經濟時代對數據有共享的需求,這是否意味著企業(yè)數據可成為任人取用的“公共資源”,甚至如一些學者提出的“數據資源應歸國家所有”呢?〔31〕參見張玉潔:《國家所有:數據資源權屬的中國方案與制度展開》,載《政治與法律》2020年第8期,第15頁。答案是否定的。在數字經濟時代,對企業(yè)數據采取保護和共享相平衡的權益模式,其實更有利于促進數據的利用和流通。
首先,數據雖是副產品,但對數據的收集和利用仍需一定的投入,恰當的保護對數據經濟的發(fā)展是必要的。大數據時代的企業(yè)數據雖主要來自用戶的活動、機器的自動收集,但要將其匯集起來變成可供利用的數據形式,仍需要數據控制企業(yè)付出相應的人力和資本,若完全不提供保護,則可能發(fā)生“公地悲劇”的后果,導致大家都無法得到共享數據的好處。同理,若數據被強制無償共享,企業(yè)很可能只提供低質量的數據,這樣的數據幾乎總是會導致低質量的數據分析和結果。作為數據共享和再利用的最關鍵參與者之一,若無數據控制者的積極貢獻,則無可用之數據。
共享數據需要對元數據、數據模型和用于數據存儲和處理的算法進行補充投資,以保護用于共享數據存儲、處理和訪問的信息技術基礎設施,總的前期成本和支出可能會非常高,當數據控制人不能對其投入獲得足額回報時,數據訪問和共享便不會發(fā)生。故此,適當調整針對數據控制者的激勵機制,同時又不妨礙其進行與數據相關的投資,對于一個運轉良好的數據共享生態(tài)系統(tǒng)而言至關重要?!?2〕See OECD, Enhancing Access to and Sharing of Data -Reconciling Risks and Benefits for Data Re-use Across Societies, 2019,http://doi.org/10.1787/276aaca8-en, last visit on August 15, 2020.
保護數據控制者的權益也是維護正當交易和競爭秩序的需要。對來源于私人投資,由企業(yè)合法取得并置于其控制之下的數據,不能任由他人侵奪,這是維護誠實信用的商業(yè)道德、建立公平合理的市場秩序的需要。因此,對企業(yè)數據而言,采用“權益”模式,既能滿足一定的激勵需要,又不至于讓企業(yè)攫取數據的全部商業(yè)價值,可謂是一種更為適當的機制。
其次,有限保護的權益模式能為企業(yè)數據的利用提供更為廣闊的公共空間?!皺嗬本哂袣w屬效能和排除效能,所有權人原則上對其物可以任意處分并排除他人的任何干涉,〔33〕參見于飛:《侵權法中權利和利益的區(qū)分方法》,載《法學研究》2011年第4期,第108頁。因此,權利模式會給企業(yè)數據帶來寬泛而強大的保護。也有學者認為,財產權模式本身具有彈性和適應性,可通過設置例外保留相當程度的公共空間,從而避免限制公共領域的行動自由?!?4〕參見崔國斌:《大數據有限排他權的基礎理論》,載《法學研究》2019年第5期,第6頁。但不容忽視的一點是,“權利”模式遵循“例外之外皆禁止”,提供的仍然是有限的自由空間,而“權益”模式提供的是一種防御性保護方式,僅在違反“保護性法規(guī)”或“故意違反善良風俗”的條件下才給予保護?!?5〕參見于飛:《侵權法中權利和利益的區(qū)分方法》,載《法學研究》2011年第4期,第113頁。通過禁止某些特定行為的方式反向保護企業(yè)數據權益,遵循的是“禁止之外皆自由”,能為數據的自由利用提供更廣闊的空間。這一方法相當于保護事實上的“擁有”,而不是所有權概念?!?6〕See Commission Staあ Working Document, On the Free Flow of Data and Emerging Issues of the European Data Economy Accompanying the Document Communication Building a European Data Economy, Brussels, 10.1.2017,COM(2017) 9 final, https://ec.europa.eu/newsroom/just/item-detail.cfm?item_id=34617, last visit on August 14, 2021.譬如,如果有人將未經許可盜取的數據轉售給不知情的第三人,那么基于“權利”可制止該善意第三人使用數據,如果依據的是防御性權利,那么并不一定可行(要看是否有禁止性規(guī)定),這猶如商業(yè)秘密保護,一旦商業(yè)秘密泄露,持有人無法阻止他人基于善意取得的使用。大數據時代企業(yè)數據的特有屬性以及數據利用中的范圍經濟,必然要求為大數據保留相當的公共空間,故而只能對企業(yè)數據提供有限之保護。
再次,“權益”模式的靈活性能夠更好地應對企業(yè)數據保護的復雜情況。權利的根本功能在于將某項確定的利益內容歸屬于特定主體,歸屬內容須客體確定且界限清晰?!?7〕參見于飛:《侵權法中權利和利益的區(qū)分方法》,載《法學研究》2011年第4期,第108頁。而企業(yè)大數據的復雜性使權利主體和權利范圍無法具有明確而穩(wěn)定的邊界。不同形態(tài)的企業(yè)數據,如“用戶提交的網頁數據”“平臺生成的個人數據”和“機器生成的非個人數據”的保護程度會有所差別,不同數據的利用行為對數據企業(yè)造成的不同影響也應區(qū)別對待,所以對數據的保護無法一概而論。他人利用數據的行為是否構成侵害,只能由法官在個案中根據企業(yè)勞動和資本投入的實際情況,結合利用者行為的具體表現來權衡受害人利益與加害人行為自由誰更值得保護后再作決定,所以,企業(yè)數據并不具備權利保護的條件,只能是一種利益。
最后,數據庫保護的歷史經驗證明,權益模式更加適合數據的保護。在小數據時代,歐盟和美國對數據庫就采用了特別權利保護和盜用侵權兩種不同的進路。歐盟的數據庫特別權利采用了“權利+例外”的方式,提供了類似財產權的保護,這種過于寬泛的保護方式遭到學界的批評。美國采用的盜用侵權保護方式在許多州是更大范圍反不正當競爭法的組成部分,其正當化依據建立在經濟考量的基礎上,更加重視勞動投入和獲取信息需要之間的平衡?!?8〕參見[澳]馬克·戴維森:《數據庫的法律保護》,朱理譯,北京大學出版社2007年版,第168、180頁。經驗表明,歐盟所采取的特別權利保護并未能給其數據庫產業(yè)帶來多少好處,反而在與美國數據庫生產商的同行競爭中處于下風,以至于人們提議歐盟委員會廢除《數據庫指令》,或者至少對其進行修訂?!?9〕2006年,歐盟委員會對《數據庫指令》進行了一次全面評估,結果顯示其成員國將指令轉化為各自的國內法后,2002年和2004年,歐洲數據庫產業(yè)的份額從33%下降到24%,而美國的份額從62%上升到72%,因此指令被認為甚至可能會損害歐盟的出版和數據庫產業(yè)。See Peter K. Yu, Data Producer’s Right and the Protection of Machine-Generated Data, 93 Tul. L. Rev. 859(2019).基于這一歷史經驗,很多人認為現在對于大數據同樣不需要類似數據生產者權的權利保護。
將企業(yè)數據定位于一種權益保護,同樣需要回答“誰享有數據上的何種權益”這個問題。大數據權屬的復雜性就在于數據上可能存在多個利益相關者都要求享有數據上的權益,在此情況下,建立以數據控制者為中心的制度化的共享數據機制,便成為解決數據權屬問題的替代方案。
數據控制者是企業(yè)數據權益的主要享有者和數據保護義務的承擔者。當下即便沒有所有權,數據也已成為日常交易的客體,持有數據的企業(yè)可利用技術手段來實現對數據的事實控制,成為事實上的所有者。承認并保護數據控制人的事實控制,而不是由法律規(guī)定誰可以成為數據所有權人,可避免立法強行干預產生的不當后果。當一個數據集是由多人貢獻產生,既無法衡量誰對數據的生成投入的貢獻最多,也無法衡量數據權利分配給誰最有效率時,如果通過法律將權利硬性分配給具體的一方,那么可能會導致所有人皆不滿意這樣的權利安排,較為妥當的方法是利益相關者可通過合同約定權益的分配。一般而言,數據控制人對數據的控制是利益相關者談判和自主分配的結果,這種市場決定的方法只需要在出現市場失靈時,如出現壟斷、談判力量不對稱等,才有外部干預之必要。
數據控制者對其收集的數據享有怎樣的財產權益存在不同的認識?!渡钲诮洕貐^(qū)數據條例》第58條規(guī)定:“市場主體對合法處理數據形成的數據產品和服務,可以依法自主使用,取得收益,進行處分?!倍渡虾J袛祿l例》第14條規(guī)定:“自然人、法人和非法人組織對其合法取得的數據,可以依法使用、加工?!笨梢钥闯觯虾l例對于權益內容的規(guī)定較深圳條例要窄,缺少了“收益、處分”的內容,這可能是由于深圳條例規(guī)定的保護對象是經過處理的“數據產品”,較之原始數據的權益范圍要寬一些?!?0〕《深圳經濟特區(qū)數據條例》第58條保護的僅是經過加工處理的數據產品,還是也保護直接收集的原始數據,并不太清楚。因為該法第2條規(guī)定“數據處理,是指數據的收集、存儲、使用、加工、傳輸、提供、開放等活動”,依此解釋,經收集的原始數據似也可理解為“合法處理數據形成的數據產品和服務”。上海條例在草案起草過程中也曾規(guī)定了“管理、收益和轉讓”的權益,但最終稿僅作了“使用、加工”的規(guī)定,說明對于數據企業(yè)是否有權進行收益和轉讓(處分)是存有爭議的。
筆者認為,“轉讓”或“處分”更適合對獨占性權利之表達,數據無法被企業(yè)獨占因而不宜將“轉讓”或“處分”作為企業(yè)數據權益的內容。企業(yè)數據的權益內容應該是“利用”“再利用”并“獲得收益”,而“加工”是實現利用和再利用的方法,“管理”則是一種事實狀態(tài),不應該被表述為一種權益。由于企業(yè)享有財產權益的前提是獲得了數據主體的同意且不損害數據主體的人格權益,所以企業(yè)數據權益上附加了個人信息保護義務,可被視為是一種新型權利和義務的結合體。企業(yè)對其合法收集并經匿名化處理的數據,既能許可他人利用,也可進一步再利用,從而成為數據交易的客體??傮w而言,這種權益并不是完全的支配權,不僅要受到個人信息保護義務的約束,而且數據控制者要與數據上的其他利益相關者共享數據上的利益,負有根據他們的請求提供數據之義務。
當一個數據集由多人的貢獻產生,那么其他利益相關者應該能夠共享數據上的利益。我們不能用“一物一權”的物權思維來理解大數據,數據是一種非競爭和非排他的無形財產,能夠支持多人共享,大數據可由多人利用、收益,實現數據利益的共享。關于企業(yè)數據上利益相關者的利益分配和數據利用關系,有學者提出了一些頗具建設性的觀點,如“數據主體享有所有權,數據企業(yè)享有用益權”,〔41〕申衛(wèi)星:《論數據用益權》,載《中國社會科學》2020年第11期,第120頁?;蛘摺皵祿黧w擁有名義的所有權,數據控制人擁有實質所有權”,〔42〕馮果、薛亦颯:《從“權利規(guī)范模式”走向“行為控制模式”的數據信托》,載《法學評論》2020年第3期,第76頁。這些方案有助于我們理解數據上存在著復雜的利益關系,但無論是用益權還是信托理論都受限于原有的理論框架,在面對大數據這樣一種全新的法律客體時,缺乏足夠的解釋力和規(guī)范效能。
大數據時代的數據主體從根本上缺乏占有支配數據的能力,告知同意形同虛設,〔43〕參見范為:《大數據時代個人信息保護的路徑重構》,載《環(huán)球法律評論》2016年第5期,第94頁。這說明數據主體難以享有所有權,也無法將其視為數據上的其他主體權利的權源。數據上的利益相關者的權益并不是從其他人那里派生或繼受取得的,而是基于各自的貢獻原始取得。在數據控制者占有數據的情況下,其他利益相關者分享數據利益的方式就是訪問權和攜帶權。數據訪問權是檢索和存儲受數據持有者控制的電子數據的權利;數據攜帶權是從數據控制者處獲得結構化、通用化和機器可讀的數據,并將這些數據轉移給其他數據利用者的權利。數據訪問權和攜帶權可讓其他利益相關者實現對數據的利用和收益。企業(yè)數據是由個人數據形成的,個人享有知情同意權、刪除權、撤回權等人格權益已較少有爭議,但是否享有數據上的財產權益還有爭論。我國頒布的《個人信息保護法》已經納入數據訪問權和攜帶權的相關規(guī)定,〔44〕參見我國《個人信息保護法》第45條規(guī)定:“個人有權向個人信息處理者查閱、復制其個人信息;有本法第十八條第一款、第三十五條規(guī)定情形的除外。個人請求查閱、復制其個人信息的,個人信息處理者應當及時提供。個人請求將個人信息轉移至其指定的個人信息處理者,符合國家網信部門規(guī)定條件的,個人信息處理者應當提供轉移的途徑。”數據主體對來源于自己的數據有權要求查閱和復制,并可將這些數據轉移給其他數據企業(yè)進行利用并獲取由此帶來的收益,這既是個人實現“信息自決”的手段,也是將數據轉化為財產利益的方式??梢姡蓚€人數據形成的企業(yè)數據,個人和企業(yè)各自擁有相應的財產權益。
對于機器生成的非個人數據而言,其他共同參與了數據生產但又無法控制數據的人也應被授予數據訪問權和攜帶權以實現數據利益的共享。數據只有更廣泛地共享才能實現其價值,作為副產品的機器生成的數據應盡可能地被需要之人利用,但在數據利用過程中應注意保護他人的商業(yè)秘密,對可能涉及商業(yè)秘密的數據經脫密處理后才可被使用。有關機器生成的非個人數據的訪問權和攜帶權目前尚未見到相關立法,但在國外已有非立法的實踐措施。例如,美國農業(yè)局聯(lián)合會、農場組織與主要的農業(yè)技術提供商一起建立了《農場數據的隱私和安全原則》,根據該原則,對農民使用農機設備耕作產生的數據,農民與其他利益相關者,如租戶、土地所有者、合作社、精準農業(yè)系統(tǒng)硬件所有者和農業(yè)技術提供商共享數據。對于非匿名或非匯總的數據,農民可根據他們的衡量而收回,并享有數據訪問權和攜帶權。〔45〕See OECD, Enhancing Access to And sharing of data -Reconciling Risks and Benefits for Data Re-use across Societies, 2019,http://doi.org/10.1787/276aaca8-en, last visit on August 15, 2021.
由此可見,數據控制者和其他利益相關者共享企業(yè)數據上的權益,這種共享既不是共同所有,也不是按份共有,而是根據各自的角色擁有不同的權益,有人稱之為“半公有的混合所有權”?!?6〕See Heverly, R. A., The Information Semicommons, 18 Berkeley Technology Law Journal, 1128-1189(2003).企業(yè)享有權益的前提是履行相應的數據保護義務,因此企業(yè)數據權益也可以看作是由多個權利義務組合而成的權義束。
以權益形態(tài)表現的企業(yè)數據,其排他性范圍表現為有限性、弱穩(wěn)定及基于場景的利益衡量?;谄髽I(yè)數據的不同形態(tài),如原始數據與加工數據、公開數據與不公開數據,保護的程度會有所不同;基于數據利用行為的不同狀態(tài),如競爭者的利用與非競爭者的利用,對其的正當性評價也會不同??傮w而言,數據集的形態(tài)、數據利用行為的表現以及利用的后果都會給企業(yè)數據的排他性判斷帶來程度不同的影響。如果將數據的完全控制與完全共享視為兩個端點,那么企業(yè)數據的排他性狀態(tài)就是在這兩個端點之間滑動,滑尺會在靠近控制端還是靠近共享端停留,取決于具體場景中基于數據集以及數據利用行為的具體狀況而作出的衡量和判斷。
數據持有者在數據集形成上的投入不同,排他性程度就有差別。經過加工的數據產品,企業(yè)在數據上的勞動、資金甚至智力的投入使其能獲得較高程度的保護,包括類似歐盟數據庫權利的保護,符合獨創(chuàng)性標準的甚至可獲得著作權的保護。而未經加工的原始數據,作為機器或程序產生的副產品,企業(yè)的投入相對較少,可以更加開放。例如,歐盟《數據庫指令》就對可以獲得特別權利保護的數據庫作出了“能夠證明在獲取、校驗或展現數據庫內容的過程中實施了品質上或數量上的實質性投入”的規(guī)定,〔47〕歐盟《數據庫指令》第7(1)條?!皩嵸|性投入”是獲得保護的門檻。對企業(yè)數據集的保護要進行經濟考量,較高程度的保護會使權利人受益,但可能減少下游創(chuàng)新和互補產品的生產,因此要找尋到最優(yōu)程度的保護,即當數據集的生產因成本高而需要更強的經濟激勵時,更高的保護是必要的;如若數據集的生產成本較低,更廣泛地訪問數據不會對數據的生產造成損害,就可以有更高程度的數據開放。
數據利用者與數據持有者是否存在競爭關系也是影響企業(yè)數據排他性判斷的因素。如果數據利用者與數據持有者不存在競爭關系,其利用數據生成另外一個功能上不同的數據集,從而成為原始數據集的補充而不是替代,那么兩者將不會在同一市場上競爭,原數據持有人的收入也不會受到影響,此際就不應一概禁止這種使用行為。如果生成新的數據集在功能上與原始數據集相重疊,二者就可能產生競爭,數據持有人的收入可能會受到影響,那么不禁止這種使用行為就會影響原始數據集產出的激勵。美國數據信息保護所采用的盜用侵權規(guī)則,就是基于不正當競爭的立場,將原告、被告之間存在直接競爭關系作為信息盜用行為成立的關鍵因素?!澳ν辛_拉案”是美國信息盜用制度現代化的典型判例,該案的判決認為:“重點不在于被告是否從使用原告的產品中獲利,而在于是否給原告造成了損害,只有被告與原告提供的產品或服務存在直接競爭,并且被告的行為減損了原告生產產品或服務的動力,以至于他的生存將受到嚴重威脅時,盜用侵權才成立?!薄?8〕National Basketball Association v. MotorolaInc., 105 F3d 841( 2d Cir. 1997).
此外,企業(yè)數據的保護還需結合數據利用行為的具體表現來判斷。首先,獲取數據的手段是否具有不正當性是重要的衡量因素,如規(guī)避robots.txt文件的設置而抓取大量數據信息會被認為具有不正當性;〔49〕參見四川省成都市中級人民法院(2019)川01民初5468號民事判決書。未經許可利用網絡爬蟲技術進入他人服務器獲取信息數據也會被認為具有不正當性?!?0〕參見廣東省深圳市中級人民法院(2017)粵03民初822號民事判決書。其次,數據的公開與否也會影響利用行為的正當性判斷,公開數據的開放程度較之不公開數據要更高一些,如在“蟻坊公司與微夢公司數據不正當競爭案”中,法院認為微博平臺中已經開放的公開數據應允許他人合法獲取和使用,而破壞或繞開對非公開數據采取的保護措施而抓取非公開數據是不正當競爭行為?!?1〕參見北京知識產權法院(2019)京73民終3789號民事判決書。再次,被利用的數據是否包含個人信息,若包含個人信息,則其利用要比非個人數據遵循更嚴格的限制性條件,如在“微博訴脈脈信息抓取案”中,法院認為第三方通過OpenAPI獲取用戶信息時應堅持“用戶授權+平臺授權+用戶授權”的三重授權原則?!?2〕參見北京知識產權法院(2016)京73民終588號判決書。最后,涉及數據權益保護的范圍還有一個問題:在數據被盜取后,第三方再利用數據的行為是否不正當?如果一概禁止第三方的利用,那么會使數據權利絕對化,為了不進一步限制數據資源的開發(fā),若第三方不明知數據是不正當取得的,則再利用行為不應當被禁止?!?3〕See Mattioli, Michael, Disclosing Big Data, Minnesota Law Review, 2014, p. 243.
利用數據的數量及后果也會對數據利用行為的正當性判斷產生影響。企業(yè)數據是以集合方式表現的,他人利用數據往往不是全部,而是抓取其中的一部分。在不存在合作關系的前提下,少量抓取和利用他人數據并不會構成不正當,只有數量達到一定程度時才會被判斷為非法。美國信息盜用判例中采用的是“實質損害”標準,體現為被告的利用行為嚴重減損了原告生產相同或更高質量信息產品的動力?!?4〕See Fred Wehrenberge Circuit of Theatres Inc. v. Moviefone Inc.在我國平臺之間抓取數據的案例中也確立了“實質性替代”的損害標準,認為利用他人信息應遵循“最少、必要”原則,超過必要限度從而實質替代了原數據提供者的服務則構成不正當競爭。〔55〕參見“北京百度網訊科技有限公司與上海漢濤信息咨詢有限公司抓取點評信息案”,上海知識產權法院(2016)滬73民終242號民事判決書。最高人民法院在2021年8月發(fā)布的《關于適用〈中華人民共和國反不正當競爭法〉若干問題的解釋(征求意見稿)》第26條對數據競爭的相關規(guī)定也采取了實質性替代標準。“實質損害”的要求可以將原告的權益限制在保障其對數據獲得合理收益的能力上。
在衡量企業(yè)數據權益是否應當保護以及保護范圍時,以上因素皆會被納入考量,但每一個因素都不是孤立的,而是遵循動態(tài)系統(tǒng)論的原理被綜合考慮?!?6〕動態(tài)系統(tǒng)論摒棄“全有或全無”的構成要件論,提出調整特定法律關系的法律規(guī)范包含諸多構成要素,且各要素是動態(tài)的系統(tǒng)。法律規(guī)范或法律效果由各個要素的數量和強度相對應地協(xié)作來確定。參見[日]山本敬三:《民法中的動態(tài)系統(tǒng)論》,解亙譯,載梁慧星主編:《民商法論叢》第23卷,金橋文化出版有限公司2003 年版,第172 頁。例如,企業(yè)在數據上的投入高的,對數據利用行為的不正當性或損害程度的要求就會低一些;如果數據利用行為的不正當性非常明顯,相應地對其他因素的要求也會降低;數據如果是公開的,非競爭者的利用可能并不會被判定為不正當,但數據如果是不公開的,即便是非競爭者,其采用侵入計算機系統(tǒng)的方式獲取數據也很可能會被判定為不正當??傊?,基于特定的場景進行利益衡量是必要的,這也使企業(yè)數據無法呈現明確、穩(wěn)定的保護范圍,只能停留在權益保護層面。
企業(yè)數據的控制者可通過數據市場,依靠合同法實現數據的財產價值,當出現未經許可的不正當利用行為時,保護性規(guī)范的路徑該如何選擇?我國的司法實踐普遍將反不正當競爭法作為企業(yè)數據保護的法律依據。在美國,盜用侵權規(guī)則也是反不正當競爭法的組成部分。反不正當競爭法是市場行為規(guī)制法,其對認定不正當競爭行為的考量是基于維護市場競爭秩序的整體主義視角,而不是基于維護經營者個體利益的靜態(tài)視角。將企業(yè)數據保護置于市場競爭的視角下,對不正當利用行為的判斷納入競爭者、消費者(用戶)、其他市場參與者的多重利益考量,能夠更好地平衡數據保護與公眾利用之間的關系,因此反不正當競爭法是可選的較優(yōu)路徑。
反不正當競爭法中的商業(yè)秘密條款對企業(yè)數據權益能夠提供一定的保護,但商業(yè)秘密保護對象有秘密性、價值性和實用性要求,相當一部分大數據集可能并不符合這些條件。首先是秘密性,公開的數據難以達到秘密性要求,而數據集上經常采用的技術保護措施與商業(yè)秘密的秘密性也存在一定的距離。例如,對下載采取了限制措施的網頁數據,公眾可以瀏覽,難以達到秘密的要求。又如,采用ID加密的數據,只要是會員便可獲得的數據,受眾較為廣泛也難以達到秘密性要求。再如,一些數據是可以通過多種渠道收集的,如公路上智能汽車收集的數據可存在于不同的車輛中,這樣的數據已不能被認為處于秘密狀態(tài),即便采取了保密措施也不一定能獲得商業(yè)秘密保護。其次是價值性,機器產生的數據是否具有價值性頗值懷疑。商業(yè)秘密所保護的價值來自于形成智力成果或經營成果的投入,而作為副產品的數據并無這種受保護的價值。原始數據本身是雜亂無章的,并無顯而易見的價值,其價值來自于后續(xù)的分析和挖掘??梢?,就現代數據產業(yè)而言,商業(yè)秘密的保護在技術上已經過時了。〔57〕See Nestor Duch-Brown, Bertin Martens and Frank Mueller-Langer, The Economics of Ownership, Access and Trade in Digital Data; Digital Economy Working Paper 2016-10; JRC Technical Reports.因此,一些國家(如日本)在應對新興的大數據問題時,會慮及商業(yè)秘密保護的局限性,在反不正當競爭法中增設“限定提供數據”條款,對通過電磁方法(電子方法、電磁方法及其他不被人知覺的方法)管理,并以營利為目的提供給特定對象的信息進行保護,〔58〕參見劉影、眭紀剛:《日本大數據立法增設“限定提供數據”條款及其對我國的啟示》,載《知識產權》2019年第4期,第93-94頁。這也反映出技術的發(fā)展對法律提出的與時俱進的要求。
在我國現有的法律制度條件下,反不正當競爭法一般條款是保護企業(yè)數據的主要法律依據。一般條款是概括性的原則條款,其所具有的靈活性與企業(yè)數據保護所要求的高度利益衡量空間具有天然的契合性,但也可能因缺乏具體的構成要件而使裁判者無所適從。為了避免適用一般條款的隨意性,應強調法律適用的原則和技術:(1)避免企業(yè)數據“權利化”保護,貫徹有限保護理念,將判斷數據不正當利用行為建立在經濟考量的基礎上,考慮對數據控制人激勵的需要與自由利用信息的平衡,研究自由利用數據對社會進步的重要性。(2)建立類型化案例群,確立認定數據不正當利用行為的要件框架??梢葬槍Σ煌螒B(tài)的數據建立類型,例如“用戶提交的網頁數據”“平臺生成的個人數據”“機器生成的非個人數據”,從數據控制人對數據的投入、被告行為的不正當性、原被告之間的競爭關系以及被告行為給原告造成的損害等方面構建法律適用要件。
“用戶提交的網頁數據”類型,典型案件如大眾點評訴愛幫網案、〔59〕參見北京市第一中級人民法院(2011)一中民終字第7512號民事判決書。大眾點評訴百度案、〔60〕參見上海知識產權法院(2016)滬73民終242號民事判決書。百度訴奇虎案,〔61〕參見北京市高級人民法院(2017)京民終487號民事判決書。這些案件的特點是:原告的網站數據由用戶提交的文字、圖片等數字資源構成,數據是公開的;抓取數據的被告與原告網站之間存在直接競爭關系;被告抓取數據后直接作為自己的網站內容呈現給大眾,可能造成代替原告網站的后果。在這些案件中,網站經營者對用戶提交的數據雖然不享有著作權等知識產權,但原告為數據的收集、整理付出了人力、財力、物力和時間等經營成本,因此產生的競爭性利益應當受到法律保護。在競爭法的視角下,利用他人的勞動成果并非必然是不正當的,而是要考慮數據利用者、數據收集者以及公眾利益的平衡,考慮行為對市場競爭秩序的影響。司法實踐中發(fā)展出了“實質性替代標準”,作為合法與非法抓取數據的行為邊界。法院認為,利用他人網站的數據應當遵循“最少、必要”的原則,控制在合理的范圍內,不得對該網站造成市場替代的后果?!?2〕參見上海知識產權法院(2016)滬73民終242號民事判決書、北京市第一中級人民法院(2011)一中民終字第7512號民事判決書。該標準可以成為判斷此類型數據不正當競爭行為的準則。
“平臺生成的個人數據”類型,典型案件如新浪微博訴脈脈案、〔63〕參見北京知識產權法院(2016)京73民終588號民事判決書。騰訊訴搜道案、〔64〕參見杭州鐵路運輸法院(2019)浙8601民初1987號民事判決書。前程無憂訴e成案〔65〕參見上海知識產權法院(2019)滬73民終263號民事判決書。等,這些案件的特點是:原告的平臺數據與個人信息相關,是用戶在使用平臺服務過程中生成的數據,如用戶的注冊信息、關系鏈數據、用戶操作數據等,這些數據可能是公開的,也可能是不公開的;被告抓取原告平臺數據的目的是進行衍生性利用而不是原樣使用,因此原被告之間不一定是直接(同業(yè))的競爭關系。例如,在新浪微博訴脈脈案中,被告開發(fā)的脈脈軟件是一款人脈社交應用,通過爬取和分析原告新浪微博用戶的數據,幫助用戶建立與新朋友的聯(lián)系。對于衍生性數據利用行為,實質性替代規(guī)則不再能夠適用,是否構成不正當競爭的判斷更為復雜。司法實踐中更傾向于考察獲取數據的手段及利用數據的行為是否具有不正當性,以及因此給原告帶來的損害。由于此類數據利用行為涉及用戶的個人信息,因此是否損害了用戶(消費者)利益也是判斷不正當競爭的關鍵因素。
“機器生成的非個人數據”類型,典型案件如“酷米客”訴“車來了”案?!?6〕參見廣東省深圳市中級人民法院(2017)粵03民初822號民事判決書。通過傳感器接收物體運行的信息而產生的數據,很可能被數據收集者控制而處于非公開狀態(tài),第三人如果要獲取該數據一般需要采取突破技術保護措施的手段,這種行為很容易被認定為不正當競爭。此類數據在共享方面會遇到更多的障礙,故而需要特別的數據訪問制度(容后詳述)。
對于數據不正當競爭而言,以上類型并未窮盡所有。慮及不同數據的利用情況和復雜的利益平衡,在判斷數據不正當競爭行為時,法官擁有自由裁量權是必要和有益的。
大數據是數字經濟時代最重要的生產要素,促進數據的共享和利用成為各國普遍的政策目標。作為副產品的企業(yè)數據應開放更多的共享空間而只作有限保護,但數據控制者能夠依靠技術手段實現對數據的控制,其可以通過合同來分享數據,也可能為了保持競爭優(yōu)勢而阻止他人利用數據,如此一來便產生了是否需要法律措施來破除對數據的控制,以促進數據共享的問題。反壟斷法作為破除壟斷的法律制度最先被考慮作為數據開放的可能路徑,但因其適用的不確定性,故而所起的作用有限,而訪問權制度的構建則被認為是促進數據共享的未來方向。
反壟斷法用于開放數據的主要依據是必要設施原則,但該原則的適用一直伴有爭議。必要設施原則傳統(tǒng)上用于鐵路、港口、橋梁、電訊設備等基礎設施的開放,一旦某個設施被認定為“必要”之后,設施的擁有者就必須承擔以合理條件開放使用該設施的義務。有學者認為,在大數據領域應用必要設施原則,爭議會變少,因為數據是非競爭的,一個數據集可以提供給無限個人使用,數據壟斷者面臨的共享成本可能接近于零,而法院也可以通過允許數據壟斷者收回必要的成本來保持其投資動機。〔67〕See Zachary Abrahamson, Essential Data, 124 Yale L. J. 867 (2014).對此,歐盟委員會也認為,必要設施原則強制開放數據的效果能夠滿足確保數字化市場有效競爭之需求,可以成為平衡保護市場投資和促進市場競爭的手段?!?8〕See Heike Schweitzer & Robert Welker Acques Crémer, Heike Schweitzer, etal., Competition Policy for the Digital Era. 轉引自王健、吳宗澤:《論數據作為反壟斷法中的必要設施》,載《法治研究》2021年第2期,第107頁。但同時也認為,該原則存在高度不確定性,以此判斷請求訪問數據的合理性對反壟斷執(zhí)法機構而言是一個沉重負擔。
依照必要設施原則開放數據需要符合兩方面的條件:一是數據是“必不可少”的;二是拒絕提供數據的行為構成濫用。然而,這兩方面的認定都存在一定的難度。其一,要求具有市場支配地位的企業(yè)開放大數據,至少需要證明在相關市場內找不到合適的大數據替代品。而數據是具有多歸屬性的,相同的數據可從不同的數據集中找到,導致在該問題的判斷上分歧很大,數據是否構成反壟斷法意義上的必要設施較難認定。其二,只有當大數據壟斷者拒絕大數據交易能夠排除相關(二級)市場的有效競爭,阻止了一種有消費需求的新產品出現,且這種拒絕客觀上為不合理時,才能適用必要設施原則?!?9〕See Microsoft v. Commission, T-201/04, ECLI:EU:T:2007:289, [2007] ECR II3601.必要設施原則的適用以杠桿原理為基礎,旨在防止擁有必要設施的企業(yè)通過杠桿將一個市場的壟斷力量傳遞到另一個市場,從而排除該相關市場的競爭。那么,拒絕交易的企業(yè)是否在一級市場上具有市場支配地位,其拒絕交易的行為是否具有反競爭意圖,能否在二級市場上起到排除、限制競爭的效果,是必須要進行證明的,這就會涉及繁重的經濟評估,從而增加適用該原則的不確定性。
考慮到必要設施原則適用的不確定性,有學者認為,我國當前并不適宜直接明確將數據作為反壟斷法中的必要設施,而應在個案分析的基礎上審慎考慮該原則的適用?!?0〕參見王健、吳宗澤:《論數據作為反壟斷法中的必要設施》,載《法治研究》2021年第2期,第102頁。也有學者認為,由于數據具有價值上的不確定性,將數據界定為必要設施要遵循嚴格限定的基本思路?!?1〕參見孫晉、鐘原:《大數據時代下數據構成必要設施的反壟斷法分析》,載《電子知識產權》2018年第5期,第38頁??傮w而言,僅從反壟斷法意義上分享數據的效果非常有限。在數據持有者沒有與請求訪問者在下游相關市場上存在競爭的情況下,通常難以適用反壟斷法,因為如果原被告在該相關市場不存在競爭,那么壟斷者拒絕交易很可能不是為了排除、限制競爭,其拒絕交易行為也就不應受反壟斷法的規(guī)制。因此,要建立完備的企業(yè)數據分享制度還需要進一步的立法措施。
數據訪問權是作為數據權屬的反向解決方案被提出來的,在數據權利的擁有者及范圍不容易確定的情況下,確定誰有權訪問數據,能夠劃定數據權益的邊界,建立數據利用的秩序。一些學者認為,與其建立一套新的財產權體系,更好的解決辦法是確認一個有針對性的、不可放棄的數據訪問權?!?2〕參見Josef Drexl等:《馬克斯·普朗克創(chuàng)新與競爭研究所就歐盟委員會“關于構建歐洲數據經濟征求意見書”的立場聲明》,載《電子知識產權》2017年第7期,第97頁。數據訪問權可視為企業(yè)數據權益的限制,它能夠明確數據控制者權益的邊界,也是促進數據利用和共享的手段。
訪問權可從兩個方面實現數據共享:一是通過訪問權和攜帶權制度實現企業(yè)數據權益在利益相關者群體內的共享(此觀點前文已述);二是通過法律規(guī)定第三方可在一定情況下訪問數據,實現數據控制人與社會共享數據利益,這可以分為“為公共利益而設的訪問權”和“基于公平、合理、非歧視性(FRAND)原則的數據訪問”。
1.為公共利益而設的訪問權
政府或研究機構為了公共利益和科學用途可被授予訪問企業(yè)數據的權利。數據分析在指導政府決策或改善公共服務方面具有巨大潛力,如利用電信運營商、網絡交易平臺、汽車制造商或社交媒體等公司持有的數據,可以更加有效地進行城市規(guī)劃、應對流行病、改善城市交通、保護環(huán)境、進行市場監(jiān)測等。獲取不同來源的數據并進行分析對于醫(yī)學、社會和環(huán)境科學等領域的科學研究同樣至關重要。
還有一種涉及由私營部門控制的“公共利益數據”的情況。由于公共部門私有化,私營部門越來越多地提供傳統(tǒng)上由政府提供的公共服務,尤其是數據密集型行業(yè)(包括電信服務、金融服務、交通運輸和公用事業(yè)),使這部分數據難以作為政府數據被開放利用。隨著“智能”城市和“智能”交通等應用程序的部署,此問題日顯突出。為此,一些國家已經開始定義和規(guī)范“公共利益數據”的獲取,將私營部門控制的涉及公共利益數據納入強制獲取范圍,如法國對來自公共設施或交通服務等委托提供公共服務的私營部門數據、接受補貼的私營部門數據、國家統(tǒng)計所需的私營部門數據納入“公共利益數據”的范疇。而我國上海市、深圳市頒布的數據條例,也將數據開放的范圍從政府數據擴大到公共數據,將經依法授權具有管理公共事務職能的組織,以及供水、供電、供氣、公共交通等提供公共服務的組織,在履行公共管理和服務職責過程中收集和產生的數據,納入共享、開放和利用范圍。
為公共利益而設置訪問權雖前景廣闊,但也存在實施上的問題。比如,如何定義“公共利益數據”?將符合公共利益的信息和僅具有商業(yè)利益的信息加以區(qū)分是比較困難的,有的商業(yè)信息仍可能有助于國家為公共利益作出決定。又如,為了公共利益而利用數據是否需要補償?如果需要補償的話,那么應以能收回為收集數據所作的投資為限,至于如何具體實施還需要作進一步的研究。
2.基于FRAND原則的數據訪問
基于數字經濟當前的發(fā)展形勢,企業(yè)間若能開放數據訪問將會是數據利用的重大機遇。從理論上說,自動化方式生成的非個人數據集以及經過匿名化處理的個人數據集從性質上是支持更廣泛的數據共享的:數據的非競爭性使各方可在無質量損失的情況下利用數據;原始數據集通過數據挖掘可用來支持或改善完全不同的產品或服務,多數情況下數據的利用并不會導致原始數據持有人喪失競爭優(yōu)勢,因而并不存在限制數據訪問的動機,而且允許他人利用數據并不意味著數據是免費的,在不損害數據持有人利益的情況下,數據可以促進福利的效果提供給第三方。〔73〕See Mayer-Schonberger, V. and T. Ramge, A Big Choice for Big Tech: Share Data or Suあer the Consequences, Foreign Aあairs September/October 2018 Issue.
歐盟委員會提出可考慮以FRAND原則為基礎,在付費的基礎上提供對匿名化數據的訪問?!?4〕See European Commission, Towards a Commom European Data Space, COM(2018) 232 final, https://ec.europa.eu/jrc/sites/jrcsh/files/23112...ial_intelligence-rizzi_en.pdf, last visit on August 14, 2021.基于FRAND原則的數據訪問之靈感來自于標準必要專利許可?!?5〕See Commission Staあ Working Document, On the Free Flow of Data and Emerging Issues of the European Data Economy Accompanying the Document Communication Building a European Data Economy, Brussels, 10.1.2017,COM(2017) 9 final, https://ec.europa.eu/newsroom/just/item-detail.cfm?item_id=34617, last visit on August 14, 2021.當一個專利成為“標準必要專利”,為了使標準盡可能得到廣泛使用,專利權人通常被要求基于公平、合理、非歧視的條件提供許可。第三方基于FRAND原則請求數據控制者提供數據,也需要符合一定的條件,并建立在支付合理報酬的基礎上。
但是,基于FRAND原則的數據訪問也存在諸多問題:(1)請求訪問的條件如何設定?支持訪問權的觀點認為,可將數據無法通過其他來源得到,抑或獨立創(chuàng)建的成本過高,作為第三方請求數據訪問的條件;出于公共利益考量而避免產生重復的數據,也可以考慮作為請求分享數據的條件。例如,歐盟化學品注冊、評估、授權條例為了限制重復進行動物化學試驗,規(guī)定潛在的注冊人有權要求以前的注冊人在提供公平補償的條件下分享研究數據?!?6〕See Josef Drexl, Designing Competitive Markets for Industrial Data- Between Propertisation and Access, 8 JIPITEC 257, 2017,para. 1.但是,類似數據“無法通過其他來源得到”這樣的條件也存在相當程度的模糊性,標準該如何掌握?筆者認為,既然數據訪問權的目的在于開放數據,而且又是建立在支付報酬的基礎上,那么這一條件就無需過于嚴格。(2)如何確定數據訪問的合理報酬?這也是操作中的難題。確定訪問的報酬要考慮數據是副產品的特征,不同于知識產權的許可費用,基本原則是收回數據企業(yè)為收集數據所作的投資,同時也要考慮數據是可以重復授權、重復利用的,每一項授權都會有攤薄投資的效應這一情況。
也有反對設置強制的數據共享義務的觀點,認為有可能會對市場競爭產生不利影響,此一擔心主要來自可能損害數據持有人的競爭能力及削弱數據投資的動力。也有人擔心,強制的數據共享可能會將初創(chuàng)企業(yè)和中小企業(yè)置于投資于數據可移植性的沉重義務之下,結果可能更有利于大型數據密集型企業(yè)。〔77〕See Swire, P. and Y. Lagos, Why the Right to Data Portability Likely Reduces Consumer Welfare: Antitrust and Privacy Critique,Maryland Law Review, Vol. 72, p. 335.對于數據訪問權向第三方開放,應區(qū)分不同的情況:如果數據集只是一個副產品,請求訪問的是不同市場上的非競爭者,數據訪問不會侵占數據持有人的利益,也不會減少數據投資的動機,原則上可賦予訪問權;如果請求訪問的是數據持有人的競爭者,此時數據構成了關鍵的競爭因素,訪問制度不應強制數據持有人向競爭對手提供競爭資源,原則上不宜規(guī)定數據訪問權。有一種情況是競爭者可能依靠其擁有的數據資源排擠對手,擴大其壟斷力量,那么是否有必要規(guī)定競爭者之間在一定情況下也應享有數據訪問權,以防止出現數據壟斷?筆者認為,目前的立法時機尚不成熟,較為妥當的方法是將競爭者之間的數據訪問交由反壟斷法處理,隨著數字經濟的深入,反壟斷法對數據壟斷的認識會不斷深化,競爭者訪問權的輪廓也會不斷明晰。相較于強制性共享的立法,以市場為基礎的方法對于鼓勵數據訪問和共享更加重要。企業(yè)之間數據共享最好的方法還是以契約自由為基石,自行發(fā)展,政府可從規(guī)范化數據交易規(guī)則,促進數據市場建設以及提供可信的數據共享平臺等方面來促進數據共享和商業(yè)化。
數據本身具有公共品特征,而大數據時代的企業(yè)數據更多以副產品面目出現,其價值有賴于后續(xù)挖掘,因此數據法律秩序中需要更多公共空間的建構。企業(yè)數據的權益保護模式有利于實現激勵與利用的平衡,但也因權益保護的模糊性及利益衡量的復雜性使其呈現捉摸不定的表象,實踐中更應當貫徹有限保護理念,妥善把握企業(yè)數據保護的邊界。談及企業(yè)數據的賦權,不可忽視的現實是企業(yè)可通過技術手段實現對數據的控制,即便不對其賦予所有權,數據仍能依靠市場完成交易和利用,因此創(chuàng)設財產權并不是關鍵性問題,而如何在數據控制的情況下促進訪問和獲取,使更多的人從中獲益,才是制度建設的未來方向。在此意義上,反壟斷法開放數據的條件及數據訪問權的制度設計,值得作更進一步的深入研究。