文 / 彭強 / 福建工程學(xué)院 / 魏森 / 華中師范大學(xué)
論數(shù)據(jù)挖掘?qū)@鏇_突與衡平
文 / 彭強 / 福建工程學(xué)院 / 魏森 / 華中師范大學(xué)
由于云計算和大數(shù)據(jù)技術(shù)的快速發(fā)展和廣泛應(yīng)用,導(dǎo)致人們需要處理的數(shù)據(jù)越來越多,如何從大量數(shù)據(jù)中分析提取有益知識,正成為目前數(shù)據(jù)分析應(yīng)用中的核心課題。為解決這個難題,人們開發(fā)出數(shù)據(jù)挖掘技術(shù),實現(xiàn)了對數(shù)據(jù)的有效分析利用。隨著數(shù)據(jù)挖掘技術(shù)在計算機領(lǐng)域的深化應(yīng)用,由數(shù)據(jù)挖掘?qū)@a(chǎn)生的利益沖突呈現(xiàn)逐步增加和日益復(fù)雜的趨勢,這已經(jīng)在一定程度上影響到數(shù)據(jù)挖掘技術(shù)的開發(fā),進而影響到了云計算和大數(shù)據(jù)的發(fā)展;因而,通過對數(shù)據(jù)挖掘?qū)@I(lǐng)域利益沖突進行分析研究,依據(jù)數(shù)據(jù)挖掘的技術(shù)特點,從法哲學(xué)的理論視角進行分析,尋找數(shù)據(jù)挖掘?qū)@馄降脑瓌t和模式,從而達(dá)到衡平數(shù)據(jù)挖掘?qū)@I(lǐng)域的利益沖突,維護各方合法權(quán)益的目的。
數(shù)據(jù)挖掘;專利利益;沖突;衡平
隨著信息技術(shù)和計算機應(yīng)用的加深,全球逐步邁入信息時代;與之相對應(yīng)的是信息數(shù)據(jù)量也隨之增加,特別是互聯(lián)網(wǎng)數(shù)據(jù)量呈現(xiàn)幾何級發(fā)展態(tài)勢,如Google每天處理的數(shù)據(jù)量超過20PB,淘寶每天的日志量超過10TB?!昂A繑?shù)據(jù)對數(shù)據(jù)庫服務(wù)器的CPU,I/O吞吐都是嚴(yán)峻的考驗,隨著網(wǎng)絡(luò)資源的迅速膨脹,不論在存儲空間,還是在訪問速度,清除網(wǎng)絡(luò)瓶頸等方面,單靠數(shù)據(jù)庫系統(tǒng)來完成所有的數(shù)據(jù)挖掘過程已經(jīng)不能適應(yīng)網(wǎng)絡(luò)發(fā)展的需要?!薄?】。如何從海量數(shù)據(jù)中,及時、高效的選取有益數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)隱藏的規(guī)律,挖掘出知識,為人們決策提供依據(jù),是當(dāng)前計算機技術(shù)面臨的重大挑戰(zhàn)。因此,當(dāng)數(shù)據(jù)挖掘技術(shù)自提出來以后,便以其具有較強針對性、適用性而得到了迅猛發(fā)展,并逐步運用到數(shù)據(jù)信息處理與知識發(fā)現(xiàn)的各個方面。
“數(shù)據(jù)挖掘(Data M ining),就是從大量數(shù)據(jù)中獲取有效的、新穎的、潛在最終可理解的模式的非平凡過程”【2】?!皵?shù)據(jù)挖掘的廣義觀點:數(shù)據(jù)挖掘就是從存放在數(shù)據(jù)庫,數(shù)據(jù)倉庫或其他信息庫中的大量的數(shù)據(jù)中挖掘有趣知識的過程”【3】。數(shù)據(jù)挖掘概自1989年8月在美國被提出來以后,其發(fā)展大致經(jīng)歷了五個階段:第一階段是以單機的向量數(shù)據(jù)為目標(biāo)的階段;第二階段通過多個算法對數(shù)據(jù)庫進行處理的階段;第三階段是初步采取網(wǎng)絡(luò)化計算,其面向的對象主要是WEB數(shù)據(jù)和半結(jié)構(gòu)化的數(shù)據(jù)的階段;第四階段是基于網(wǎng)格計算的建立相應(yīng)數(shù)據(jù)挖掘的階段;第五階段是“現(xiàn)在基于云計算的并行數(shù)據(jù)挖掘與服務(wù)的模式,同一個算法可以分布在多個節(jié)點上,多個算法之間是并行的,多個節(jié)點的計算資源實行按需分配”【4】,如通常人們利用GOOGLE地圖搜索地名時,在輸入一個地名后,往往會出現(xiàn)類似地名的提示,這便是數(shù)據(jù)挖掘的成果;第五階段產(chǎn)生的數(shù)據(jù)挖掘技術(shù)也是目前數(shù)據(jù)挖掘被更為廣泛應(yīng)用,并成為數(shù)據(jù)處理的主要運用方式的緣由。數(shù)據(jù)挖掘技術(shù)在給人們帶來便利的同時,也給人們帶來了越來越多的經(jīng)濟利益;為保護開發(fā)者的智力成果和其中的利益不被侵害,數(shù)據(jù)挖掘開發(fā)者紛紛采取申報并獲取專利的方式對技術(shù)進行保護。通常認(rèn)為,“專利(patent)一詞來源于拉丁語Litterae patentes,意為公開的信件或公共文獻(xiàn);現(xiàn)在的含義通常是指一項發(fā)明創(chuàng)造向國家審批機關(guān)提出專利申請,經(jīng)依法審查合格后向?qū)@暾埲耸谟璧脑谝?guī)定的時間內(nèi)對該項發(fā)明創(chuàng)造享有的專有權(quán)”【5】,故數(shù)據(jù)挖掘?qū)@褪侵笇?shù)據(jù)挖掘開發(fā)者或委托開發(fā)人對數(shù)據(jù)挖掘技術(shù),或?qū)?shù)據(jù)挖掘獲取的信息向國家審批機關(guān)申請專利,經(jīng)依法審查合格后獲取的專有權(quán);或者說,數(shù)據(jù)挖掘?qū)@侵笇?shù)據(jù)進行處理,并獲取有益知識的計算機技術(shù)的專用權(quán)。
鼓勵發(fā)明創(chuàng)造和進行技術(shù)創(chuàng)新是專利的核心所在,利用專利獲取相應(yīng)收益并依托專利制度進行專利保護是專利權(quán)人開發(fā)專利的核心目的。同樣,利用專利這一特性對計算機產(chǎn)業(yè)發(fā)展過程中的智力成果進行保護,有利于計算機產(chǎn)業(yè)的發(fā)展,數(shù)據(jù)挖掘也不例外。美國作為數(shù)據(jù)挖掘技術(shù)概念的提出國,尤為重視數(shù)據(jù)挖掘?qū)@暾埮c保護,至今美國已經(jīng)獲取了數(shù)據(jù)挖掘方面的專利7543項1.見美國專利商標(biāo)局網(wǎng)站:http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&p=1&u=%2Fnetahtml%2FPTO%2Fsearchbool.html&r=0&f=S&l=50&TERM1=Data+Mining&FIELD1=&co1=AND&TERM2=&FIELD2=&d=PTXT,信息采集2012年8月5日。,中國的數(shù)據(jù)挖掘技術(shù)發(fā)展雖然較晚,但是在數(shù)據(jù)挖掘領(lǐng)域也已經(jīng)獲取了382項專利2.見國家知識產(chǎn)權(quán)局網(wǎng)站:http://211.157.104.87:8080/sipo/zljs/hyjs-jieguo.jsp,信息采集2012年8月8日。。數(shù)據(jù)挖掘?qū)@麛?shù)量的增多,在一方面有利于通過專利保護推動數(shù)據(jù)挖掘技術(shù)向前發(fā)展,另一方面由于數(shù)據(jù)挖掘?qū)@膽?yīng)用范圍正在迅速擴大,數(shù)據(jù)挖掘?qū)@婕案鞣街g也產(chǎn)生了利益相互對立和沖突,這些利益沖突具體表現(xiàn)在如下幾方面:
(一)專利權(quán)利人之間的利益沖突
數(shù)據(jù)挖掘?qū)@壳爸饕怯捎嬎銠C業(yè)界中專利權(quán)利人所持有,并且每個權(quán)利人所持有的專利面向的領(lǐng)域和范圍也有所不同。在競爭過程中,現(xiàn)有專利保護法律的規(guī)定之下,各個權(quán)利人獲取的數(shù)據(jù)挖掘?qū)@麘?yīng)具有不同的算法設(shè)計和制定方案,權(quán)利人也應(yīng)向市場提供不同的數(shù)據(jù)挖掘?qū)@?,讓客戶選擇不同的算法和不同的并行發(fā)展策略,從而滿足市場的需要。但在利益最大化追求的渴望之下,即便是面對細(xì)分市場,各數(shù)據(jù)挖掘?qū)@麢?quán)利人向市場提供的數(shù)據(jù)處理服務(wù)可能會存在一定的重疊性,這將導(dǎo)致權(quán)利人之間的發(fā)生利益沖突,特別當(dāng)權(quán)利人所提供的算法、并行策略、設(shè)定和調(diào)節(jié)的參數(shù)面對的服務(wù)對象一致時,或相互之間擁有的數(shù)據(jù)挖掘?qū)@麑⒆柚够蚍恋K其他權(quán)利人在數(shù)據(jù)挖掘領(lǐng)域獲取專利或影響公司發(fā)展策略時,這種權(quán)利人之間的利益沖突表現(xiàn)的更為激烈,往往是通過訴訟解決爭端,也有通過購買專利或干脆對專利權(quán)人進行收購以解決利益沖突,如谷歌向IBM公司購買數(shù)據(jù)挖掘?qū)@詼p少在Android平臺所受到的甲骨文公司的專利侵權(quán)起訴辯護3. 見《谷歌向IBM購買1000項專利 以保護Android》,http://ip.people.com.cn/GB/15672420.html,信息采集2012年8月12日。。
(二)專利保密性與公眾知情權(quán)的沖突
數(shù)據(jù)挖掘技術(shù)功能模塊設(shè)計、運用存在諸多的不確定性,諸如如何描述任務(wù)、如何對數(shù)據(jù)進行采集、分析、聚類等是數(shù)據(jù)挖掘,獲得相關(guān)知識時所要解決的前端問題,而在此過程中因不同的使用方式導(dǎo)致專利面對不同的應(yīng)用對象,出現(xiàn)不同的數(shù)據(jù)挖掘結(jié)果,從而會被不同的客戶選擇并被使用在不同的領(lǐng)域中,也就是說數(shù)據(jù)挖掘不同構(gòu)思、算法,是不同客戶選擇使用不同數(shù)據(jù)挖掘?qū)@囊罁?jù),是影響相關(guān)專利的轉(zhuǎn)讓和獲利的核心部分。數(shù)據(jù)挖掘技術(shù)在申請專利后,會向社會公開其專利的內(nèi)容,但對于數(shù)據(jù)挖掘?qū)@猩婕暗降牟煌瑯?gòu)思、算法等有關(guān)具體任務(wù)設(shè)置、采集、分析等技術(shù)步驟和技術(shù)構(gòu)思等并不會完全向社會公開,即使公開,出于利益的考慮或為避免其他競爭對手通過公布的專利獲知其數(shù)據(jù)挖掘技術(shù)發(fā)展方向和策略,廠商對專利的描述對核心技術(shù)的加以保護,并且在專利中對其功能性和適用性描述往往具有一定的專業(yè)性,通常使公眾不能準(zhǔn)確理解其含義。在這種情況下,公眾想選擇合適的數(shù)據(jù)挖掘?qū)@⑼ㄟ^數(shù)據(jù)挖掘技術(shù)獲取自己想要的知識就存在一定的難度,從而導(dǎo)致公眾的知情權(quán)在專利權(quán)利人的利益選擇和博弈中,被無形忽略或剝奪,對公眾的利益造成了一定損害。
(三)專利安全性的利益沖突
數(shù)據(jù)挖掘?qū)@ǔJ擒浖_發(fā)者對數(shù)據(jù)環(huán)境進行預(yù)設(shè),在此基礎(chǔ)上運用算法建立數(shù)據(jù)處理模式,以期獲得可用的數(shù)據(jù)。用戶使用數(shù)據(jù)挖掘?qū)@那樾闻c軟件開發(fā)者的預(yù)設(shè)使用存在一定的差異,在專利中設(shè)定的運行環(huán)境、計算模型和用戶的使用并不完全一致,這是對數(shù)據(jù)挖掘?qū)@夹g(shù)的考驗,如挖掘技術(shù)過程是否符合可控、可視的安全要求,數(shù)據(jù)挖掘過程是否會泄露用戶的安全信息或?qū)τ脩舻陌踩栽斐蓾撛谟绊懙?,如最近在美國,Com Score公司因利用數(shù)據(jù)挖掘?qū)@浖米詫κ占脩粜畔⒍鴮?dǎo)致糾紛4. Jef f Clabaugh :《ComScore disputes data-mining lawsuit》,Washington Business Journal, see http://www.bizjournals.com/ washington/news/2011/08/24/comscore-disputes-data-mining-lawsuit.html,信息采集2012年8月12日。。安全性的要求本應(yīng)是用戶使用數(shù)據(jù)挖掘的首要要求,但是提供數(shù)據(jù)挖掘?qū)@夹g(shù)的廠商為規(guī)避其中的風(fēng)險,往往通過“使用須知”對其中的風(fēng)險進行提示,以求規(guī)避因安全帶來的法律責(zé)任,即便是用戶因使用數(shù)據(jù)挖掘而導(dǎo)致其信息或利益受到了損害,但因為對數(shù)據(jù)挖掘技術(shù)和運算處理過程專業(yè)性了解程度不夠或由于使用的是封裝的程序模塊,也不能完全維護其自身在數(shù)據(jù)挖掘過程中的利益;特別當(dāng)發(fā)生數(shù)據(jù)丟包【6】情況時,會出現(xiàn)用戶使用目的與獲取結(jié)果不一致的情況,上述這些就是實際使用的安全性與專利權(quán)人宣稱的安全性存在差異導(dǎo)致的利益沖突。
(四)數(shù)據(jù)挖掘?qū)@麑ο罂刂坪褪褂檬跈?quán)權(quán)限的利益沖突
數(shù)據(jù)挖掘?qū)@夹g(shù)是對數(shù)據(jù)進行處理,并獲取有益知識的計算機技術(shù)。為從眾多的數(shù)據(jù)中獲取符合要求的數(shù)據(jù),從而進行分類、處理,軟件開發(fā)者在數(shù)據(jù)挖掘技術(shù)中,往往會設(shè)定數(shù)據(jù)的閾值 (或稱之為數(shù)據(jù)靈敏度)或設(shè)定對象控制的級別。通過設(shè)置閥值,那些符合閥值的數(shù)據(jù)會被算法所發(fā)現(xiàn)、捕獲并進行隨后的數(shù)據(jù)處理,在此過程中,數(shù)據(jù)挖掘?qū)@夹g(shù)對閥值的選取將對用戶的使用目的造成直接的影響,過于高的閥值所導(dǎo)致的結(jié)果是用戶數(shù)據(jù)挖掘后不能得到合適的結(jié)果,過于低的閥值卻會導(dǎo)致用戶除了獲取有用數(shù)據(jù)還將獲取大量無法使用的數(shù)據(jù);而通過對象控制的級別設(shè)定,可以極大的簡化數(shù)據(jù)挖掘每一層級所運算處理的對象,但這種控制對象級別往往是軟件開發(fā)者在設(shè)計軟件時進行設(shè)定,而用戶的使用授權(quán)或希望數(shù)據(jù)挖掘技術(shù)處理數(shù)據(jù)的范圍、深度與軟件開發(fā)者設(shè)定之間往往存在不同,這種不同的后果會使用戶在使用數(shù)據(jù)挖掘后,因無法預(yù)見、識別、控制數(shù)據(jù)挖掘?qū)ο蠡蚴褂梅秶欠窠?jīng)過合法授權(quán),導(dǎo)致挖掘出的數(shù)據(jù)信息存在外泄的可能,從而損害用戶或他人的利益。在湖南快樂陽光互動娛樂傳媒有限公司訴上??麻W(wǎng)絡(luò)科技有限公司、達(dá)貝妮、合一信息技術(shù)(北京)有限公司侵犯著作權(quán)案件中,數(shù)據(jù)挖掘?qū)@浖峁┑乃阉饕鏌o從預(yù)見、識別、控制被搜索作品是否經(jīng)過合法授權(quán),由此進行的數(shù)據(jù)挖掘侵犯了湖南快樂陽光互動娛樂傳媒有限公司的著作權(quán)5. 裁判案例見:《原告湖南快樂陽光互動娛樂傳媒有限公司訴被告上??麻W(wǎng)絡(luò)科技有限公司、達(dá)貝妮、合一信息技術(shù)(北京)有限公司侵犯著作財產(chǎn)權(quán)糾紛一案》,載中國知識產(chǎn)權(quán)裁判文書網(wǎng),http://ipr.court.gov.cn/sh/zzqhljq/200904/t20090419_125902.html,信息采集2012年8月20日。,從而產(chǎn)生利益沖突導(dǎo)致訴訟。
數(shù)據(jù)挖掘技術(shù)可以被運用在對數(shù)據(jù)集的處理從而獲取有益知識,或者說數(shù)據(jù)挖掘技術(shù)可以為知識發(fā)現(xiàn)創(chuàng)設(shè)可能性,在此過程中,數(shù)據(jù)挖掘的專利在使用前是否對使用對象和使用范圍作出規(guī)定,以及是否對知識發(fā)現(xiàn)后的成果分享作出約定是數(shù)據(jù)挖掘?qū)@麢?quán)利人在設(shè)定專利使用權(quán)限中的內(nèi)容。在大多數(shù)的數(shù)據(jù)挖掘技術(shù)使用過程中,專利權(quán)利人對于專利使用后的知識發(fā)現(xiàn)均約定了使用者的范圍和使用對象,并對于可能造成知識產(chǎn)權(quán)侵權(quán)后果的使用方式,在用戶須知中對其使用權(quán)限進行了規(guī)定;但是這種規(guī)定并不能完全避免用戶在使用過程中因知識發(fā)現(xiàn)或超使用權(quán)限使用,而在用戶與專利權(quán)利人之間發(fā)生利益沖突。
上述沖突的產(chǎn)生與知識產(chǎn)權(quán)本質(zhì)上作為私權(quán)的特征密切相關(guān),各方從自身權(quán)益出發(fā),對數(shù)據(jù)挖掘?qū)@臋?quán)利內(nèi)涵和外延提出了不同的要求,而這些相互沖突的要求在數(shù)據(jù)挖掘?qū)@褂眠^程中,以彼此之間的利益沖突表現(xiàn)出來,這便形成了數(shù)據(jù)專利的利益沖突。
“從專利制度的發(fā)端來看,專利權(quán)作為一種壟斷權(quán),一開始只是歐洲封建王朝隨意恩賜與某些個別人的特權(quán)”【7】。隨著公平正義等民事法律原則確立和相應(yīng)法律體系完善,專利的授予與保護逐步和智力成果的創(chuàng)造緊密聯(lián)系起來,以法律的形式對于智力成果創(chuàng)造人享有的權(quán)利進行了明確保護,激發(fā)了人們對智力創(chuàng)造的熱情,推動了社會向前發(fā)展。但是,我們亦應(yīng)看到專利的獨占性和壟斷性也在一定程度上引起了專利涉及各方的利益沖突,這正如前文所述的數(shù)據(jù)挖掘?qū)@械睦鏇_突。這種利益沖突并非屬于不可調(diào)和的矛盾,因此可對此利益沖突在“衡平”各方利益之后進行調(diào)和,以求減少各方的利益沖突,從而在現(xiàn)在技術(shù)環(huán)境之下平衡并保護各方利益;但對專利衡平的前提應(yīng)建立在對數(shù)據(jù)挖掘?qū)@婧馄降睦碚摶A(chǔ)分析之上,也只有通過分析數(shù)據(jù)挖掘?qū)@睦碚摶A(chǔ),才能得出數(shù)據(jù)挖掘?qū)@袩o衡平的可能,并以此建立數(shù)據(jù)挖掘的專利利益衡平的合適模式。本文在此對數(shù)據(jù)挖掘?qū)@馄降睦碚摶A(chǔ)作如下分析:
(一)法哲學(xué)的相關(guān)理論分析
盧梭在《社會契約論》中認(rèn)為,“人類由于社會契約而喪失的,乃是他的天然的自由以及對于他所企圖的和所能得到的一切東西的那種無限權(quán)利;而他所獲得的,乃是社會的自由以及對于他所享有的一切東西的所有權(quán)?!薄?】,“社會公意是從全體出發(fā),對全體都適用;并且,當(dāng)它傾向于某種個別的、特定的目標(biāo)時,它就會喪失它的天然的公正性。實際上由社會公約而得出的第一條法律,也是惟一真正根本的法律,就是每個人在一切事物上都應(yīng)該以全體的最大幸福為依歸”【9】。盧梭論述所要表明的意思,當(dāng)人為契約社會中的成員,所被賦予或被保護的是在社會中通過契約形式認(rèn)可的權(quán)利,這種被賦予的權(quán)利與自然狀態(tài)中權(quán)利有所區(qū)別,但這種被賦予的權(quán)利會被社會以法律在公正性的基礎(chǔ)上所作出的衡平的公約保護,這表達(dá)出盧梭對社會在個體利益與公眾利益綜合考量之后,提出的維護權(quán)利人的利益的觀點。約翰·洛克在《政府論》中認(rèn)為,“(一個人)的身體所從事的勞動和他的雙手所進行的工作,我們可以說,是正當(dāng)?shù)貙儆谒?,所以只要他使任何東西脫離自然所提供的和那個東西所處的狀態(tài),他就己經(jīng)摻進他的勞動,在這上面摻加他自己所有的某些東西,因而使它成為他的財產(chǎn)……,從而排斥了其他人的共同權(quán)利”【10】,但是約翰·洛克同時認(rèn)為,“至少留有足夠的同樣好的東西給他人所共有。”【10】,約翰·洛克認(rèn)為人們可以通過勞動創(chuàng)造屬于自己的財富,社會在對屬于個人創(chuàng)造財富進行確認(rèn)和尊重的同時,亦應(yīng)考慮其他社會其他人應(yīng)獲取財富的可能性,不能用自己創(chuàng)造財富來獨占或阻礙社會的進步以及妨礙其他人獲取財富,這樣才能形成公平的社會和賦予人人均有創(chuàng)造并獲取財富的可能。
(二)人格權(quán)的相關(guān)理論分析
馬克思、恩格斯認(rèn)為:“我們首先應(yīng)該確立一切人類生存的第一個前提,也就是一切歷史的第一個前提,這個前提就是人們?yōu)榱四堋畡?chuàng)造歷史’,必須能夠生活,但是為了生活,首先就需要衣、食、住以及其他東西。因此第一個歷史活動就是生產(chǎn)滿足這些需要的資料,即生產(chǎn)物質(zhì)生活本身?!薄?1】,馬克思、恩格斯的這種表述,表達(dá)了人存在于社會應(yīng)具有最基本的生存條件,而這些生存條件是由人們自己創(chuàng)造并生產(chǎn)物質(zhì)提供的,通過人們的這些活動,創(chuàng)造出衣食住等基本資料以滿足人類自身的需要,讓人類社會得以存續(xù),生存權(quán)是人類的第一等的人格權(quán)。隨著人對自身認(rèn)識的加深,人權(quán)的內(nèi)涵和外延也隨之發(fā)展,前聯(lián)合國教科文組織法律顧問瓦薩克認(rèn)為人權(quán)分為:自有權(quán)本位階段、生存權(quán)本位階段和發(fā)展權(quán)本位階段等三個階段,在滿足了人們生存權(quán)的同時,人們自然會去尋找向前發(fā)展的機會,人類的這種發(fā)展欲望同時激發(fā)了人本身的創(chuàng)造激情,既滿足人類自身發(fā)展欲望的又推動社會向前發(fā)展,同時這種生存和發(fā)展權(quán)的存在也積累社會財富、國家財富和個人財富,經(jīng)濟狀況的改善為人類在完善社會上層建筑的過程中提供了動力和原材料,達(dá)到了社會與人類共同發(fā)展的目的。
(三)對數(shù)據(jù)挖掘?qū)@婧馄降睦碚摶A(chǔ)分析
從上述法哲學(xué)和人格權(quán)的相關(guān)理論論述可以知道,人類在發(fā)展過程中,應(yīng)該既維護作為個體的人的生存權(quán)益,但是不能以個體的權(quán)益阻礙社會或集體的權(quán)益;個體也不能以維護個體權(quán)益為由,任意擴大自身享有的權(quán)益范圍,從而損害公共利益,只有群體和個體權(quán)益一致,才能和諧發(fā)展。社會制度是人類為實施管理,調(diào)和個體之間和個體與社會之間矛盾所設(shè)置的社會管理工具,而專利制度作為人類社會制度的組成部分,設(shè)置的目的是人類社會為維護對智力成果創(chuàng)造,對作出了勞動的個體的合法權(quán)益進行保護,這一制度的出發(fā)點與落腳點是保護專利權(quán)利人的個體利益,這與知識產(chǎn)權(quán)本質(zhì)上作為私權(quán)密不可分,而利益作為權(quán)利的核心,由權(quán)利爭議必然導(dǎo)致利益爭議,權(quán)利爭議也必然圍繞著利益爭議展開,個體利益與社會利益的沖突在專利被確立之日起就紛爭不斷。此時,調(diào)和專利領(lǐng)域的利益應(yīng)以同時關(guān)注個體利益和社會利益之間的衡平,在保護專利權(quán)利人的權(quán)益同時對社會使用專利的情形作出規(guī)定,并對特殊情況下使用專利進行制約,以求最大限度的保護專利權(quán)利人個體和社會之間的利益。專利始終是社會上的智力成果的表達(dá)形式,其被申請和授予的過程就已經(jīng)被烙上社會的印記,因而,在對專利進行保護的同時,應(yīng)注重專利社會性的內(nèi)涵和社會功能的發(fā)展,在隨著社會發(fā)展和人們認(rèn)識世界不斷深化,繼而在不斷拓寬可專利對象的同時,注重對專利應(yīng)具有的社會功能進行拓寬和深化,從公平和正義的角度賦予專利應(yīng)具有社會內(nèi)涵,從而在權(quán)利人實現(xiàn)其權(quán)利獲取利益的同時與他人損害之間達(dá)到衡平的度,這個度是隨著社會和公序良俗發(fā)展而發(fā)展,變化而變化的,只有衡平后,專利領(lǐng)域中社會公平和正義才能得以實施。
數(shù)據(jù)挖掘?qū)@鳛槟壳皩@I(lǐng)域中一種高科技專利,雖然其專利授予或使用有其特點,但是其權(quán)利的基礎(chǔ)是建立在社會對個體權(quán)利的確認(rèn)和保護基礎(chǔ)之上。社會出于社會財富公平分配和個體財富衡平的考慮,對個體在數(shù)據(jù)挖掘技術(shù)作出了創(chuàng)造性的勞動而得出的智力成果,以專利的形式賦予了數(shù)據(jù)挖掘技術(shù)的創(chuàng)造者享有一定的權(quán)利和利益,而數(shù)據(jù)挖掘?qū)@嗽谙碛泻托惺股鐣x予個體的權(quán)益時,并不能以此對抗社會公眾的權(quán)益,或不能以此為由阻礙他人使用數(shù)據(jù)挖掘?qū)@蛩碎_發(fā)有關(guān)數(shù)據(jù)挖掘新的技術(shù),對這些權(quán)利之間進行調(diào)和是社會公平正義的必然要求,也是社會功能的必然反映,故而對數(shù)據(jù)挖掘?qū)@孢M行衡平是目前專利制度的必然要求和內(nèi)容。
(一)數(shù)據(jù)挖掘?qū)@婧馄降脑瓌t
針對數(shù)據(jù)挖掘?qū)@鏇_突現(xiàn)狀,依據(jù)上述利益衡平的理論分析,在數(shù)據(jù)挖掘的關(guān)聯(lián)分析、異常分析、分類及演變分析中所涉及的各方利益主體進行分析,所得利益衡平的原則如下:專利利益的必要保護和適當(dāng)限制原則、公眾利益的適度分配原則、“避風(fēng)港規(guī)則”有限使用原則、知識發(fā)現(xiàn)的合理使用原則。
1.專利利益的必要保護和適當(dāng)限制原則
從維護社會進步和保護個體創(chuàng)造力的角度出發(fā),應(yīng)該對從事了智力活動的個體所做出的勞動賦予必要的利益,因而數(shù)據(jù)挖掘?qū)@丝梢砸驅(qū)@夹g(shù)而獲取相應(yīng)利益,這種獲取利益被社會認(rèn)可并保護也是社會公平正義的必然要求,鑒于數(shù)據(jù)挖掘?qū)@鶐淼睦婕扔幸蚴谟鑼@褂脵?quán)而獲取的專利權(quán),也有在數(shù)據(jù)處理過程中因知識發(fā)現(xiàn)而派生出來的利益,為防止數(shù)據(jù)挖掘?qū)@艘驅(qū)@黄渌麄€體擅自使用而受到利益損失,有必要對專利權(quán)利人的利益進行必要保護;也為防止專利權(quán)利人借專利權(quán)的保護而對其他個體使用專利設(shè)置過高的使用費,或限制專利人在知識發(fā)現(xiàn)后獲取過多的利益,有必要對專利權(quán)利人借專利獲取的利益進行必要的限制。
2.公眾利益的適度分配原則
在數(shù)據(jù)挖掘技術(shù)創(chuàng)造社會收益過程中,為社會創(chuàng)造收益的并不僅僅是數(shù)據(jù)挖掘?qū)@环?,還有社會資源或已有數(shù)據(jù)庫的另一方亦在此過程中發(fā)揮了作用,并且數(shù)據(jù)挖掘?qū)@@取的利益是從社會收益的一部分,也是社會財富進行再分配的一部分,數(shù)據(jù)挖掘?qū)@膬r值體現(xiàn)在為社會創(chuàng)造財富的過程中。因而對因數(shù)據(jù)挖掘所獲取的利益就不能被專利人一方獨自享有,而是需要對公眾提供的社會資源或提供數(shù)據(jù)庫方在利益創(chuàng)造過程中的作用予以適當(dāng)考量,有必要建立與公眾利益的適度分配相適應(yīng),并賦予相關(guān)方以適當(dāng)?shù)睦嬖瓌t,以符合公平正義的要求。
3.“避風(fēng)港規(guī)則”有限使用原則
“避風(fēng)港規(guī)則”最先在美國提出,“初衷主要有以下兩個方面:第一,建立一種激勵機制,激勵網(wǎng)絡(luò)服務(wù)商與權(quán)利人密切合作,以便于有效地制止網(wǎng)絡(luò)侵權(quán)行為的蔓延;第二,明確網(wǎng)絡(luò)服務(wù)商可能的版權(quán)侵權(quán)責(zé)任,使得網(wǎng)絡(luò)服務(wù)商可以在準(zhǔn)確預(yù)測法律風(fēng)險的情況下,正常經(jīng)營和發(fā)展網(wǎng)絡(luò)信息產(chǎn)業(yè)?!薄?2】,由于數(shù)據(jù)挖掘本質(zhì)是對數(shù)據(jù)進行處理的技術(shù),數(shù)據(jù)挖掘?qū)@麢?quán)人為規(guī)避因?qū)W(wǎng)絡(luò)數(shù)據(jù)進行處理而導(dǎo)致侵權(quán),擴大數(shù)據(jù)挖掘?qū)@膽?yīng)用范圍,從而收取更多的專利費,并主張適用“避風(fēng)港規(guī)則”,這不利于保護原始數(shù)據(jù)提供者和社會資源,因此有必要設(shè)立“避風(fēng)港規(guī)則”有限使用原則,從而衡平專利人、原始數(shù)據(jù)提供者或社會公眾的利益。
4.知識發(fā)現(xiàn)的合理使用原則
數(shù)據(jù)挖掘?qū)@菑臄?shù)據(jù)庫中通過技術(shù)獲取有益知識的過程,知識的發(fā)現(xiàn)依賴于已有數(shù)據(jù)和數(shù)據(jù)挖掘?qū)@募夹g(shù)手段,發(fā)現(xiàn)的知識一經(jīng)獲取即具有了社會資源的自然屬性,對于這部分知識,數(shù)據(jù)挖掘?qū)@嗽谫x予用戶使用專利時,一般會對其使用范圍和歸屬作出約定,通常而言,對大型或特大型商場的數(shù)據(jù)挖掘獲取的關(guān)聯(lián)數(shù)據(jù)的知識會被商場以商業(yè)秘密而言予以保密,但是這部分知識中蘊含的信息不僅僅涉及到商場自身的經(jīng)營,還涉及到社會整體經(jīng)濟運行,故而對于這部分知識的使用,應(yīng)在考慮社會整體運行有序和社會利益的前提下,建立知識發(fā)現(xiàn)的合理使用原則。
(二)數(shù)據(jù)挖掘?qū)@婧馄降哪J?/p>
1.設(shè)立基于分配正義的利益分配和補償機制
自從分配正義被亞里斯多德提出來后,因其對社會財富、榮譽、權(quán)利等有價值的東西的分配方式符合社會對公平正義的要求而受到推崇,并被貫徹到各種以社會公平正義為目的而制定的社會制度中。由于“分配正義核心是利益的分配”【13】,故對本文探討的數(shù)據(jù)挖掘?qū)@睦娣峙湟鄳?yīng)遵循以分配正義為基礎(chǔ)的利益分配和補償機制,專利人之間利益分配應(yīng)遵循同樣方式對待,對于專利人和使用者之間利益分配在考慮不同方面因素基礎(chǔ)上不同方式對待。鑒于數(shù)據(jù)挖掘?qū)@鶐淼睦娌⒉粌H僅是專利本身的利益,還包括因使用數(shù)據(jù)挖掘?qū)@l(fā)現(xiàn)有益知識而帶來的利益,對于數(shù)據(jù)挖掘?qū)@麢?quán)人和專利的使用者而言,這兩部分的利益并不僅僅存在專利的授權(quán)使用費中,還存在于對發(fā)現(xiàn)知識的使用利益的分享上,故對于這部分利益的分配和補償,應(yīng)以限制專利權(quán)人利用其優(yōu)勢地位而獲取過多利益為基礎(chǔ),在對專利權(quán)人獲取專利使用費的內(nèi)涵和繳付方式上進行規(guī)制,對使用者利用數(shù)據(jù)挖掘?qū)@@取的有益知識對使用者帶來的收益為考慮對象,對專利使用協(xié)議中關(guān)于利益分享條文進行適當(dāng)?shù)暮馄?,從而達(dá)到既維護專利權(quán)人利益又對使用的利益進行保護的目的。對于不同的專利權(quán)人而言,開發(fā)者利用不同的算法和不同的數(shù)據(jù)處理方式,開發(fā)出了不同的數(shù)據(jù)挖掘技術(shù),并申請了不同的專利。但是每賦予開發(fā)者一項專利,都會在無形中阻礙其他開發(fā)者利用原專利或在原有專利基礎(chǔ)上開發(fā)更加完善的數(shù)據(jù)挖掘?qū)@?,雖然在計算機技術(shù)中可以利用強制授權(quán)使用方式利用原有的專利,但是這并不利于其他開發(fā)者開發(fā)出新的技術(shù),因而“數(shù)據(jù)挖掘?qū)@呱形赐耆蔀殚_放源代碼”【14】的擁護者和實行者前,需要根據(jù)數(shù)據(jù)挖掘技術(shù)特點,對利用同一算法或同一分析技術(shù)的開發(fā)者之間的利益,在考慮利益貢獻(xiàn)度的基礎(chǔ)上進行彈性分配,根據(jù)后一開發(fā)者利用前一專利權(quán)人專利的程度,適當(dāng)將后一專利人獲取利益向前一專利人予以彈性分配,從而便捷的衡平前后專利人的利益,為開發(fā)者開發(fā)出新的數(shù)據(jù)挖掘?qū)@麆?chuàng)造新的條件,促進數(shù)據(jù)挖掘技術(shù)更快發(fā)展。
2.調(diào)整數(shù)據(jù)挖掘?qū)@姹Wo對象
自1975年以后,美國以判例的形式推動了專利保護軟件知識產(chǎn)權(quán)活動的開展,如“1978年Freeman案件”【15】和“1981年Diamond vs Dieh案件(450U. S.175(1981)”【16】,“ 1992年In re Alappat案件”【17】,均是運用專利法保護軟件知識產(chǎn)權(quán)的典型案例,美國還逐漸在相關(guān)的知識產(chǎn)權(quán)法律體系中完善利用專利保護計算機軟件和硬件的規(guī)定;在美國的帶動下,各國紛紛利用專利對計算機硬件和軟件進行保護。在數(shù)據(jù)挖掘技術(shù)提出以后申報專利過程中,對于數(shù)據(jù)挖掘?qū)@Wo對象大多維護在現(xiàn)有軟件專利保護范圍之內(nèi),但是這種保護并不能保護利用算法而得出有益知識的這一過程中的所體現(xiàn)的所有智力活動,特別是對建立數(shù)據(jù)挖掘的基礎(chǔ)—算法的構(gòu)思者或開發(fā)者。有鑒于此,有必要對現(xiàn)有數(shù)據(jù)挖掘?qū)@姹Wo對象進行調(diào)整,主要是補充對數(shù)據(jù)挖掘中特殊算法開發(fā)者的利益保護,“在運用程序語言規(guī)則進行模式設(shè)計的過程中,算法是運用最多的軟件構(gòu)思方式”【18】。“算法是對特定問題求解步驟的一種描述,是為了解決一個或一類問題而給出的一個確定的、有限的操作序列”【19】,“一個算法通常由若干個邏輯步驟組成,而計算機中的算法就是把指令或語句組合成程序以處理特定數(shù)據(jù)的方法,屬于計算機程序的設(shè)計構(gòu)思”【20】,但按照專利法的規(guī)定,專利法只保護運用規(guī)律外在表達(dá),對于規(guī)律是不予保護的,算法作為程序的設(shè)計構(gòu)思即是軟件的設(shè)計的內(nèi)在規(guī)律,不能作為專利的保護對象,故算法是不在目前的專利保護范圍內(nèi),但對于數(shù)據(jù)挖掘?qū)@?,算法?gòu)成了數(shù)據(jù)挖掘?qū)@幕A(chǔ),如果不對算法進行保護僅保護利用算法得出的數(shù)據(jù)挖掘技術(shù)的利益,這會在一定程度上將算法構(gòu)思者的智力成果權(quán)和利益轉(zhuǎn)移到利用算法得出數(shù)據(jù)挖掘技術(shù)的開發(fā)者手中,不符合利益衡平的要求,故建議在目前數(shù)據(jù)挖掘?qū)@姹Wo中考慮算法開發(fā)者的利益,并適當(dāng)進行利益分配,以衡平其中的利益沖突。
3.控制數(shù)據(jù)挖掘?qū)@褂脵?quán)限和范圍
數(shù)據(jù)挖掘?qū)@饕菍?shù)據(jù)進行處理的計算機技術(shù),專利權(quán)人在授權(quán)使用書中對使用者的使用行為作出約定將專利授予給使用者使用后,通常并不在實際上對使用者的使用行為進行約束。但是鑒于數(shù)據(jù)挖掘技術(shù)的強大數(shù)據(jù)處理能力和網(wǎng)絡(luò)廣泛化使用,使用者在使用數(shù)據(jù)挖掘?qū)@杏锌赡軐?dǎo)致侵權(quán)現(xiàn)象發(fā)生,即便是專利權(quán)人采用在線提供數(shù)據(jù)挖掘?qū)@绞交蚓W(wǎng)絡(luò)服務(wù)平臺方式提供服務(wù),在專利授權(quán)書中盡可能的對使用者的使用行為進行約束,并在事后通過適用“避風(fēng)港規(guī)則”以規(guī)避自身的責(zé)任。但是在目前各國對侵權(quán)行為認(rèn)定的技術(shù)手段角度出發(fā),專利權(quán)人的責(zé)任不能完全被免除,即便在事后專利權(quán)人在對被侵權(quán)人賠償后并對實際使用者進行追責(zé)以彌補自身的損失,專利權(quán)人在此過程中自身利益也會受到一定損害。為避免這種情況發(fā)生,衡平使用數(shù)據(jù)挖掘?qū)@麑?dǎo)致侵權(quán)時專利權(quán)人和使用者之間的利益沖突,建議對數(shù)據(jù)挖掘?qū)@氖褂脵?quán)限和范圍通過一定的計算機規(guī)范或規(guī)則限定下來,并將這種限定在數(shù)據(jù)挖掘的專利中以一定的用戶使用權(quán)限和觸發(fā)器權(quán)限6.觸發(fā)器(trigger)是個特殊的存儲過程,它的執(zhí)行不是由程序調(diào)用,也不是手工啟動,而是由事件來觸發(fā),比如當(dāng)對一個表進行操作(insert,delete, update)時就會激活它執(zhí)行。觸發(fā)器經(jīng)常用于加強數(shù)據(jù)的完整性約束和業(yè)務(wù)規(guī)則等。詳見姚志偉:《基于C/S模式的使用權(quán)限管理系統(tǒng)的設(shè)計與實現(xiàn)》,電子科技大學(xué)碩士學(xué)位論文。管理條件等技術(shù)手段實施,同時在數(shù)據(jù)挖掘?qū)@麢?quán)人之間建立相應(yīng)的侵權(quán)損害基金;當(dāng)用戶在無過錯情況下觸發(fā)這些限制而導(dǎo)致的損害建議在衡平機制中由雙方共同負(fù)擔(dān),當(dāng)用戶在有意情況下觸發(fā)這些限制由用戶承擔(dān)損失,即便是用戶無法查找或用戶無力承擔(dān)損失賠償,由侵權(quán)損害基金負(fù)責(zé)按比例賠償,以求最大限度的維護專利權(quán)人和他人的利益不受損害。
4.確立政府對利益分配的有限管理
在社會分配的三種層次之中,處于第一層次由市場對社會財富等進行分配是社會分配的主要方式,處于第二層次的政府調(diào)控分配方式和處于第三層次的社會調(diào)控分配方式是市場分配方式的補充。由于數(shù)據(jù)挖掘?qū)@且环N專用權(quán),需要由政府相關(guān)機構(gòu)進行認(rèn)定并賦予專用權(quán),并對數(shù)據(jù)挖掘?qū)@麑嵤┣闆r進行管理,故政府在數(shù)據(jù)挖掘?qū)@械臋?quán)限比較大,為維護數(shù)據(jù)挖掘涉及各方的利益,建議對政府在對高科技專利管理過程中的權(quán)限根據(jù)技術(shù)特點進行限定,弱化政府對專利實施過程中利益的影響,擴大市場對數(shù)據(jù)挖掘?qū)@龑?dǎo)作用,并將利益分配方式交由市場完成,政府僅僅在此過程中起到游戲規(guī)則的制定者和裁判者的角色,以此來促進專利市場化的利益配置作用,從而更好的衡平數(shù)據(jù)挖掘?qū)@睦?,促進數(shù)據(jù)挖掘技術(shù)發(fā)展。
【1】朱珠.基于Hadoop的海量數(shù)據(jù)處理模型研究和應(yīng)用【D】.北京:北京郵電大學(xué),2007.
【2】Yang M.,Sun Z.H.,Ji G.L.Fast mining of global f requent Itemsets.Journal of Computer of Research and evelopment【M】.2003,40(4):620-625。
【3】Iayyad U.M.,Shapiro G.P.Advances in Knowledge Discovery and Data Mining【M】.California:AAA/MIT Press,1996。
【4】張誠,郭毅.數(shù)據(jù)挖掘與云計算—專訪中國科學(xué)院計算機技術(shù)研究所何清博士【J】.數(shù)字通信,2011,3:33-34.
【5】吳漢東.知識產(chǎn)權(quán)法【M】.北京:北京大學(xué)出版社,2007:120-121.
【6】鄔春學(xué),余鎮(zhèn)危.NCS中數(shù)據(jù)傳輸丟包與控制方法【J】.微計算機信息,2005,20:43-44.
【7】吳蓮.基因?qū)@鏇_突及平衡的法理學(xué)思考【J】.法學(xué),2002,4:64-66.
【8】盧俊.社會契約論【M】.何兆武,譯.北京:商務(wù)印書館,1982:39.
【9】吳漢東.法哲學(xué)家對知識產(chǎn)權(quán)的哲學(xué)解讀【J】.法商研究,2003,5:29-32.
【10】【英】約翰·洛克,葉啟芳,翟菊農(nóng)譯.政府論【M】.北京:商務(wù)印書館,1983:36.
【11】【德】馬克思,恩格斯.馬克思恩格斯選集第一卷【M】.北京:人民出版社,1995:79.
【12】Copyright Law of the United States of America【C/OL】.§512.(c).(3)(B)and§512(d).(3). http://www.doc88.com/p-190102713010. html.
【13】陳毅君,曾恩全.分配正義:中國的理論與實踐【J】.經(jīng)濟與社會發(fā)展,2008,9:1-4。
【14】金梅.開放源代碼軟件協(xié)議的若干法律問題之探討【D】.武漢:華中科技大學(xué),2004.
【15】DIAMOND v. DIEHR, 450 U.S. 175 (1981) 【EB/OL】.【2012-09-15】 ht tp://caselaw.lp.f ind law.com/scripts/getcase. pl?court=US&vol=450&invol=175。
【16】中文詳細(xì)案情見張乃根.美國專利法判例選析【M】.北京:中國政法大學(xué)出版社,1995:58-65.英文見http://laws.find law.com/ us/450/175.html。
【17】In re Alappat 案,見袁建中.電腦軟件相關(guān)發(fā)明專利審查基準(zhǔn)【J】.資訊法務(wù)透析,1998,12:19-21.
【18】彭強.論軟件二次開發(fā)知識產(chǎn)權(quán)保護【D】.武漢:華中師范大學(xué),2009.
【19】彭波.數(shù)據(jù)結(jié)構(gòu)及算法【M】.北京:機械工業(yè)出版社,2008:9-10.
【20】馬治國,孫可舟.計算機軟件的專門立法保護研究【J】.法律科學(xué),1999,6(100):7-9.