曾泓竣 曾千容
1.廣西大學商學院,廣西 南寧 530004;2.北海市海城區(qū)人民檢察院,廣西 北海 536000
網(wǎng)絡爬蟲,是一種用來自動挖掘互聯(lián)網(wǎng)信息的網(wǎng)絡機器人,其目的一般用于編纂網(wǎng)絡索引,也可以用于網(wǎng)絡搜索引擎等站點通過爬蟲軟件更新自身的網(wǎng)站內(nèi)容或其對其他網(wǎng)站的索引。網(wǎng)絡爬蟲始于一張被稱作種子的統(tǒng)一資源地址(URL)列表。爬蟲在執(zhí)行的過程中復制歸檔和保存網(wǎng)站上的信息,這些文件通常儲存,使他們可以較容易的被查看,閱讀和瀏覽他們存儲的網(wǎng)站上并即時更新的信息。
robots.txt是一種ASCII編碼的文本文件,通常存放于網(wǎng)頁服務器中,它將提示網(wǎng)絡爬蟲哪些網(wǎng)頁不應被抓取,哪些網(wǎng)頁可以抓取。但這只是一個約定俗成的規(guī)范,并不具有法律效力,并不能保證所有爬蟲都準守這一規(guī)則。
目前,我國對爬蟲技術還沒有專門的法律法規(guī)加以規(guī)定。在通常意義上,爬蟲技術只是更快速有效地收集互聯(lián)網(wǎng)中的內(nèi)容和信息,因此從技術中立的角度來看,爬蟲技術本身并沒有存在任何違反現(xiàn)有的法律法規(guī)之處。隨著大數(shù)據(jù)產(chǎn)業(yè)的快速發(fā)展,數(shù)據(jù)爬取隨著各網(wǎng)絡主體對資源的爭奪而越發(fā)激烈。數(shù)據(jù)爬取行為存在越來越多的問題和擔憂,爬蟲技術帶來的各種問題和顧慮日漸增加。
由于爬蟲的工作方式是通過解析代碼,為了規(guī)避網(wǎng)站經(jīng)營者設置的反爬蟲措施,爬蟲運營方有可能會采取偽裝行為。因此通過爬蟲,爬蟲控制者將有可能訪問和抓取到一般用戶無法接觸到的內(nèi)容。除了使用數(shù)據(jù)爬取技術獲取數(shù)據(jù)的自身風險外,爬蟲控制者還可能因獲取某些受法律保護的信息而面臨違法、違規(guī)甚至犯罪的風險。
互聯(lián)網(wǎng)中的很多數(shù)據(jù)都可能具備獨創(chuàng)性,例如文章、圖片、用戶評論等都存在構(gòu)成著作權(quán)法保護的可能性。對于網(wǎng)絡爬蟲的數(shù)據(jù)抓取行為是否涉嫌侵權(quán),主要存在下列情況:
就網(wǎng)絡訪問行為而言,由于爬蟲本身僅僅是對人類訪問行為的模仿,因此訪問行為不會構(gòu)成對人類訪問本身可以訪問的信息的侵權(quán)行為。但是,如果被數(shù)據(jù)抓取到的網(wǎng)站本身設置有一些技術措施,以確保只有特定的用戶才可以通過這些技術措施以訪問這些信息,但是爬蟲運營方突破了這些限制,則爬蟲運營方的訪問行為可能涉嫌破壞技術措施的侵權(quán)或違法違規(guī)行為。
就數(shù)據(jù)保存本身而論,根據(jù)著作權(quán)法的角度來闡述,數(shù)據(jù)抓取行為本質(zhì)上是對信息的復制,因此這些行為有可能構(gòu)成對著作權(quán)人的復制權(quán)的侵犯。當然,我國對臨時復制行為是持寬容的態(tài)度。但如果爬蟲控制者在自己的網(wǎng)站上獲取信息并公開傳播抓取到的信息,則可能進一步侵犯著作權(quán)人在互聯(lián)網(wǎng)上傳播信息的信息傳播權(quán)。
雖然在互聯(lián)網(wǎng)上的公開信息很難構(gòu)成商業(yè)秘密,但網(wǎng)絡上的某些信息只能由特定的用戶通過采取技術措施訪問。因此,網(wǎng)絡信息可能仍然具有商業(yè)秘密所要求的保密性和秘密性,可能構(gòu)成商業(yè)秘密。
根據(jù)《反不正當競爭法》第九條相關規(guī)定,以不正當手段獲取他人商業(yè)秘密的行為即構(gòu)成侵犯商業(yè)秘密。后續(xù)該等信息如被進一步加以利用,則構(gòu)成對他人商業(yè)秘密的披露和使用,同樣構(gòu)成對他人的商業(yè)秘密的侵犯。
因此,如果爬蟲控制者有意規(guī)避網(wǎng)站運營方為獲取信息,突破網(wǎng)站運營方設置的反爬蟲保護措施,保存甚至公開普通用戶無法訪問的網(wǎng)站內(nèi)容,從而構(gòu)成商業(yè)秘密的侵犯,爬蟲控制者的行為構(gòu)成侵犯他人的商業(yè)秘密。
如果爬蟲抓取的是UGC模式的網(wǎng)站上用戶發(fā)布的信息,并在爬蟲運營者自家的產(chǎn)品或者服務中提供這些內(nèi)容,則存在構(gòu)成不正當競爭的較大的風險。因為這些案件的涉及數(shù)據(jù)和內(nèi)容是構(gòu)成原告競爭力的主要來源。
如在D公司訴B公司不正當競爭案件等案件中,法院均認為被告未經(jīng)許可,擅自獲取和使用原告網(wǎng)站數(shù)據(jù)的行為影響了原網(wǎng)站的正常使用和獲利,攫取了他人的經(jīng)營成果,損害了互聯(lián)網(wǎng)的市場競爭秩序,構(gòu)成對原告產(chǎn)品的實質(zhì)性替代,構(gòu)成不正當競爭。
為規(guī)避使用爬蟲過程中產(chǎn)生相關知識產(chǎn)權(quán)侵權(quán)風險,爬蟲控制者使用爬蟲時應:1.不違反網(wǎng)站設置的robots協(xié)議;2.在爬蟲策略設置上,構(gòu)成版權(quán)保護的數(shù)據(jù),某些特定網(wǎng)站的用戶生成內(nèi)容不能隨意抓?。?.先審查所抓取的內(nèi)容,方能使用、傳播抓取到的相關數(shù)據(jù)。