謝瑋 宋杰
9月以來,大數(shù)據(jù)行業(yè)可謂風(fēng)聲鶴唳。
一時(shí)間,魔蝎數(shù)據(jù)、新顏科技、公信寶、快錢支付、天翼征信等公司先后傳來有人被警方帶走調(diào)查的消息。
這令處于大數(shù)據(jù)風(fēng)控服務(wù)核心的——爬蟲技術(shù)推上了風(fēng)口浪尖,大數(shù)據(jù)行業(yè)也迎來了前所未有的“震蕩”。消息稱,被調(diào)查或是因?yàn)檫@些公司利用網(wǎng)絡(luò)爬蟲技術(shù)侵犯?jìng)€(gè)人隱私數(shù)據(jù),這些隱私數(shù)據(jù)的泄露,加劇了暴力催收的泛濫,助長(zhǎng)了“套路貸”“高利貸”。
而港股上市公司51信用卡(02051.HK)被警方突擊調(diào)查的消息,則為這場(chǎng)風(fēng)波炸響了一聲“驚雷”。10月21日晚,杭州公安通報(bào)稱,51信用卡被突擊調(diào)查原因在于,今年9月以來,其委托的外包催收公司冒充國(guó)家機(jī)關(guān),采取恐嚇、滋擾等軟暴力手段催收債務(wù),涉嫌尋釁滋事。
目前,已經(jīng)有多家大數(shù)據(jù)風(fēng)控平臺(tái)暫停部分服務(wù)。大數(shù)據(jù)行業(yè)似乎進(jìn)入了一個(gè)前所未有的“整頓期”。
在近年互聯(lián)網(wǎng)金融大潮中,大數(shù)據(jù)風(fēng)控供應(yīng)商一直扮演著重要角色。爬蟲技術(shù)也是大數(shù)據(jù)風(fēng)控行業(yè)的主打產(chǎn)品?!芭老x”怎么成了“害蟲”?在互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)整治不斷深化的大背景下,大數(shù)據(jù)風(fēng)控行業(yè)又將何去何從?
網(wǎng)絡(luò)爬蟲也叫網(wǎng)絡(luò)蜘蛛(spider),是一種自動(dòng)瀏覽網(wǎng)絡(luò)的計(jì)算機(jī)技術(shù),能夠自動(dòng)化、高效率地檢索互聯(lián)網(wǎng)并抓取數(shù)據(jù)。爬蟲技術(shù)也是搜索引擎技術(shù)的核心元素之一,經(jīng)歷了20多年的發(fā)展,已經(jīng)日趨多樣化,在搜索引擎、數(shù)據(jù)分析、人工智能等領(lǐng)域得到了廣泛應(yīng)用。
此次風(fēng)波中的公司大多是國(guó)內(nèi)較早從事大數(shù)據(jù)風(fēng)控的服務(wù)商,主要為銀行、保險(xiǎn)、消費(fèi)金融公司、貸款機(jī)構(gòu)等提供風(fēng)控技術(shù)解決方案,而其中就包括了爬蟲服務(wù)或者基于爬蟲技術(shù)而形成的產(chǎn)品。
知名大數(shù)據(jù)風(fēng)控平臺(tái)同盾科技卷入了此次風(fēng)波。其旗下子公司信川科技的數(shù)聚魔盒業(yè)務(wù)已經(jīng)停止。公開信息顯示,數(shù)聚魔盒主要涉及數(shù)據(jù)采集流程,支持爬取數(shù)據(jù)用作信用評(píng)估。
“信川科技是同盾科技下屬獨(dú)立運(yùn)營(yíng)的子公司,旗下的數(shù)聚魔盒業(yè)務(wù)已經(jīng)停止?!蓖芸萍枷嚓P(guān)負(fù)責(zé)人向《中國(guó)經(jīng)濟(jì)周刊》記者介紹,數(shù)聚魔盒業(yè)務(wù)本身對(duì)適用條件與場(chǎng)景有嚴(yán)格的授權(quán)要求與限制,為更加嚴(yán)格地保護(hù)用戶合法權(quán)益,并積極響應(yīng)國(guó)家關(guān)于個(gè)人信息保護(hù)的相關(guān)政策,去年公司已經(jīng)開始主動(dòng)收縮該業(yè)務(wù),今年上半年已完全停止。
而背靠中國(guó)電信的天翼征信也傳來被調(diào)查的消息。有媒體報(bào)道稱,9月12日上午,天翼征信總經(jīng)理、副經(jīng)理以下及市場(chǎng)人員,共計(jì)十余人被警察帶走。
天翼征信相關(guān)負(fù)責(zé)人對(duì)《中國(guó)經(jīng)濟(jì)周刊》記者表示,“我們現(xiàn)在一切都正常,沒有什么太大問題。未來可能將對(duì)客戶進(jìn)行篩選。我們業(yè)務(wù)都是合規(guī)的,至于行業(yè)里的傳聞也不太好評(píng)價(jià)。而關(guān)于有無(wú)人員被帶走調(diào)查,對(duì)外不做任何回復(fù)。”
爬蟲作為一種計(jì)算機(jī)技術(shù)具有中立性,在法律上也從未被禁止,為什么這些公司會(huì)因?yàn)榕老x技術(shù)而被調(diào)查?
插圖:《中國(guó)經(jīng)濟(jì)周刊》美編 劉屹鈁
問題的關(guān)鍵在于爬取的行為和爬取獲得的數(shù)據(jù)是否觸及監(jiān)管紅線——是否經(jīng)過授權(quán)?是否過度爬取數(shù)據(jù)?獲取了哪些數(shù)據(jù)?是否為獲取數(shù)據(jù)破壞被爬服務(wù)器的防護(hù)措施?
前述同盾科技負(fù)責(zé)人直言,“爬蟲其實(shí)是一個(gè)中立的技術(shù),但現(xiàn)在可能會(huì)有灰色地帶存在?!?h3>“爬蟲”的野蠻生長(zhǎng)
在近年來的互聯(lián)網(wǎng)金融大潮中,大數(shù)據(jù)風(fēng)控服務(wù)商扮演著重要角色。
隨著互聯(lián)網(wǎng)金融興起,非銀行金融機(jī)構(gòu)如P2P、小貸公司、消費(fèi)金融公司等都試圖掘金傳統(tǒng)征信數(shù)據(jù)缺失人群。而伴隨用戶金融行為進(jìn)一步線上化,還產(chǎn)生了除工商財(cái)稅、水電煤繳費(fèi)之外的信息,如支付和交易信息、社交大數(shù)據(jù)信息等等,成為判斷用戶信用水平的重要數(shù)據(jù)類型。
然而,對(duì)于這些機(jī)構(gòu)而言,自身搭建完整的風(fēng)控系統(tǒng)成本動(dòng)輒高達(dá)數(shù)千萬(wàn)。在此背景下,服務(wù)金融機(jī)構(gòu)以及類金融機(jī)構(gòu)的第三方大數(shù)據(jù)風(fēng)控公司應(yīng)運(yùn)而生。
從這些大數(shù)據(jù)風(fēng)控企業(yè)的合作體量,就可以看出市場(chǎng)需求的旺盛。公開信息顯示,魔蝎科技已與國(guó)內(nèi)銀行、保險(xiǎn)機(jī)構(gòu)、消費(fèi)金融、互聯(lián)網(wǎng)金融等超過2000家客戶合作。新顏科技合作機(jī)構(gòu)2500家以上;數(shù)聚魔盒在2019年3月份下線前,合作企業(yè)超過10000家。
隨著行業(yè)的“野蠻生長(zhǎng)”,競(jìng)爭(zhēng)日益激烈,一些變異的爬蟲產(chǎn)品也隨之出現(xiàn),涉及竊取、泄露、濫用用戶數(shù)據(jù)等。
有業(yè)內(nèi)人士向《中國(guó)經(jīng)濟(jì)周刊》記者介紹,一些大數(shù)據(jù)風(fēng)控服務(wù)商為了獲取海量數(shù)據(jù),許多非授權(quán)隱私數(shù)據(jù)也會(huì)成為爬蟲的目標(biāo),甚至用戶手機(jī)里的通訊錄、通訊記錄、電商交易數(shù)據(jù)、外賣交易記錄等等,要是被盯上,“基本上你就沒什么秘密了”。
而有些爬蟲技術(shù)則采用“多線程爬取”,從而導(dǎo)致網(wǎng)站癱瘓或不能訪問,這也是大多數(shù)網(wǎng)絡(luò)攻擊所使用的方法之一。
“去年就一直存在個(gè)人隱私信息不斷被泄露,部分金融公司通過各種數(shù)據(jù)源對(duì)用戶數(shù)據(jù)進(jìn)行打包出售再加工,嚴(yán)重涉及到公民隱私及數(shù)據(jù)安全的問題?!庇袠I(yè)內(nèi)人士對(duì)《中國(guó)經(jīng)濟(jì)周刊》記者表示,有的金融公司通過各種數(shù)據(jù)源對(duì)用戶數(shù)據(jù)進(jìn)行打包出售再加工,嚴(yán)重涉及公民隱私及數(shù)據(jù)安全問題。去年問題爆發(fā)得很明顯,主要集中在消費(fèi)金融和現(xiàn)金貸兩大業(yè)務(wù)板塊。
部分拓展在線零售業(yè)務(wù)的中小城商行、農(nóng)商行,也會(huì)選擇與第三方大數(shù)據(jù)風(fēng)控公司合作,進(jìn)行數(shù)據(jù)交叉驗(yàn)證、豐富風(fēng)控維度。
在上述業(yè)內(nèi)人士看來,大量第三方數(shù)據(jù)公司為了獲得銀行業(yè)務(wù),會(huì)提供大量不同的數(shù)據(jù)源,很多數(shù)據(jù)是“非脫敏”數(shù)據(jù),“銀行業(yè)是一個(gè)國(guó)家的經(jīng)濟(jì)命脈, 這些數(shù)據(jù)提供給銀行就會(huì)涉及到金融安全問題?!?/p>
“即便客戶允許你抓取,也是在這一次審批當(dāng)中可以用,你把這些數(shù)據(jù)留存用于其他場(chǎng)景肯定是不對(duì)的?!币晃徊辉竿嘎缎彰臉I(yè)內(nèi)人士對(duì)《中國(guó)經(jīng)濟(jì)周刊》記者分析,從對(duì)個(gè)人信息保護(hù)的嚴(yán)格意義上講,這些數(shù)據(jù)應(yīng)當(dāng)全部銷毀。而部分爬蟲公司并不銷毀歷史上抓取的數(shù)據(jù),同時(shí)還提供給其他客戶、其他場(chǎng)景使用。
這位業(yè)內(nèi)人士舉例稱,還有一類公司會(huì)采用特殊手段規(guī)避法律風(fēng)險(xiǎn),“比如:用戶上傳身份證號(hào)碼,征信公司直接顯示用戶每個(gè)月納稅金額,這肯定觸犯法律。但他們會(huì)規(guī)避掉法律風(fēng)險(xiǎn),用數(shù)據(jù)標(biāo)簽給用戶的納稅金額打分,比如繳稅1萬(wàn)元的人就是5分,1萬(wàn)元以下的就是3分?!?h3>劍指爬蟲,意在數(shù)據(jù)
隨著強(qiáng)監(jiān)管信號(hào)的不斷釋放,“野蠻生長(zhǎng)”的大數(shù)據(jù)爬蟲時(shí)代或?qū)⒔Y(jié)束。在不少業(yè)內(nèi)人士看來,本次整頓也是一個(gè)行業(yè)凈化、洗牌的過程,有利于整個(gè)行業(yè)更加健康、規(guī)范發(fā)展。
今年5月28日,國(guó)家互聯(lián)網(wǎng)信息辦公室發(fā)布了《數(shù)據(jù)安全管理辦法(征求意見稿)》 (下稱“《管理辦法》”),用部門立法的方式對(duì)互聯(lián)網(wǎng)數(shù)據(jù)收集、數(shù)據(jù)處理使用,都做了明確的界定。
《管理辦法》第十六條規(guī)定,“網(wǎng)絡(luò)運(yùn)營(yíng)者采取自動(dòng)化手段訪問收集網(wǎng)站數(shù)據(jù),不得妨礙網(wǎng)站正常運(yùn)行;此類行為嚴(yán)重影響網(wǎng)站運(yùn)行,如自動(dòng)化訪問收集流量超過網(wǎng)站日均流量三分之一,網(wǎng)站要求停止自動(dòng)化訪問收集時(shí),應(yīng)當(dāng)停止。”
在北京大成律師事務(wù)所執(zhí)業(yè)律師、北京網(wǎng)貸協(xié)會(huì)法律顧問肖颯看來,沒有授權(quán)的爬蟲就一定是違法的,需要重點(diǎn)整治?,F(xiàn)在的關(guān)鍵是如何面對(duì)這些看似“合法”的爬蟲,重中之重就是運(yùn)營(yíng)商做到用戶授權(quán)鏈的完整,明晰完整的授權(quán)鏈,做到源頭控制??偟膩碚f,應(yīng)當(dāng)盡快制定完善針對(duì)網(wǎng)絡(luò)爬蟲的數(shù)據(jù)安全法律法規(guī),將網(wǎng)絡(luò)爬蟲引向合法軌道。若是違法進(jìn)行網(wǎng)絡(luò)爬蟲,就要重拳出擊,加大懲罰力度和偵查力度,涉及刑事犯罪的要重點(diǎn)處理。
然而,過去一個(gè)多月的行業(yè)“震蕩”昭示著,針對(duì)大數(shù)據(jù)風(fēng)控行業(yè)的強(qiáng)監(jiān)管才剛剛開始。
10月24日,有報(bào)道稱,央行日前發(fā)文緊急調(diào)研銀行與第三方數(shù)據(jù)公司合作情況。其中,銀行需排查的內(nèi)容主要涉及數(shù)據(jù)采集、信用欺詐、信用評(píng)分、風(fēng)控建模等方面。央行還要求各企業(yè)征信機(jī)構(gòu)排查自身業(yè)務(wù)中是否存在違規(guī)爬蟲行為。央行表示,如存在上述情況,請(qǐng)立即上報(bào),對(duì)于存在違規(guī)爬蟲業(yè)務(wù)的要立即整改。如不存在上述情況的,請(qǐng)出具加蓋公章的書面承諾函,并于10月24日前送至央行征信管理處。
責(zé)編:陳棟棟 chendongdong@ceweekly.cn
編審:張偉
美編:黃河浪