黃益平(北京大學(xué)國(guó)家發(fā)展研究院副院長(zhǎng))
如果標(biāo)準(zhǔn)卡得太嚴(yán),大數(shù)據(jù)分析也就無(wú)從做起。
周小川提出用安全算法手段克服國(guó)際間數(shù)據(jù)難以完全自由流動(dòng)的矛盾,他的話可以理解為“數(shù)據(jù)不出境,但分析結(jié)果可以出境”。這個(gè)思路對(duì)我有很大的啟示。
當(dāng)前歐美國(guó)家正積極推動(dòng)國(guó)際數(shù)字貿(mào)易規(guī)則的制訂,提出了數(shù)據(jù)跨境自由流動(dòng)的主張,但這對(duì)包括中國(guó)在內(nèi)的其他一些國(guó)家來(lái)說(shuō)構(gòu)成了挑戰(zhàn)。如果基于國(guó)家安全等考慮做不到數(shù)據(jù)自由流動(dòng),就可能會(huì)對(duì)這些國(guó)家參與國(guó)際數(shù)字貿(mào)易形成制約。周小川的思路為化解這個(gè)矛盾提供了一個(gè)解決方案,就是用分析結(jié)果的流動(dòng)替代原始數(shù)據(jù)的流動(dòng)。
現(xiàn)實(shí)中大數(shù)據(jù)應(yīng)用的成功案例已經(jīng)非常多,包括產(chǎn)品的精準(zhǔn)營(yíng)銷、服務(wù)的個(gè)性化方案以及信用風(fēng)險(xiǎn)的有效評(píng)估等。大數(shù)據(jù)分析可以幫助提高經(jīng)濟(jì)效率,改善用戶體驗(yàn),擴(kuò)大經(jīng)營(yíng)規(guī)模,促進(jìn)經(jīng)濟(jì)與社會(huì)的創(chuàng)新與發(fā)展。大數(shù)據(jù)已經(jīng)成為當(dāng)前經(jīng)濟(jì)中十分重要的生產(chǎn)要素。
如果大數(shù)據(jù)可以共享,大數(shù)據(jù)分析的紅利就會(huì)更大??赡芫褪浅鲇谶@個(gè)考慮,最近幾年政府在一些領(lǐng)域推動(dòng)數(shù)據(jù)共享。設(shè)立幾家大數(shù)據(jù)征信公司的目的,應(yīng)該就是為了讓更多的商業(yè)銀行利用大數(shù)據(jù)信用風(fēng)險(xiǎn)評(píng)估的手段。不過(guò),作為特殊的生產(chǎn)要素,并非所有的大數(shù)據(jù)都是可以拿出來(lái)共享的。在這個(gè)前提下如何達(dá)成數(shù)據(jù)共享的效果,確實(shí)需要?jiǎng)?chuàng)新性的思考。
討論數(shù)據(jù)共享,首先要面對(duì)數(shù)據(jù)權(quán)屬的問(wèn)題,即數(shù)據(jù)歸誰(shuí)所有?傳統(tǒng)生產(chǎn)要素如資本和土地的有效利用都是基于一個(gè)前提,就是清晰地界定產(chǎn)權(quán)。但這個(gè)做法很難簡(jiǎn)單地套用到大數(shù)據(jù),直接的原因是一些大數(shù)據(jù)的權(quán)屬很難被清晰地界定。比如用戶在平臺(tái)上點(diǎn)外賣、看短視頻的數(shù)據(jù),既包含個(gè)人的一些信息,但同時(shí)也有平臺(tái)支持的線上活動(dòng)。顯然,在這個(gè)實(shí)例中,要在用戶和平臺(tái)之間劃清楚數(shù)據(jù)的所有權(quán)界線,難度非常大。一個(gè)合理的解決方案是涉及個(gè)人特性的數(shù)據(jù)歸個(gè)人所有,用戶在平臺(tái)上活動(dòng)留下的數(shù)字足跡可以歸個(gè)人和平臺(tái)共同擁有,與個(gè)人基本上沒(méi)有關(guān)系的數(shù)據(jù)則可以歸平臺(tái)所有。
在現(xiàn)實(shí)生活中,數(shù)據(jù)確權(quán)還面臨一個(gè)挑戰(zhàn),就是要在權(quán)益保護(hù)與使用效率之間取得一個(gè)平衡。中國(guó)和歐盟的實(shí)踐提供了兩個(gè)對(duì)應(yīng)的典型案例。過(guò)去中國(guó)缺乏有效的數(shù)據(jù)治理政策,既沒(méi)有確權(quán),保護(hù)也不足。這樣,一方面,利用大數(shù)據(jù)分析的創(chuàng)新活動(dòng)十分活躍,但另一方面,各種違規(guī)、違法的行為也十分普遍。因此,最近幾年政府采取了許多措施,加大數(shù)據(jù)保護(hù)的力度。歐盟在數(shù)據(jù)保護(hù)方面一直做得比較早、也比較好,美中不足是由于限制比較多,基于大數(shù)據(jù)分析的經(jīng)濟(jì)創(chuàng)新相對(duì)不活躍。
討論數(shù)據(jù)共享還要面對(duì)適合性的問(wèn)題,什么數(shù)據(jù)可以共享、什么數(shù)據(jù)不能共享?從原則上說(shuō),起碼有三類數(shù)據(jù)不能共享:個(gè)人隱私、商業(yè)機(jī)密、國(guó)家安全。個(gè)人的姓名、年齡、性別、教育水平、家庭住址、聯(lián)系方式等均屬于個(gè)人隱私,應(yīng)該明確歸屬于個(gè)人所有,當(dāng)然也不能輕易分享。業(yè)內(nèi)常見(jiàn)的做法是對(duì)行為與交易數(shù)據(jù)做脫敏處理,分析師無(wú)法追溯到具體的個(gè)人或者人群。就這些大的原則達(dá)成共識(shí)并不難,難的是在執(zhí)行過(guò)程中如何把握。以國(guó)家安全為例,如果范圍劃得寬泛一些,那也許可以認(rèn)定絕大部分?jǐn)?shù)據(jù)都有敏感性,即便像公眾打車、叫外賣甚至看短視頻這樣的數(shù)據(jù),也不排除能分析出一些人群行為方式的變化。所以,如何恰當(dāng)?shù)匕盐者@個(gè)度,同樣是一個(gè)極大的考驗(yàn)。如果標(biāo)準(zhǔn)設(shè)定得不夠嚴(yán)格,可能會(huì)造成不少隱患。但如果標(biāo)準(zhǔn)卡得太嚴(yán),大數(shù)據(jù)分析也就無(wú)從做起。