蔣潔
摘 要:立足廣域共享信息資源池和聚匯機器學習算法的實時且廉價的可視化數(shù)據(jù)探勘在充分展現(xiàn)出深度發(fā)掘數(shù)據(jù)資產價值剩余、創(chuàng)新優(yōu)化公共服務能力、有序增進社交福祉等強勁實力的同時,逐漸暴露出直觀探勘干擾自由表達、智數(shù)決策破壞平等格局、數(shù)據(jù)鴻溝擾亂競爭秩序等嚴重背離基本人權與經濟目標的道德風險。亟待在弘揚超越異質群體不同訴求的共在、共生、共享、共榮之共同道德精神的基礎上,全面執(zhí)行安全、自主、適應性和利益協(xié)調等具體道德規(guī)訓。
關鍵詞:大數(shù)據(jù);復雜數(shù)據(jù)探勘;道德風險;共同道德精神;道德規(guī)訓
中圖分類號: G203 文獻標識碼: A DOI:10.11968/tsyqb.1003-6938.2016114
Abstract When the real-time, low-priced, and visual data are discovered through sharing information resource pool over the wide area, converging machine learning algorithms efficiently reveals powerful strengths like deep mining of the surplus value of data assets, and innovation and improvement of public service capacity makes ordered enhancement of social well-being possible, moral hazards which seriously deviate basic human rights and economic goals are gradually exposed, for instance, intuitive mining interferes free expression, intellectual data decision-making breaks equal structure, and digital divide disturbs competition orders. The solutions to these burning problems lies in the promotion of common moral spirits which is symbiotic, co-existing, shared and co-prosperous to advance the different demand of heterogeneous group. Specific moral disciplines like safety, independence, adaptation, coordination of interests ought to be fully implemented, in order to help the leap development of singularity era.
Key words big data; multiple data discovery; moral hazards; common moral spirits; moral disciplines
1 引言
IT4.0時代,海量數(shù)據(jù)與創(chuàng)新技術逐漸構成人類生存的整體環(huán)境背景,同時,隨著具有語義特征的智數(shù)基礎設施、并發(fā)采集工具、分布式存儲集群及計算能力的指數(shù)級攀升,旨在促使數(shù)據(jù)清洗、數(shù)據(jù)整合、數(shù)據(jù)選擇、數(shù)據(jù)流轉、數(shù)據(jù)挖掘、型式評價等流程日漸澄明,而及時且直觀的復雜數(shù)據(jù)探勘通過深入揭露事物本質特征和內在規(guī)律,改善人類族群的思維邏輯與行為模式,助力數(shù)據(jù)引領的爆發(fā)式經濟增長迅速走出混沌無序的狀態(tài),驅動著整個社會的多棲化自由發(fā)展。復雜數(shù)據(jù)探勘不僅可以筑造出可供任意需求者(如政府部門、企事業(yè)單位、其他組織和強勢個人)自主挖掘海量數(shù)據(jù)的簡便通路,亦在一定程度上加深了這些探勘主體與原初數(shù)據(jù)權利人之間資源占有和技術認知的巨大鴻溝。面對數(shù)字經濟的歷史性機遇,缺乏法律規(guī)制、政策調控、輿論干預與信念影響的惡意探勘者通過輸入巨量冗余數(shù)據(jù)、搭建錯漏頻現(xiàn)的集成模型、超界域深度挖掘敏感關聯(lián)、悄然獨占數(shù)據(jù)資產價值增幅以及篡改探勘結果等牟取短線暴利,頻頻引發(fā)了評估失真與預測偏差,甚至動搖了多元利益群體之間脆弱的動態(tài)平衡。
人類活動的價值基礎和生命意義的判斷標尺是道德良善。以道德敗壞為代價的技術勝利只能使得個人愈益成為別人的奴隸或自身卑劣行為的奴隸[1]。充分發(fā)揮復雜數(shù)據(jù)探勘推動不同產業(yè)融合創(chuàng)新、助力供給側結構性改革等正向效應亟待建立以公正、平等、效率、互利等為核心的道德規(guī)訓機制,全局閉環(huán)導控直觀可視的海量數(shù)據(jù)存儲、流轉與分析過程,有序平衡政治、社會和精神力量,聯(lián)動增進全人類福祉。
2 復雜數(shù)據(jù)探勘概述及分析
復雜數(shù)據(jù)探勘(Multiple Data Discovery)特指大數(shù)據(jù)時代基于人工智能技術開發(fā)的創(chuàng)新型數(shù)據(jù)處理平臺中技術實力薄弱的泛在探勘主體自助采集、傳輸與分析海量數(shù)據(jù)的直觀流程,具有廉價、簡單(無需編碼)、實時(數(shù)分鐘內完成建模并隨數(shù)據(jù)更新自動運轉)、直觀(可視化透明處理)等特征[2]。如多摩平臺(Domo)從廣大探勘主體正在使用的多元數(shù)據(jù)資源池中直接調用零散信息并以可視化方式實時展現(xiàn)濃縮和提煉的挖掘結果[3]。
復雜數(shù)據(jù)探勘大幅降低深度挖掘的準入門檻,有力提升以中小企業(yè)為代表的弱勢探勘需求群體的社會競爭力。近年來,巨量數(shù)據(jù)資產滿溢的潛在價值促使眾多逐利主體通過積極挖掘以前因為科技所限而忽略的資料,構筑嶄新的數(shù)據(jù)引導決策的高效運營模式。如亞馬遜公司(Amazon)通過集中分析140萬臺服務器上10億GB數(shù)據(jù)優(yōu)化供應鏈和動態(tài)價格,以提供卓越的個性化購物體驗,促進總銷量和平均盈利增長[4];又如,領英網(LinkedIn)基于高量級、高速率與高辨識度的數(shù)據(jù)挖掘形成推薦列表,提升了職業(yè)雙選滿意度[5];再如,捷孚凱市場研究集團(GFK)通過挖掘海量高附加值調查數(shù)據(jù)及其關聯(lián)資訊,較為精準及時地披露受試者的掩飾傾向[6]。然而,這些傳統(tǒng)的深度挖掘模型較高的物理設施要求與高新技術障礙等迫使探勘需求者投入大量成本購置基礎設備并培育和雇傭眾多數(shù)據(jù)專家。復雜數(shù)據(jù)探勘雖然“沒有完美無缺的內部架構,卻具備簡明、便捷和廉價的優(yōu)勢”[7],確保任一需求者均有能力自主參與多元共治的數(shù)據(jù)資源流轉,通過實時關聯(lián)決策從消費源頭重識產品價值、從個人終端完善知識共享[8],推動去中心化的泛化社交平臺逐步替代傳統(tǒng)交互場域[9],引領所有社會領域的革命。如“點對點”的全景億圖系統(tǒng)(Panorama Necto)通過“比Excel更直觀的界面、比Tableau更強的分析能力、比SaS更簡單的操作”[10],為廣大探勘需求者提供動態(tài)自主完成數(shù)據(jù)存儲、挖掘并生成分析報告的“所見即所得”的自助平臺,促進整個市場的公平競爭與有序發(fā)展。
同時,復雜數(shù)據(jù)探勘避免了委付數(shù)據(jù)引發(fā)的諸多風險。高度專業(yè)化的舊式數(shù)據(jù)挖掘迫使無力自建平臺的探勘需求者(如中小企業(yè))冒著泄露、損毀商業(yè)機密或客戶數(shù)據(jù)的巨大風險委托第三方進行深度挖掘。受托者卻不可能完全了解委托人的運營細節(jié)和具體市場狀況,常常在算法選擇與模型建構上出現(xiàn)錯漏偏失,導致挖掘結果失真無效,甚至產生較為惡劣的負面影響。如基于Facebook巨量運作數(shù)據(jù)挖掘的精準廣告投放不斷暴露的實效偏差迫使全球最大的廣告主寶潔公司(Procter & Gamble)大比例削減精投費用,迅速回轉傳統(tǒng)營銷平臺[11]。復雜數(shù)據(jù)探勘為廣大弱勢需求者提供了安全低耗、直觀廉價地自主點亮暗數(shù)據(jù)(Dark Data)的最優(yōu)選擇,正在改變包括天睿(Teradata)、維提卡(Vertica)、哈道普(Hadoop)等在內的晦澀深奧的二進制運作機體壟斷挖掘市場的局面。
3 復雜數(shù)據(jù)探勘的道德風險
復雜數(shù)據(jù)探勘技術與平臺的出現(xiàn),一方面是以梅爾數(shù)據(jù)(Datameer)[12]為代表的“傻瓜式”復雜數(shù)據(jù)探勘系統(tǒng)廣泛應用于政府部門、企事業(yè)單位乃至個人用戶的靶向研發(fā)、精益生產、精準營銷、個性教學以及普惠金融等,在一定程度上突破了探勘需求者的技術局限,填補了專業(yè)數(shù)據(jù)處理機構、數(shù)據(jù)工程師與探勘需求者之間的實力差距,減輕近乎固化的“自然的或生理上的不平等”以及“精神上的或政治上的不平等”[13],迅速獲得大眾信賴和推崇;另一方面是“基于信息技術無限擴容的數(shù)據(jù)藍?!盵14]的復雜數(shù)據(jù)探勘私密化的可視化運作方式無形之中加深了熟悉對象數(shù)據(jù)內涵與關聯(lián)價值的廣大探勘需求者與原初數(shù)據(jù)權利人之間的能力鴻溝。道德規(guī)則認知有限或自信有能力規(guī)避的需求者為了“多快好省”地“追求眼前短暫的利益”[15],通過違反了自主、公平、不傷害等基本道德要求的自主探勘侵害合法的數(shù)據(jù)權益,導致原初數(shù)據(jù)權利人長期處于邊緣化的社會失語狀態(tài)[16]。缺乏道德規(guī)制的直觀探勘情境正在轉變?yōu)槭挛锱卸ǖ奈ㄒ粯俗R,日漸引發(fā)不確定、不可靠且有失公允的唯數(shù)主義和數(shù)據(jù)獨裁,有可能逐步將整個社會推向失控和崩潰的異化邊緣。如應用復雜數(shù)據(jù)探勘的醫(yī)藥企業(yè)和保健機構可以通過直觀的動態(tài)圖表實時地自如掌控和自主分析成分混雜的多元數(shù)據(jù)資源池集聚信息,導致相關違法違規(guī)事件的曝光、取證、追責和救濟難度幾何乘數(shù)增加[17]。
3.1 直觀探勘干擾自由表達
數(shù)據(jù)滲透到當今每一個行業(yè)和業(yè)務職能領域,我們每個人隨時都在成為大數(shù)據(jù)源端[18],廣大掌握海量原初數(shù)據(jù)的政府機關、企事業(yè)單位和強勢個人通過融會貫通新一代信息技術的復雜數(shù)據(jù)探勘廉價、直觀且實時地自主使用元數(shù)據(jù)負載設備、聚合集成控制平臺、動態(tài)分割管理布局以及廣域挖掘架構等,在未獲原初數(shù)據(jù)權利人明示同意的情況下肆意采集、闡釋與識別顆粒數(shù)據(jù)變化趨勢。如用于健康醫(yī)療的全景億圖系統(tǒng)助力醫(yī)療機構通過低成本地自行悄然廣域挖掘病案地理位置信息和關聯(lián)內容分享信息,具體識別特定的醫(yī)生、護士、患者及其家屬等相關主體并評估預測其行為模式與趨勢,進而成為確定本單位資源補給、價格定位、服務標準與技術投入的核心依據(jù)[19]。此類探勘需求者通過廉價、便捷、直觀且實時的復雜數(shù)據(jù)探勘系統(tǒng),搭建最優(yōu)化控制成本與提升質量的預測預警模型,嚴重侵害了原初數(shù)據(jù)合法持有者的知情權與自主選擇權,違背了遵循誠信與尊重自由等道德要求。
3.2 智數(shù)決策破壞平等格局
場景時代作為現(xiàn)狀評估與趨勢預測新標尺的易操作的復雜數(shù)據(jù)探勘為每一個需要數(shù)據(jù)處理的社會主體提供了獨立、低價、便捷且私密地完成海量數(shù)據(jù)存儲、流轉與分析的全新途徑,逐步擴展應用于勸服、調整與控制決策領域,切實提升眾多探勘需求者的洞察力與戰(zhàn)略遠見,推動產業(yè)轉型升級和經濟快速發(fā)展。如眾多科研院所和醫(yī)藥企業(yè)通過共鏈生物銀行(Colink Biotics)進行基因數(shù)據(jù)自主探勘,較為準確地實時預測客戶巨量基因數(shù)據(jù)中隱藏的絕癥發(fā)病率[20],相應的精準用藥自動化探勘機制更是將文明社會的醫(yī)療水平提升到嶄新的高度[21]。包括梅爾數(shù)據(jù)、全景億圖等在內的可視化復雜數(shù)據(jù)探勘平臺使得掌握定量數(shù)據(jù)的機構和個人有能力自行完成數(shù)據(jù)處理并持續(xù)推送精準量化分析結果,在一定程度上導致全社會范圍內的個人奮斗、企業(yè)選擇、社會服務和政府管理等異化為固態(tài)計算程式。相關價值博弈帶來的負面效應和惡劣后果則進一步加劇人性蛻化和創(chuàng)新危機,破壞整個社會的平等格局。如不同規(guī)模的企業(yè)只要耗費少量成本就可以在“正確”時間以“正確”形式即時地可視化私密探勘“正確”數(shù)據(jù)引領的長期決策往往侵害平等用工權或公平交易權等[22]。又如,掌握大量適齡男女等信息的婚介公司通過操作簡單的可視化復雜數(shù)據(jù)探勘勾勒的看似理性的配對決策模型試圖將人類情感作為技術干預的工具和對象,可能造成嚴重的心理失衡和人格障礙[23]。將之拓展為全方位優(yōu)婚、優(yōu)育、優(yōu)養(yǎng)的精密探勘計劃更是肆意侵害了獨立個體的尊嚴和權利,違背“己所不欲,勿施于人”的道德準則,破壞現(xiàn)代社會引以為傲的平等人際關系,背離了實現(xiàn)“兼收并蓄、取長補短、相互容忍、和平共存的人類共同文明”[24]之道德初衷。
3.3 數(shù)據(jù)鴻溝擾亂競爭秩序
復雜數(shù)據(jù)探勘可視化集聚了廣域深層離散數(shù)據(jù),在一定程度上消減了數(shù)據(jù)資源共享中的信息孤島現(xiàn)象,逐漸展現(xiàn)出“讓一切改頭換面”[25]的顛覆性價值。龐大的政府部門、企事業(yè)單位和個人用戶群通過獨立自主地開展復雜數(shù)據(jù)探勘,積極掌握數(shù)據(jù)處理主動權并占據(jù)發(fā)展制高點[26]。復雜數(shù)據(jù)探勘助力構建“跨行業(yè)、跨部門、跨區(qū)域”的電子政務智慧管理體系[27];高效且代價合理地優(yōu)化個性化動態(tài)競爭情報生態(tài)鏈,顛覆地區(qū)封鎖和行業(yè)壟斷[28];真正實現(xiàn)社會零庫存,改善綜合實力薄弱中小企業(yè)的前途和命運[29]。然而,極簡探勘模式大幅降低了數(shù)據(jù)存儲、流轉與分析成本,使得眾多探勘需求者之間的競爭演變?yōu)閺氐椎脑鯏?shù)據(jù)量額和質比紛爭。探勘主體出于短期利益需求與長遠發(fā)展考慮,在數(shù)據(jù)采集、存儲和綜合挖掘中設置長效割裂原初數(shù)據(jù)橫向轉移與縱向傳承的諸多障礙,通過廉價拋售交叉聚探的數(shù)據(jù)變量交互關系釋放盈利潛能,動態(tài)阻擋創(chuàng)新力量參與行業(yè)競爭[30]。物理世界與數(shù)字世界匯聚進程中日漸擴大的數(shù)據(jù)鴻溝導致部分新生業(yè)態(tài)陷入難以洞悉周邊態(tài)勢的信息失衡困境,打破有序競爭的良好愿景,嚴重違背不傷害的基本道德準則。