【內容提要】在擔憂新聞機器人是否將代替人類記者時,人們或多或少地忽視了其網絡安全。隨著新聞機器人逐漸滲透至網絡的各個領域,其作為“技術”的本質或將引發(fā)多種問題,威脅著網絡安全,我們有必要采取相關措施以防患于未然。
【關鍵詞】新聞機器人 網絡安全 對策
2017年“兩會”期間,人民網、《光明日報》、新華社等數十家媒體共推出15臺虛擬及實體新聞機器人,在“兩會”新聞報道中可謂賺足了眼球。作為新興科技的新聞機器人以高效、精準的數據挖掘及分析大大解放了人類記者的生產力,使其得以投身于挖掘數據背后的潛在關系,以生產更高質量的新聞。然而,在擔憂其是否將取代新聞記者時,不少研究者卻忽略了新聞機器人的網絡安全。相較于傳統(tǒng)的網絡安全,新聞機器人所引發(fā)的網絡安全問題將更為集中,防范及控制難度更大,這是必須要引起重視的問題。
一、新聞機器人的發(fā)展趨勢
所謂“新聞機器人”,實際上是一套軟件或算法語言,它自動采集數據,然后撰寫出人類可讀的內容。①通過哥倫比亞大學對“敘事科學”公司的新聞機器人進行的數據公開,我們可以發(fā)現(xiàn),新聞機器人的新聞生產主要包含五個步驟,即數據抓取、“新聞性”評估、確定角度和框架、填充“故事點”和文本生成。這一新聞生產流程全程實現(xiàn)自動化,能通過低廉的成本生產海量的新聞資訊,大大減輕了記者的數據信息采集負擔,有望開啟“人機分工”新聞生產模式的新篇章。以美聯(lián)社所使用的Wordsmith為例,其在相同時限內生產的新聞數量是人類記者的十倍不止,打破了人類的新聞生產極限;同時,基于互聯(lián)網斷點式數據抓取技術,新聞機器人能在天氣、財經及體育等有著“純凈數據”的信息領域,高速發(fā)布較為準確的新聞資訊,目前已在歐美各主流媒體得到廣泛推廣。2015年,騰訊公司成功開發(fā)Dreamwriter寫作機器人,迄今為止以每天產出超過2000篇財經科技類稿件、500篇體育類稿件的速度進行寫作。同時,隨著新華社的“快筆小新”、《南方都市報》的“小南”以及今日頭條的“張小明”等新聞機器人投入使用,我國的機器人寫作也逐漸步入發(fā)展的上升期。
然而,新聞機器人在為新聞工作者帶來極大便利的同時,也為網絡安全帶來不小的隱患。從“安全”的指數來看,網絡安全側重于網絡社區(qū)的安全,強調“網絡系統(tǒng)中的數據內容是否遭到破壞、更改、泄露,系統(tǒng)是否連續(xù)可靠地正常運行等”,②著眼于信息的機密性、真實性以及可驗證性。隨著新聞機器人全面興起,其廣泛的數據抓取分析、高度的自動新聞生產在一定程度上不斷地侵蝕著這一網絡信息安全基礎,同時其自身的“技術”本質也或使法律責任判定陷入混亂,使得網絡安全面臨新的考驗。
二、新聞機器人網絡安全的隱憂
(一)廣泛的數據抓取或導致個人信息泄露
“敘事科學”公司的CTO曾指出在未來的15年內,將有超過90%以上的新聞由機器人生成。換言之,未來的新聞機器人將不局限于天氣、體育及財經等“公共數據”領域。隨著軟件的推陳出新,機器人算法邏輯的不斷增強,新聞機器人將能勝任新聞行業(yè)大部分領域的數據采集及信息挖掘工作,其數據覆蓋范圍將逐步脫離“純凈數據”的范疇向著大眾化、生活化的信息內容方向發(fā)展,基于強大互聯(lián)網索引及數據抓取技術的新聞機器人,在拓展了信息收集及傳播技術的同時,也對網民的個人隱私安全提出了挑戰(zhàn)。
據CNNIC發(fā)布的第39次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》顯示,截至2016年12月,我國網民規(guī)模已達7.31億。③龐大的用戶群體產生的UGC內容已占據互聯(lián)網知識信息的大半江山。浩如煙海的數據信息中實則包含了豐富的個人資料數據,如用戶的居住地、職業(yè)、年齡、興趣愛好、個人習慣等等,加之接入互聯(lián)網所產生的Cookie信息包,用戶在機器人算法面前可謂一絲不掛。鑒于先前“傳感器”新聞生產的成功運用,如今有著強大的數據處理能力的新聞機器人,對于大數據的處理分析已是輕車熟路,因而對于互聯(lián)網用戶的個人生活軌跡的分析更是不在話下。隨著新聞機器人不斷滲透生活的各個領域,依照其已被壓縮至毫秒的信息處理、分析及評估過程,新聞機器人能在現(xiàn)有模板支撐的情況下,在短時間內完成某特定網站所有用戶的個人情況報告。如果說在大數據時代用戶的個人隱私保護已是形同虛設,那么當“90%的新聞由機器人撰寫”的時代來臨之后,用戶個人隱私安全將面臨更為嚴峻的考驗。
(二)“脫韁”的新聞生產或引發(fā)輿論動蕩
2014年,谷歌公司的“維基百科實時監(jiān)測”機器人曾因《紐約郵報》關于失蹤球員昆頓·羅斯的一則烏龍新聞自動發(fā)表一條推特簡訊,稱該球員的尸首已被發(fā)現(xiàn)。雖然這則新聞在之后得到報社的澄清,但谷歌旗下的新聞機器人卻因內在算法的限制未能對已發(fā)布的消息進行改正,導致這一“假消息”得以繼續(xù)傳播,存在散布不實消息之嫌,造成了不小的輿論動蕩。
依托算法程序的機器人新聞生產模式的一大亮點便是高度的自動化,在數據爆炸的今天能夠快速、準確地挖掘新聞素材并迅速以簡報的形式進行上報或直接發(fā)表?!昂谙洹奔夹g的特點卻決定了其運行過程的不可逆且難以控制,程序一旦檢測出數據異常波動便立即觸發(fā)新聞寫作流程,能在極短的時間內完成新聞的寫作及發(fā)布。然而現(xiàn)階段基于程序運作的機械缺乏人類所具備的批判性思考,也無法親臨現(xiàn)場獲取一手資料以驗證消息真?zhèn)?。在上述案例中,新聞機器人的新聞生產流程之所以被觸發(fā),是因為在同一時間段內出現(xiàn)五個人對三個語言版本的“昆頓·羅斯”詞條進行修改,算法在沒有也無法確認事實真?zhèn)蔚那闆r下判定這是一條“重大新聞”。不可否認,新聞機器人在數據監(jiān)控挖掘、信息整理及撰寫速度上遠超人類,然而其錯誤的產生及傳播的速度也同樣遠遠領先人類。同時,病毒性的網絡傳播模式能使機器人產生的錯誤或有害的信息,以前所未有的速度擴散至整個網絡社區(qū)。另外,新聞機器人的新聞寫作尚未擺脫“陳述事實”的模式。這種客觀事實陳述雖然在一定程度上避免了人類記者所持有的個人偏見,然而冰冷的數據羅列在缺乏新聞工作者所必須具備的人文關懷的同時也將留下巨大的解讀空間,存在被過度解讀的危險。一旦發(fā)生信息誤讀或惡意的信息投食行為,“脫韁”的機器人新聞生產便可能引發(fā)網絡輿論動蕩。
(三)“技術中立”或導致責任判定混亂
一旦新聞機器人產生上述行為對網絡社區(qū)利益造成損害時,人們最先想到的便是訴諸法律以求制裁。然而,新聞機器人在本質上屬于一種技術手段,其復雜的技術背景以及作為互聯(lián)網技術的本質,或將使法律責任判定因“技術中立”原則陷入困境。
從早期的“索尼案”到“Napster案”再到2016年的“快播案”,“技術中立”一直是新興技術領域所不可避免的話題。一方面,技術本身無罪,并且新聞機器人作為非“自然人”在法律上無法承擔相應的法律責任,這將導致造成個人隱私泄露或引發(fā)輿論動蕩的新聞機器人無法作為被告被起訴。另一方面,回顧新聞機器人的發(fā)展史,谷歌公司擁有新聞機器人源代碼的專利權,并授權于美國“敘事科學”、“自動洞見”及法國“耶索”等公司進行開發(fā)使用。新聞機器人的開發(fā)初衷并非為實施違法行為,因此谷歌公司作為“實質性非侵權”技術的提供者也同樣不承擔法律責任。那么,是否授權開發(fā)公司或網絡中間商應為新聞機器人產生侵權行為或發(fā)布不實消息而接受制裁呢?依據現(xiàn)有案例分析,中間方責任的認定主要是基于行為人是否能被證明存在“指示、鼓動”的言論,是否存在“共同”犯罪的行為。然而,暫不提在取證、立案等技術層面對上述責任進行判定存在極大的困難,我國現(xiàn)有法律在新聞機器人違法事件追究責任方面依舊是空白,而走在新聞機器人領域前沿的美國也依然處于立法討論階段,并無明文法律進行指導。同時,從科技立法角度看,過早地對尚未成熟的新聞機器人進行專項立法存在投入大、回報小的缺陷,并不利于該技術的完善和發(fā)展。因此,法律的缺位使得當新聞機器人造成違法行為后,因“技術中立”的抗辯理由而使得責任方判定陷入混亂,為網絡安全的有序發(fā)展埋下禍根。
三、新聞機器人隱患之對策
(一)限制數據庫接入,完善機器人訪問協(xié)議
新聞機器人對于個人隱私信息的獲取,是基于對社交網站及公共網絡數據的監(jiān)測及抓取。然而,全球至今尚未對機器人數據覆蓋邊界做出明確的規(guī)范。出于新聞工作的要求,我們不能摒棄新聞機器人算法中所包含的數據監(jiān)測及評估系統(tǒng)和聯(lián)想機制,反而應大力發(fā)展之。因此,采取一定措施限制新聞機器人對網站數據庫的接入并完善機器人訪問協(xié)議,對保護用戶隱私、防止侵權行為的產生有著極為重要的作用。被監(jiān)測網站可與包含敏感信息的數據庫(如用戶Cookie數據)設立相應的機器人監(jiān)測及排除協(xié)議,并做好信息漏洞的檢查及防范措施;同時,新聞機器人的運作方需明確“新聞”與“隱私”的邊界,從數據喂食的源頭控制新聞機器人的數據庫覆蓋范圍,并規(guī)范機器人新聞生產的內容,杜絕涉及個人隱私信息的新聞發(fā)布,在技術層面做好互聯(lián)網社區(qū)的隱私保障工作。
(二)堅持“把關人”角色,做好審查及補充工作
美聯(lián)社于2014年開始在機器人新聞撰寫方面取消了原有的人工審核制度,新聞機器人可以不經由人工審查自動完成從數據采集到新聞發(fā)表的全過程。但美聯(lián)社很快表現(xiàn)出了對新聞機器人的不放心,并推翻先前聲明,堅持對“每篇自動生成的報道進行審閱后再發(fā)表”④。筆者認為,隨著新聞機器人逐漸深入人類生活的各個領域,在大力發(fā)展其新聞生產自動化的同時必須保證內容審查工作的進行,對于部分深度新聞寫作更是需要“把關人”對新聞內容進行審核把控,在提高新聞生產效率的同時保證新聞內容的真實性。同時,鑒于新聞機器人的語言組成技術依舊處于發(fā)展階段,運行方在對稿件進行潤色的同時也可對部分缺乏邏輯或停留于陳述層面的內容進行補充說明,在提升機器人新聞的可讀性的同時完善新聞內容,防止新聞被過度解讀所引發(fā)的輿論危機。
(三)完善標準評估,確定相關責任方
目前,我國的數據庫建設依舊處于發(fā)展中狀態(tài),技術發(fā)展的不對等使得相關利益方的平衡關系發(fā)生了改變。因此,在采用“知道原則”“誘導原則”⑤之余,各利益方可集中進行協(xié)商并結合實際國情制定相應的責任評判標準。同時,雖說“技術中立”原則是科學技術得以迅猛發(fā)展的一大“保護傘”,但是一旦技術被投入市場并廣泛使用,技術的開發(fā)及運營方就肩負著一定的社會責任及義務。在新聞機器人開發(fā)公司不斷對算法進行更新以及發(fā)布補丁的同時,新聞機構作為技術的使用方在做好相應的技術更新及審核工作之余,必須履行對所屬新聞機器人的監(jiān)管責任,在運行新聞機器人的過程中不忘掌控機器人的“電源”?!敖忖忂€須系鈴人”,技術所導致的問題還須交由技術解決,因運營不當所導致的后果也應由相關運營方承擔,而非法律或社會為其買單。
注釋:
①鄧建國.機器人新聞:原理、風險和影響[J].新聞記者,2016(9).
②王世偉.論信息安全、網絡安全、網絡空間安全[J].中國圖書館學報,2015(2).
③中國互聯(lián)網絡信息中心.第39次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》.http://www.cnnic.net.cn/gywm/xwzx/rdxw/20172017/201701/t20170122_66448.htm.
④孫瑛.機器人新聞:一種基于大數據的新聞生產模式[J].編輯之友,2016(3).
⑤武萬方.論技術中立原則[D].中南民族大學,2015.
作者簡介:黎文松,南昌大學外國語學院碩士研究生
編輯:王洪越