大數(shù)據(jù)重構(gòu)了傳媒行業(yè),成為當下的熱點話題。然而,大數(shù)據(jù)卻不是萬能的,存在種種問題和隱患,需要人們對其進行理性對待。
一、大數(shù)據(jù)是絕大多數(shù)媒體人的弱項
今年5月,我在北京做了一個針對媒體從業(yè)人員及高校新聞傳播院系教師的500人規(guī)模的問卷調(diào)查,有效回收問卷353份。我發(fā)現(xiàn),高達85.55%的被訪者只是知道大數(shù)據(jù)這個名詞,只有7.08%的被訪者知道大數(shù)據(jù)的概念和特征,1.98%的被訪者知道大數(shù)據(jù)技術(shù)所涉及的軟件。然而,還有5.39%的被訪者竟然完全不知道大數(shù)據(jù),包括不知道這個名詞。
究其原因,一是與我國的新聞傳播學教育有關(guān),在我國幾乎所有高校的新聞傳播院系都是所謂的文科,開設的技術(shù)課程十分有限。二是中國的傳統(tǒng)媒體從業(yè)人員,技術(shù)出身的人所占比例偏低,絕大多數(shù)是所謂的文科出身。
對于新聞傳播學的研究者而言,存在同樣的問題。在小數(shù)據(jù)時代,由于技術(shù)手段有限,人們只能采用抽樣的調(diào)查方法對事物進行分析,并將局部的研究結(jié)果延伸至總體,傳統(tǒng)的電話調(diào)查、攔截面訪等新聞傳播學的研究方法是基于這個原理展開的。然而,每一種抽樣方法都存在一定不足,難以反映總體樣本的全貌,因此,調(diào)查人員一般會增加抽樣的數(shù)量,以提高統(tǒng)計的精確度,但這也意味著調(diào)查成本的增加。大數(shù)據(jù)的確具有不可替代的優(yōu)勢,但就此認為一種新興的技術(shù)將完全取代千百年積累下來的科學發(fā)展成果,這無疑走進了大數(shù)據(jù)自大的怪圈。隨著大數(shù)據(jù)的不斷發(fā)展,越來越多的實例證明,全數(shù)據(jù)分析具有不可替代優(yōu)勢的夢想在現(xiàn)實中無法實現(xiàn),大數(shù)據(jù)只能對傳統(tǒng)的新聞傳播調(diào)研方法進行補充,卻無法取而代之。傳統(tǒng)科研方法經(jīng)歷了長時間的學術(shù)沉淀,具有較強的邏輯性、科學性和規(guī)范性,這是新誕生的大數(shù)據(jù)研究方法難以相比的。
二、過分依賴大數(shù)據(jù)容易出現(xiàn)假發(fā)現(xiàn)
大數(shù)據(jù)是客觀存在的,卻無法進行自我處理和分析,需要人對其進行進一步解釋和分析。在這個過程中,人為主觀性將可能導致事實客觀性的偏頗,進而產(chǎn)生對新聞客觀性的挑戰(zhàn)。有美國學者指出,人們在翻譯數(shù)據(jù)信息時存有偏見……記者群體容易濫用因果推理邏輯或相關(guān)性分析{1}。記者群體的輕易歸因,容易導致許多“假規(guī)律”的產(chǎn)生,反而讓人難以發(fā)現(xiàn)事件背后的真正規(guī)律和問題。
大數(shù)據(jù)分析更多的不在于對事情因果關(guān)系的分析,而是對其相關(guān)性的體現(xiàn),進而對未來發(fā)展趨勢做出預測,并最終進行決策判斷。比如:通過用戶數(shù)據(jù)的反饋,程序化廣告系統(tǒng)發(fā)現(xiàn)某用戶近來多次瀏覽某一品牌廠商的廣告,因此判斷他有可能購買該產(chǎn)品,并進而對該用戶進行更大力度的宣傳。這種“人工智能”看似神奇,但也可能會導致許多機械性結(jié)果和決策的產(chǎn)生。在進行某項決策時,人類會綜合多種因素,包括聯(lián)系前后情景,感性、理性雙重的作用等,最終形成判斷,這是人腦如此發(fā)達的原因。顯然,沒有情感的機器無法做到這一點,許多通過算法自動生成的預測和決策都具有一定的機械性。
大數(shù)據(jù)分析有可能帶來歧視。2016年年初,百度大數(shù)據(jù)推出中國偏見地圖,這可能造成人們對某一地區(qū)、族群刻板印象的加深。比如:河南人都是騙子,廣東人什么都吃,新疆人多為小偷等。這種刻板印象將可能造成現(xiàn)實生活中職業(yè)歧視、司法歧視、婚姻歧視等一系列歧視問題的發(fā)生。
三、基于大數(shù)據(jù)技術(shù)的機器人容易產(chǎn)生冰冷的新聞
機器人寫新聞的技術(shù)基礎是大數(shù)據(jù)技術(shù)。
2015年年末,許多媒體機構(gòu)傳出機器人代替記者寫稿的消息,例如:新華社迎來一位“機器人記者”——“快筆小新”,騰訊財經(jīng)使用“Dreamwriter”寫稿,能在第一時間運用算法生成新聞稿件,這些都讓人感嘆“記者即將下崗”。技術(shù)的進步加快了生產(chǎn)力的發(fā)展,“機器人寫稿”雖好,但卻缺少“溫度”。雖然大數(shù)據(jù)看似解決了新聞客觀性問題,但新聞的角度同樣重要。新聞是“有溫度”的,它嵌入記者的思考,倡導一種理念,體現(xiàn)人文關(guān)懷。然而,機器人“記者”卻只能“冷冰冰”地將數(shù)據(jù)中反映的事實全盤托出,難以體現(xiàn)人文精神。而且,機器人難以做到歸因、舉證,因此無法引導人們對某一則新聞的深入思考。由于機器人是根據(jù)特定算法生成稿件的,沒有加入記者的個性,千篇一律,長此以往,容易令人厭倦。
當前新聞寫作軟件只能生成特定類型的報道,且只能采用單一來源的數(shù)據(jù),遵循這類報道常用的固定模式,大批量“生產(chǎn)”出有限類別的短新聞。具體的生產(chǎn)過程是機器人中固化的軟件事先被設定了算法,通過軟件整理數(shù)據(jù)事實,并與歷史數(shù)據(jù)和其他背景信息相結(jié)合,再遣詞造句呈現(xiàn)出描述性的新聞。因此,機器人撰寫報道就如同做填空題一樣,只需要在設定好的語境中進行簡單的填充即可。雖然現(xiàn)今這類寫作軟件變得更加“聰明”,算法更加先進,如將讀者喜好的語氣、角度甚至幽默融入一篇報道之中。以機器人報道籃球賽事為例,可能機器人會用同樣的數(shù)據(jù)生成兩個版本的新聞:一個版本為獲勝球隊的粉絲所寫,一種歡天喜地的氣氛;另一個版本則是為失敗的球隊準備的,讀起來讓粉絲沮喪低落。但無論如何,機器人無法理解兩個球隊所有粉絲的感受,因為并不是獲勝就完全滿足,可能球隊通過比賽還是反映出存在的一些問題;而失敗的也不一定完全是失落的,因為他們也許看到了同強隊交手中顯示出來的球隊進步。因此,機器人是無法同創(chuàng)造力旺盛、想象力豐富的人類作者相比擬的。
作為面向普羅大眾的新聞媒體,要增強新聞宣傳和輿論引導的吸引力、感染力、親和力和影響力,就必須采制出有現(xiàn)場溫度及人情溫度的報道內(nèi)容。當然,評判一條新聞的質(zhì)量好壞有多重標準,但真正能打動受眾的往往是有溫度的新聞。新聞的溫度源于媒體人的社會責任感,源于媒體人對普通受眾的感情積累。做新聞不能只站在媒體的角度來反映民眾的生活,更重要的是在情感上實現(xiàn)與受眾的相互交融。
美國西北大學研發(fā)了新一代智能寫作軟件Narrative Science,宣稱將新聞報道和大數(shù)據(jù)技術(shù)進行了一次新時代的結(jié)合,這款軟件通過對給定主題的數(shù)據(jù)分析,能夠自動地選擇合適的寫作角度,快速完成一篇具有標準新聞報道結(jié)構(gòu)的文章。雖然在新聞報道中自動增加了一些形容詞以提高可讀性,但寫出來的文章依然明顯缺乏新聞溫度。這是因為機器本身沒有辦法判斷情緒,它們只是單純地從數(shù)據(jù)庫中抽取形容詞,用法正確與否暫且不論,但與“手工打造”的飽含情感、責任和人文諸因素的新聞稿相比,從機器人手中傳遞出來的新聞雖然是新鮮的卻是冰涼的。
四、依賴大數(shù)據(jù)技術(shù)容易使人缺失新聞敏感度
通過新聞敏感度,不但能夠?qū)π侣剰臉I(yè)者的采寫能力進行判定,同時也能對新聞價值進行判定。新聞實踐是新聞從業(yè)者職業(yè)新鮮感、新聞寫作創(chuàng)新感的體現(xiàn),在新聞實踐過程中,如新聞敏感度缺失,則直接降低了新聞價值。一個具備很強新聞敏感度的新聞從業(yè)者,可以從平凡的事件中發(fā)現(xiàn)有價值的新聞,從很小的細節(jié)中洞見真實和深度,從而挖掘出有價值的新聞;而新聞敏感度較弱的新聞從業(yè)者,則會存在漠視現(xiàn)象和反應遲鈍的問題,從而與有新聞價值的線索擦肩而過,錯失好的新聞題材。
機器人將數(shù)據(jù)直接轉(zhuǎn)化為文章其價格較為低廉,因此機器人可用以提供對不同讀者的新聞定制服務。但是,基于大數(shù)據(jù)技術(shù)的機器人寫新聞,存在新聞敏感度缺失的問題,機器畢竟是機器,盡管美聯(lián)社表示機器人寫作軟件按照程序使用不同語氣的能力越來越強,但新聞畢竟出自機器人之手,它不具備對新聞線索進行挖掘的觀察能力,也不具備對新聞事件進行取舍的決斷能力,而這兩種能力是新聞敏感度的重要體現(xiàn)。
就機器人撰寫新聞的過程而言,一些具有固定模式的行業(yè)性文章更符合它的本能,因為既不需煉字鍛句,又不需深度分析。如果有一天記者真的被冷冰冰的機器人取代,新聞恐將淪為諸多報道模式的生硬“拼盤”。人們很難期望機器人會像人類一樣,能夠根據(jù)不同的采訪對象,變換不同的采訪語氣與被訪者進行觀點和思維的交鋒。因此,我們在認可機器人存在技術(shù)上的優(yōu)勢之外,也承認機器人是無法同人類一樣具有足夠的應變能力和創(chuàng)造能力的。
美國《大西洋月刊》網(wǎng)站報道稱,自動寫作軟件目前最擅長的領域是體育和金融,因為這些領域的一些報道本來就已經(jīng)很“機械化”。
人類的思維至少在短時間內(nèi)無法被機器人模仿,分析和觀點性的報道需要消息來源、知識積累、邏輯思維等眾多的能力在里面,在這些方面,機器人寫手無法與記者一決高下。通過機器人撰寫的稿件,會因為內(nèi)容的生硬和重復而影響稿件的質(zhì)量?!皺C器人記者”能寫的文章種類有限,無法進行深度分析,更不會煉字鍛句。
記者工作是一種復雜的、高級的腦力勞動。機器人也是人類發(fā)明的。機器人的構(gòu)思再精巧,也無法替代人腦。機器人搶不走記者的飯碗。
人們不能指望機器人在鏡頭前隨機應變或深入背街小巷明察暗訪。新聞作為一種文字和圖像的藝術(shù),字里行間與鏡頭之下,都包含著記者的判斷、價值觀與人文關(guān)懷。機器人寫手雖有其技術(shù)優(yōu)勢,但卻無法完全具備人的靈活性和創(chuàng)造力。
顯然,機器人寫手只是一種輔助形式,它可以節(jié)省時間,把記者從一堆基礎數(shù)據(jù)和信息中解放出來。
總之,對于大數(shù)據(jù)技術(shù),以及衍生出來的機器人寫新聞,我們要理性、客觀地對待,不必人云亦云。作為媒體人,既要積極學習吸收新技術(shù),也不必自卑自棄。
注釋:
{1}Toby Segaran、 Jeff Hammerbacher.Beautiful Data: The Stories Behind Elegant Data Solutions,O'Reilly Media,2009年7月,第1版,205-211