◎陳雄濤
隨著芯片工藝和計(jì)算機(jī)軟件的發(fā)展,計(jì)算作為一種工具增強(qiáng)了我們處理數(shù)據(jù)的能力。當(dāng)我們?cè)谔幚泶罅课臋n時(shí),標(biāo)準(zhǔn)的新聞處理方式已經(jīng)發(fā)生了很多變化。 通過(guò)機(jī)器學(xué)習(xí),我們可以以一種機(jī)械的方式閱讀成千上萬(wàn)的文檔。幾十年前,如果沒(méi)有很多人的努力,如此大規(guī)模的“閱讀”是不可能的。 現(xiàn)在,機(jī)器學(xué)習(xí),或更確切地說(shuō)是自然語(yǔ)言處理,不再需要將數(shù)據(jù)逐行逐字地輸入文本,而是幫助我們創(chuàng)建文本摘要或?qū)⑺鼈兎譃榫哂泄餐卣鞯娜舾深?。通過(guò)計(jì)算技術(shù),我們?cè)鰪?qiáng)了“讀取”成千上萬(wàn)個(gè)文檔的能力。 但是,這些新功能必然會(huì)改變我們對(duì)文檔集合以及從文檔中獲取知識(shí)的看法。也就是說(shuō),我們的能力得到增強(qiáng),但我們對(duì)同一事物的觀點(diǎn)也會(huì)改變。與文本源一樣,數(shù)字圖像,音頻和視頻也都可以以數(shù)字的方式進(jìn)行計(jì)算了。 同樣,這些計(jì)算能力也改變了我們的觀點(diǎn)。 然而,我們需要注意的是某些現(xiàn)象會(huì)因?yàn)槲覀兊募夹g(shù)改進(jìn)而被忽略。
從目前的發(fā)展形勢(shì)來(lái)看,每個(gè)新聞編輯室都有一套獨(dú)立的AI工具使用方式。一個(gè)明顯的問(wèn)題是我們應(yīng)該如何更好地將這些工具帶入新聞編輯室。有學(xué)者指出,在新聞編輯室中,AI技術(shù)可以在以下三類活動(dòng)中提供一些幫助:
1.在大規(guī)模數(shù)據(jù)中找出關(guān)鍵信息:在那些由于數(shù)據(jù)的規(guī)?;蚋邚?fù)雜性而可能使人類無(wú)法勝任的特殊工作條件下,AI技術(shù)可以成為突破性的工具。 這個(gè)角色非常適合標(biāo)準(zhǔn)的新聞編輯室流程,因?yàn)榧词笰I技術(shù)發(fā)現(xiàn)了人眼看不到的情況,也可以通過(guò)標(biāo)準(zhǔn)的人類調(diào)查技術(shù)對(duì)這種發(fā)現(xiàn)進(jìn)行核查。
2.識(shí)別趨勢(shì):AI技術(shù)的強(qiáng)大計(jì)算能力可以幫助描述數(shù)據(jù)集合的特征,這些特征可以按時(shí)間,地理位置或人口統(tǒng)計(jì)學(xué)進(jìn)行分組。 與此同時(shí),它也可以快速識(shí)別異常數(shù)據(jù)。
3.將AI技術(shù)或計(jì)算的應(yīng)用作為故事本身的課題進(jìn)行研究:由于它們是人為構(gòu)建的,因此算法存在人為偏差。通過(guò)研究它們,我們可以發(fā)現(xiàn)以前看不見(jiàn)的偏差。 因此,我們可以利用AI工具找到一件復(fù)雜事件的真相,并讓我們更好的去了解我們的社區(qū),城市或國(guó)家。
將AI技術(shù)整合到新聞編輯中,使得記者有可能成為業(yè)余數(shù)據(jù)科學(xué)家。AI技術(shù)可以通過(guò)以下三種方式來(lái)增強(qiáng)記者的能力:(1)幫助對(duì)文檔進(jìn)行分類和分類;(2)識(shí)別值得仔細(xì)檢查的數(shù)據(jù);(3)在大量數(shù)據(jù)中尋找關(guān)鍵信息。有研究人員指出,AI技術(shù)存在兩種工作模式:一方面是完全的自治,完全沒(méi)有人類的參與;另一方面,AI技術(shù)可以與人類協(xié)同一起工作。
盡管有很多AI工具用來(lái)撰寫(xiě)新聞報(bào)道的案例,例如體育賽事總結(jié),企業(yè)收益發(fā)布,甚至是地震等等,但是很少有人會(huì)認(rèn)為新聞工作者的工作有可能被某種AI工具或者算法所完全取代。一些新聞工作者可以花時(shí)間來(lái)學(xué)習(xí)他們想要使用的AI工具。 比如可以從網(wǎng)絡(luò)上獲取示例代碼并將其應(yīng)用于事件的報(bào)道,這也會(huì)大大提高記者的工作效率。但是,除非記者對(duì)這類工具或技術(shù)相關(guān)的警告有深刻的了解,否則確實(shí)存在新聞不當(dāng)行為的風(fēng)險(xiǎn)。 有時(shí),記者發(fā)現(xiàn)標(biāo)準(zhǔn)的新聞方法可以有效地審核各種AI操作,但有時(shí)卻不行。為了避免其中的某些問(wèn)題,我們建議記者應(yīng)該與熟悉該工具的研究人員聯(lián)系,雖然行業(yè)專家與實(shí)地記者和編輯之間仍然存在溝通鴻溝。
說(shuō)起AI技術(shù),就必須談到數(shù)據(jù)。當(dāng)前社會(huì),數(shù)據(jù)的可獲得性不斷提高。大量的數(shù)據(jù),無(wú)論是從社交媒體還是政府網(wǎng)站,都會(huì)有辦法查詢到,這使以前一些不可能的報(bào)道成為可能。但這些大量的數(shù)據(jù)會(huì)存在很多陷阱,記者必須謹(jǐn)慎評(píng)估這種新型消息來(lái)源的可信度,尤其是在涉及AI技術(shù)的地方。 目前許多學(xué)者都強(qiáng)調(diào)了對(duì)數(shù)據(jù)的批判性思考。 比如,使用新浪微博作為其首選社交媒體平臺(tái)的記者必須謹(jǐn)慎地依靠它來(lái)分析社會(huì)的行為,思想和感受。 盡管新浪微博的開(kāi)發(fā)人員的工具和數(shù)據(jù)非常易于使用,但記者們不應(yīng)該只關(guān)注它,因?yàn)樵撈脚_(tái)在從事政治和媒體工作的人們中受歡迎的程度過(guò)高。另一方面,現(xiàn)在的記者可以更方便的去使用現(xiàn)有的公共數(shù)據(jù)。 但是,有時(shí)最好的新聞報(bào)道是用尚不存在的數(shù)據(jù)完成的,記者可能必須去制作自己的數(shù)據(jù)。為了提高效率,記者應(yīng)該花多長(zhǎng)時(shí)間來(lái)僅利用手上的有限資源來(lái)完成一個(gè)新聞報(bào)道,這是一個(gè)值得思考的問(wèn)題。
對(duì)于AI這種新工具,有研究人員認(rèn)為必須對(duì)記者和新聞編輯室開(kāi)發(fā)人員進(jìn)行培訓(xùn),告訴他們?nèi)绾呜?fù)責(zé)任地使用它們。 這項(xiàng)工作可能需要花費(fèi)很多錢。 對(duì)于像《湖北日?qǐng)?bào)》這樣的大型新聞機(jī)構(gòu)來(lái)說(shuō),這種投資可能不是問(wèn)題,但對(duì)于資源較少的小型新聞編輯室而言,這將是一個(gè)挑戰(zhàn)。新聞編輯室負(fù)責(zé)人可能面臨的一個(gè)選擇是建立,購(gòu)買還是與他人合作的方式來(lái)使用AI工具。 需要指出的是,使用復(fù)雜的數(shù)據(jù)集和自定義算法進(jìn)行調(diào)查分析可能需要花費(fèi)數(shù)月的時(shí)間才能建立大型團(tuán)隊(duì)。 因此,并非所有新聞機(jī)構(gòu)都能夠自己編寫(xiě)這些工具。
與學(xué)術(shù)機(jī)構(gòu)和研究人員合作可能是新聞機(jī)構(gòu)開(kāi)始在其新聞編輯室中使用AI的好方法。 但是新聞編輯室和學(xué)術(shù)實(shí)驗(yàn)室的文化截然不同。 一般來(lái)說(shuō),學(xué)術(shù)研究人員可能很難很好地理解許多公認(rèn)的新聞道德規(guī)范,對(duì)于不了解同行評(píng)審研究的道德規(guī)范的新聞工作者也是如此。 這也就需要花費(fèi)時(shí)間來(lái)發(fā)展伙伴關(guān)系,以及了解這種伙伴關(guān)系將如何運(yùn)作。
由于AI技術(shù)可以在新聞業(yè)中扮演許多重要的角色,因此需要關(guān)注的是AI技術(shù)在什么時(shí)候、什么地點(diǎn)以及如何使用。一般來(lái)說(shuō)AI技術(shù)的實(shí)現(xiàn)過(guò)程對(duì)讀者可能不清楚,但是記者應(yīng)該去了解該技術(shù)的實(shí)現(xiàn)過(guò)程。以聊天機(jī)器人為例,如果它是被AI技術(shù)所控制,那么它所描繪的故事是否是由一個(gè)算法所編寫(xiě)出來(lái)的?讀者是否需要知道這些故事是如何編寫(xiě)出來(lái)的?當(dāng)涉及到AI技術(shù)時(shí),誰(shuí)將最終對(duì)故事的真實(shí)性或者其引起的錯(cuò)誤負(fù)責(zé)?如何解釋錯(cuò)誤的性質(zhì)是由人類創(chuàng)造的算法造成的?最終該追責(zé)的是人類還是算法?
在學(xué)術(shù)文獻(xiàn)中,作者需要清楚的描述所使用的AI工具是如何去進(jìn)行分析和模式識(shí)別的。但是在新聞業(yè)中,這種描述必須翻譯成非技術(shù)術(shù)語(yǔ),并以簡(jiǎn)明的方式告訴讀者,讓讀者了解人工智能是如何使用的,以及如何做出選擇。一項(xiàng)調(diào)查指出,讀者更希望記者使用清晰、可描述性的術(shù)語(yǔ),而不是學(xué)術(shù)界的術(shù)語(yǔ),如“機(jī)器學(xué)習(xí)”或“計(jì)算機(jī)視覺(jué)”。
因此,AI技術(shù)的透明度應(yīng)該不僅僅是分享數(shù)據(jù),也需要對(duì)算法的透明度提出一定的要求。一般來(lái)說(shuō),算法對(duì)于讀者來(lái)說(shuō)是以黑盒子的形式存在的,無(wú)法進(jìn)行簡(jiǎn)單的解釋。記者應(yīng)該盡一切努力去描述在算法構(gòu)建時(shí)所做的選擇,并突出顯示可能發(fā)生的任何偏差。事實(shí)上,人類有他們自己的偏好,因此算法在構(gòu)建的過(guò)程中也需要對(duì)讀者顯示出一定的透明性。有學(xué)者有給出一種解決的方案,即讀者通過(guò)調(diào)整AI算法的參數(shù)并觀察這些給結(jié)果所帶來(lái)的變化,從而判斷算法對(duì)結(jié)果的影響。
新聞學(xué)是一門需要對(duì)所有事實(shí)都進(jìn)行核實(shí)的一門學(xué)科,因此,新聞工作者有兩項(xiàng)主要責(zé)任:(1)核實(shí)并以清晰易懂的方式向讀者呈現(xiàn)信息,(2)解釋其有效性。這也就引申出了一個(gè)問(wèn)題:關(guān)于AI工具的使用是否應(yīng)該有一個(gè)披露標(biāo)準(zhǔn)?比如,在學(xué)術(shù)界,研究論文中有一個(gè)方法論部分,其中有詳細(xì)的研究人員遵循的方案的描述。需要指出的是,AI算法在保險(xiǎn)和醫(yī)療服務(wù)行業(yè)中的應(yīng)用中,很少進(jìn)行獨(dú)立的測(cè)試。那么在新聞行業(yè)中,是否需要進(jìn)行這類的測(cè)試呢?目前的實(shí)踐證明,AI算法在保險(xiǎn)和醫(yī)療服務(wù)行業(yè)中會(huì)不可避免的存在數(shù)學(xué)偏差。那么即有沒(méi)有可能讓新聞界致力于讓這些算法負(fù)責(zé),并開(kāi)發(fā)出一種系統(tǒng),在算法開(kāi)發(fā)流程中建立問(wèn)責(zé)制?
考慮到正在使用的工具,記者需要首先在內(nèi)部積累專業(yè)知識(shí),以便讓人們知道外界有什么,減少對(duì)領(lǐng)域?qū)<业囊蕾嚕瑫r(shí)需要知道應(yīng)該向他們提出什么要求。有學(xué)者指出,透明度和可解釋性是有區(qū)別的。透明度將涉及到使基礎(chǔ)數(shù)據(jù)可用,讓人們能夠與之交互,而解釋性不需要透明。
我們對(duì)AI工具在新聞工作室中的使用可以得出以下的一些結(jié)論:
1.人工智能工具可以幫助記者完成以前很難在技術(shù)上實(shí)現(xiàn)的新聞報(bào)道。 雖然AI技術(shù)可能會(huì)改變新聞業(yè),但它依然難以取代新聞工作者的工作。
2.設(shè)計(jì)AI的技術(shù)人員與使用AI的記者之間既存在知識(shí)鴻溝又存在溝通鴻溝,這可能會(huì)導(dǎo)致新聞不端行為。
3.讀者應(yīng)該被告知如何使用AI工具來(lái)執(zhí)行事件分析和模式識(shí)別。
4.數(shù)據(jù)的規(guī)范化使用和披露(如何收集,存儲(chǔ),使用,分析和共享來(lái)自用戶的信息)是記者需要面對(duì)的基本問(wèn)題。
5.AI技術(shù)可以幫助記者獲得更多的數(shù)據(jù),這是好的一面,但是如何保證數(shù)據(jù)的真實(shí)性仍然是一個(gè)挑戰(zhàn)。
基于于上述結(jié)論,我們給出以下建議:
1.對(duì)編輯和記者的培訓(xùn)至關(guān)重要。 隨著AI工具進(jìn)入新聞編輯室,記者需要了解如何使用新資源進(jìn)行新聞報(bào)道。
2.關(guān)于數(shù)據(jù)的規(guī)范使用和AI算法的公開(kāi)披露,新聞工作者和技術(shù)人員之間必須制定一定的準(zhǔn)則并嚴(yán)格的遵守。
3.對(duì)于定制的AI技術(shù),新聞編輯室應(yīng)考慮與學(xué)術(shù)機(jī)構(gòu)建立伙伴關(guān)系。