◎王 佳
(金融時報社新媒體部,北京 100081)
生成式人工智能(Artificial Intelligence Generated Content,AIGC)是人工智能1.0 時代進入2.0 時代的重要標志。2022 年,Open AI 發(fā)布ChatGPT 模型用于生成自然語言文本。2023年3 月15 日,Open AI 發(fā)布了多模態(tài)預訓練大模型GPT4.0。GPT 類應用逐步賦能各行各業(yè),其能夠與人進行深度交流,撰寫郵件、文章,編寫代碼的種種功能都令人驚嘆。此后出現(xiàn)了能夠進行藝術創(chuàng)作、視頻處理的產(chǎn)品。AIGC 的出現(xiàn),引起了新聞從業(yè)者極大的關注。
人工智能的發(fā)展歷經(jīng)多年,目前已經(jīng)在媒體生產(chǎn)過程中得到應用的有算法推薦、寫作機器人、元宇宙新聞產(chǎn)品,這些應用能夠提升新聞生產(chǎn)的效率,減少新聞從業(yè)者在初級工作中的精力投入,新出現(xiàn)的生成式AI 在這一方面被寄予厚望。當然,新事物的出現(xiàn)總會有不一樣的聲音。生成式AI對新聞從業(yè)者的替代效應、對新聞生產(chǎn)流程產(chǎn)生的不確定影響需要引起重視。
本文分階段介紹人工智能逐步融入傳媒行業(yè)的過程,嘗試通過案例分析和從業(yè)經(jīng)驗總結兩個角度,來探討應如何看待生成式AI 這一新事物,如何將其引入媒體生產(chǎn)流程。
較早進入新聞行業(yè)的人工智能技術是智能算法推薦。智能算法推薦是指利用機器學習和數(shù)據(jù)挖掘技術,對用戶的歷史行為和偏好進行分析和預測,從而向用戶推薦符合其興趣的內容。算法推薦最初并非應用于媒體而是商業(yè)領域,如郵箱廣告、電子商務等。王仕勇認為,我們進入到一個信息過載的時代,強大的內容生產(chǎn)能力,要求傳統(tǒng)的內容分發(fā)進行變革,以解決用戶對有用信息的分辨及選擇不足的問題。在我國,依次出現(xiàn)了以微信為代表的“訂閱分發(fā)”、以知乎為代表的“社群分發(fā)”和以今日頭條為代表的“算法分發(fā)”[1]。
2012 年,今日頭條率先推出了基于協(xié)同過濾算法的內容推薦系統(tǒng)。一方面,今日頭條對內容進行分類,如娛樂、科技、財經(jīng)等。另一方面,進行個性化推薦,即通過收集和分析用戶信息,針對不同用戶的興趣和行為特征給用戶打標簽,之后為其推薦最符合其需求的內容。
算法推薦在媒體行業(yè)的成功應用改變了傳統(tǒng)的新聞分發(fā)模式,受到受眾的追捧。這一技術讓今日頭條實現(xiàn)了快速發(fā)展,獲得了數(shù)億用戶。此后算法推薦逐漸被更多的媒體所應用,新聞分發(fā)渠道與過去有了實質性改變,這也成為傳統(tǒng)紙媒逐漸式微的一個原因。
算法推薦雖然有益于新聞內容直達用戶,優(yōu)質內容更容易獲得大范圍傳播,但是也存在弊端,即產(chǎn)生了“信息繭房”效應?!靶畔⒗O房”是指人們關注的信息領域會習慣性地被自己的興趣所引導,從而將自己的生活局限在像蠶繭一般的“繭房”中的現(xiàn)象。如何破除“信息繭房”也是值得學界、業(yè)界深入思考的一個問題。
算法推薦除作用于新聞消費端,對新聞生產(chǎn)端也有助力?;ヂ?lián)網(wǎng)時代,人人都可以拍攝、錄制并上傳信息,很多新聞的第一現(xiàn)場信息,不再是記者提供,而是來源于網(wǎng)民。大量的線索依靠人力無法全部掌握、核實,大數(shù)據(jù)和人工智能通過算法輔助人工進行選題策劃,編輯可以通過大數(shù)據(jù)和算法推薦,找到當前最熱、最合適的選題,從而進行新聞策劃、深度挖掘等工作。
新聞寫作機器人是一種基于人工智能技術的自動寫作工具,它可以根據(jù)給定的關鍵詞、主題和要求,按照某種模板自動生成文章。新聞寫作機器人可以用于各種應用場景,例如自動化新聞報道、生成營銷文案、撰寫社交媒體帖子等。
2015 年9 月,騰訊財經(jīng)發(fā)表了一篇文章《8 月CPI 漲2.0% 創(chuàng)12 個月新高》,該文章的署名為自動化新聞寫作機器人Dreamwriter。同年11 月,新華社也推出了自己的寫作機器人——“快筆小新”,輸入股票代碼,它3 秒鐘就能完成一篇財報分析,稿件中大小標題一應俱全,還配有圖表等信息[2]。2016 年里約奧運會期間,今日頭條推出了新聞機器人“張小明”。作為第二代新聞機器人,“張小明”除了生成賽事新聞報道,還能智能檢索并選擇圖片,根據(jù)比賽結果模仿人類語氣等。
相較目前出現(xiàn)的生成式AI,新聞寫作機器人智能程度較低。黃雅蘭認為,財經(jīng)、體育、天氣等領域的新聞寫作,有可靠、清晰、結構化的數(shù)據(jù)資源,以及比較穩(wěn)定的寫作風格和結構,自動化新聞在這些領域表現(xiàn)出優(yōu)勢[3],可以代替新聞從業(yè)者完成較為簡單的稿件撰寫,解放部分勞動力,為專業(yè)人士節(jié)約時間從事高難度、原創(chuàng)性作品,提高媒體生產(chǎn)效率。
2021 年被稱為元宇宙元年,當年眾多互聯(lián)網(wǎng)企業(yè)爭相布局元宇宙,尤以Facebook 為主,當年改名為Meta,對外宣稱其全力投入元宇宙的開發(fā)。元宇宙目前尚無權威定義,但普遍認為元宇宙是利用擴展現(xiàn)實技術和數(shù)字孿生技術生成現(xiàn)實世界的鏡像,用戶通過專用設備體驗到置身其中的現(xiàn)場感、沉浸感,身份也從“旁觀者”轉向“見證者”。
鄭滿寧認為,在新聞生產(chǎn)方面,以虛擬現(xiàn)實為代表的多種表達方式,讓以娛樂或游戲方式輔助新聞表達等成為新聞產(chǎn)品形式的創(chuàng)新嘗試[4]。元宇宙新聞產(chǎn)品可以滿足受眾除視覺、聽覺外更多的感官體驗,能夠突破新聞消費者的角色桎梏,以第一人稱親臨新聞現(xiàn)場,了解新聞事件的全貌,不受媒體觀念引導,做出自己的判斷。
目前元宇宙技術發(fā)展仍處于極早期,相關領域專家認為,從元宇宙賦能不同行業(yè)的角度來看,目前落地的行業(yè)有會展業(yè)、文旅業(yè)、教育、娛樂社交,甚至是工業(yè)和農(nóng)業(yè)[5]。從投入產(chǎn)出比來看,大多數(shù)媒體沒有自有技術和極強動力推動元宇宙的突破性發(fā)展,順勢而為較為普遍。目前媒體應用較為廣泛的元宇宙技術包括虛擬會議、數(shù)字人主播、新聞播報、數(shù)字內容自動生成等。
新華網(wǎng)在元宇宙新聞領域布局范圍廣,投入資金多。2022 年全國兩會前夕,新華社新立方智能化演播室推出首個沉浸式融屏訪談,運用5G、MR(混合現(xiàn)實)、XR(擴展現(xiàn)實)、虛擬空間等技術,打破時空限制,讓主持人與王亞平代表等實現(xiàn)“裸眼3D”般的面對面交流,實現(xiàn)全實景、真融屏。
作為AIGC 的一個領域,近期GPT 類應用的出現(xiàn),讓傳媒領域的從業(yè)者感到職業(yè)危機的來臨。GPT 類應用建立在大語言模型基礎上,主要研究如何訓練和應用能夠處理自然語言的大規(guī)模神經(jīng)網(wǎng)絡。幾乎同時,利用圖像識別技術和大數(shù)據(jù)分析進行剪輯、創(chuàng)作生成圖像和視頻的技術進入了媒體的視野。
AIGC 的各類應用將給圖文、視聽傳媒生產(chǎn)方式帶來三方面的變化。一是改變新聞生產(chǎn)的主體。新聞生產(chǎn)由專業(yè)生產(chǎn)、用戶生成轉向專業(yè)+用戶+機器人共同生產(chǎn)。二是極大地提升了機器人自動寫作的質量。不同于過去寫作機器人的簡單式、模塊化生產(chǎn),大語言模型可以模仿人類語言,更快速、高效地生成大量文本,且不再局限于某幾個領域的創(chuàng)作;圖片視頻類AI 應用則可以直接將簡單的文本創(chuàng)作為視頻,順應了目前新聞碎片化、視頻化的趨勢。三是重塑媒體的傳播格局。過去媒體到用戶的傳播格局轉為用戶到媒體,由編輯決定用戶看什么——由算法決定用戶看什么——由用戶自主提問決定看什么。四是改變了新聞策劃邏輯,過去新聞議題設置多依靠上級指令、新聞熱點,后將算法推薦納入策劃參考,可以提升受眾體驗,未來的趨勢是媒體根據(jù)用戶指令自動生成內容。
未來,機器人寫作將逐步升級為大語言模型輔助的新聞寫作,這雖然提升了新聞生產(chǎn)的效率,但它在新聞真實性、立場把控,以及必要的人人關懷方面存在缺陷。究其原因,大語言模型采納和分析的數(shù)據(jù)均來自互聯(lián)網(wǎng)數(shù)據(jù)庫,但互聯(lián)網(wǎng)上海量的數(shù)據(jù)存在質量良莠不齊、虛假數(shù)據(jù)、重復數(shù)據(jù)等多種問題。
如何規(guī)范化使用、核實數(shù)據(jù),在使用數(shù)據(jù)的同時保護用戶的隱私,都需要媒體專業(yè)人員把控。如果媒體不能對AI生成的內容進行核實,將出現(xiàn)稿件“一本正經(jīng)瞎說”的荒誕情況,媒體的公信力將遭受極大損害。筆者認為,可行的解決方式之一是媒體構建自己的大模型數(shù)據(jù)庫并交由技術人員進行訓練,夯實數(shù)據(jù)基礎,從而為受眾提供可靠的新聞產(chǎn)品。
我國著作權法律制度規(guī)定,作品是指文學、藝術和科學領域具有獨創(chuàng)性并能以某種有形形式復制的智力成果。當前,人工智能生成的內容不受著作權法保護。但是這不影響人工智能生成的作品具有歸屬權及收益權。這兩者雖看似矛盾,卻也是推動技術進步的重要的一面。
王淵博士認為,人工智能生成的內容不是著作權法意義上的作品,其理由是人工智能生成的內容不屬于人的智力成果、不能反映人類的情感和思想、缺乏獨創(chuàng)性,而且社會對高品質作品的需要要求不能將人工智能生成物作為作品。但是他認為,人工智能生成內容可歸屬于三方,即程序設計者、內容整體把控者以及投資設計者[6]。
筆者認為,一是站在傳媒企業(yè)的角度,如果媒體在使用模型的過程中,數(shù)據(jù)、模型算法均來自程序設計者,媒體僅僅將這個平臺交由受眾使用,受眾提問后,模型自主生成并直接提供給受眾,這樣生成的作品應為程序設計者所有。二是如果媒體僅將大模型作為輔助工具,作品結構設置、陳述鋪排、核實驗證均由媒體完成,此類作品應為程序設計者和媒體共有。在目前沒有明確的法律條文規(guī)范的情況下,作品所有權歸屬更多的是商業(yè)問題,應由媒體和程序設計者通過友好協(xié)商、制定合約的形式確定。待日后法律法規(guī)逐步完善后進行合理合法界定。
首先,不同國家開發(fā)的GPT 類應用,因底層邏輯、數(shù)據(jù)不同而存在立場偏差。媒體在使用過程中如不加以區(qū)分,或編輯水平有限未能識別,生產(chǎn)出的內容極容易受到影響,導致文章立場錯誤、圖片或視頻存在導向問題,給媒體帶來不可估量的重大影響。
其次,AIGC 模型本身是通過機器學習的方式訓練得到的,它在學習過程中會尋找數(shù)據(jù)中的模式和規(guī)律。如果訓練數(shù)據(jù)集中存在某些類型的偏見或傾向,AIGC 很可能會學習到這些傾向性的模式,并在生成內容時表現(xiàn)出來。這也可能導致AIGC 在觀點表達上存在立場偏差。
最后,AIGC 對于語言和語義的理解是有限的。它無法真正理解文本中的含義和背景知識,只是通過統(tǒng)計模型和模式匹配來生成內容。這種有限的理解能力也加劇了AIGC 生成內容中可能存在的立場偏差。
人工智能的持續(xù)發(fā)展,對于任何行業(yè)來說都存在一個奇點,屆時從業(yè)者將有可能被人工智能取代,傳媒行業(yè)亦是如此。首先,從事基礎性報道和剪輯的新聞從業(yè)者將面臨職業(yè)危機。其次,新聞報道呈現(xiàn)給受眾之前需要嚴格的審校流程,記者本是第一道關口,對其作品負責,依靠人工智能寫稿無寫作責任人,稿件審核人員的審核責任將加重。
未來,傳媒企業(yè)不能對科技發(fā)展視而不見,畫地為牢。陸小華預測,新聞出版業(yè)在有規(guī)則約束的條件下,會以專業(yè)方式探索使用智能內容生成工具,而智能內容生成技術開發(fā)者也會把新聞出版作為重要行業(yè)應用場景定制開發(fā)[7]。事實上,這一幕已經(jīng)在上演了。包括澎湃新聞等多家媒體均已對外宣稱引入大語言模型輔助內容生產(chǎn)。筆者認為,“內容為王”的理念依然重要,但在技術飛速發(fā)展的時代,媒體更應重視技術的運用,走上內容+技術+渠道+市場+人才的多元化發(fā)展之路。在這一過程中,媒體有以下幾點需要注意。
AIGC 基于數(shù)據(jù)和算法生產(chǎn),數(shù)據(jù)的質量決定了AIGC 內容的質量、立場,算法的邏輯決定了AIGC 的行文邏輯。而新聞有其嚴格的生產(chǎn)和審核流程,在引入AIGC 后,媒體應對進入數(shù)據(jù)庫的數(shù)據(jù)加強審核,嚴守新聞道德底線。
AIGC 有其優(yōu)勢,但其最大的劣勢是內容均來自已有數(shù)據(jù)。新聞回歸最原始的初衷是新聞事件發(fā)生后第一時間為受眾傳遞實時消息。AIGC 無法完成一手新聞的報道。鑒于此,媒體應不忘初心,做好本職工作,提升“四力”,為受眾提供源源不斷的一手新聞資訊。另外,資深媒體人所具有的廣泛人脈、信息搜集整合能力以及深刻的洞察力、判斷力是人工智能不具備的能力,媒體應取長補短,加大深度報道、解讀報道的創(chuàng)作力度。
雖說“酒香不怕巷子深”,但如果媒體自主傳播渠道不暢,優(yōu)質的內容將無法被受眾看到,或者被聚合類新聞資訊平臺傳播成為“別人的嫁衣”。南瑞琴認為,在傳統(tǒng)媒體面臨的種種危機中,最直接和最致命的就是渠道分發(fā)和廣告收入被互聯(lián)網(wǎng)平臺截留[8]。因此,無論優(yōu)質內容出自人還是人工智能,其目標都是為受眾服務,因此傳播渠道始終非常重要,媒體應發(fā)力守住自己的輿論陣地。
綜上,歷史發(fā)展經(jīng)驗告訴我們,在算法推薦、寫作機器人、元宇宙新聞的發(fā)展過程中,媒體逐步將其成功引入自身的發(fā)展中。技術的發(fā)展推動媒體走向何方,仍取決于媒體的判斷和戰(zhàn)略規(guī)劃。合理、有效地利用AIGC,一定能夠提升媒體的生產(chǎn)效率,正向推動媒體深度融合,提升媒體的傳播力、引導力、影響力和公信力。