亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

大模型數(shù)據(jù)新聞寫作的特點(diǎn)、方法與風(fēng)險(xiǎn)防范

2024-11-29 00:00:00陳星

智慧東方·新傳播 2024年5期

【摘要】隨著人工智能技術(shù)的飛速發(fā)展，大模型在數(shù)據(jù)新聞自動(dòng)化寫作領(lǐng)域的應(yīng)用逐漸成為可能，不僅提高了新聞生產(chǎn)的效率，也為新聞內(nèi)容的創(chuàng)新提供了新思路。然而，這一技術(shù)的應(yīng)用并非沒有挑戰(zhàn)。提升數(shù)據(jù)的準(zhǔn)確性、模型的處理能力等都是需要深入探討的話題。本文探討大模型在數(shù)據(jù)新聞自動(dòng)化寫作中的應(yīng)用，并對(duì)其技術(shù)實(shí)現(xiàn)、面臨的挑戰(zhàn)進(jìn)行討論。

【關(guān)鍵詞】數(shù)據(jù)新聞"" 大模型"" AI"" 自動(dòng)化寫作

隨著人工智能技術(shù)特別是大模型技術(shù)的日益成熟，數(shù)據(jù)新聞的生產(chǎn)方式正經(jīng)歷深刻變革。大模型以其強(qiáng)大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力，正逐步改變著傳統(tǒng)新聞生產(chǎn)的面貌。它不僅極大地提升了新聞生產(chǎn)的效率，更在內(nèi)容的深度和廣度上實(shí)現(xiàn)了質(zhì)的飛躍。然而，正如任何技術(shù)革新都伴隨著挑戰(zhàn)與考驗(yàn)，大模型在數(shù)據(jù)新聞自動(dòng)化寫作中的應(yīng)用也非一帆風(fēng)順。數(shù)據(jù)的準(zhǔn)確性、大模型幻覺、內(nèi)容同質(zhì)化等問題，都需要我們深入探討與解決。

一、大模型數(shù)據(jù)新聞寫作的原則

（一）準(zhǔn)確性原則

利用大模型進(jìn)行數(shù)據(jù)新聞寫作，只是增加了大模型這一輔助工具，并不能改變新聞寫作原有的準(zhǔn)確性原則。

在準(zhǔn)確性方面，應(yīng)使用高質(zhì)量、無(wú)誤差的數(shù)據(jù)來(lái)避免“垃圾進(jìn)、垃圾出”的問題。一旦模型部署完成，其輸出也應(yīng)經(jīng)過人工審核，以確保最終報(bào)道的準(zhǔn)確性。準(zhǔn)確性還涉及對(duì)數(shù)據(jù)時(shí)效性的考量。在數(shù)據(jù)實(shí)時(shí)變化的領(lǐng)域（如金融市場(chǎng)或突發(fā)新聞事件）使用過時(shí)數(shù)據(jù)可能導(dǎo)致誤導(dǎo)性的結(jié)論。

（二）客觀性原則

在客觀性方面，使用大模型時(shí)，應(yīng)注意避免算法偏見。即使模型提供了某種趨勢(shì)或模式的分析，記者也應(yīng)從多個(gè)角度探討問題，提供平衡的視角。為了增強(qiáng)報(bào)道的客觀性，可以采用交叉驗(yàn)證的方法，即使用不同的模型或方法來(lái)檢驗(yàn)同一數(shù)據(jù)集，比較它們的結(jié)果是否一致。

（三）倫理性原則

尊重個(gè)人隱私和數(shù)據(jù)安全是使用大模型時(shí)必須遵守的原則。在收集和使用數(shù)據(jù)的過程中，應(yīng)確保符合相關(guān)法律法規(guī)的要求，不得侵犯他人權(quán)益。

二、大模型數(shù)據(jù)新聞寫作的特點(diǎn)

（一）自動(dòng)化生成

自動(dòng)化生成是大模型在數(shù)據(jù)新聞寫作中的一個(gè)顯著特點(diǎn)。通過預(yù)先訓(xùn)練好的算法，這些模型能夠自動(dòng)分析大量的數(shù)據(jù)集，并生成新聞稿件。這不僅提高了效率，還能讓記者將更多的時(shí)間和精力投入到深度報(bào)道和調(diào)查報(bào)道中。

當(dāng)需要報(bào)道經(jīng)濟(jì)數(shù)據(jù)時(shí)，記者只需輸入相關(guān)的經(jīng)濟(jì)指標(biāo)，模型便能快速自動(dòng)產(chǎn)出一篇包含關(guān)鍵信息和基本分析的報(bào)道草稿。這不僅減少了初步撰寫的時(shí)間，也為記者提供可靠的起點(diǎn)，以便進(jìn)一步豐富和完善報(bào)道內(nèi)容。

自動(dòng)化生成的另一個(gè)優(yōu)勢(shì)在于其一致性和標(biāo)準(zhǔn)化。只要將指令固化，模型就會(huì)持續(xù)穩(wěn)定地產(chǎn)出符合一定質(zhì)量標(biāo)準(zhǔn)的內(nèi)容。

（二）多角度分析

大模型可從多個(gè)維度對(duì)數(shù)據(jù)進(jìn)行深入挖掘，揭示數(shù)據(jù)背后的復(fù)雜關(guān)系。它們不僅能進(jìn)行簡(jiǎn)單的數(shù)據(jù)統(tǒng)計(jì)，還能通過算法識(shí)別出數(shù)據(jù)間的相關(guān)性、趨勢(shì)變化等深層次信息。

以失業(yè)率為例，模型可能會(huì)同時(shí)考慮到經(jīng)濟(jì)增長(zhǎng)率、通貨膨脹率等多個(gè)因素，幫助記者構(gòu)建更為立體的報(bào)道框架。這種多角度的分析使得新聞報(bào)道不再局限于表面的數(shù)字，而是能夠觸及更深層次的社會(huì)問題和經(jīng)濟(jì)現(xiàn)象。

（三）分步驟完成稿件

大模型雖然在效率和分析方面能夠極大地幫助記者，但目前并不能一次性形成完整的稿件，需要記者分步驟對(duì)其提出指令，得到階段性答案，然后再將前面的答案“拼”成一篇稿件。這一過程通常包括數(shù)據(jù)收集、分析、生成初稿，以及穿插在這些環(huán)節(jié)中的反復(fù)微調(diào)等。

例如，我們不能直接對(duì)大模型說(shuō)“請(qǐng)結(jié)合國(guó)家統(tǒng)計(jì)局發(fā)布的8月份PMI數(shù)據(jù)，幫我寫一篇新聞稿件?！卑l(fā)出這個(gè)指令，大模型雖然會(huì)寫出一篇“文章”，但由于它并不知道記者的具體要求以及文章的風(fēng)格，所以可用性并不強(qiáng)。

三、大模型寫作的流程和方法

目前市面上主流的通用大模型數(shù)量眾多，但從操作角度來(lái)看差別不大，只是效果參差不齊。本文以kimi大模型為例，結(jié)合國(guó)家統(tǒng)計(jì)局公布的2024年1-8月主要經(jīng)濟(jì)數(shù)據(jù)，探討數(shù)據(jù)新聞寫作的流程和方法。

（一）數(shù)據(jù)搜集與整理

目前市面上大多數(shù)大模型可以讀取單個(gè)網(wǎng)址或單個(gè)文件中的數(shù)據(jù)。如果新聞寫作只涉及當(dāng)月公布的新數(shù)據(jù)，那么就可以直接將網(wǎng)址或文件投喂給大模型，讓其提煉數(shù)據(jù)特點(diǎn)，并做出分析。

但如果想分析一個(gè)指標(biāo)在一段時(shí)間內(nèi)的整體特點(diǎn)，或者將新數(shù)據(jù)放置在較長(zhǎng)的一段時(shí)間內(nèi)觀察比較，就有兩種操作方法。一是讓大模型自行聯(lián)網(wǎng)搜索一段時(shí)間內(nèi)的某個(gè)經(jīng)濟(jì)指標(biāo)。例如，可以向大模型提出“請(qǐng)幫我找出今年以來(lái)國(guó)家統(tǒng)計(jì)局公布的PMI數(shù)據(jù)”的指令。該操作的優(yōu)點(diǎn)是可以省去人工收集數(shù)據(jù)的步驟，但劣勢(shì)是仍然需要記者或編輯對(duì)數(shù)據(jù)進(jìn)行核查，整體上看并沒有節(jié)省人力。

二是記者自行整理一段時(shí)間以來(lái)的經(jīng)濟(jì)數(shù)據(jù)。由于經(jīng)濟(jì)數(shù)據(jù)的發(fā)布較為規(guī)范，所以對(duì)于有經(jīng)驗(yàn)的記者而言，人工整理并不會(huì)用太多時(shí)間，但準(zhǔn)確率大大提高，會(huì)為后續(xù)環(huán)節(jié)節(jié)省人力。

（二）大模型的識(shí)別、分析

如果是記者自行收集整理數(shù)據(jù)，那么可以將投喂數(shù)據(jù)、提出分析指令合二為一，一次性讓大模型完成數(shù)據(jù)讀取、分析工作。

例如，我們可以先復(fù)制粘貼好一年內(nèi)的PPI數(shù)據(jù)，然后直接在其后附上分析要求——“以上是一段時(shí)間以來(lái)的制造業(yè)出廠價(jià)格指數(shù)（PPI），請(qǐng)幫我分析一下：

（1）8月份的數(shù)據(jù)有哪些特點(diǎn)？例如上漲、下跌，是否是最高點(diǎn)……

（2）本月數(shù)據(jù)背后的原因是什么？不要籠統(tǒng)地分析，要具體說(shuō)出是什么因素導(dǎo)致的，分析要有針對(duì)性。

（3）要注意結(jié)合當(dāng)下的政策、國(guó)內(nèi)外經(jīng)濟(jì)環(huán)境，以及此時(shí)此刻的新形勢(shì)進(jìn)行分析。分析內(nèi)容達(dá)到800字?！?/p>

只需幾秒鐘，kimi就會(huì)從原材料價(jià)格上漲、穩(wěn)增長(zhǎng)政策措施、國(guó)際供應(yīng)鏈影響等9個(gè)方面作出分析，同時(shí)還能描述數(shù)據(jù)特征、作出綜合總結(jié)，質(zhì)量很高。

（三）文本寫作

前述兩個(gè)階段實(shí)際上還是素材準(zhǔn)備階段，并沒有進(jìn)入寫作環(huán)節(jié)。在寫作之前，應(yīng)該先讓大模型熟悉了解所需的文章風(fēng)格或格式。

我們可以先將一篇成熟、規(guī)范的稿件作為參考標(biāo)準(zhǔn)投喂給大模型讓其學(xué)習(xí)。這時(shí)的指令要明確，讓它學(xué)習(xí)這篇文章的結(jié)構(gòu)、邏輯、語(yǔ)言風(fēng)格等。

然后可以將剛才大模型分析的結(jié)果，以及其他背景資料投喂給大模型，讓其仿照范文，寫出一篇新的文章。

目前市面上很多大模型對(duì)字?jǐn)?shù)有限制，如果要求生成的文章篇幅較大，那么可以考慮分塊生成，比如先讓大模型仿照范文寫導(dǎo)語(yǔ)和第一個(gè)小標(biāo)題的內(nèi)容，再寫第二、第三個(gè)小標(biāo)題的內(nèi)容，然后人工拼裝即可。

（四）文章潤(rùn)色、微調(diào)

稿件生成后，還需要繼續(xù)微調(diào)或潤(rùn)色，包括調(diào)整標(biāo)題。這時(shí)，既可以讓kimi直接潤(rùn)色或重?cái)M若干標(biāo)題，也可以繼續(xù)給它范例，讓它學(xué)習(xí)后“照貓畫虎”。

（五）根據(jù)大模型的反饋調(diào)整指令

在自動(dòng)化寫作各環(huán)節(jié)中，我們可隨時(shí)根據(jù)大模型的反饋調(diào)整指令。簡(jiǎn)言之，凡是大模型沒有做到令人滿意的地方，我們就可以繼續(xù)提出調(diào)整要求，直至給出理想答案。

需要注意的是，大模型的生成過程是基于用戶平時(shí)的訓(xùn)練，如果平時(shí)用戶就同一話題、同一指令反復(fù)訓(xùn)練大模型，那么最終形成的指令就會(huì)成為“模板”被固化，從而一次性得到較為滿意的答案，無(wú)需再調(diào)整指令，將極大地節(jié)省寫作時(shí)間。

訓(xùn)練大模型是一個(gè)不斷進(jìn)步的過程。隨著時(shí)間的推移和技術(shù)的發(fā)展，這些模型可以變得越來(lái)越聰明，越來(lái)越擅長(zhǎng)理解和生成語(yǔ)言。

四、風(fēng)險(xiǎn)識(shí)別

大模型目前仍處于快速發(fā)展階段，不可避免地會(huì)存在一定問題。

首先是大模型幻覺。大模型出現(xiàn)幻覺，簡(jiǎn)而言之就是“胡說(shuō)八道”。有研究者將大模型幻覺分為事實(shí)性幻覺和忠實(shí)性幻覺。

事實(shí)性幻覺是指模型生成的內(nèi)容與事實(shí)不一致。比如問大模型“第一個(gè)做……事的人是誰(shuí)？”模型回復(fù)“是張三”，實(shí)際上應(yīng)該是李四。事實(shí)性幻覺又可以分為與正確事實(shí)不一致和捏造不存在的事實(shí)。

忠實(shí)性幻覺則是指模型生成的內(nèi)容與用戶的指令或上下文不一致。比如讓模型總結(jié)今年10月份的數(shù)據(jù)特點(diǎn)，結(jié)果模型卻在說(shuō)去年10月份的數(shù)據(jù)。

目前，基于用戶角度并不能完全解決大模型幻覺問題，緩解辦法一是投喂高質(zhì)量、準(zhǔn)確度高的素材；二是反復(fù)調(diào)整指令，直至得出較為準(zhǔn)確的答案；三是加強(qiáng)人工核查。

例如，2024年5月，國(guó)家統(tǒng)計(jì)局公布了月度制造業(yè)出廠價(jià)格指數(shù)（PPI），該數(shù)據(jù)8個(gè)月來(lái)首次升至擴(kuò)張區(qū)間。大模型在分析其他原因之后還提出一點(diǎn)——“降準(zhǔn)之后，金融條件持續(xù)寬松，市場(chǎng)流動(dòng)性增加。這種貨幣寬松政策支持了企業(yè)的融資需求，促進(jìn)了生產(chǎn)擴(kuò)張的同時(shí)，增強(qiáng)了企業(yè)在定價(jià)上的信心。這導(dǎo)致制造業(yè)企業(yè)在面對(duì)需求上升時(shí)，不會(huì)因資金緊張而抑制定價(jià)。”這種分析在邏輯上是對(duì)的，但事實(shí)上是有問題的，因?yàn)閷?shí)際上國(guó)內(nèi)降準(zhǔn)是在2月初實(shí)施的，用來(lái)解釋4月的數(shù)據(jù)，明顯過于滯后。另外根據(jù)4月份的金融數(shù)據(jù)，尤其是企業(yè)融資需求來(lái)看，市場(chǎng)是在萎縮的。

其次是內(nèi)容同質(zhì)化風(fēng)險(xiǎn)。當(dāng)多個(gè)用戶使用相同的大模型生成數(shù)據(jù)新聞時(shí)，就有可能出現(xiàn)內(nèi)容同質(zhì)化的情況。由于大模型的算法和訓(xùn)練數(shù)據(jù)可能相似，它們生成的報(bào)道可能就會(huì)在結(jié)構(gòu)甚至內(nèi)容上重復(fù)。

針對(duì)這一風(fēng)險(xiǎn)，記者可以通過在特定領(lǐng)域進(jìn)行深入訓(xùn)練，讓大模型生成更專業(yè)、更具深度的內(nèi)容。比如，提高敏感性，關(guān)注細(xì)分領(lǐng)域的數(shù)據(jù)，而不是只關(guān)注主要數(shù)據(jù)；再比如同時(shí)使用多個(gè)大模型進(jìn)行同一題材的寫作，利用各模型之間的差異性來(lái)提升稿件的獨(dú)創(chuàng)性等。

參考文獻(xiàn)

[1]《如何調(diào)教大模型？——提示詞工程實(shí)踐》https：//blog.csdn.net/aolan123/article/details/139863057

[2]誰(shuí)是最強(qiáng)“AI記者”？每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告（第1期）發(fā)布https：//www.nbd.com.cn/articles/2024-06-21/3436368.html

[3]周葆華，陸盈盈.生成式人工智能影響下的新聞生產(chǎn)創(chuàng)新：實(shí)踐與挑戰(zhàn).青年記者，2024（03）：5-11.

[4]大模型「幻覺」，看這一篇就夠了|哈工大華為出品https：//mp.weixin.qq.com/s？__biz=MzIzNjc1NzUzMw==amp;mid=2247704227amp;idx=3amp;sn=67632acba917363f710b5ab176f516d8

智慧東方·新傳播2024年5期

智慧東方·新傳播的其它文章: 外媒新探; 微觀圍觀; 面對(duì)普通人，評(píng)論慎說(shuō)狠話; 奧運(yùn)采訪頻被懟，記者做錯(cuò)了什么？; 數(shù)字端任意改動(dòng)，損害報(bào)紙的歷史價(jià)值; 空白筆記本貴過書

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

大模型數(shù)據(jù)新聞寫作的特點(diǎn)、方法與風(fēng)險(xiǎn)防范

大模型數(shù)據(jù)新聞寫作的特點(diǎn)、方法與風(fēng)險(xiǎn)防范