亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大模型數(shù)據(jù)新聞寫作的特點(diǎn)、方法與風(fēng)險(xiǎn)防范

        2024-11-29 00:00:00陳星
        智慧東方·新傳播 2024年5期

        【摘要】隨著人工智能技術(shù)的飛速發(fā)展,大模型在數(shù)據(jù)新聞自動(dòng)化寫作領(lǐng)域的應(yīng)用逐漸成為可能,不僅提高了新聞生產(chǎn)的效率,也為新聞內(nèi)容的創(chuàng)新提供了新思路。然而,這一技術(shù)的應(yīng)用并非沒有挑戰(zhàn)。提升數(shù)據(jù)的準(zhǔn)確性、模型的處理能力等都是需要深入探討的話題。本文探討大模型在數(shù)據(jù)新聞自動(dòng)化寫作中的應(yīng)用,并對(duì)其技術(shù)實(shí)現(xiàn)、面臨的挑戰(zhàn)進(jìn)行討論。

        【關(guān)鍵詞】數(shù)據(jù)新聞"" 大模型"" AI"" 自動(dòng)化寫作

        隨著人工智能技術(shù)特別是大模型技術(shù)的日益成熟,數(shù)據(jù)新聞的生產(chǎn)方式正經(jīng)歷深刻變革。大模型以其強(qiáng)大的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力,正逐步改變著傳統(tǒng)新聞生產(chǎn)的面貌。它不僅極大地提升了新聞生產(chǎn)的效率,更在內(nèi)容的深度和廣度上實(shí)現(xiàn)了質(zhì)的飛躍。然而,正如任何技術(shù)革新都伴隨著挑戰(zhàn)與考驗(yàn),大模型在數(shù)據(jù)新聞自動(dòng)化寫作中的應(yīng)用也非一帆風(fēng)順。數(shù)據(jù)的準(zhǔn)確性、大模型幻覺、內(nèi)容同質(zhì)化等問題,都需要我們深入探討與解決。

        一、大模型數(shù)據(jù)新聞寫作的原則

        (一)準(zhǔn)確性原則

        利用大模型進(jìn)行數(shù)據(jù)新聞寫作,只是增加了大模型這一輔助工具,并不能改變新聞寫作原有的準(zhǔn)確性原則。

        在準(zhǔn)確性方面,應(yīng)使用高質(zhì)量、無(wú)誤差的數(shù)據(jù)來(lái)避免“垃圾進(jìn)、垃圾出”的問題。一旦模型部署完成,其輸出也應(yīng)經(jīng)過人工審核,以確保最終報(bào)道的準(zhǔn)確性。準(zhǔn)確性還涉及對(duì)數(shù)據(jù)時(shí)效性的考量。在數(shù)據(jù)實(shí)時(shí)變化的領(lǐng)域(如金融市場(chǎng)或突發(fā)新聞事件)使用過時(shí)數(shù)據(jù)可能導(dǎo)致誤導(dǎo)性的結(jié)論。

        (二)客觀性原則

        在客觀性方面,使用大模型時(shí),應(yīng)注意避免算法偏見。即使模型提供了某種趨勢(shì)或模式的分析,記者也應(yīng)從多個(gè)角度探討問題,提供平衡的視角。為了增強(qiáng)報(bào)道的客觀性,可以采用交叉驗(yàn)證的方法,即使用不同的模型或方法來(lái)檢驗(yàn)同一數(shù)據(jù)集,比較它們的結(jié)果是否一致。

        (三)倫理性原則

        尊重個(gè)人隱私和數(shù)據(jù)安全是使用大模型時(shí)必須遵守的原則。在收集和使用數(shù)據(jù)的過程中,應(yīng)確保符合相關(guān)法律法規(guī)的要求,不得侵犯他人權(quán)益。

        二、大模型數(shù)據(jù)新聞寫作的特點(diǎn)

        (一)自動(dòng)化生成

        自動(dòng)化生成是大模型在數(shù)據(jù)新聞寫作中的一個(gè)顯著特點(diǎn)。通過預(yù)先訓(xùn)練好的算法,這些模型能夠自動(dòng)分析大量的數(shù)據(jù)集,并生成新聞稿件。這不僅提高了效率,還能讓記者將更多的時(shí)間和精力投入到深度報(bào)道和調(diào)查報(bào)道中。

        當(dāng)需要報(bào)道經(jīng)濟(jì)數(shù)據(jù)時(shí),記者只需輸入相關(guān)的經(jīng)濟(jì)指標(biāo),模型便能快速自動(dòng)產(chǎn)出一篇包含關(guān)鍵信息和基本分析的報(bào)道草稿。這不僅減少了初步撰寫的時(shí)間,也為記者提供可靠的起點(diǎn),以便進(jìn)一步豐富和完善報(bào)道內(nèi)容。

        自動(dòng)化生成的另一個(gè)優(yōu)勢(shì)在于其一致性和標(biāo)準(zhǔn)化。只要將指令固化,模型就會(huì)持續(xù)穩(wěn)定地產(chǎn)出符合一定質(zhì)量標(biāo)準(zhǔn)的內(nèi)容。

        (二)多角度分析

        大模型可從多個(gè)維度對(duì)數(shù)據(jù)進(jìn)行深入挖掘,揭示數(shù)據(jù)背后的復(fù)雜關(guān)系。它們不僅能進(jìn)行簡(jiǎn)單的數(shù)據(jù)統(tǒng)計(jì),還能通過算法識(shí)別出數(shù)據(jù)間的相關(guān)性、趨勢(shì)變化等深層次信息。

        以失業(yè)率為例,模型可能會(huì)同時(shí)考慮到經(jīng)濟(jì)增長(zhǎng)率、通貨膨脹率等多個(gè)因素,幫助記者構(gòu)建更為立體的報(bào)道框架。這種多角度的分析使得新聞報(bào)道不再局限于表面的數(shù)字,而是能夠觸及更深層次的社會(huì)問題和經(jīng)濟(jì)現(xiàn)象。

        (三)分步驟完成稿件

        大模型雖然在效率和分析方面能夠極大地幫助記者,但目前并不能一次性形成完整的稿件,需要記者分步驟對(duì)其提出指令,得到階段性答案,然后再將前面的答案“拼”成一篇稿件。這一過程通常包括數(shù)據(jù)收集、分析、生成初稿,以及穿插在這些環(huán)節(jié)中的反復(fù)微調(diào)等。

        例如,我們不能直接對(duì)大模型說(shuō)“請(qǐng)結(jié)合國(guó)家統(tǒng)計(jì)局發(fā)布的8月份PMI數(shù)據(jù),幫我寫一篇新聞稿件?!卑l(fā)出這個(gè)指令,大模型雖然會(huì)寫出一篇“文章”,但由于它并不知道記者的具體要求以及文章的風(fēng)格,所以可用性并不強(qiáng)。

        三、大模型寫作的流程和方法

        目前市面上主流的通用大模型數(shù)量眾多,但從操作角度來(lái)看差別不大,只是效果參差不齊。本文以kimi大模型為例,結(jié)合國(guó)家統(tǒng)計(jì)局公布的2024年1-8月主要經(jīng)濟(jì)數(shù)據(jù),探討數(shù)據(jù)新聞寫作的流程和方法。

        (一)數(shù)據(jù)搜集與整理

        目前市面上大多數(shù)大模型可以讀取單個(gè)網(wǎng)址或單個(gè)文件中的數(shù)據(jù)。如果新聞寫作只涉及當(dāng)月公布的新數(shù)據(jù),那么就可以直接將網(wǎng)址或文件投喂給大模型,讓其提煉數(shù)據(jù)特點(diǎn),并做出分析。

        但如果想分析一個(gè)指標(biāo)在一段時(shí)間內(nèi)的整體特點(diǎn),或者將新數(shù)據(jù)放置在較長(zhǎng)的一段時(shí)間內(nèi)觀察比較,就有兩種操作方法。一是讓大模型自行聯(lián)網(wǎng)搜索一段時(shí)間內(nèi)的某個(gè)經(jīng)濟(jì)指標(biāo)。例如,可以向大模型提出“請(qǐng)幫我找出今年以來(lái)國(guó)家統(tǒng)計(jì)局公布的PMI數(shù)據(jù)”的指令。該操作的優(yōu)點(diǎn)是可以省去人工收集數(shù)據(jù)的步驟,但劣勢(shì)是仍然需要記者或編輯對(duì)數(shù)據(jù)進(jìn)行核查,整體上看并沒有節(jié)省人力。

        二是記者自行整理一段時(shí)間以來(lái)的經(jīng)濟(jì)數(shù)據(jù)。由于經(jīng)濟(jì)數(shù)據(jù)的發(fā)布較為規(guī)范,所以對(duì)于有經(jīng)驗(yàn)的記者而言,人工整理并不會(huì)用太多時(shí)間,但準(zhǔn)確率大大提高,會(huì)為后續(xù)環(huán)節(jié)節(jié)省人力。

        (二)大模型的識(shí)別、分析

        如果是記者自行收集整理數(shù)據(jù),那么可以將投喂數(shù)據(jù)、提出分析指令合二為一,一次性讓大模型完成數(shù)據(jù)讀取、分析工作。

        例如,我們可以先復(fù)制粘貼好一年內(nèi)的PPI數(shù)據(jù),然后直接在其后附上分析要求——“以上是一段時(shí)間以來(lái)的制造業(yè)出廠價(jià)格指數(shù)(PPI),請(qǐng)幫我分析一下:

        (1)8月份的數(shù)據(jù)有哪些特點(diǎn)?例如上漲、下跌,是否是最高點(diǎn)……

        (2)本月數(shù)據(jù)背后的原因是什么?不要籠統(tǒng)地分析,要具體說(shuō)出是什么因素導(dǎo)致的,分析要有針對(duì)性。

        (3)要注意結(jié)合當(dāng)下的政策、國(guó)內(nèi)外經(jīng)濟(jì)環(huán)境,以及此時(shí)此刻的新形勢(shì)進(jìn)行分析。分析內(nèi)容達(dá)到800字?!?/p>

        只需幾秒鐘,kimi就會(huì)從原材料價(jià)格上漲、穩(wěn)增長(zhǎng)政策措施、國(guó)際供應(yīng)鏈影響等9個(gè)方面作出分析,同時(shí)還能描述數(shù)據(jù)特征、作出綜合總結(jié),質(zhì)量很高。

        (三)文本寫作

        前述兩個(gè)階段實(shí)際上還是素材準(zhǔn)備階段,并沒有進(jìn)入寫作環(huán)節(jié)。在寫作之前,應(yīng)該先讓大模型熟悉了解所需的文章風(fēng)格或格式。

        我們可以先將一篇成熟、規(guī)范的稿件作為參考標(biāo)準(zhǔn)投喂給大模型讓其學(xué)習(xí)。這時(shí)的指令要明確,讓它學(xué)習(xí)這篇文章的結(jié)構(gòu)、邏輯、語(yǔ)言風(fēng)格等。

        然后可以將剛才大模型分析的結(jié)果,以及其他背景資料投喂給大模型,讓其仿照范文,寫出一篇新的文章。

        目前市面上很多大模型對(duì)字?jǐn)?shù)有限制,如果要求生成的文章篇幅較大,那么可以考慮分塊生成,比如先讓大模型仿照范文寫導(dǎo)語(yǔ)和第一個(gè)小標(biāo)題的內(nèi)容,再寫第二、第三個(gè)小標(biāo)題的內(nèi)容,然后人工拼裝即可。

        (四)文章潤(rùn)色、微調(diào)

        稿件生成后,還需要繼續(xù)微調(diào)或潤(rùn)色,包括調(diào)整標(biāo)題。這時(shí),既可以讓kimi直接潤(rùn)色或重?cái)M若干標(biāo)題,也可以繼續(xù)給它范例,讓它學(xué)習(xí)后“照貓畫虎”。

        (五)根據(jù)大模型的反饋調(diào)整指令

        在自動(dòng)化寫作各環(huán)節(jié)中,我們可隨時(shí)根據(jù)大模型的反饋調(diào)整指令。簡(jiǎn)言之,凡是大模型沒有做到令人滿意的地方,我們就可以繼續(xù)提出調(diào)整要求,直至給出理想答案。

        需要注意的是,大模型的生成過程是基于用戶平時(shí)的訓(xùn)練,如果平時(shí)用戶就同一話題、同一指令反復(fù)訓(xùn)練大模型,那么最終形成的指令就會(huì)成為“模板”被固化,從而一次性得到較為滿意的答案,無(wú)需再調(diào)整指令,將極大地節(jié)省寫作時(shí)間。

        訓(xùn)練大模型是一個(gè)不斷進(jìn)步的過程。隨著時(shí)間的推移和技術(shù)的發(fā)展,這些模型可以變得越來(lái)越聰明,越來(lái)越擅長(zhǎng)理解和生成語(yǔ)言。

        四、風(fēng)險(xiǎn)識(shí)別

        大模型目前仍處于快速發(fā)展階段,不可避免地會(huì)存在一定問題。

        首先是大模型幻覺。大模型出現(xiàn)幻覺,簡(jiǎn)而言之就是“胡說(shuō)八道”。有研究者將大模型幻覺分為事實(shí)性幻覺和忠實(shí)性幻覺。

        事實(shí)性幻覺是指模型生成的內(nèi)容與事實(shí)不一致。比如問大模型“第一個(gè)做……事的人是誰(shuí)?”模型回復(fù)“是張三”,實(shí)際上應(yīng)該是李四。事實(shí)性幻覺又可以分為與正確事實(shí)不一致和捏造不存在的事實(shí)。

        忠實(shí)性幻覺則是指模型生成的內(nèi)容與用戶的指令或上下文不一致。比如讓模型總結(jié)今年10月份的數(shù)據(jù)特點(diǎn),結(jié)果模型卻在說(shuō)去年10月份的數(shù)據(jù)。

        目前,基于用戶角度并不能完全解決大模型幻覺問題,緩解辦法一是投喂高質(zhì)量、準(zhǔn)確度高的素材;二是反復(fù)調(diào)整指令,直至得出較為準(zhǔn)確的答案;三是加強(qiáng)人工核查。

        例如,2024年5月,國(guó)家統(tǒng)計(jì)局公布了月度制造業(yè)出廠價(jià)格指數(shù)(PPI),該數(shù)據(jù)8個(gè)月來(lái)首次升至擴(kuò)張區(qū)間。大模型在分析其他原因之后還提出一點(diǎn)——“降準(zhǔn)之后,金融條件持續(xù)寬松,市場(chǎng)流動(dòng)性增加。這種貨幣寬松政策支持了企業(yè)的融資需求,促進(jìn)了生產(chǎn)擴(kuò)張的同時(shí),增強(qiáng)了企業(yè)在定價(jià)上的信心。這導(dǎo)致制造業(yè)企業(yè)在面對(duì)需求上升時(shí),不會(huì)因資金緊張而抑制定價(jià)。”這種分析在邏輯上是對(duì)的,但事實(shí)上是有問題的,因?yàn)閷?shí)際上國(guó)內(nèi)降準(zhǔn)是在2月初實(shí)施的,用來(lái)解釋4月的數(shù)據(jù),明顯過于滯后。另外根據(jù)4月份的金融數(shù)據(jù),尤其是企業(yè)融資需求來(lái)看,市場(chǎng)是在萎縮的。

        其次是內(nèi)容同質(zhì)化風(fēng)險(xiǎn)。當(dāng)多個(gè)用戶使用相同的大模型生成數(shù)據(jù)新聞時(shí),就有可能出現(xiàn)內(nèi)容同質(zhì)化的情況。由于大模型的算法和訓(xùn)練數(shù)據(jù)可能相似,它們生成的報(bào)道可能就會(huì)在結(jié)構(gòu)甚至內(nèi)容上重復(fù)。

        針對(duì)這一風(fēng)險(xiǎn),記者可以通過在特定領(lǐng)域進(jìn)行深入訓(xùn)練,讓大模型生成更專業(yè)、更具深度的內(nèi)容。比如,提高敏感性,關(guān)注細(xì)分領(lǐng)域的數(shù)據(jù),而不是只關(guān)注主要數(shù)據(jù);再比如同時(shí)使用多個(gè)大模型進(jìn)行同一題材的寫作,利用各模型之間的差異性來(lái)提升稿件的獨(dú)創(chuàng)性等。

        參考文獻(xiàn)

        [1]《如何調(diào)教大模型?——提示詞工程實(shí)踐》https://blog.csdn.net/aolan123/article/details/139863057

        [2]誰(shuí)是最強(qiáng)“AI記者”?每日經(jīng)濟(jì)新聞大模型評(píng)測(cè)報(bào)告(第1期)發(fā)布https://www.nbd.com.cn/articles/2024-06-21/3436368.html

        [3]周葆華,陸盈盈.生成式人工智能影響下的新聞生產(chǎn)創(chuàng)新:實(shí)踐與挑戰(zhàn).青年記者,2024(03):5-11.

        [4]大模型「幻覺」,看這一篇就夠了|哈工大華為出品https://mp.weixin.qq.com/s?__biz=MzIzNjc1NzUzMw==amp;mid=2247704227amp;idx=3amp;sn=67632acba917363f710b5ab176f516d8

        日韩精品一区二区三区视频| 一本色道久久亚洲加勒比| 日本中文字幕一区二区有码在线| 人人妻人人爽人人澡人人| 国产精品嫩草影院AV| 最新亚洲无码网站| 国产成人精品电影在线观看18| 亚洲精品国产综合久久一线| 81久久免费精品国产色夜| 精品无码av无码专区| 久久不见久久见免费影院www| 国产成人美女AV| 日本激情久久精品人妻热| 日本久久伊人特级黄色| 亚洲狠狠婷婷综合久久久久图片| 国产女精品| 亚洲第一页在线观看视频网站| 情爱偷拍视频一区二区| 国产熟人av一二三区| 中文字幕亚洲精品第1页| 国产一区二区三区av观看| 国产精品免费观看调教网| 国产精品久久久久9999吃药| 国产亚洲日韩欧美一区二区三区| 久久精品有码中文字幕1| 亚洲福利二区三区四区| 国产成人午夜无码电影在线观看| 國产一二三内射在线看片| 久久av一区二区三区下| 极品尤物精品在线观看| 激情第一区仑乱| 亚洲日韩区在线电影| 五月婷婷丁香视频在线观看| 中国无码人妻丰满熟妇啪啪软件 | 久久久久久久中文字幕| 手机在线免费av网址| 狠狠色噜噜狠狠狠8888米奇| 波多野结衣中文字幕久久| 完整在线视频免费黄片| 亚洲精品视频中文字幕| 伊人激情av一区二区三区|