亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)的新聞內(nèi)容生產(chǎn)效能評估
        ——以上海某媒體為例

        2020-12-10 03:04:50李開宇
        關(guān)鍵詞:效能內(nèi)容生產(chǎn)

        唐 錚,李開宇

        (1.中國人民大學(xué) 新聞學(xué)院,北京100872;2.清華大學(xué) 計算機系,北京100091)

        媒體融合帶來了新聞內(nèi)容生產(chǎn)的組織機制重構(gòu),將新聞生產(chǎn)者大量轉(zhuǎn)化為全媒體生產(chǎn)者,由此促進了新聞生產(chǎn)力的提升。而隨著融合背景下的媒體日漸增加且內(nèi)容產(chǎn)品日益豐富,如何對新機構(gòu)下的新內(nèi)容產(chǎn)品進行效能評估便成為擺在眼前的迫切問題。既有的媒體效能評估大多基于單一媒介類型的單一新聞產(chǎn)品,并長期處在隨機性和任意性較強的狀態(tài)下,難以適應(yīng)媒體融合下內(nèi)容生產(chǎn)力改造后的實際需求。本研究力求從大數(shù)據(jù)角度出發(fā),基于媒體運行的真實數(shù)據(jù),將新聞從生產(chǎn)者的特性進行量化建模,從“人力—產(chǎn)出”的角度為這一實際困境提出或可實踐的解決方案。

        一、融合背景下的新聞內(nèi)容生產(chǎn)效能

        融合格局下,傳統(tǒng)媒體在宣傳理念、新聞生產(chǎn)模式、傳播技術(shù)、載體更新等各方面實施組織重構(gòu)和業(yè)務(wù)再造。在這一過程中,新聞工作者逐漸告別新聞常規(guī),即日常完成新聞工作的一系列模式化的、常規(guī)的、重復(fù)的實踐和形式(1)Shoemaker,P.J.,Reese,S.D. ,“Mediating the message”.London:White Plains Longman.1996,p105.,新聞生產(chǎn)也隨之進入“一次采集、多次生成”的融合生產(chǎn)模式。

        融合型記者成為大勢所趨,單個新聞工作者常常肩負著同時生產(chǎn)不同體裁、不同形式新聞作品的任務(wù)。在這一過程中,有新聞工作者成長為全媒體生產(chǎn)者的自我提升,也有組織調(diào)整例如搭建“中央廚房”的結(jié)構(gòu)性助力。以上融合機制重構(gòu)均以媒體能夠持續(xù)地產(chǎn)出高質(zhì)量、跨媒體形態(tài)的融合性內(nèi)容產(chǎn)品為目標。隨著內(nèi)容生產(chǎn)者的素質(zhì)提升、內(nèi)容生產(chǎn)平臺的科學(xué)化以及一些更為先進的內(nèi)容管理系統(tǒng)的引入,新聞生產(chǎn)的單位時間越來越短。尼格倫(Nygren)在2009 年的調(diào)查表明,傳統(tǒng)媒體的記者一天可以制作2 到3 條新聞,但在網(wǎng)絡(luò)媒體工作的記者效率最高的可以達到一天5 到10 條(2)Preston.P,“Making the news:Journalism and news cultures in Europe”,New York:Routledge,2009,p.66.。

        新聞內(nèi)容作為高流動性的信息綜合體,其生產(chǎn)過程高度機動而不可控,在生產(chǎn)中需要包含結(jié)構(gòu)化的經(jīng)驗,獨到見解,對經(jīng)驗的反思以及有價值的、整合的相關(guān)信息(3)Davenport,T.H.,Prusak,L.“Working knowledge:How org-anization manage what they know”,Boston:Harvard Bus-iness School Press,1998,p.108.,完成創(chuàng)造性工作是新聞從業(yè)者的核心價值所在。正因其顯著的創(chuàng)造性、靈活性和機動性,此前包括媒體在內(nèi)的內(nèi)容生產(chǎn)機構(gòu)一直無法針對新聞內(nèi)容生產(chǎn)設(shè)立精準的效能評估方法。傳統(tǒng)媒體的內(nèi)容生產(chǎn)機制和考核標準,是以專業(yè)機構(gòu)持續(xù)穩(wěn)定地生產(chǎn)單一屬性的新聞產(chǎn)品為前提,內(nèi)核是沿用“信息收集—把關(guān)人篩選—分發(fā)”的機制模式,效能衡量體系也相應(yīng)地為原有載體服務(wù),采用工作量統(tǒng)計和打分評估等手段,對于新聞生產(chǎn)者進行評價。

        目前媒體使用較為廣泛的新聞生產(chǎn)效能評估方式主要有以下幾種:(:(1)完全按量評價;(;(2)完全按質(zhì)評價;(;(3)質(zhì)、量結(jié)合評價。這三種主流衡量方式分別對應(yīng)知識組織效能評估的三種主流視角,即行為視角、效果視角和能力視角。

        行為視角下的效能被定義為“一套與組織或個體所工作的組織單位的目標相關(guān)的行為”(4)Murphy G.“Human Resource Management”,NewYork:Internantional Journal of Project Management,1993,pp.3-12.。在行為論視角下,行為被視為效能的最核心體現(xiàn)。使用這種方式的媒體效能評估單純以新聞發(fā)布數(shù)量(條數(shù)、字數(shù)、時長等)為衡量指標。

        基于效果視角,特別是以實踐為導(dǎo)向的效能評價體系中,大多將績效理解為結(jié)果。BerMrdin 將績效定義為“在特定的時間內(nèi),由特定的工作職能或活動產(chǎn)生的產(chǎn)出紀錄,工作績效的總和相當(dāng)于關(guān)鍵和必要工作職能中績效的總和(或平均值)”(5)理查德·威廉姆斯:《業(yè)績管理》,趙政斌譯,大連:東北財經(jīng)大學(xué)出版社,1999 年版,第81 頁。。使用這種方式的媒體效能評估單純以新聞發(fā)布質(zhì)量(版面位置、時段、社會評價)為衡量指標。

        而McBer 咨詢公司和Spencer 倡導(dǎo)從能力角度衡量效能,認為基于能力的判斷是“向前看”的績效管理方式(6)French W.“Human resource management”.Boston:Hongton Miffin Company.1990,Chapter20.,這一觀點將效能進行了更為立體化的解構(gòu),將其對應(yīng)為與組織戰(zhàn)略目標、用戶滿意感及投資相關(guān)的過程與結(jié)果的綜合體。使用這種方式的媒體效能評估既計算新聞產(chǎn)品的發(fā)布數(shù)量,同時通過打分、定級等方式界定質(zhì)量,再計算綜合指標得到最終結(jié)果。

        然而,以上三種方式在媒體融合背景下都出現(xiàn)了障礙,無法有效地界定內(nèi)容生產(chǎn)的效能?!靶Ч暯恰弊⒅睾饬磕繕伺c結(jié)果,但融媒體新聞生產(chǎn)工作是創(chuàng)造性的、獨特的、機動的,幾乎不可能在內(nèi)容生產(chǎn)前就清晰明確地做出結(jié)果定義。目標只能是在進行中不斷調(diào)整、修正和明確。因而,僅僅以效果為導(dǎo)向有明顯的不足之處?!靶袨橐暯恰卑研侣勆a(chǎn)者的作品數(shù)量作為重點衡量目標,這與新聞生產(chǎn)者的熟練程度、努力程度和資源駕馭能力直接相關(guān),但完成創(chuàng)造性工作是新聞從業(yè)者的核心價值所在,單純以數(shù)量定江山,是對新聞生產(chǎn)的簡單化和庸俗化。而在新聞生產(chǎn)中,生產(chǎn)者的能力、潛力往往難以從其工作的過程或工作表現(xiàn)中體現(xiàn)出來,特別是在媒體融合時代,“中央廚房”式的集約化社會化生產(chǎn)日成主流,一則新聞產(chǎn)品往往由整個團隊甚至由外部支援來支撐,所以“能力視角”也難以完成對新聞內(nèi)容生產(chǎn)效能的準確評估。

        以上分析證明,目前傳統(tǒng)媒體內(nèi)部在融合背景下尚未形成一種有效的績效評價管理機制,難以配合媒體深度融合轉(zhuǎn)型發(fā)展戰(zhàn)略目標的實現(xiàn)。

        大數(shù)據(jù)技術(shù)的完善和媒體融合的不斷推進,給效能評估的進一步量化提供了可能。移動媒體時代,新聞信息從生產(chǎn)、發(fā)布、反饋等各環(huán)節(jié)的效果都是可定量化分析的。根據(jù)后臺數(shù)據(jù),媒體不但可以監(jiān)測到新聞內(nèi)容的點擊率、瀏覽量、轉(zhuǎn)載率、評論情況、情感極性(7)Alexandra Balahur, Hristo Tanev:“Detecting Event-Related Links and Sentiments from Social Media Texts”,Sofia, Bulgaria: ACL (Conference System Demonstrations)2013:pp.25-30.,從而了解讀者閱讀偏好,把握報道節(jié)奏,策劃報道內(nèi)容,也能夠?qū)⒋髷?shù)據(jù)應(yīng)用于媒介組織架構(gòu)和效能評估,使得新聞生產(chǎn)者和媒體組織之間通過更科學(xué)的評價體系,建立互信、支持和協(xié)作的“雙向依賴”關(guān)系。

        建立科學(xué)而全面的效能評估體系是一個長期而綜合的過程,需要大量數(shù)據(jù)支撐。本研究旨在使用定量方式,基于媒體真實運行數(shù)據(jù)的推演,將上海某媒體的真實內(nèi)容生產(chǎn)及人力運轉(zhuǎn)數(shù)據(jù)用于構(gòu)建模型,將真實數(shù)據(jù)代入模型進行“空轉(zhuǎn)”,這一設(shè)計參考了我國在重慶、上海進行的“房地產(chǎn)稅空轉(zhuǎn)”體系實踐,以及借鑒了人民日報“中央廚房”從無到有的機制搭建經(jīng)驗。把真實的數(shù)據(jù)帶入到仿真體系中加以驗證,能夠從一定程度上看到效能模型在媒體現(xiàn)有體系下運行時的真實狀況,進而提出媒介融合背景下媒體調(diào)整和改進效能評估機制的新模式。

        二、效能模型建構(gòu)原則及數(shù)據(jù)來源

        (一)建構(gòu)原則

        基于既往數(shù)據(jù)的相對缺乏和內(nèi)容生產(chǎn)的機動性,構(gòu)建這個初級模型時暫且排除了其他更為復(fù)雜的變量,而只是以“人力—產(chǎn)出”的邏輯來推導(dǎo)內(nèi)容生產(chǎn)的效能最優(yōu)。

        這一模型基于下述邏輯:如果將新聞生產(chǎn)視為人的創(chuàng)意性生產(chǎn),那么,新聞產(chǎn)出與人力(包括時間、精力、創(chuàng)意性生產(chǎn)的工作狀態(tài)等)直接相關(guān),而這種相關(guān)性可以用具體的具有可解釋性的模型來描述。同時,假設(shè)新聞生產(chǎn)的數(shù)量在非重大影響(例如重大自然災(zāi)害、重大突發(fā)新聞等)的情況下,在一定程度上是存在周期性的。也就是說,持續(xù)增加的工作時間并不能使得新聞產(chǎn)量無限量擴張,新聞產(chǎn)量在受到人力限制的同時還會受到新聞資源的限制。另外,新聞工作者一旦不眠不休地進行新聞生產(chǎn)的話,會因為創(chuàng)造力下降而影響新聞的產(chǎn)量。因此對于實際新聞生產(chǎn)而言,通過建立模型來找到關(guān)鍵性節(jié)點,以便確定生產(chǎn)效能,是有意義的。

        因而,模型以真實新聞生產(chǎn)量為基礎(chǔ)參考值,以生產(chǎn)周期為變量,可以得出現(xiàn)階段新聞內(nèi)容生產(chǎn)力下的呈理想化狀態(tài)的新聞產(chǎn)量。進而在工作人數(shù)不變的前提下,可以獲知實際新聞生產(chǎn)量和理想化產(chǎn)量之間的邏輯關(guān)系,由此為制定科學(xué)的新聞效能產(chǎn)出提供依據(jù)。

        (二)數(shù)據(jù)來源

        于2014 年提速建設(shè)的媒體融合改革為研究提供了可靠的數(shù)據(jù)源。自2014 年媒體融合全面提速以來,新聞生產(chǎn)的硬件配置及軟件配備全面升級,全面的數(shù)字化和線上化成為各個媒體在融合時的必要項。本研究所采集的數(shù)據(jù),便源自上海某媒體近年來的相關(guān)真實數(shù)據(jù):

        1.使用線上簽到工具,統(tǒng)計記者的日均工時和年均工作日。這部分數(shù)據(jù)能夠提供該媒體從事新聞生產(chǎn)的人員的準確數(shù)量,并提供他們的工作時長。

        2.使用多媒體處理系統(tǒng),統(tǒng)計新聞產(chǎn)品的生產(chǎn)周期。這部分數(shù)據(jù)來自于媒體的數(shù)字化處理系統(tǒng)。按照媒體的要求,所有內(nèi)容產(chǎn)品都要在該媒體的多媒體數(shù)字化處理系統(tǒng)上上傳并簽發(fā),通過“大花臉”功能記錄全部流程。由此可以記錄新聞作品從入庫提交、修改、簽發(fā)的全過程中每個節(jié)點的時間,從而得知新聞作品的生產(chǎn)時長。

        3.該媒體2017 年8 月3 日至2019 年12 月31 日的每月新聞生產(chǎn)量。這部分數(shù)據(jù)來自于數(shù)字化處理系統(tǒng)的后臺統(tǒng)計功能。根據(jù)這一功能,能夠準確列出該媒體在此期間的每日新聞生產(chǎn)量,并根據(jù)需求進行相應(yīng)的分類和歸并。

        (三)數(shù)據(jù)清洗與梳理

        根據(jù)該媒體的大數(shù)據(jù)記錄進行清洗和梳理后,得出的數(shù)據(jù)如下:

        1.根據(jù)媒體稿件入庫記錄,獲得該媒體2017 年8 月3 日至2019 年12 月31 日共881 天的數(shù)據(jù)。

        2.根據(jù)線上簽到工具上的數(shù)據(jù)記錄,該媒體共有新聞生產(chǎn)者126 人,平均工作時長為9.7 小時(法定工作時長8 小時),年平均工作日為304.3 天(2018 年法定工作日為252 天,2019 年法定工作日為250 天)。

        3.根據(jù)多媒體處理系統(tǒng)上的數(shù)據(jù)記錄,2017 年8 月3 日至2019 年12 月31 日該媒體共計生產(chǎn)新聞作品40 673 件,分為文字稿件、圖片稿件和音視頻稿件三類,并得到這三類稿件在2017 年8 月至2019 年12月的每天的新聞產(chǎn)量。

        4.通過新聞編輯文稿系統(tǒng)修改功能,能夠記錄每篇稿件的入庫、修改過程、簽發(fā)過程等每一步驟的時間。在媒體融合進程中,多數(shù)媒體已經(jīng)實現(xiàn)了這一功能的實現(xiàn)及運用。這一功能被媒體俗稱“大花臉”功能,可以被用來界定每篇新聞的生產(chǎn)周期長度。根據(jù)“大花臉”功能,對以上三類新聞的生產(chǎn)周期進行統(tǒng)計,取平均數(shù)±5%的區(qū)間,得到如下結(jié)果:文字稿件的生產(chǎn)周期為4.9~25.7 小時,圖片稿件的生產(chǎn)周期為2.4~4.5小時,音視頻稿件的生產(chǎn)周期為14.3~48.9 小時。

        繼而,基于數(shù)據(jù)清洗技術(shù)(8)Xu Chu, Ihab F. Ilyas, Sanjay Krishnan, Jiannan Wang:“Data Cleaning: Overview and Emerging Challenges”, San Francisco:SIGMOD Confer?ence ,2016,pp.2201-2206.對數(shù)據(jù)的空值與非法值進行了清洗與修正,使得數(shù)據(jù)的取值在合理的范圍內(nèi),之后在底層使用MongoDB 作為基本的數(shù)據(jù)管理引擎。

        (四)模型選型

        建模過程中引入人工智能領(lǐng)域的前沿技術(shù)——神經(jīng)網(wǎng)絡(luò)技術(shù),從既有的數(shù)據(jù)當(dāng)中通過機器學(xué)習(xí)算法,得出規(guī)律,繼而通過數(shù)學(xué)模型來描述人力與產(chǎn)出之間的關(guān)系。神經(jīng)網(wǎng)絡(luò)技術(shù)模擬人腦的神經(jīng)元結(jié)構(gòu),通過構(gòu)造多層次的網(wǎng)絡(luò)結(jié)構(gòu),來表征數(shù)據(jù)特征(輸入)與因變量(輸出)之間的關(guān)系(9)Lecun Y,Bengio Y,Hinton G,“Deep Learning”,No.521(7553),Nature,2015,p.436.。

        舉例來講,如果想要知道一處房產(chǎn)的屬性與房價之間的關(guān)系,可以將屬性X(建筑面積、使用面積、城市、地段、樓層、朝向和是否有電梯等)作為自變量,而將房屋的價格Y 作為因變量。假設(shè)因變量和自變量之間存在某種關(guān)系滿足Y=f(X),當(dāng)今后給定一個新的房屋的基本屬性值時,便可以預(yù)測該房屋的房價。機器學(xué)習(xí)中的回歸問題(10)Ripley,Brian D,“Pattern Recognition and Neural Networks”.Cambridge:Cambridge University Pess,2009,pp.97-118.,也就是如何在給定一部分真實數(shù)據(jù)情況下(同時包含因變量與自變量),去尋找一個最可能真實的模型f。而深度學(xué)習(xí)理論假設(shè)函數(shù)f是由一個網(wǎng)狀的神經(jīng)元結(jié)構(gòu)組成的,以自變量作為第0層,網(wǎng)狀結(jié)構(gòu)的每一層會對上一層的輸入進行一次非線性的變換,從而計算出最終的結(jié)果。

        本文將基于以上理論和數(shù)據(jù),尋找合適的自變量表達方式,去對媒體內(nèi)容生產(chǎn)者工時投入進行量化。同時尋找合適的網(wǎng)絡(luò)模型參數(shù),通過機器學(xué)習(xí)算法確定一個最為合理的模型,從而建模出生產(chǎn)者工時與產(chǎn)出模型,用于完成媒體產(chǎn)出效益最優(yōu)化的預(yù)測。

        三、計算原理和研究方法

        本節(jié)著重研究這樣一個問題“給定一個媒體生產(chǎn)組織(例如,某上海媒體),已知其過往的具體工時X與真實產(chǎn)出數(shù)據(jù)Y,如何尋找模型f,可以近似描述工時與產(chǎn)出的關(guān)系,即“Y≈f(x)”。

        (一)初級問題定義

        模型的雛形出于最樸素的邏輯“人力—產(chǎn)出”,也就是說,無論媒體形態(tài)和最終產(chǎn)品發(fā)生了什么變化,現(xiàn)階段的新聞內(nèi)容生產(chǎn)仍然基本全部依靠于人力,因此“新聞工作者的數(shù)量和產(chǎn)能——新聞內(nèi)容產(chǎn)品”之間存在緊密的正相關(guān)性。而后一層層對問題進行具象化,不斷在機器學(xué)習(xí)的過程中加入各種參數(shù)和影響因素,最終得到可解釋性較高的“新聞發(fā)稿量預(yù)測模型”。

        首先,建模中考慮一種簡單的映射關(guān)系,假設(shè)共有n個生產(chǎn)者(實際數(shù)據(jù)為126),定義每天的工作時長為X(小時)=[X1,X2......Xn],其中Xi表示第i個生產(chǎn)者本日的工作時長。相應(yīng)的總產(chǎn)量為Y=[Y1,Y2,Y3],Y1,Y2,Y3分別表示文字稿件,圖片稿件和視頻稿件的產(chǎn)出。如果兩者之間存在簡單的映射關(guān)系,則可以表示為簡單的Y=f(X),即給定X即可通過其映射關(guān)系找到Y(jié)。

        其中的函數(shù)f可以使用多種方式來表達,其中最簡潔的形式是使用線性模型進行回歸分析,擬合出X與Y的關(guān)系。本模型使用更復(fù)雜的方式,即深度神經(jīng)網(wǎng)絡(luò),給予足夠多的網(wǎng)絡(luò)層數(shù),通過調(diào)參技巧學(xué)習(xí)出精確的模型參數(shù)。

        在使用數(shù)據(jù)集訓(xùn)練模型之前,需要先將整個數(shù)據(jù)集分為訓(xùn)練集、驗證集和測試集。訓(xùn)練集是用來訓(xùn)練模型的,通過嘗試不同的方法和思路使用訓(xùn)練集來訓(xùn)練不同的模型,再通過驗證集使用交叉驗證來挑選最優(yōu)的模型,再通過不斷地迭代,來改善模型在驗證集上的性能,最后再通過測試集來評估模型的性能。數(shù)據(jù)集劃分得越好,模型的應(yīng)用部署就越強,但如果劃分不好,則會大大影響模型的應(yīng)用部署。在建模時,基于交叉驗證的準則(11)周志華:《機器學(xué)習(xí)》.北京:清華大學(xué)出版社2016 年版,第210-219 頁。將881 條數(shù)據(jù)進行切分,其中500 條用于訓(xùn)練,100 條用作驗證集,其余281 條用于下一節(jié)進行最優(yōu)產(chǎn)出模型擬合。在這一過程中,使用損失函數(shù)來描述模型的精準程度,即真實數(shù)據(jù)與預(yù)測值之間的誤差。

        (二)神經(jīng)網(wǎng)絡(luò)求解與特征工程

        理論上來講,隨著模型訓(xùn)練的過程,參數(shù)將會越來越精準,相應(yīng)的損失(LOSS)應(yīng)該越來越小,然而,當(dāng)下展示出的學(xué)習(xí)過程并沒有明顯使LOSS 變小,而當(dāng)模型逐漸變得復(fù)雜,層數(shù)增多時,損失函數(shù)漸漸出現(xiàn)明顯變化。這說明模型選擇并不合理。應(yīng)該進一步思考加入更為合理的系數(shù),發(fā)掘更合理的模型。

        結(jié)合實際情況則能夠發(fā)現(xiàn):一個部門的實際工作產(chǎn)出不應(yīng)該只取決于新聞工作者的工作時間,還應(yīng)當(dāng)取決于當(dāng)前這一天的具體時間屬性。例如,這一天是周一還是周五對于新聞工作者來講是不同的,不僅他們的工作熱情不同,實際生活中,可供加工的新聞素材也可能不同。其次,要看這一個工作日是否是假日,是否是重大節(jié)日,這些信息都應(yīng)當(dāng)被編碼在輸入項X當(dāng)中,因為是否是假日,個人工作熱情應(yīng)當(dāng)不同,是否是節(jié)日,可能產(chǎn)生的新聞數(shù)量與話題度就不同,例如,重大的節(jié)日一般會有許多活動和紀念儀式可供報道。其次,還需要考慮一年當(dāng)中各個月份中由于季節(jié)性,會導(dǎo)致新聞內(nèi)容的具體產(chǎn)出出現(xiàn)差異(包含陽歷、陰歷)。因此,應(yīng)該基于這樣的考慮,增加時間屬性特征的系數(shù)。

        因此在不考慮隨機擾動的情況下,額外編碼了上述五種信息,編碼規(guī)則如表1。

        表1 基于時間屬性的編碼信息

        在實際情況中,具體的新聞內(nèi)容生產(chǎn)過程其實相當(dāng)于一個時序序列,因此在考慮某一個時間點的產(chǎn)量時,不可忽略前面若干個時間點的產(chǎn)量,也就是說,7 月12 日的新聞生產(chǎn)量其實對于7 月13 日是有影響的,兩者并不是孤立的存在,其中存在時序關(guān)系。因此,應(yīng)該基于這樣的考慮,增加基于時序關(guān)系特征的系數(shù)。

        根據(jù)這個因素,設(shè)定為第i天,Yi的產(chǎn)量應(yīng)當(dāng)同時取決于Xi和Yi-1,Yi-2,......Y1兩個因素,由此得出的模型為:Yi=g(Xi|Yi-1,Yi-2,......Y1)。在實際中,為了簡化模型,同時為了使模型具有更高的合理性,通常認為當(dāng)前狀態(tài)量只和前一狀態(tài)量有關(guān),即滿足齊次馬爾科夫性(12)張波,張景肖:《應(yīng)用隨機過程》,北京:清華大學(xué)出版社2004 年版,第28-59 頁。,這一性質(zhì)使得模型的求解更為便利,同時,假如采取遞推的鏈式法則,第i- 1 個變量里面,實則已經(jīng)包含了前i- 2 個變量的信息,因此,形如Yi=g(Xi|Yi-1)的形式對于求解參數(shù)更為方便。

        (三)循環(huán)神經(jīng)網(wǎng)絡(luò)求解實際模型參數(shù)

        經(jīng)過數(shù)據(jù)工程方法處理,得到更全面的向量后,運用循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)進行建模。這是一種經(jīng)過實踐證明在處理時序序列時優(yōu)于隱馬爾科夫模型的一種方式。在經(jīng)典的神經(jīng)網(wǎng)絡(luò)模型中,隱藏層的值只取決于x輸入,然而在本例中,需要考慮到當(dāng)前狀態(tài)可能不僅與當(dāng)前輸入有關(guān),還與上一狀態(tài)有關(guān),因此其相應(yīng)的結(jié)構(gòu)應(yīng)該表達如圖1 所示,其中y為實際產(chǎn)出,W 為相應(yīng)的權(quán)重。最終計算得出的結(jié)果如圖2 所示。

        圖1 循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)示意圖

        圖2 損失函數(shù)在模型訓(xùn)練過程中的變化(越小代表性能越好):循環(huán)神經(jīng)網(wǎng)絡(luò)

        然而,目前的模型仍然包含兩個重要缺陷:(:(1)從模型可解釋性的角度,需要對于上述提出的方法進行進一步的改進,考慮到現(xiàn)實生活中,內(nèi)容生產(chǎn)對于歷史數(shù)據(jù)應(yīng)當(dāng)是具有記憶性的,即假如去年的10 月1 日印象發(fā)稿量非常大,那么將可以判斷出今年10 月1 日的發(fā)稿量也會比較大。(2)模型進行學(xué)習(xí)的參數(shù)與前一階段的數(shù)據(jù)有關(guān),在具體實現(xiàn)中,由于神經(jīng)元個數(shù)過多,特別容易出現(xiàn)參數(shù)累計相乘后出現(xiàn)數(shù)值膨脹或萎縮的情況,導(dǎo)致數(shù)值不穩(wěn)定,出現(xiàn)所謂的“梯度爆炸”與“梯度消失”的情況,即當(dāng)神經(jīng)網(wǎng)絡(luò)很深時,梯度呈指數(shù)級增長,不穩(wěn)定的數(shù)值造成模型失當(dāng)。梯度爆炸和梯度消失的問題在循環(huán)神經(jīng)網(wǎng)絡(luò)中最為常見。

        針對上述兩個問題,引入長短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)予以解決(13)Greff,Klaus,Srivastava,Rupesh Kumar,Koutník,Jan,etc,“LSTM:A Search Space Odyssey”,NewYork :IEEE Transactions on Neural Networks&Learning Systems,vol.28(10),2015,pp.2222-2232.。該網(wǎng)絡(luò)在1997 年被學(xué)者Hochreiter和Schmidhuber 引入,用于解決具有長依賴特性的時序數(shù)據(jù)建模。通過LSTM 可以對于有效的信息進行保留。從而解決對于模型輸出預(yù)測的長依賴問題。如果將預(yù)測結(jié)果的誤差求均值后作為偏差量,能夠得出結(jié)果如圖3。

        圖3 損失函數(shù)在模型訓(xùn)練過程中的變化:LSTM 模型

        在LSTM 模型中,損失越小代表性能越好。從圖上可以看出,經(jīng)過幾次調(diào)整,模型已經(jīng)逐漸收斂,誤差值非常小。通過前期的參數(shù)調(diào)整與數(shù)據(jù)工程,這一模型在該數(shù)據(jù)集上可達到平均90%以上的準確率(Preci?sion)和召回率(Recall),據(jù)此可以使用這個模型去進一步預(yù)測新聞內(nèi)容生產(chǎn)量及生產(chǎn)效能。

        四、新聞內(nèi)容生產(chǎn)的最優(yōu)效能

        根據(jù)此前得出的模型,本節(jié)將解決這樣一個問題——“在假定人力不變的前提下,制定多少新聞內(nèi)容生產(chǎn)數(shù)量時,效能是最優(yōu)的”。

        由于單日的新聞內(nèi)容產(chǎn)量具有較大隨機性,容易受到突發(fā)事件和各種偶然因素的干擾,因此在模型中把時間軸放寬至以月度為單位,依據(jù)上一節(jié)計算所得的模型,計算在未來一段時間內(nèi)單月的新聞產(chǎn)量如何達到最優(yōu)效能。

        首先,在假定工作總?cè)藬?shù)不變的前提下,根據(jù)模型預(yù)測出該媒體后281 天的內(nèi)容生產(chǎn)產(chǎn)出數(shù)量,作為輸入值,并以真實的281 天數(shù)據(jù)作為輸出值,在模型中擬合出預(yù)期產(chǎn)出與真實產(chǎn)出之間的關(guān)系,并對這一擬合結(jié)果進行觀測和分析。這一擬合的實際意義在于:如果將預(yù)期產(chǎn)出理解為該媒體的管理者給新聞工作者下達的工作任務(wù),那么根據(jù)預(yù)期產(chǎn)出對真實產(chǎn)出的影響就可以真切地觀測出,在人力不變的情況下,新聞內(nèi)容生產(chǎn)將在何時出現(xiàn)變化節(jié)點,又將在何時達到最優(yōu)化的生產(chǎn)效能。因此,這一結(jié)果將有助于衡量真實的新聞工作,為媒體管理者在融媒體變化大勢下更科學(xué)準確地下達新聞生產(chǎn)任務(wù)提供重要的參考。

        其次,在融合媒體背景下,全媒體記者成為必需,一則新聞內(nèi)容通常會由單人進行采寫,隨后以文字、圖片或音視頻等不同的方式單一發(fā)布或結(jié)合多種形式融合發(fā)布。不同新聞內(nèi)容所耗費時間不同,會導(dǎo)致新聞產(chǎn)出量的差異。根據(jù)該上海媒體的真實數(shù)據(jù),文字稿件的生產(chǎn)周期為4.9~25.7 小時(平均時間15.3 小時),圖片稿件的生產(chǎn)周期為2.4~4.5 小時(平均3.45 小時),音視頻稿件的生產(chǎn)周期為14.3~48.9 小時(平均31.6小時)。在計算中,使用平均數(shù)對新聞產(chǎn)出總量進行量化。根據(jù)生產(chǎn)周期的平均時間計算,文字、圖片、音視頻的新聞生產(chǎn)時長比例約為30:7:63。音視頻新聞的生產(chǎn)時長是圖片新聞生產(chǎn)時長的7 倍。在假定人力不變的前提下,這三類新聞內(nèi)容的總量必然符合恒定的總工時所能出產(chǎn)的新聞產(chǎn)量,且三類內(nèi)容呈現(xiàn)此消彼長的關(guān)系。

        第三,研究中使用的全部是真實數(shù)據(jù),實際新聞內(nèi)容產(chǎn)量是由該媒體的126 名在職新聞工作者完成的,因此,預(yù)期新聞產(chǎn)量仍以126 人作為基礎(chǔ)量,并在輸入數(shù)值時折算為126 人的工作總時長。

        基于以上三點,以預(yù)期生產(chǎn)時間作為橫坐標,以實際產(chǎn)出作為縱坐標,進行擬合操作,擬合結(jié)果如圖4所示。

        圖4 期望發(fā)稿量與真實發(fā)稿量模型預(yù)測

        擬合結(jié)果得到了四個坐標節(jié)點,分別是(20 160,20 160)、(42 012,47 106)、(60 480,28 130)和(37 599,46 023)。這四個節(jié)點標記了新聞內(nèi)容生產(chǎn)效能的變化。在(20 160,20 160)之前,新聞內(nèi)容的預(yù)期產(chǎn)出和實際產(chǎn)出呈45°直線。在(20160,20160)和(42012,47106)之間,新聞內(nèi)容的預(yù)期產(chǎn)出和實際產(chǎn)出呈上升拋物線,并在(42 012,47 106)這一坐標點上達到最高值。在(42 012,47 106)和(60 480,28 130)之間,新聞內(nèi)容的預(yù)期產(chǎn)出和實際產(chǎn)出呈下降拋物線,并在(60480,28130)之后,呈水平直線。在拋物線左側(cè)(37599,46023)坐標點之前,導(dǎo)數(shù)值低于1,在此點之后導(dǎo)數(shù)值高于1。也就是說,(,(37599,46023)是拋物線與水平坐標軸的夾角呈45°的分界線。

        由此,基于總工時則能夠計算出三種不同形式的新聞內(nèi)容的生產(chǎn)量。由于總工時確定之下,三種不同形式的新聞內(nèi)容產(chǎn)量是互相約束、此消彼長的,便可以描繪出三種稿件的生產(chǎn)占用時間的比例隨不同工作期望下的不同結(jié)果,如圖5 所示。

        圖5 各類稿件占比隨月總工時的變化

        根據(jù)圖5,隨著月度總工時的上升,文字類新聞的比例逐漸增加,音視頻類新聞的比例則呈現(xiàn)逐步減少的趨勢,圖片類新聞基本保持恒定。

        五、結(jié)論及不足之處

        通過使用上海某媒體600 天新聞生產(chǎn)的真實數(shù)據(jù),長短記憶神經(jīng)網(wǎng)絡(luò)(LSTM)模型計算后得到了對后續(xù)281 天新聞生產(chǎn)預(yù)期數(shù)據(jù)的推演,并與真實的281 天相比對,得到了期望發(fā)稿量與真實發(fā)稿量模型的預(yù)測結(jié)果。根據(jù)這一結(jié)果,可以得出以下結(jié)論:

        (1)坐標點(20 160,20 160)約為126 名在職新聞工作者每天工作8 小時,每月工作20 天的總工作時長,與法定工作時間基本吻合。也就是說,在不需加班的情況下,真實新聞產(chǎn)量與預(yù)期呈現(xiàn)線性對應(yīng)關(guān)系,所有預(yù)期的新聞產(chǎn)量都能夠被如期完成。而坐標點(60 480,28 130)為126 名在職新聞工作者每人每天工作16 小時,每月工作30 天,這一工作時長形成了超平面,是新聞生產(chǎn)者的工作負荷極限。當(dāng)預(yù)期新聞產(chǎn)量所需的工作時長超過這一負荷極限后,無論再怎么增加預(yù)期,都不能帶來新聞?wù)鎸嵁a(chǎn)量的增長。這兩個坐標點成為了工作時長的下限和上限。

        (2)根據(jù)擬合結(jié)果,最優(yōu)的預(yù)期新聞產(chǎn)量就是在預(yù)期總工時達到42 012 小時,即126 名在職新聞工作者大約每月工作時長約333 小時的時候,實際新聞產(chǎn)量可達到47 106 小時的效果,這一新聞產(chǎn)量也是實際內(nèi)容生產(chǎn)總量的峰值。

        (3)在(42 012,47 106)節(jié)點左側(cè),拋物線呈上升狀態(tài),表明提高預(yù)期對于新聞效能有正向的促進作用。而當(dāng)超過(42 012,47 106)這一節(jié)點,拋物線呈下降狀態(tài),表明繼續(xù)提高預(yù)期對于新聞工作者有負向的促進作用,真實新聞產(chǎn)量隨著預(yù)期目標的上升而緩慢增長。

        (4)在拋物線左側(cè),(,(37 599,46 023)坐標點之前的導(dǎo)數(shù)值高于1,在此點之后導(dǎo)數(shù)值低于1。這意味著,在(37 599,46 023)點之前,增加預(yù)期對新聞工作者的激勵作用比45°對角線的效率更高。這一節(jié)點,即126名在職新聞工作者大約每月工作時長約298 小時的時候,實際新聞產(chǎn)量可達到42 012 小時的效果。而在(37 599,46 023)至(42 012,47 106)這個區(qū)間內(nèi),即使真實發(fā)稿量仍能夠隨著期望發(fā)稿量呈現(xiàn)正向增長,但是其增益速度已經(jīng)低于期望的增長速度。也就是說,如果在這一區(qū)間內(nèi)再繼續(xù)給新聞工作者加壓,他們雖然還能根據(jù)預(yù)期目標增加新聞產(chǎn)量,但是已經(jīng)顯示出力有不逮,難以繼續(xù)。

        綜上,這一模型的擬合結(jié)論提供了一個全新的視角:按照既有的真實數(shù)據(jù)計算,126 名新聞工作者在法定工作時間內(nèi)能夠完成所有預(yù)期任務(wù),且呈現(xiàn)出工作量不飽和、積極性未被充分調(diào)動激發(fā)的狀況。在達到法定的工作時長并繼續(xù)調(diào)高預(yù)期目標后,擬合曲線呈現(xiàn)拋物線上升,這證明了適度的工作壓力反而能夠更加充分地調(diào)動和激發(fā)新聞工作者的工作積極性,達到更高的效能。然而,這種超出預(yù)期的實際工作量增長并不能長時間持續(xù),拋物線增長漸趨平緩,在到達(37 599,46 023)坐標點時角度小于45°,這表明新聞工作者在持續(xù)增加的預(yù)期目標壓力之下無法保持足夠的工作積極性,真實新聞產(chǎn)量逐漸放緩。進而,拋物線在到達頂峰后進一步下降。這是由于新聞業(yè)是一個創(chuàng)造性的工作,過高的預(yù)期產(chǎn)量會造成新聞工作者的過度焦慮、體力不濟等,反而會傷害新聞效能。最終,當(dāng)工作壓力超出新聞工作者的能力,形成超平面,屆時預(yù)期新聞產(chǎn)量對于實際不起作用。

        因此,根據(jù)擬合結(jié)果,管理者日常的最優(yōu)預(yù)期效能目標可以制定在拋物線起點至45°角的坐標點之間,即工作時長在每月20 160 小時到37 599 小時之間。當(dāng)遇到重大新聞或者重要突發(fā)事件時,可短暫將最優(yōu)效能目標調(diào)高至拋物線45°角至頂點之間,即工作時長在每月37 599 小時和每月42 012 小時之間,但總工時42 012 小時是總工作量的極限峰值。

        根據(jù)圖5 即各類稿件占比隨月總工時的變化圖可以觀察出,當(dāng)工作時間的預(yù)期要求較短時,新聞生產(chǎn)者一般會保持一個合理的生產(chǎn)數(shù)量,三類新聞產(chǎn)出的比例比較均衡。而當(dāng)預(yù)期任務(wù)要求過高時,生產(chǎn)者會為了追求更多的新聞產(chǎn)量,刻意選擇生產(chǎn)周期更短的新聞類型,即生產(chǎn)更多的文字稿件和圖片稿件,而減少視頻類稿件的產(chǎn)出,這從新聞內(nèi)容生產(chǎn)上講是一種不健康的規(guī)劃方式。因此管理者應(yīng)當(dāng)制定適中的工作計劃,以期達到合理的生產(chǎn)比例。

        本研究主要做出了兩個貢獻:首先,提出將媒體的生產(chǎn)特征量化的方式并使用真實數(shù)據(jù)進行建模。在量化的過程中同時考慮了某媒體的基本屬性和時序?qū)傩?,基于此,做出的模型可以預(yù)測每日的發(fā)稿數(shù)量。本文使用的方法可以對更為復(fù)雜場景下的異構(gòu)數(shù)據(jù)生產(chǎn)進行預(yù)測,在基于更大的數(shù)據(jù)量與更多維的數(shù)據(jù)描述下,可以得到更為精準的模型。其次,根據(jù)模型擬合了預(yù)期投入與真實產(chǎn)出之間的關(guān)系,因此可以更為科學(xué)和準確地制定出新聞內(nèi)容生產(chǎn)量的預(yù)期目標。如果在相應(yīng)數(shù)據(jù)支持下,這一模型可以應(yīng)用于類似于新聞生產(chǎn)的知識性生產(chǎn)環(huán)境,如著作、文章等,針對具體情況,給出期望情況下能獲得最高產(chǎn)出的產(chǎn)量預(yù)期。

        本研究還存在以下幾點改進空間:

        (1)在應(yīng)用循環(huán)神經(jīng)網(wǎng)絡(luò)進行產(chǎn)出預(yù)測時,需要提取更多的特征,來更加多維地建模描述一個媒體的生產(chǎn)能力。(2)目前的模型可以相對較準確地對單個新聞機構(gòu)或知識生產(chǎn)型單位進行效能評估,但無法在更大的范圍內(nèi)使用。未來可以對內(nèi)容產(chǎn)出進行更加細化的分類,進一步精準測算各類產(chǎn)出之間的約束關(guān)系(相關(guān)系數(shù)),如規(guī)制、外界影響等,以期得到更好的預(yù)測結(jié)果。(3)目前的新聞生產(chǎn)效能模型主要基于“人力—產(chǎn)出”這一邏輯,而忽視了近年來越來越多的機器人寫作或其他智能化新聞生產(chǎn)方式,且新聞產(chǎn)出仍以傳統(tǒng)的文字、圖片、音視頻類作品為主。當(dāng)新聞生產(chǎn)環(huán)境隨著科技發(fā)展而發(fā)生變化,或當(dāng)AR、VR等實驗性新聞產(chǎn)品的比例增加時,本模型無法對于屆時的新聞生產(chǎn)效能做出評估。

        猜你喜歡
        效能內(nèi)容生產(chǎn)
        內(nèi)容回顧溫故知新
        遷移探究 發(fā)揮效能
        同時多層擴散成像對胰腺病變的診斷效能
        充分激發(fā)“以工代賑”的最大效能
        用舊的生產(chǎn)新的!
        “三夏”生產(chǎn) 如火如荼
        S-76D在華首架機實現(xiàn)生產(chǎn)交付
        主要內(nèi)容
        臺聲(2016年2期)2016-09-16 01:06:53
        唐代前后期交通運輸效能對比分析
        Сварочное Проμзвоσсmво(《焊接生產(chǎn)》)2012年第5期要目
        四虎影视在线影院在线观看| 国产免费人成视频在线观看 | h视频在线免费观看视频| 色婷婷五月综合激情中文字幕 | 国产91精选在线观看麻豆| 亚洲双色视频在线观看| 青青青免费在线视频亚洲视频| 精品国产一区二区三区av性色| 区久久aaa片69亚洲| 91久久综合精品国产丝袜长腿| 日产国产精品亚洲高清| 久久久久人妻一区二区三区| 99久久国产露脸精品竹菊传媒| 99久久亚洲国产高清观看| 黄色潮片三级三级三级免费| 久久国产成人精品国产成人亚洲| 久久av无码精品人妻出轨| 亚洲AV无码一区二区三区少妇av | 亚洲成av人片极品少妇| 精品一区二区三区免费视频| 丰满多毛少妇做爰视频| av永久天堂一区二区三区蜜桃| 性感女教师在线免费观看| 黑森林福利视频导航| 午夜高清福利| 一本久道在线视频播放| 国产精品亚洲а∨无码播放| 精品久久久噜噜噜久久久| 国产成人精品无码一区二区老年人| 日本中文字幕乱码中文乱码| 人妻少妇精品视频专区| 北条麻妃在线视频观看| 国产av一区仑乱久久精品| 色综合久久网| 色噜噜狠狠色综合成人网| 国产91AV免费播放| a黄片在线视频免费播放| 四虎国产精品永久在线国在线| 综合精品欧美日韩国产在线| 最新中文字幕乱码在线| 国产一区二区三区四区三区|