亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)在新聞學(xué)研究領(lǐng)域的應(yīng)用與展望

        2020-11-17 12:02:24潘衛(wèi)華
        新聞前哨 2020年10期
        關(guān)鍵詞:監(jiān)督文本理論

        ◎李 佳 潘衛(wèi)華

        與其他傳播科學(xué)領(lǐng)域一致, 新聞學(xué)研究也已經(jīng)開始使用計(jì)算分析方法。在這些方法中,有監(jiān)督的機(jī)器學(xué)習(xí)技術(shù)得到了越來越廣泛的關(guān)注。 該技術(shù)的主要優(yōu)點(diǎn)在于其預(yù)測(cè)能力,例如,預(yù)測(cè)新聞價(jià)值或通用新聞框架的流行度。

        那么, 有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)在什么條件下可以對(duì)新聞學(xué)研究帶來促進(jìn)作用?目前的研究存在哪些問題?新的技術(shù)將為新聞學(xué)理論的發(fā)展會(huì)帶來哪些變化?本文試加以分析。

        一、新聞學(xué)領(lǐng)域中的有監(jiān)督機(jī)器學(xué)習(xí)

        有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)與其他統(tǒng)計(jì)推斷方法、 無監(jiān)督機(jī)器學(xué)習(xí)技術(shù)的最大區(qū)別在于其可預(yù)測(cè)性。舉例來說,有監(jiān)督機(jī)器學(xué)習(xí)是從訓(xùn)練數(shù)據(jù)中建立一個(gè)模式, 并依此模式預(yù)測(cè)新的實(shí)例。相比而言,無監(jiān)督學(xué)習(xí)的目的是對(duì)原始數(shù)據(jù)進(jìn)行分類,以便了解數(shù)據(jù)內(nèi)部的結(jié)構(gòu),在學(xué)習(xí)階段并不知道其分類結(jié)果是否正確。 而有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)可通過測(cè)試大量模型以找到在預(yù)測(cè)方面性能最佳的模型。

        在新聞學(xué)研究中, 統(tǒng)計(jì)推斷的方法主要是用來做自動(dòng)內(nèi)容分析, 其最簡(jiǎn)單的形式就是對(duì)數(shù)據(jù)庫(kù)中的某些關(guān)鍵字進(jìn)行計(jì)數(shù)。然而,這種基于字?jǐn)?shù)統(tǒng)計(jì)的文本分析方法不能對(duì)文本的前后文或者變量進(jìn)行關(guān)聯(lián)分析。 而有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)可以抓住大型新聞數(shù)據(jù)庫(kù)中更多的潛在和隱含變量,從而可以比簡(jiǎn)單的字?jǐn)?shù)統(tǒng)計(jì)更好地理解文本的含義。

        機(jī)器學(xué)習(xí)算法的目標(biāo)是對(duì)文本進(jìn)行編碼, 并用特定的標(biāo)簽進(jìn)行標(biāo)注。針對(duì)簡(jiǎn)單的分類應(yīng)用,一般會(huì)采用二進(jìn)制的編碼方式, 來判斷文本所展現(xiàn)出來的情緒是積極的還是消極的,或者文本內(nèi)容主要針對(duì)的是男性用戶還是女性用戶。隨著機(jī)器學(xué)習(xí)技術(shù)的發(fā)展, 有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)甚至可以實(shí)現(xiàn)自動(dòng)編碼,從而進(jìn)一步降低時(shí)間和財(cái)務(wù)成本。從目前的研究結(jié)果來看, 研究人員普遍認(rèn)為有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)非常適合自動(dòng)內(nèi)容分析, 采用自動(dòng)編碼的方式可以彌補(bǔ)精度降低所帶來的損失。

        總的來說, 在新聞學(xué)研究中采用有監(jiān)督機(jī)器學(xué)習(xí)的方式做內(nèi)容分析是很有必要的,其主要原因有三點(diǎn)。 第一,一般來說機(jī)器學(xué)習(xí)無需對(duì)文本數(shù)據(jù)進(jìn)行重新采樣, 從而可以在不增加成本的情況下同時(shí)對(duì)多個(gè)文本進(jìn)行分析。第二,有監(jiān)督機(jī)器學(xué)習(xí)可以提升新聞學(xué)研究的可靠性。 研究人員可以共享訓(xùn)練數(shù)據(jù)和算法, 從而保證標(biāo)簽的標(biāo)記方式完全相同,也就降低了人為操作導(dǎo)致錯(cuò)誤的可能性。 第三,有監(jiān)督機(jī)器學(xué)習(xí)可以促進(jìn)新聞理論研究, 幫助探索新的新聞學(xué)研究方法。

        二、當(dāng)前存在的主要問題

        如上所述,采用有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)的優(yōu)勢(shì)之一是可以處理更大的樣本量,但大的樣本量也存在一定的問題。第一,可能存在數(shù)據(jù)質(zhì)量較低的問題,這也是自動(dòng)化和可靠性之間的固有平衡。 第二,對(duì)大樣本進(jìn)行處理,其統(tǒng)計(jì)能力或者性能會(huì)在達(dá)到某個(gè)閾值后不再提高, 過大的樣本量也增加了得出微不足道的結(jié)論的可能性。 第三,已有的社會(huì)科學(xué)方法論已經(jīng)在抽樣理論中得到了較好的發(fā)展, 在某些情況下使用相對(duì)較小的隨機(jī)樣本進(jìn)行抽樣往往會(huì)產(chǎn)生更好的結(jié)果。

        在可靠性方面, 目前主要質(zhì)疑的是機(jī)器學(xué)習(xí)模型是否真能夠捕獲其目標(biāo)變量的深度內(nèi)涵和細(xì)微差別。事實(shí)上,目前的機(jī)器學(xué)習(xí)技術(shù)還無法掌握人類語言含義內(nèi)在的細(xì)微差別。 在文本分析中所使用的機(jī)器學(xué)習(xí)技術(shù)往往僅限于明確的概念,比如用來判斷某文本是否屬于娛樂新聞的范疇。當(dāng)機(jī)器學(xué)習(xí)技術(shù)應(yīng)用到多項(xiàng)分類任務(wù)中時(shí), 其預(yù)測(cè)的準(zhǔn)確性會(huì)受到較大影響。此外,機(jī)器學(xué)習(xí)模型的可擴(kuò)展性也會(huì)受到新聞學(xué)研究領(lǐng)域依賴性與特殊性等方面的限制。比如,人們的審美、愛好、政治傾向等都會(huì)隨著時(shí)間改變,其對(duì)新聞傳播的影響也隨之變化。 有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)不僅需要大量的訓(xùn)練數(shù)據(jù), 而且在某些領(lǐng)域或時(shí)間段可能表現(xiàn)不佳。 因此,要想實(shí)現(xiàn)標(biāo)準(zhǔn)化的自動(dòng)編碼或者機(jī)器學(xué)習(xí)模型,幾乎是不可能的。

        三、新聞學(xué)研究與計(jì)算機(jī)科學(xué)的融合

        在線新聞數(shù)據(jù)的豐富和可用性加速了新聞學(xué)研究和計(jì)算機(jī)科學(xué)之間的融合, 這很大程度上超出了以往新聞學(xué)的研究范圍。目前來看,計(jì)算機(jī)行業(yè)研究者的首要重點(diǎn)是算法及其性能,而較少關(guān)注該算法如何提高我們對(duì)新聞的理解,這可能導(dǎo)致一種低水平的經(jīng)驗(yàn)主義。在某些情況下,研究中使用的與新聞相關(guān)的數(shù)據(jù)可以與任何其他類型的文本互換。目前,關(guān)于如何利用模型理解媒介這一社會(huì)機(jī)構(gòu)的理論研究很少。 這可能是由于計(jì)算機(jī)科學(xué)家和新聞學(xué)者都習(xí)慣了兩種不同的統(tǒng)計(jì)建模文化, 計(jì)算機(jī)科學(xué)家將統(tǒng)計(jì)數(shù)據(jù)視為做出準(zhǔn)確預(yù)測(cè)的工具, 而社會(huì)科學(xué)家則將統(tǒng)計(jì)數(shù)據(jù)視為根據(jù)理論假設(shè)揭示變量之間因果關(guān)系的工具。 不同的理論方法也反映出模型評(píng)估的不同標(biāo)準(zhǔn)。

        為了在新聞學(xué)研究中可持續(xù)地使用機(jī)器學(xué)習(xí)技術(shù),我們認(rèn)為需要確保機(jī)器學(xué)習(xí)技術(shù)集成到新聞學(xué)研究現(xiàn)有的認(rèn)識(shí)論框架中。新聞學(xué)研究是本身就是跨學(xué)科領(lǐng)域的研究,因此,如何在傳統(tǒng)的新聞傳播學(xué)研究中融入計(jì)算機(jī)科學(xué)方法,使有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)成為新聞學(xué)研究現(xiàn)有方法框架的補(bǔ)充是值得探索的。

        四、未來的研究方向探討

        不斷變化的社會(huì)技術(shù)環(huán)境已向新聞學(xué)者提出了新的挑戰(zhàn)。 新聞學(xué)的許多核心理論在當(dāng)代數(shù)字新聞生態(tài)中得到了進(jìn)一步發(fā)展。我們認(rèn)為,可以利用有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)來對(duì)新聞學(xué)理論研究進(jìn)行補(bǔ)充。

        舉例來說,上世紀(jì)媒體環(huán)境相對(duì)簡(jiǎn)單,議程設(shè)置理論蓬勃發(fā)展。 但在當(dāng)前的媒體環(huán)境中,這一理論都受到了挑戰(zhàn)。議程設(shè)置理論放大了媒介的主導(dǎo)作用, 但忽略了受眾的能動(dòng)性。 下面來簡(jiǎn)要說明為什么有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)可以幫助我們應(yīng)對(duì)復(fù)雜的媒體環(huán)境對(duì)議程設(shè)置理論的挑戰(zhàn)。

        議程設(shè)置意味著因果關(guān)系主張,一般來說,預(yù)測(cè)和因果關(guān)系是相輔相成的。 有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)可以用于建立模型, 該模型可以根據(jù)以往的議程來預(yù)測(cè)未來某個(gè)時(shí)間點(diǎn)的議程。 首先,需要兩個(gè)分類器,一個(gè)用來確定主題或事件在不同的媒體平臺(tái)上是否屬于同一類別, 另一個(gè)用來確定產(chǎn)生信息的參與者的類型 (權(quán)威機(jī)構(gòu)、 新聞媒介、普通大眾等)。 然后,構(gòu)建一個(gè)可以處理預(yù)測(cè)時(shí)間相關(guān)的數(shù)據(jù)序列模型。 一旦有了一個(gè)可以預(yù)測(cè)未來議程的模型,我們可以將該模型運(yùn)用到實(shí)際的新聞生產(chǎn)中。 該模型的預(yù)測(cè)結(jié)果, 與實(shí)際的議程設(shè)置結(jié)果勢(shì)必存在一定的差距。 在新的媒體環(huán)境中,有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)可對(duì)媒體數(shù)據(jù)進(jìn)行分析, 并通過學(xué)習(xí)實(shí)際的議程設(shè)置結(jié)果對(duì)算法進(jìn)行修正,使預(yù)測(cè)模型不斷完善。 這意味著,有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)可以幫助解釋不同的因素, 如受眾的反饋意見對(duì)下一階段的議程設(shè)置有怎樣的影響, 從而使我們更好地掌握媒體生態(tài)。

        總而言之, 機(jī)器學(xué)習(xí)技術(shù)可以用來對(duì)新聞理論輔以解釋,通過在理論研究中應(yīng)用有監(jiān)督機(jī)器學(xué)習(xí)技術(shù),我們可以更深入地了解這些理論在當(dāng)前時(shí)代所經(jīng)歷的變化。

        結(jié)語

        我們分析了基于有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)在新聞學(xué)研究領(lǐng)域的現(xiàn)狀,并指出了未來的可能發(fā)展方向。 我們注意到,有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)在大型數(shù)據(jù)樣本、 可擴(kuò)展性和成本效率的假定優(yōu)勢(shì)并非在所有情況下都適用。根據(jù)項(xiàng)目的目標(biāo),基于傳統(tǒng)方法構(gòu)建的樣本可能更合適。

        有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)目前在新聞研究中的應(yīng)用仍然由算法主導(dǎo),但為了進(jìn)一步發(fā)展,我們需要考慮如何將有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)納入現(xiàn)有新聞學(xué)的典型理論研究中。 這里潛在的研究方向是利用有監(jiān)督機(jī)器學(xué)習(xí)技術(shù)的預(yù)測(cè)能力來掌握數(shù)字新聞生態(tài)系統(tǒng)的復(fù)雜性, 使預(yù)測(cè)能力與解釋性研究相協(xié)調(diào)。 當(dāng)然,有監(jiān)督機(jī)器學(xué)習(xí)只是一種分析方法,絕不能替代新聞學(xué)者已擁有的豐富的背景知識(shí), 只有讓機(jī)器學(xué)習(xí)技術(shù)與當(dāng)前新聞學(xué)研究方法相輔相成, 才可能得到更加令人滿意的研究成果。

        猜你喜歡
        監(jiān)督文本理論
        堅(jiān)持理論創(chuàng)新
        神秘的混沌理論
        理論創(chuàng)新 引領(lǐng)百年
        相關(guān)于撓理論的Baer模
        突出“四個(gè)注重” 預(yù)算監(jiān)督顯實(shí)效
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識(shí)別
        電子制作(2018年18期)2018-11-14 01:48:06
        監(jiān)督見成效 舊貌換新顏
        夯實(shí)監(jiān)督之基
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        噜噜噜噜私人影院| 国产目拍亚洲精品区一区| 国产精品自产拍av在线| 桃红色精品国产亚洲av| 西西大胆午夜人体视频| 国产成人久久精品二区三区牛| 蜜桃av多人一区二区三区| 91久久国产香蕉熟女线看| 国产精品毛片一区二区三区| 国内精品久久久久久久影视麻豆| 中文字幕有码高清| 亚洲av色福利天堂久久入口| 无码人妻一区二区三区兔费 | 免费a级毛片出奶水| 99福利影院| 亚洲日本高清一区二区| 免费人成在线观看网站| 激情欧美日韩一区二区| 欧美成人网视频| 中国少妇久久一区二区三区| 亚洲va无码va在线va天堂 | 2021精品综合久久久久| 亚洲天码一区二区三区| 久久人人爽爽爽人久久久 | 日本道免费精品一区二区| 水蜜桃网站视频在线观看| 国内精品久久久久国产盗摄| 亚洲男人第一av网站| 在线观看中文字幕一区二区三区| 蜜臀av一区二区三区免费观看| 桃花影院理论片在线| 国产激情视频在线观看首页| 精品蜜桃av免费观看| 国模精品一区二区三区| 亚洲av熟妇高潮30p| 国产精品一区二区三区蜜臀| 日本一区二区三区免费精品| 无码精品人妻一区二区三区人妻斩 | 国产综合色在线视频| 少妇特殊按摩高潮对白| 真实国产乱子伦精品视频 |