亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        大數(shù)據(jù)時代傳播研究中語料庫分析方法的價值

        2014-03-29 02:49:54喻國明李慧娟
        傳媒 2014年2期
        關(guān)鍵詞:熱詞傳播學結(jié)構(gòu)化

        文/喻國明 李慧娟

        在新聞傳播學視野之下,大數(shù)據(jù)的分析思維正在對我們的研究形成沖擊,比如新聞業(yè)務(wù)將實現(xiàn)一些方向性調(diào)整,趨勢預(yù)測性新聞和數(shù)據(jù)驅(qū)動型深度報道分量增加。對于輿情研究來說,問卷發(fā)放和小組訪談等傳統(tǒng)的民意調(diào)查方法,已經(jīng)不能滿足基于社交媒體平臺的海量信息處理要求。新聞傳播學領(lǐng)域的研究面臨一個共同問題,即文本分析方法的創(chuàng)新?;诖髷?shù)據(jù)的分析思維,文本也是一種有巨大潛在價值的數(shù)據(jù)。但是傳統(tǒng)的文本分析手段拘泥于有限的樣本數(shù)量和定性研究的窠臼,無法滿足大數(shù)據(jù)時代對內(nèi)容挖掘上廣度和深度的要求。在這種情況下,來源于應(yīng)用語言學領(lǐng)域的語料庫分析方法的介入,能夠使結(jié)構(gòu)化文本數(shù)據(jù)庫的構(gòu)建成為可能。再結(jié)合語言學、修辭學領(lǐng)域的內(nèi)容分析手段,能為我們從研究范式到研究方法、工具上都提供一些新思路。

        一、大數(shù)據(jù)時代對新聞傳播學研究范式提出的新課題

        (一)新聞實踐領(lǐng)域

        隨著社交媒體的應(yīng)用和智能手機的普及,人人都可以是事件的目擊者和發(fā)布者,傳統(tǒng)媒體新聞報道在原創(chuàng)性和獨家性方面的優(yōu)勢已不復存在。大眾傳媒作為社會的記錄者與傳播者的傳統(tǒng)定位及面向所有受眾的粗放式信息傳播方式,已越來越不能滿足受眾對于精準信息和定制內(nèi)容的需求。

        大數(shù)據(jù)時代,最重要的是數(shù)據(jù)的開放性,其被壟斷的可能性很小,公共云、公共數(shù)據(jù)庫到處存在。媒體既要生產(chǎn)自己的數(shù)據(jù),更要會用、用好公共數(shù)據(jù)。這些公共數(shù)據(jù)不僅包括數(shù)字信息,也包括大量文本內(nèi)容。要使用這些公共內(nèi)容,就需要有對海量信息的整合能力以及對潛在信息價值的挖掘能力,并需用可視化工具把結(jié)果精準地呈現(xiàn)出來。

        (二)輿情研究領(lǐng)域

        在研究視角上,傳統(tǒng)的輿情研究大都局限于比較表層化的話語研究和事件研究,沒有深入挖掘公眾的思想、行為和情感方面豐富的內(nèi)涵和規(guī)律性信息。而且受傳統(tǒng)的調(diào)查、訪談方法自身的局限性影響,很難進行受眾心理圖譜、行為圖譜和社會關(guān)系圖譜這樣復雜的語義關(guān)系的繪制和分析。

        在研究時距上,目前的輿情研究以共時性研究為主,歷時性研究缺乏。但是,輿情熱點的變化具有年輪效應(yīng),只有橫向的共時性分析是不夠充分的,沒有對公眾輿論的歷時性演變和輿情發(fā)生機制的縱向研究,我們在認識和行動上的方位感就會不夠客觀和真實。

        在采集方法上,現(xiàn)有的輿情監(jiān)測和分析軟件的同質(zhì)化程度較高,采集的文本大多是基于互聯(lián)網(wǎng)社交媒體,分析結(jié)果的呈現(xiàn)方式也比較相似。在炫目的可視化圖景背后,沒有對文本數(shù)據(jù)的深度分析,而這種深度分析要基于對大量文本的內(nèi)容挖掘和整合,這就需要經(jīng)過結(jié)構(gòu)化處理的文本數(shù)據(jù)庫來支持。輿情話語的表達亂象紛繁,真?zhèn)尾⒋?,既需要小型的基礎(chǔ)文本數(shù)據(jù)庫來深度挖掘某類熱點專題,也需要大型合成文本數(shù)據(jù)庫對輿論走向和趨勢進行宏觀把握。

        (三)傳播學學術(shù)研究領(lǐng)域

        傳統(tǒng)的傳播學文本分析,主要以框架分析、符號分析等定性分析方法為主,但這兩種分析主要集中于意識形態(tài)、修辭方式等方面,不夠客觀。而文本內(nèi)容,特別是輿論研究的文本內(nèi)容,有零散化、碎片化的特征,在拉斯韋爾的5W里面, say what(文本內(nèi)容研究)的問題常常被人忽略。雖然有一些專門的詞頻統(tǒng)計分析軟件,可以完成對高頻詞和低頻詞的統(tǒng)計分析,但在語義深度挖掘方面仍然有待開發(fā)。我們需要找到一種常規(guī)的工具,可以把學術(shù)文本進行結(jié)構(gòu)化方法上的整合,通過把文本分類、合并,提取常用關(guān)鍵詞和核心詞,按研究主題分門別類地進行儲存,為對比研究、專題研究等領(lǐng)域提供更加嚴謹和結(jié)構(gòu)化的文本數(shù)據(jù)庫支持。

        二、語料庫分析:體現(xiàn)大數(shù)據(jù)思維的研究方法

        語料庫屬于應(yīng)用語言學的范疇,是指按照一定的語言學原則,運用隨機抽樣方法,收集自然出現(xiàn)的連續(xù)語言運用文本或話語片段而建成的、具有一定容量的大型電子文本庫。該方法在國外已有三十年以上的研究歷史,如今也擁有較為成熟的語料庫構(gòu)建與檢索工具,比如Wordsm ith、AntConc等。國內(nèi)語料庫的研究亦開展近二十年時間,研究范疇基本被劃分為詞匯、語法、語篇、語用和文體研究等五個方面。利用語料庫作為研究工具,可以從微觀層面對新聞傳播學領(lǐng)域的文本內(nèi)容進行研究。在語言學領(lǐng)域,語料庫的研究方法已日趨成熟,只不過尚未走進新聞傳播學的視野,這是因為新聞傳播學在文本內(nèi)容分析方面欠缺新的方法,需要語料庫這類研究方法的介入。

        三、語料庫研究方法的應(yīng)用領(lǐng)域

        (一)在新聞實踐領(lǐng)域的應(yīng)用

        1.史料檢索語料庫。即把新聞報道的原創(chuàng)內(nèi)容和歷史資料數(shù)據(jù)化,變成媒體的核心資產(chǎn)。在新聞傳播渠道日益扁平化的今天,建立一個受眾易于發(fā)現(xiàn)和易于使用的史料數(shù)據(jù)庫,是報紙生存下去的核心競爭力之一。另外還可以采集一些外部數(shù)據(jù)來作為語料庫的擴充部分,如通過合作、購買、交換、抓取等方式來獲取來自其他媒體的內(nèi)容和來自互聯(lián)網(wǎng)平臺用戶創(chuàng)造的內(nèi)容,并完善語料庫的資料存儲、檢索查詢和版權(quán)管理,為進一步轉(zhuǎn)化利用打好基礎(chǔ)。

        2.政府公開信息語料庫。彭博社亞洲區(qū)新聞資訊主編Lee M iller指出:數(shù)據(jù)驅(qū)動型報道中的數(shù)據(jù)都可以并且應(yīng)該從公開信息渠道中獲得。所謂的信源和數(shù)據(jù),并不一定要像“維基解密”或斯諾登那樣從秘密渠道獲取,而是應(yīng)該從公開信息中挖掘。這些信源包括政府機構(gòu)網(wǎng)站中日常發(fā)布的政策信息和每年重大會議的政府工作報告;大眾媒體官方網(wǎng)站上的報道和專題;官方媒體的新媒體移動終端發(fā)布的內(nèi)容等等。根據(jù)政治、經(jīng)濟、教育、公共衛(wèi)生等不同主題,建立可供隨時檢索的公開信息語料庫,能夠為媒體報道節(jié)約大量搜尋數(shù)據(jù)和素材的人力和物力。

        3.“數(shù)據(jù)博客”語料庫。在基于社交網(wǎng)絡(luò)平臺的節(jié)點式傳播基礎(chǔ)上,來自草根階層或者是專業(yè)領(lǐng)域人士的博客、微博的內(nèi)容和數(shù)據(jù),也能成為新聞線索的來源和報道內(nèi)容的基礎(chǔ)。因此,我們可以采集那些比較有影響力的博客或微博的內(nèi)容,通過初步的結(jié)構(gòu)化處理,轉(zhuǎn)換成隨時可供查詢和檢索的民間信息語料庫,供數(shù)據(jù)驅(qū)動型的新聞報道作為參考,也可以作為普通讀者查詢的數(shù)據(jù)庫。

        (二)在輿情研究領(lǐng)域的應(yīng)用

        通過建立動態(tài)輿情監(jiān)測語料庫,提供可供檢索的關(guān)鍵詞數(shù)據(jù)庫,結(jié)合修辭學、語言學的分析方法,分析輿論話語表達、公眾社會關(guān)系、群體心理特征等。首先按照一定的規(guī)則和專題對收集的輿情文本內(nèi)容進行分類和標注,然后是文本合并和關(guān)鍵詞提取。在語料處理方面要注意兩點:一是小型基礎(chǔ)語料庫的支撐和建設(shè),大數(shù)據(jù)庫作為信息母體,需要若干小型數(shù)據(jù)庫作為檢索源;二是中心度和關(guān)聯(lián)度結(jié)構(gòu)化的算法,大數(shù)據(jù)庫作為一種非結(jié)構(gòu)化的數(shù)據(jù),需要進行一些結(jié)構(gòu)化的解讀和梳理,這就需要相關(guān)的數(shù)據(jù)結(jié)構(gòu)化算法,這種算法可稱之為數(shù)據(jù)模型。

        1.輿情熱詞語料庫。輿情熱詞語料庫主要服務(wù)于輿情監(jiān)測,解決重大和突發(fā)事件中引爆點和關(guān)聯(lián)度的關(guān)系。我們可以通過關(guān)注熱點內(nèi)容,搜集熱點事件的語料,建立輿情熱詞數(shù)據(jù)庫,找出引發(fā)輿情關(guān)注的引爆詞。并結(jié)合語詞情感分析、修辭分析手段,來劃分引爆詞的中心度級別和關(guān)聯(lián)度級別,在此基礎(chǔ)上設(shè)計熱詞發(fā)現(xiàn)模型,達到輿情預(yù)警和預(yù)測的目的。

        首先我們根據(jù)研究規(guī)模來選取一定數(shù)量的樣本,然后用語料庫構(gòu)建工具對選定文本進行標注和結(jié)構(gòu)化處理,對輿情關(guān)鍵詞進行再次統(tǒng)計并生成核心主題詞表數(shù)據(jù)庫,從中找出輿情引爆詞。需要特別指出一點,核心主題詞不一定是詞頻最高的那個詞,而是輿情敏感度,也就是熱度最高的詞,即輿論的中心詞。中心詞是輿論的引爆點,實現(xiàn)了引導公眾把輿論由說變成做的過程,同時也是關(guān)聯(lián)度最高的詞,從最大限度上關(guān)聯(lián)其他的主題詞并形成語義網(wǎng)絡(luò)。

        關(guān)于輿情熱詞的分析,有兩個關(guān)鍵點:引爆點和關(guān)聯(lián)點。由引爆點可以導出對引爆詞的挖掘;由關(guān)聯(lián)點可以導出對連接詞的發(fā)現(xiàn);引爆詞具有意見領(lǐng)袖的作用,迅速擴大熱詞的影響力并號召公眾付之行動;關(guān)聯(lián)詞具有搬運工的作用,能夠連接各種關(guān)系詞,形成主題詞網(wǎng)絡(luò)?;谝~的挖掘和連接詞的發(fā)現(xiàn),輿情熱詞分析可以劃分出兩個維度:中心度分析和關(guān)聯(lián)度分析,進而設(shè)定中心度指標和關(guān)聯(lián)度指標,并設(shè)計指標體系的計算公式,形成具有引爆性質(zhì)的熱詞理論模型。這樣就可以輿情監(jiān)測,隨著熱詞強度的提高,熱詞的范圍是不是在擴大,社會的緊張度又如何,進而往前預(yù)推,達到預(yù)警的目的。

        2.意見領(lǐng)袖修辭特征詞語料庫。在一些官方傳統(tǒng)媒體失語或報道不及時的情況下,網(wǎng)民習慣于打開網(wǎng)絡(luò)意見領(lǐng)袖的博客或追逐微博上的只言片語,從他們那里尋找解讀、剖析和批判。意見領(lǐng)袖的觀點、意見情緒能為受眾所接收,能引起受眾的共鳴,會產(chǎn)生巨大的輿論影響,這與他們個人的話語表達風格、對某個領(lǐng)域的專業(yè)知識和對某類問題的把握能力密不可分。因此,通過對意見領(lǐng)袖的觀點、態(tài)度關(guān)鍵主題詞等內(nèi)容的提取,可以從中總結(jié)某個或某類意見領(lǐng)袖的修辭特點及個人特征,形成一定的辨識度依據(jù);進而還可以從中尋找具有心理喚起度和社會動員能力的詞,為輿論引導提供來自民間輿論場的參照。

        3.傳播學學術(shù)主題詞語料庫。在傳播學內(nèi)容研究領(lǐng)域,可以嘗試用語料庫來完成對常規(guī)5W領(lǐng)域的深化研究,尤其是引向微觀層面。越是細小的不易覺察的,越是人們忽視的,也越是研究者值得進軍的領(lǐng)域,而微觀的研究恰恰能夠揭示很多深度的東西。所以傳播學主題詞語料庫可以做的,恰恰是把非結(jié)構(gòu)化的文本數(shù)據(jù)結(jié)構(gòu)化,根據(jù)研究主題設(shè)定結(jié)構(gòu)化的方向、結(jié)構(gòu)化的坐標、結(jié)構(gòu)化的指標,來完成研究的目標。比如傳播史方面的研究,我們可以找到一個時間節(jié)點,搜集與這一節(jié)點同步的史實資料,然后把文本進行整合、分詞、標注,提取與這一歷史節(jié)點關(guān)聯(lián)的年份詞、學者名稱、學術(shù)觀點、專門術(shù)語,構(gòu)建主題詞語料庫,繪制這一時期的主題詞學術(shù)地圖。

        4.受眾特征關(guān)鍵詞語料庫。利用微博進行廣告?zhèn)鞑?,有著天然的精準投放?yōu)勢。我們可以利用語料庫來分析挖掘受眾群體特征,繪制不同目標群體的心理圖譜、行為圖譜和社會圖譜,從而實現(xiàn)對目標接觸點的精準把握,找到受眾的需求交叉點。這種語料庫分析的應(yīng)用原理來自于特征聚類,以此為依據(jù),來向具有相似心理需求的受眾推送受本群體認可的資訊和產(chǎn)品廣告,從而達到對品牌接觸點和受眾需求交叉點的精準把握。

        四、語料庫分析在傳播學研究方法論上的創(chuàng)新點

        工具性的研究方法,要和研究內(nèi)容的屬性相匹配;要把主觀感覺的內(nèi)容變成可靠結(jié)論,從而挖掘出研究對象的潛在價值。語料庫的分析方法,符合大數(shù)據(jù)的思維邏輯,通過對海量文本數(shù)據(jù)的處理,可以對文本內(nèi)容進行深入挖掘,而不僅僅局限于表層研究或定性分析。以微觀偏中觀的修辭手段和語義分析的研究為基礎(chǔ),通過語料庫這種結(jié)構(gòu)化的文本數(shù)據(jù)來開展量化研究,這在國內(nèi)外新聞傳播學界都屬新鮮待開發(fā)的領(lǐng)域。

        語料庫的研究,本質(zhì)上也是一種跨學科的研究,綜合了語言學、修辭學、計算機科學和統(tǒng)計學各學科的知識。當前國內(nèi)外大型語料庫的建設(shè)都具有動態(tài)性的特點,即語料會定期更新,基于它可以豐富傳播學量化研究的方法,發(fā)現(xiàn)關(guān)鍵詞和主題詞的歷史性演變,從而尋找其中的年輪效應(yīng),為學術(shù)文本和實踐領(lǐng)域的研究提供縱向的和歷時性的參照物和坐標系。

        [1]彭蘭.大數(shù)據(jù)時代,新聞業(yè)面臨的新震蕩[J].編輯之友,2012(1).

        [2]官建文,劉揚,劉振興.大數(shù)據(jù)時代對傳媒業(yè)意味著什么[J].新聞戰(zhàn)線,2012(2).

        [3]李彪.大數(shù)據(jù)視域下社會輿情研究的新境界.編輯之友,2013(6).

        [4]人民網(wǎng)輿情辦公室.如何應(yīng)對網(wǎng)絡(luò)輿情——網(wǎng)絡(luò)輿情分析師手冊[M].北京:新華出版社,2011.

        猜你喜歡
        熱詞傳播學結(jié)構(gòu)化
        熱詞
        時代郵刊(2021年8期)2021-11-26 12:48:48
        熱詞
        促進知識結(jié)構(gòu)化的主題式復習初探
        熱詞
        結(jié)構(gòu)化面試方法在研究生復試中的應(yīng)用
        計算機教育(2020年5期)2020-07-24 08:53:00
        十九大熱詞 我踐行
        少先隊活動(2018年8期)2018-12-29 12:15:54
        2016央視春晚“咻一咻”的傳播學解析
        新聞傳播(2016年10期)2016-09-26 12:14:47
        傳播學視閾下新一代“四有”革命軍人的培養(yǎng)研究
        新聞傳播(2016年1期)2016-07-12 09:24:45
        相遇中的“傳播”:傳播學研究反思
        新聞傳播(2016年20期)2016-07-10 09:33:31
        大數(shù)據(jù)的傳播學解讀
        新聞傳播(2015年14期)2015-07-18 11:14:06
        久久精品国产精品亚洲婷婷| 亚洲av日韩综合一区二区三区| 亚洲av无码av男人的天堂| 国产在线白丝DVD精品| 丁香九月综合激情| 青青青爽在线视频免费播放| 国产高清在线观看av片| 又污又爽又黄的网站| 亚洲自拍愉拍| 国产一区二区三区在线观看蜜桃| 精品一区三区视频在线观看| 国产精品成人久久电影| 人妻熟妇乱系列| 国产精品毛片av一区二区三区| 亚洲一区二区免费在线观看视频| 国产av无码专区亚洲av毛网站| 久久久精品免费观看国产| 亚洲情精品中文字幕有码在线| 日本一区二区免费在线看| 制服丝袜中文字幕在线| 伊人久久综合影院首页| 亚洲一区二区成人在线视频| 国产一区二区av免费观看| 国产乱码一区二区三区爽爽爽| 亚洲福利视频一区| 国产蜜臀精品一区二区三区| 中出人妻希奇杰卡西av| 成人三级a视频在线观看| 欧美伊人亚洲伊人色综| 日本中文字幕官网亚洲| 欧美老熟妇乱子| 亚洲 欧美 影音先锋| 亚洲AV秘 无码一区二区久久| 国产情侣亚洲自拍第一页| 亚洲热妇无码av在线播放| 国产美女在线一区二区三区| 内射中出后入内射极品女神视频| 内射白浆一区二区在线观看| www国产精品内射熟女| 亚洲无码图| 偷拍视频网址一区二区|