亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析方法研究

        2014-08-08 03:20:47唐濤
        現(xiàn)代情報(bào) 2014年3期
        關(guān)鍵詞:網(wǎng)絡(luò)輿情大數(shù)據(jù)

        基金項(xiàng)目:本文系國家社會(huì)科學(xué)基金項(xiàng)目“移動(dòng)互聯(lián)網(wǎng)環(huán)境下網(wǎng)絡(luò)輿情新特征、新問題與對(duì)策研究”(項(xiàng)目編號(hào):13CTQ028)研究成果之一。

        作者簡介:唐濤(1982-),男,助理研究員,博士,研究方向:網(wǎng)絡(luò)輿情、信息產(chǎn)業(yè)發(fā)展戰(zhàn)略,發(fā)表論文10余篇?!だ碚撎剿鳌?/p>

        〔摘要〕隨著互聯(lián)網(wǎng)技術(shù)和應(yīng)用的發(fā)展,網(wǎng)絡(luò)輿情在數(shù)據(jù)體量、復(fù)雜性和產(chǎn)生速度等方面發(fā)生巨大變化。網(wǎng)絡(luò)輿情分析方法已超出了現(xiàn)有常用的分析框架,必須在大數(shù)據(jù)分析的思維下有所創(chuàng)新。本文概述了常用的網(wǎng)絡(luò)輿情分析方法,歸納了當(dāng)前網(wǎng)絡(luò)輿情的大數(shù)據(jù)特征和分類,提出了網(wǎng)絡(luò)輿情分析創(chuàng)新要向大數(shù)據(jù)分析方向發(fā)展的觀點(diǎn),并概述了4種新思路新方法,對(duì)需要注意的相關(guān)問題進(jìn)行了總結(jié),對(duì)未來網(wǎng)絡(luò)輿情分析創(chuàng)新進(jìn)行了展望。

        〔關(guān)鍵詞〕網(wǎng)絡(luò)輿情;大數(shù)據(jù);輿情分析

        DOI:10.3969/j.issn.1008-0821.2014.03.001

        〔中圖分類號(hào)〕G203〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2014)03-0003-04

        Research on Method of Internet Public Opinion Analysis Based on Big DataTang Tao

        (Institute of Information,Shanghai Academy of Social Sciences,Shanghai 200235,China)

        〔Abstract〕With the development of Internet technology and applications,network public opinion changed dramatically in the data volume,complexity and generate speed.Network public opinion analysis method has exceeded the existing analytical framework,and must make some innovative under the thinking of big data.The paper summaried common methods of public opinion analysis,induced the big data characteristics and classifications of public opinion,proposed the point that innovation of internet public opinion analysis should develop toward to big data analysis.The paper summaried four new methods and some issues which should be paid attention to,and forecased the innovation trends of public opinion analysis.

        〔Keywords〕internet public opinion;big data;public opinion analysis

        人類社會(huì)的數(shù)據(jù)產(chǎn)生方式主要有3種:一是運(yùn)營數(shù)據(jù),伴隨著各類組織的運(yùn)營而被動(dòng)產(chǎn)生;二是感知數(shù)據(jù),由遍布世界各個(gè)角落的傳感器等設(shè)備監(jiān)測社會(huì)運(yùn)行和環(huán)境變化而自動(dòng)產(chǎn)生;三是人類原創(chuàng)數(shù)據(jù),由人單獨(dú)創(chuàng)作和人際互動(dòng)而主動(dòng)產(chǎn)生[1]。其中,人類原創(chuàng)數(shù)據(jù)在互聯(lián)網(wǎng),尤其是Web20環(huán)境下產(chǎn)生了爆發(fā)式增長,形成了龐大的網(wǎng)絡(luò)數(shù)據(jù)資源,而其中有相當(dāng)一部分是由個(gè)人和各種社會(huì)群體,對(duì)自己關(guān)心或與自身利益緊密相關(guān)的各種公共事務(wù)所持有的情緒、意愿、態(tài)度和意見[2],也就是網(wǎng)絡(luò)輿情。

        我國擁有世界上最多的網(wǎng)民和最大的訪問量,有效分析網(wǎng)絡(luò)輿情,對(duì)于政府,可以更好地了解公眾意見和訴求,有助于建設(shè)安全和諧的網(wǎng)絡(luò)環(huán)境和社會(huì)環(huán)境;對(duì)于媒體,可以突破傳統(tǒng)“從記者到讀者”的單向信息生產(chǎn)模式,而加強(qiáng)對(duì)公眾輿論的深層次分析,實(shí)現(xiàn)新聞信息增值[3];對(duì)于企業(yè),可以掌握客戶對(duì)產(chǎn)品與服務(wù)的評(píng)價(jià)及客戶特征知識(shí),更好地提供個(gè)性化產(chǎn)品與服務(wù),實(shí)現(xiàn)利潤增長。因此,政府、媒體、企業(yè)和學(xué)術(shù)界都越來越重視網(wǎng)絡(luò)輿情分析,并不斷追求分析方法的創(chuàng)新,充分發(fā)揮輿情信息的價(jià)值。

        1網(wǎng)絡(luò)輿情分析研究與實(shí)踐現(xiàn)狀

        當(dāng)前常用的網(wǎng)絡(luò)輿情分析方法主要有網(wǎng)絡(luò)調(diào)查方法、基于統(tǒng)計(jì)規(guī)則的模式識(shí)別方法、基于內(nèi)容挖掘的主題監(jiān)測方法等[4]。

        網(wǎng)絡(luò)調(diào)查方法是將社會(huì)調(diào)查法移植到網(wǎng)絡(luò)上,即在網(wǎng)上進(jìn)行問卷調(diào)查。這種方法通過設(shè)計(jì)問卷、抽樣調(diào)查、統(tǒng)計(jì)分析等一整套科學(xué)程序,能夠客觀地推論社情民意。這種方法應(yīng)用廣泛,許多網(wǎng)站在新聞網(wǎng)頁下方設(shè)置新聞評(píng)論功能和讀者態(tài)度傾向調(diào)查,新華網(wǎng)、人民網(wǎng)等網(wǎng)站在近年全國兩會(huì)期間專門進(jìn)行關(guān)于民眾關(guān)注熱點(diǎn)的網(wǎng)絡(luò)輿情問卷調(diào)查,一些網(wǎng)站還針對(duì)國家重大事件和社會(huì)熱點(diǎn)進(jìn)行網(wǎng)絡(luò)調(diào)查。

        在基于統(tǒng)計(jì)規(guī)則的模式識(shí)別方面,有學(xué)者通過統(tǒng)計(jì)分析某段時(shí)間內(nèi)用戶所關(guān)注信息點(diǎn)的記錄,構(gòu)建了互聯(lián)網(wǎng)內(nèi)容與輿情的熱點(diǎn)/熱度、重點(diǎn)/重度、焦點(diǎn)/焦度、敏點(diǎn)/敏度、頻點(diǎn)/頻度、拐點(diǎn)/拐度、難點(diǎn)/難度、疑點(diǎn)/疑度、粘點(diǎn)/粘度、散點(diǎn)/散度等10個(gè)分析模式和判據(jù)[5]。

        在基于內(nèi)容挖掘的主題監(jiān)測方面,流程有3步:信息提?。òㄐ畔⒉杉⒔Y(jié)構(gòu)化數(shù)據(jù)存儲(chǔ));信息預(yù)處理(包括信息過濾、詞法分析、句法分析、概念分析);輿情分析(包括文本標(biāo)示、主題發(fā)現(xiàn)、意見挖掘、傾向分析),主要進(jìn)行話題識(shí)別。近年來淺層分析技術(shù)出現(xiàn),相關(guān)研究開始關(guān)注網(wǎng)絡(luò)輿情的情感傾向。這種方法的核心技術(shù)包括搜索引擎技術(shù)、信息組織技術(shù)、自然語言處理技術(shù)等。

        同時(shí),市場上還出現(xiàn)了不少網(wǎng)絡(luò)輿情監(jiān)測分析軟件,知名的有人民網(wǎng)輿情監(jiān)測平臺(tái)、拓爾思網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)、方正智思互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)、邦富互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)、軍犬網(wǎng)絡(luò)輿情監(jiān)控系統(tǒng)等。以人民網(wǎng)輿情監(jiān)測平臺(tái)為例,網(wǎng)絡(luò)輿情信息采集系統(tǒng)可對(duì)傳統(tǒng)媒體網(wǎng)絡(luò)版、新聞網(wǎng)站、論壇、博客等進(jìn)行全天候定向抓取信息,還可利用百度、谷歌、奇虎等搜索引擎進(jìn)行信息補(bǔ)充,并進(jìn)行關(guān)鍵詞、關(guān)注度、轉(zhuǎn)載率等統(tǒng)計(jì)分析。但這些輿情監(jiān)測系統(tǒng)擅長的是抓取新聞網(wǎng)頁,在網(wǎng)絡(luò)社區(qū)中,如BBS、博客、微博、QQ群、新聞跟帖等則效果有效,網(wǎng)絡(luò)社區(qū)中的輿情主要依靠人工分析[6]。

        在傳統(tǒng)數(shù)據(jù)時(shí)代,我們分析輿情走勢(shì)時(shí),往往比較關(guān)注網(wǎng)民的言論,而忽視有多少人持此意見;往往重視解讀文字內(nèi)容,而忽視網(wǎng)民互動(dòng)的社會(huì)關(guān)系網(wǎng)絡(luò)。

        2網(wǎng)絡(luò)輿情的大數(shù)據(jù)特征及分類

        21網(wǎng)絡(luò)輿情的大數(shù)據(jù)特征

        大數(shù)據(jù)是指無法在一定時(shí)間內(nèi)用常規(guī)軟件工具進(jìn)行抓取、管理和處理的數(shù)據(jù)集合[7],其在數(shù)據(jù)體量、復(fù)雜性和產(chǎn)生速度3個(gè)方面均大大超出了傳統(tǒng)的數(shù)據(jù)形態(tài),具有4V特征:規(guī)模性(Volume)、多樣性(Variety)、變化快速性(Velocity)、價(jià)值(Value)。對(duì)當(dāng)前網(wǎng)絡(luò)輿情狀況的觀察可以看出,互聯(lián)網(wǎng)的開放性使數(shù)量龐大的網(wǎng)民和各種社會(huì)群體可以在網(wǎng)上方便快捷地發(fā)表觀點(diǎn),這使得網(wǎng)絡(luò)輿情的數(shù)據(jù)量急速增長。其次,多媒體的發(fā)展使網(wǎng)絡(luò)輿情的數(shù)據(jù)形態(tài)既有文本,又有圖片、音頻、視頻等,呈現(xiàn)出多樣性特征。再次,現(xiàn)代社會(huì)價(jià)值觀念多元,各種觀點(diǎn)交流交融交鋒,輿論多元多樣多變,網(wǎng)絡(luò)輿情變化快速。各種因素共同作用,使得網(wǎng)絡(luò)輿情數(shù)據(jù)越來越呈現(xiàn)出大數(shù)據(jù)特征。

        endprint

        22顯性輿情和隱性輿情

        當(dāng)公共事務(wù)發(fā)生后,網(wǎng)民在瀏覽、搜索、互動(dòng)的過程中會(huì)隨時(shí)發(fā)表言論信息,這些信息直接呈現(xiàn)了網(wǎng)民的情緒、態(tài)度、意見,可以被稱為“顯性”網(wǎng)絡(luò)輿情大數(shù)據(jù)。

        此外,還有一些數(shù)據(jù)并不是直接的網(wǎng)絡(luò)輿情內(nèi)容,但卻從側(cè)面客觀反映了網(wǎng)民的關(guān)注熱點(diǎn)、輿情主體之間關(guān)系等,可以被稱為“隱性”網(wǎng)絡(luò)輿情大數(shù)據(jù)。如,網(wǎng)民在瀏覽相關(guān)信息時(shí),網(wǎng)站服務(wù)器端的日志記錄了瀏覽頁面URL等數(shù)據(jù),在搜索相關(guān)信息時(shí),搜索引擎服務(wù)器端的日志記錄了搜索關(guān)鍵詞等數(shù)據(jù),可以反映用戶的瀏覽偏好和搜索熱點(diǎn)。網(wǎng)絡(luò)社區(qū)用戶之間互相“加關(guān)注”成為“粉絲”,服務(wù)器端記錄的人際關(guān)系數(shù)據(jù)能夠描述用戶構(gòu)成的社會(huì)化網(wǎng)絡(luò)。用戶之間互相轉(zhuǎn)發(fā)和評(píng)論帖文所形成的轉(zhuǎn)發(fā)量和評(píng)論量數(shù)據(jù),可以反映帖文的重要程度。

        3網(wǎng)絡(luò)輿情大數(shù)據(jù)分析方法創(chuàng)新

        網(wǎng)絡(luò)調(diào)查方法主要是進(jìn)行采樣分析,其結(jié)果精確性隨著采樣隨機(jī)性的提高而提高,與樣本數(shù)量的增加關(guān)系不大,也就是說,樣本的隨機(jī)性比樣本的數(shù)量更重要,但實(shí)現(xiàn)這樣的隨機(jī)性非常困難,以至于如果抽樣對(duì)象是互聯(lián)網(wǎng)用戶這樣的復(fù)雜和海量對(duì)象時(shí),就很難找到一個(gè)“最優(yōu)抽樣”的標(biāo)準(zhǔn),更不可能奢求抽樣得到的小樣本能夠精確反映整體的所有特征。

        基于統(tǒng)計(jì)規(guī)則的模式識(shí)別方法具有有效性,但由于不同信息源的信息產(chǎn)生方式有較大差異,該方法適用于對(duì)特點(diǎn)對(duì)象進(jìn)行定點(diǎn)監(jiān)測,有一定的局限性。

        基于內(nèi)容挖掘的主題監(jiān)測方法主要針對(duì)“顯性”網(wǎng)絡(luò)輿情大數(shù)據(jù),從現(xiàn)有的實(shí)踐來看,由于受限于當(dāng)前語義分析技術(shù)的精確度和速率,語義支持的缺失仍然是普遍存在的問題,一些工具難以有效地處理復(fù)雜的人類語言和不斷變化的網(wǎng)絡(luò)語言,而且對(duì)大規(guī)模數(shù)據(jù)分析的支持也較弱[8],仍然需要大量采用抽樣分析和人工分析。而人工分析又具有很強(qiáng)的定性化色彩,所以不少輿情分析報(bào)告經(jīng)常使用“普遍表示贊成”、“不少網(wǎng)民認(rèn)為”、“少數(shù)網(wǎng)民持反對(duì)態(tài)度”等定性化的語言,輿情分析的準(zhǔn)確性難以進(jìn)一步提高。

        因此,要不斷創(chuàng)新網(wǎng)絡(luò)輿情大數(shù)據(jù)分析思路。一是繞開語義分析的技術(shù)瓶頸,開辟“隱性”輿情分析的“第二戰(zhàn)線”;二是突破抽樣分析的思維,用大數(shù)據(jù)方法分析收集到的全體數(shù)據(jù);三是將搜索數(shù)據(jù)、點(diǎn)擊數(shù)據(jù)、人際關(guān)系數(shù)據(jù)、網(wǎng)民個(gè)人特征數(shù)據(jù)、相關(guān)社會(huì)數(shù)據(jù)等關(guān)聯(lián)起來進(jìn)行分析,深度挖掘出有價(jià)值的輿情。四是主動(dòng)進(jìn)行網(wǎng)絡(luò)民意調(diào)查,有針對(duì)性地收集標(biāo)準(zhǔn)化數(shù)據(jù)。具體有以下幾種方法。

        31基于網(wǎng)絡(luò)日志數(shù)據(jù)挖掘的隱性輿情分析

        當(dāng)網(wǎng)民關(guān)注某公共事件而去瀏覽或搜索相關(guān)信息時(shí),會(huì)在網(wǎng)站服務(wù)器端產(chǎn)生瀏覽日志或搜索日志。瀏覽日志中記錄了網(wǎng)民IP地址、瀏覽時(shí)間、網(wǎng)頁URL地址等數(shù)據(jù),可以通過分析日志,統(tǒng)計(jì)某地區(qū)、某時(shí)間段內(nèi)的瀏覽熱點(diǎn),許多網(wǎng)站推出的“輿情熱點(diǎn)排行榜”就是這方面的應(yīng)用。

        搜索引擎后臺(tái)的搜索日志記錄了網(wǎng)民IP地址、搜索時(shí)間、搜索詞、被點(diǎn)擊的結(jié)果網(wǎng)頁URL地址等數(shù)據(jù)。通過統(tǒng)計(jì)分析用戶的搜索詞及搜索頻率,可以發(fā)現(xiàn)網(wǎng)民的關(guān)注點(diǎn)及其熱度;對(duì)一段時(shí)間內(nèi)與某個(gè)社會(huì)事件相關(guān)的搜索詞進(jìn)行詞頻統(tǒng)計(jì),可以描述網(wǎng)民關(guān)注點(diǎn)的產(chǎn)生和變化過程。

        目前,一些搜索引擎公司已經(jīng)研發(fā)了通過搜索日志挖掘發(fā)現(xiàn)網(wǎng)絡(luò)輿情的技術(shù)和應(yīng)用。谷歌公司開發(fā)的“谷歌趨勢(shì)”應(yīng)用能統(tǒng)計(jì)某個(gè)關(guān)鍵詞在一定時(shí)間段內(nèi)某個(gè)地區(qū)被搜索的次數(shù),將其與谷歌上隨時(shí)間推移的搜索總量及當(dāng)?shù)氐乃阉骺偭肯啾容^,得出該關(guān)鍵詞的“相對(duì)搜索指數(shù)”,并將較長一段時(shí)間內(nèi)的相對(duì)搜索指數(shù)描繪出來,以預(yù)測未來趨勢(shì)[9]。一個(gè)成功的應(yīng)用是谷歌制作發(fā)布的全球20多個(gè)國家的“流感趨勢(shì)”。設(shè)計(jì)人員編入一系列與“流感”相關(guān)的關(guān)鍵詞,包括“流感”、“溫度計(jì)”、“發(fā)燒”、“咳嗽”等。當(dāng)用戶輸入這些關(guān)鍵詞,系統(tǒng)就認(rèn)為可能與“流感”發(fā)病相關(guān),繼而跟蹤分析并作出相對(duì)搜索量指數(shù)圖。通過對(duì)以往指數(shù)的變化情況預(yù)測未來趨勢(shì),進(jìn)而預(yù)報(bào)流感發(fā)病率。谷歌“流感趨勢(shì)”在測試期間就表現(xiàn)出良好的預(yù)測效果,比美國疾病控制中心提前7~10天公布美國流感預(yù)報(bào),且與官方公布的預(yù)報(bào)數(shù)據(jù)高度吻合,顯示了基于搜索日志大數(shù)據(jù)進(jìn)行預(yù)測的前瞻性和準(zhǔn)確性。

        32基于社會(huì)網(wǎng)絡(luò)分析的輿情主體關(guān)系發(fā)現(xiàn)

        中國工程院李國杰院士認(rèn)為,“數(shù)據(jù)背后是網(wǎng)絡(luò),網(wǎng)絡(luò)背后是人,研究網(wǎng)絡(luò)數(shù)據(jù)實(shí)際上是研究人組成的社會(huì)網(wǎng)絡(luò)”[10]?;ヂ?lián)網(wǎng)上不同主體間的互動(dòng)形成很多社會(huì)化網(wǎng)絡(luò),以微博為例,用戶之間互相關(guān)注、轉(zhuǎn)帖、評(píng)論,假設(shè)用戶乙關(guān)注了用戶甲,則可以畫一條由甲指向乙的有向邊,表示甲發(fā)布的信息可以自動(dòng)傳遞給乙。將所有用戶之間互相關(guān)注的關(guān)系都畫成有向邊,整個(gè)微博輿論場就成為一個(gè)有向圖,每個(gè)用戶就是一個(gè)節(jié)點(diǎn),每個(gè)“關(guān)注”就是一條有向邊,所有人際關(guān)系數(shù)據(jù)最終全景展示了整個(gè)社會(huì)化網(wǎng)絡(luò)。這些輿情主體間頻繁聯(lián)系、相互影響,在這個(gè)過程中涌現(xiàn)出一些威望和地位較高的輿論“意見領(lǐng)袖”,他們左右著其他主體的輿論方向,最終影響整個(gè)輿論場。同時(shí),關(guān)注點(diǎn)相似的輿情主體間也自覺或不自覺地形成了一些聯(lián)系相對(duì)緊密的子群體,在子群體中信息傳播速度更快。要管理和引導(dǎo)網(wǎng)絡(luò)輿情,就必須對(duì)網(wǎng)絡(luò)輿情主體和輿論子群體進(jìn)行研究,而社會(huì)網(wǎng)絡(luò)分析方法就是有效的手段。

        “社會(huì)網(wǎng)絡(luò)”的概念由英國人類學(xué)家布朗于20世紀(jì)30年代在研究社會(huì)結(jié)構(gòu)時(shí)首次提出,到20世紀(jì)70年代,社會(huì)網(wǎng)絡(luò)分析方法在社會(huì)學(xué)、心理學(xué)、人類學(xué)、數(shù)學(xué)、信息學(xué)等領(lǐng)域逐步發(fā)展起來。目前,社會(huì)網(wǎng)絡(luò)分析方法已成為研究現(xiàn)實(shí)社會(huì)網(wǎng)絡(luò)和以互聯(lián)網(wǎng)為基礎(chǔ)的網(wǎng)絡(luò)信息交流的重要工具,其中就包括了個(gè)體中心度分析和凝聚子群分析。

        個(gè)體中心度是評(píng)價(jià)一個(gè)人在網(wǎng)絡(luò)中重要性的指標(biāo),主要包括點(diǎn)度中心度和中間中心度。其中,點(diǎn)度中心度用來衡量誰是網(wǎng)絡(luò)中的重要人物。如果一個(gè)人可以將信息發(fā)送給更多其他人,那么他在網(wǎng)絡(luò)中就擁有較大的話語權(quán)。因此,一個(gè)點(diǎn)的點(diǎn)度中心度可以用該點(diǎn)在表示網(wǎng)絡(luò)的有向圖中的“出度”來衡量。中間中心度衡量一個(gè)人作為媒介者的能力,即在網(wǎng)絡(luò)中控制其他人的能力。如果一個(gè)人處于許多其他兩點(diǎn)之間的路徑上,則認(rèn)為他具有控制其他兩個(gè)行動(dòng)者之間交往的能力。因此,一個(gè)人的中間中心度越高,就有越多人需要通過他才能與其他人發(fā)生聯(lián)系[11]。凝聚子群分析主要揭示網(wǎng)絡(luò)輿情形成者之間實(shí)際存在的或者潛在的關(guān)系,它們是否構(gòu)成了相對(duì)較強(qiáng)的、直接的、緊密的或積極關(guān)系的小團(tuán)體,這些小團(tuán)體是否會(huì)成為促進(jìn)輿情發(fā)展的核心群體。

        根據(jù)輿情主體之間的“關(guān)注”數(shù)據(jù),如果一個(gè)主體擁有的粉絲量越多,則他的信息能直接傳遞給其他人的可能性越大,他的點(diǎn)度中心度越高,他就越有可能成為意見領(lǐng)袖。如果一個(gè)主體鏈接的意見領(lǐng)袖的數(shù)量越多,則他越有可能成為傳播信息的橋梁,他的中間中心度越高。還可以根據(jù)主體之間的相互關(guān)注數(shù)據(jù),發(fā)現(xiàn)相互關(guān)注度高的子群體,他們之間信息的相互傳播就越便利。

        根據(jù)輿情主體之間的發(fā)帖、轉(zhuǎn)帖、評(píng)論數(shù)據(jù),如果一個(gè)輿情主體的原創(chuàng)帖文在一定時(shí)間內(nèi)被轉(zhuǎn)發(fā)和評(píng)論的數(shù)量越多,則他的點(diǎn)度中心度越高,那么他就是意見領(lǐng)袖。如果一個(gè)主體的轉(zhuǎn)發(fā)帖文在一定時(shí)間內(nèi)被再次轉(zhuǎn)發(fā)和評(píng)論的數(shù)量越多,則他的中間中心度就越高,那么他就是傳播信息的橋梁。同時(shí),還可以根據(jù)主體之間相互轉(zhuǎn)帖、評(píng)論的數(shù)據(jù),發(fā)現(xiàn)互動(dòng)緊密的子群體,他們之間輿情互動(dòng)的實(shí)際效果更加明顯。

        當(dāng)前,已經(jīng)有一些成熟的社會(huì)網(wǎng)絡(luò)分析軟件,可以很好地進(jìn)行社會(huì)網(wǎng)絡(luò)分析,并呈現(xiàn)出可視化的分析結(jié)果,對(duì)于發(fā)現(xiàn)網(wǎng)絡(luò)意見領(lǐng)袖和子群體有很好的作用。

        33關(guān)聯(lián)不同領(lǐng)域數(shù)據(jù)進(jìn)行輿情分析

        endprint

        大數(shù)據(jù)的一個(gè)重要特征是數(shù)據(jù)的混雜性,因此我們不僅要接受多樣化的數(shù)據(jù),還要善于利用多樣化的數(shù)據(jù),將不同領(lǐng)域數(shù)據(jù)關(guān)聯(lián)起來進(jìn)行分析。

        將用戶職業(yè)數(shù)據(jù)、地域數(shù)據(jù)、年齡數(shù)據(jù)、專注領(lǐng)域等和社會(huì)網(wǎng)絡(luò)數(shù)據(jù)結(jié)合起來,可以分析出不同的輿情熱點(diǎn)在哪些職業(yè)、哪些地域、哪些年段、哪些團(tuán)體中傳播廣泛,這對(duì)于更有針對(duì)性地進(jìn)行輿論引導(dǎo)意義重大。

        將網(wǎng)站新聞數(shù)據(jù)、論壇數(shù)據(jù)、博客數(shù)據(jù)、微博數(shù)據(jù)等進(jìn)行對(duì)比,可以分析出輿情熱點(diǎn)在不同輿論場的傳播速度和廣度,從而掌握哪些輿論場更易于傳播哪類輿情。

        還可以將輿情分析的數(shù)據(jù)與外部數(shù)據(jù)聯(lián)系,如將食品安全問題輿情數(shù)據(jù)與相關(guān)食品的銷售數(shù)據(jù)相聯(lián)系,就能反映出輿情對(duì)企業(yè)經(jīng)營的巨大影響。將網(wǎng)絡(luò)謠言傳播與造成的社會(huì)后果數(shù)據(jù)相聯(lián)系,可以反映謠言的巨大破壞力;辟謠的引導(dǎo)性輿論發(fā)布后,再動(dòng)態(tài)監(jiān)測相關(guān)社會(huì)數(shù)據(jù),可以看出輿論引導(dǎo)的效果。

        34基于網(wǎng)絡(luò)民意調(diào)查的輿情分析

        政府要進(jìn)行輿情分析,只被動(dòng)接受網(wǎng)絡(luò)輿情數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的,還需要走出去,主動(dòng)收集數(shù)據(jù),了解全社會(huì)對(duì)某項(xiàng)政策的評(píng)價(jià)。

        現(xiàn)代意義上的民意調(diào)查實(shí)踐起源于19世紀(jì)美國對(duì)總統(tǒng)大選的預(yù)測,發(fā)展到今天已經(jīng)延伸到對(duì)各類社會(huì)現(xiàn)象的調(diào)查,且方法成熟。21世紀(jì)后,我國才開始重視民意調(diào)查。2003年,中國人民大學(xué)進(jìn)行了第一個(gè)全國性的大型社會(huì)調(diào)查項(xiàng)目“中國綜合社會(huì)調(diào)查”,將人們對(duì)社會(huì)熱點(diǎn)事件和其他人群的看法作為調(diào)查內(nèi)容。2006年9月,我國才成立了第一個(gè)、也是目前惟一的國家級(jí)專門的民意調(diào)查機(jī)構(gòu)——國家統(tǒng)計(jì)局社情民意調(diào)查中心。目前,我國互聯(lián)網(wǎng)用戶的人數(shù)、手機(jī)持有量都位居全球第一,這些都是網(wǎng)絡(luò)民意調(diào)查的大數(shù)據(jù)來源??梢?,我國缺乏的不是可供收集的數(shù)據(jù)和收集數(shù)據(jù)的手段,而是收集數(shù)據(jù)的意識(shí)。只有主動(dòng)地進(jìn)行網(wǎng)絡(luò)民意調(diào)查,化被動(dòng)分析為主動(dòng)收集,才能更有針對(duì)性地滿足對(duì)輿情的需求,也更準(zhǔn)確地掌握輿情動(dòng)向。

        4需要注意的問題

        41數(shù)據(jù)的安全性

        在進(jìn)行大數(shù)據(jù)分析時(shí),隱私是個(gè)大問題。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)的價(jià)值很大一部分體現(xiàn)在二次分析上,由于二次分析的結(jié)果未知,所以在收集數(shù)據(jù)前,進(jìn)行“告知”和獲得“許可”就不一定能起到絕對(duì)保險(xiǎn)的作用。我們需要設(shè)立一個(gè)不一樣的隱私保護(hù)模式,這個(gè)模式應(yīng)該更注重?cái)?shù)據(jù)使用者為其行為承擔(dān)責(zé)任,而不是將重點(diǎn)放在收集數(shù)據(jù)之初取得數(shù)據(jù)所有者的許可。這樣,數(shù)據(jù)使用者就需要基于其對(duì)數(shù)據(jù)所有者造成的影響,對(duì)涉及數(shù)據(jù)再利用的行為進(jìn)行評(píng)測。此外,我們還需要發(fā)明并推行新技術(shù)方式來促進(jìn)隱私保護(hù),一種途徑是故意將數(shù)據(jù)模糊處理,促使對(duì)大數(shù)據(jù)的查詢不能顯示精確的結(jié)果,而只有相近的結(jié)果,這就使得挖出特定個(gè)人與特定數(shù)據(jù)點(diǎn)的聯(lián)系變得難以實(shí)現(xiàn)并且耗費(fèi)巨大[12]。

        大數(shù)據(jù)的挖掘與利用應(yīng)該有法可依。2012年底,我國全國人大通過的加強(qiáng)網(wǎng)絡(luò)信息保護(hù)的決定就是一個(gè)好的開始。現(xiàn)在很多機(jī)構(gòu)和企業(yè)擁有大量客戶信息。應(yīng)當(dāng)既鼓勵(lì)面向群體、服務(wù)社會(huì)的數(shù)據(jù)挖掘,又防止侵犯個(gè)體隱私;既提倡數(shù)據(jù)共享,又防止數(shù)據(jù)被濫用。此外,還需要界定數(shù)據(jù)挖掘、利用的權(quán)限和范圍。大數(shù)據(jù)系統(tǒng)本身的安全性也是值得特別關(guān)注的,要注意技術(shù)安全性和管理制度安全性并重,防止信息被損壞、篡改、泄露或被竊,保護(hù)公民和國家的信息安全。

        42數(shù)據(jù)的可獲取性

        要想提高大數(shù)據(jù)分析的效果,可獲取的數(shù)據(jù)量是關(guān)鍵。大數(shù)據(jù)時(shí)代,傳播形式的多元化使得數(shù)據(jù)分布在不同的傳播終端,如一條新聞的網(wǎng)民評(píng)價(jià)可能分布在眾多移動(dòng)新聞客戶端的用戶評(píng)價(jià)中;再如微信中用戶對(duì)社會(huì)事務(wù)的意見是一種處于半封閉圈群中的數(shù)據(jù),非好友用戶難以獲取。這些問題都給設(shè)想基于大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析帶來難題。除此之外,政府掌握著社會(huì)的大多數(shù)信息,而網(wǎng)絡(luò)輿情分析還需要網(wǎng)站、運(yùn)營商等企業(yè)的數(shù)據(jù),所以政府和企業(yè)應(yīng)該加強(qiáng)合作,共享數(shù)據(jù)。一些經(jīng)過隱私保護(hù)處理后的數(shù)據(jù)還可以向全社會(huì)開放,以供企業(yè)、學(xué)術(shù)界和各社會(huì)群體進(jìn)行研究,促進(jìn)創(chuàng)新性應(yīng)用。

        43數(shù)據(jù)的代表性

        網(wǎng)絡(luò)輿情大數(shù)據(jù)源于互聯(lián)網(wǎng)的開放、共享,但我們不能僅僅憑借技術(shù)構(gòu)建的大數(shù)據(jù)平臺(tái)去打撈那些可能代表一個(gè)群體或一定數(shù)量級(jí)的“沉默的聲音”。因?yàn)槿绻麄兣c網(wǎng)絡(luò)隔絕,或者由于“沉默的螺旋”心理效應(yīng)而不提供任何數(shù)據(jù),那么我們所精心分析出的網(wǎng)絡(luò)輿情實(shí)際上是不全面的,以此來指導(dǎo)社會(huì)管理是有偏差的。因此,我們?cè)谶M(jìn)行輿情分析的時(shí)候,網(wǎng)絡(luò)輿情大數(shù)據(jù)只是一個(gè)方面,而非全部。

        5對(duì)未來的展望

        隨著網(wǎng)絡(luò)技術(shù)和應(yīng)用的不斷創(chuàng)新,網(wǎng)絡(luò)輿情在不斷發(fā)生變化,面對(duì)數(shù)億網(wǎng)民和浩如煙海的網(wǎng)絡(luò)大數(shù)據(jù)環(huán)境,我們需要不斷擴(kuò)大網(wǎng)絡(luò)輿情分析的內(nèi)涵,從分析顯性輿情內(nèi)容,拓展到分析隱性輿情、輿情主體間關(guān)系、輿情子群體、輿情對(duì)社會(huì)的動(dòng)態(tài)影響等更廣義的輿情分析。我們要不斷改進(jìn)輿情的分析方法,網(wǎng)絡(luò)輿情分析不再僅僅是采樣分析,而是要開始關(guān)注大數(shù)據(jù)分析;不再僅僅是依靠語義分析,而是更求諸于自動(dòng)化的數(shù)據(jù)分析;不再僅僅是對(duì)部分?jǐn)?shù)據(jù)集的精確分析,而是涵蓋多個(gè)數(shù)據(jù)集的關(guān)聯(lián)分析。我們還要拓展網(wǎng)絡(luò)輿情數(shù)據(jù)的收集方式,將分析系統(tǒng)自動(dòng)產(chǎn)生的數(shù)據(jù),發(fā)展到主動(dòng)地、精準(zhǔn)地收集輿情數(shù)據(jù)。為保障網(wǎng)絡(luò)輿情大數(shù)據(jù)分析的安全和可持續(xù)開展,我們還要解決可能涉及的隱私問題,以及推動(dòng)數(shù)據(jù)的公開和共享。這些都將是面向大數(shù)據(jù)的網(wǎng)絡(luò)輿情分析的潮流和趨勢(shì)。

        參考文獻(xiàn)

        [1]孟小峰,慈祥.大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J].計(jì)算機(jī)研究與發(fā)展,2013,50(1):146-169.

        [2]劉毅.網(wǎng)絡(luò)輿情研究概論[M].天津:天津人民出版社,2007:51-53.

        [3]張嶸.大數(shù)據(jù)時(shí)代輿情分析對(duì)媒體增值服務(wù)的可行性[J].中國傳媒科技,2012,(11):34-36.

        [4]陳憶金,曹樹金,陳少馳,等.網(wǎng)絡(luò)輿情信息監(jiān)測研究進(jìn)展[J].圖書情報(bào)知識(shí),2011,(6):41-49.

        [5]謝海光,陳中潤.互聯(lián)網(wǎng)內(nèi)容及輿情深度分析模式[J].中國青年政治學(xué)院學(xué)報(bào),2006,(3):95-100.

        [6]羅婷,李成.如何開發(fā)輿情監(jiān)測產(chǎn)品——人民網(wǎng)輿情監(jiān)測室的運(yùn)作模式[J].中國記者,2010,(6):52-54.

        [7]Big data[EB/OL].http:∥en.wikipedia.org/wiki/Bigdata,2013-04-26.

        [8]李廣建,楊林.大數(shù)據(jù)視角下的情報(bào)研究與情報(bào)研究技術(shù)[J].圖書與情報(bào),2012,(6):1-8.

        [9]Google趨勢(shì)[EB/OL].http:∥www.google.com/trends,2013-04-26.

        [10]甘曉.大數(shù)據(jù)成為信息科技新關(guān)注點(diǎn)——訪中國工程院院士李國杰[N].中國科學(xué)報(bào),2012-06-27,(A1).

        [11]羅家德.社會(huì)網(wǎng)分析講義[M].北京:社會(huì)科學(xué)文獻(xiàn)出版社,2010:179-193.

        [12]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013:220-223.

        (本文責(zé)任編輯:孫國雷)

        endprint

        猜你喜歡
        網(wǎng)絡(luò)輿情大數(shù)據(jù)
        網(wǎng)絡(luò)輿情事件的引導(dǎo)策略分析
        數(shù)據(jù)挖掘技術(shù)在網(wǎng)絡(luò)輿情管理中的研究
        “互聯(lián)網(wǎng)+”背景下高校平安校園建設(shè)研究
        中國市場(2016年38期)2016-11-15 23:42:46
        淺析網(wǎng)絡(luò)輿情治理
        基于社會(huì)穩(wěn)定視角的網(wǎng)絡(luò)輿情預(yù)警機(jī)制構(gòu)建的思考
        今傳媒(2016年9期)2016-10-15 22:02:52
        大數(shù)據(jù)環(huán)境下基于移動(dòng)客戶端的傳統(tǒng)媒體轉(zhuǎn)型思路
        新聞世界(2016年10期)2016-10-11 20:13:53
        基于大數(shù)據(jù)背景下的智慧城市建設(shè)研究
        科技視界(2016年20期)2016-09-29 10:53:22
        數(shù)據(jù)+輿情:南方報(bào)業(yè)創(chuàng)新轉(zhuǎn)型提高服務(wù)能力的探索
        中國記者(2016年6期)2016-08-26 12:36:20
        突發(fā)事件網(wǎng)絡(luò)輿情的演化規(guī)律與監(jiān)控
        正在播放国产多p交换视频| 国内自拍偷拍一区二区| 国产精品午夜高潮呻吟久久av| 日本一二三四区在线观看| 在线视频夫妻内射| 中文字幕一区二区人妻性色| 荡女精品导航| 91精品亚洲一区二区三区| 久久精品蜜桃美女av| 狠狠综合久久av一区二区蜜桃| 国产精品免费_区二区三区观看| 藏春阁福利视频| 人妻系列影片无码专区| 国产精品亚洲一区二区三区久久| 成人国产一区二区三区| 丁香六月久久婷婷开心| 狠狠躁夜夜躁无码中文字幕| 中文亚洲成a人片在线观看| 在线不卡精品免费视频| 久久精品国产久精国产爱| 国产亚洲精品久久久ai换| 成年女人A级毛片免| 丝袜美女美腿一区二区| 国产精品白浆一区二区免费看| 精品久久久久久久久午夜福利 | 国精品人妻无码一区二区三区性色| 九月婷婷人人澡人人添人人爽| 欧美中出在线| 亚洲综合久久中文字幕专区一区 | 一道本中文字幕在线播放| 成人一区二区人妻少妇| 三级全黄的视频在线观看| 国产精品99久久久久久宅男| 国产精品女同学| 精品综合久久88少妇激情| 国产欧美亚洲精品第一页| 无码人妻少妇色欲av一区二区| 无遮挡粉嫩小泬| 草逼视频污的网站免费| 无码小电影在线观看网站免费| 狼色精品人妻在线视频|