亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于社會(huì)系統(tǒng)響應(yīng)函數(shù)的在線群體分類研究

        2016-10-13 23:40:34劉嘉琪齊佳音
        電子與信息學(xué)報(bào) 2016年9期
        關(guān)鍵詞:分類

        劉嘉琪 齊佳音

        ?

        基于社會(huì)系統(tǒng)響應(yīng)函數(shù)的在線群體分類研究

        劉嘉琪①齊佳音*②③

        ①(北京郵電大學(xué)經(jīng)濟(jì)管理學(xué)院 北京 100876)②(北京郵電大學(xué)可信分布式計(jì)算與服務(wù)教育部重點(diǎn)實(shí)驗(yàn)室 北京 100876)③(上海對(duì)外經(jīng)貿(mào)大學(xué)工商管理學(xué)院 上海 201620)

        該文致力于豐富在線群體的研究體系,為未來探索深層次科學(xué)問題提供支撐。討論了在線群體與在線話題的定義及常見分類方式。重點(diǎn)展現(xiàn)了一種全新的依據(jù)觀測(cè)社會(huì)系統(tǒng)響應(yīng)函數(shù)的趨勢(shì)將在線話題分為4類的定性研究方法,即外源性首要傳播型話題、外源性次要傳播型話題、內(nèi)源性首要傳播型話題和內(nèi)源性次要傳播型話題,并且進(jìn)一步以此區(qū)分討論不同類型話題的在線群體。同時(shí),明確地提出了規(guī)范的使用步驟與實(shí)際操作時(shí)可能遇到的問題及解決方法。最后嘗試運(yùn)用該方法來估計(jì)以“新浪微博”與“百度貼吧”為代表的在線社交網(wǎng)絡(luò)平臺(tái)中各類話題群體的分布情況。

        社交網(wǎng)絡(luò);在線群體;在線話題;定性分類;社會(huì)系統(tǒng)響應(yīng)函數(shù)

        1 引言

        互聯(lián)網(wǎng)+時(shí)代,在線社交網(wǎng)絡(luò)的出現(xiàn)改變了傳統(tǒng)的信息交流方式,成為日常生活中獲取、傳播信息的主要平臺(tái)。在多學(xué)科融合的背景下,在線社交網(wǎng)絡(luò)已經(jīng)逐漸成為學(xué)術(shù)研究的熱點(diǎn)之一。

        近年來,與在線社交網(wǎng)絡(luò)中群體的相關(guān)研究中,出現(xiàn)了許多將其分類的標(biāo)準(zhǔn),包括個(gè)體在網(wǎng)絡(luò)空間與現(xiàn)實(shí)空間中的交集、需求、行為、目標(biāo)、商業(yè)營利性、互動(dòng)內(nèi)容的主題、合法性、異質(zhì)性、對(duì)公共事件傳播關(guān)注的偏好、表達(dá)觀點(diǎn)時(shí)的態(tài)度、生存周期、要素穩(wěn)定性、互動(dòng)頻率、焦點(diǎn)/集中度、凝聚力和成員參與度等[1,2]。分類方式雖較廣泛,但出于網(wǎng)絡(luò)輿情監(jiān)控視角,鮮見學(xué)者專注于以話題為基礎(chǔ)的群體分類研究。而話題作為一種組織信息的方式,恰恰是形成群體的重要方式之一。用戶發(fā)表的言論往往受到一段時(shí)期內(nèi)直接相關(guān)的事件或活動(dòng)影響,與特定主題緊密相關(guān)[3]。甚至不同的話題對(duì)于群體的影響力也不同[4]??梢娫掝}的分類對(duì)于在線群體的研究領(lǐng)域來說十分必要。

        縱觀近年文獻(xiàn),不難發(fā)現(xiàn)在線話題研究大多屬于計(jì)算機(jī)領(lǐng)域,適用于技術(shù)層面的研究成果不斷涌現(xiàn),如話題檢測(cè)、跟蹤、分析、存儲(chǔ)、預(yù)警和應(yīng)急處理技術(shù)等。在涉及在線話題的分類研究中,學(xué)者們從不同的角度,結(jié)合實(shí)際場景需求提出了不同的分類方法。

        從話題分類算法與技術(shù)的角度,學(xué)者們分別利用決策樹、層次聚類、LDA、主成分分析法、樸素貝葉斯、支持向量機(jī)、K-NN 算法、Ricchi算法、BP算法等方法提出了多元的網(wǎng)絡(luò)話題分類算法。

        從網(wǎng)絡(luò)輿情預(yù)判的角度,有學(xué)者將話題作為網(wǎng)絡(luò)輿情萌芽初級(jí)階段的產(chǎn)物,將其分為事件型話題與觀點(diǎn)型話題。其中事件型分為可預(yù)見的和不可預(yù)見的,可預(yù)見型指一定會(huì)發(fā)生的事件,如“春節(jié)放假”,不可預(yù)見的事件往往是一些突發(fā)事件,如“墜機(jī)”等。

        面向新聞報(bào)道類話題,文獻(xiàn)[11]根據(jù)新聞報(bào)道的特征將話題分為3類:重復(fù)性新聞話題、演化性新聞話題和評(píng)論性新聞話題。文獻(xiàn)[12]提出面向新聞TDT系統(tǒng)的話題分類方法,認(rèn)為話題和話題核心文檔類別屬性一致。

        從話題熱度評(píng)估的角度,文獻(xiàn)[11]定義了熱點(diǎn)話題,認(rèn)為它不僅是被新聞網(wǎng)站報(bào)道和宣傳力度大的話題,同時(shí)也是受互聯(lián)網(wǎng)用戶關(guān)注程度大的話題。文獻(xiàn)[13]通過熱度計(jì)算,將熱點(diǎn)話題歸為3類:周期性熱點(diǎn)話題、臨時(shí)性熱點(diǎn)話題和長期性熱點(diǎn)話題。文獻(xiàn)[14]借助TF-IDF思想,利用狄利克雷信息檢索模型把話題分為長期話題和臨時(shí)話題。

        從社會(huì)語言學(xué)的角度,文獻(xiàn)[15]基于漢語語法結(jié)構(gòu),估計(jì)出“微話題”中詞語、短語、句子分布情況,并指出話題內(nèi)容主要涉及政治、體育、行業(yè)、生活、教育及影視6大方面,其中社會(huì)生活類占80%、影視評(píng)論類占10%。文獻(xiàn)[16]根據(jù)熱門話題的多元內(nèi)容,將其歸納為社會(huì)新聞、娛樂名人資訊、定時(shí)性話題及微博營銷類話題。

        綜上,現(xiàn)有在線話題分類方法或過于表面、不成體系,或過于繁復(fù)、不易操作,缺乏易于識(shí)別和判斷,并適用于在線群體的分類方法。為此,本文創(chuàng)新性地提出了一種有效的基于社會(huì)系統(tǒng)響應(yīng)函數(shù)的在線話題分類方法。理論方面,引入系統(tǒng)動(dòng)力學(xué)和新聞傳播的思想,將在線話題從動(dòng)力、傳播兩個(gè)維度,分為外源性首要傳播型話題、外源性次要傳播型話題、內(nèi)源性首要傳播型話題和內(nèi)源性次要傳播型話題4類,同時(shí)以此將在線群體進(jìn)行細(xì)分,彌補(bǔ)了現(xiàn)有在線群體理論研究領(lǐng)域的空白。應(yīng)用方面,本文提出的分類方法也適用于網(wǎng)絡(luò)輿情分析。在線社交網(wǎng)絡(luò)為輿論自由化提供了開放環(huán)境的同時(shí),也帶來了網(wǎng)絡(luò)謠言、暴力的隱患,甚至部分輿論給國家穩(wěn)定和社會(huì)安全帶來嚴(yán)重的危害。因此,快速地判斷社會(huì)系統(tǒng)響應(yīng)趨勢(shì)、及時(shí)地監(jiān)控話題走向,有利于有效引導(dǎo)在線群體和積極解決潛在輿情危機(jī),對(duì)維護(hù)社會(huì)穩(wěn)定和促進(jìn)國家發(fā)展具有重要的現(xiàn)實(shí)意義。

        2 術(shù)語界定

        2.1在線話題(online topic)

        在明確在線話題的概念之前,首先應(yīng)該明確話題的含義和在線社交網(wǎng)絡(luò)的范圍。

        話題,在TDT(Topic Detection and Tracking)話題發(fā)現(xiàn)與跟蹤評(píng)測(cè)計(jì)劃中,是最基本的概念。在研究初期,事件和話題被認(rèn)為有相同的含義,隨后話題被普遍解釋為一個(gè)核心事件或活動(dòng)以及與之直接相關(guān)的事件或活動(dòng)。相同地,洪宇等人[17]也認(rèn)為話題是指由一個(gè)種子事件出發(fā)的一連串直接相關(guān)的事件或活動(dòng)。

        在線社交網(wǎng)絡(luò)(online social network),是由社會(huì)成員之間的相互交互所形成的相對(duì)穩(wěn)定的社會(huì)結(jié)構(gòu),具有復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu)和信息動(dòng)態(tài)傳播機(jī)制[18]。根據(jù)功能與展現(xiàn)方式的不同,大致可分為3類。一是關(guān)系導(dǎo)向型網(wǎng)絡(luò),基本為現(xiàn)實(shí)社交圈子的映射,如人人網(wǎng)、微信、Fackbook等。二是內(nèi)容導(dǎo)向型網(wǎng)絡(luò),用戶基于共同興趣,采用BBS論壇、博客等形式的互聯(lián)網(wǎng)應(yīng)用,通過長期交流、互動(dòng)形成的社交聚合,如天涯社區(qū)、百度貼吧等。三是媒體分享型網(wǎng)絡(luò),用于發(fā)布、檢索和共享媒體資源,如Flickr、土豆網(wǎng)等。目前,各類網(wǎng)站的功能日益豐富,使得上述類型劃分日益模糊,如微博既包含關(guān)系導(dǎo)向型網(wǎng)絡(luò)又含有內(nèi)容導(dǎo)向型網(wǎng)絡(luò)。本文將上述3種網(wǎng)絡(luò)及其各種組合,統(tǒng)稱為在線社交網(wǎng)絡(luò)。

        在現(xiàn)有研究中,幾乎沒有發(fā)現(xiàn)在線話題的明確定義。具有一定參考意義的是,曾有學(xué)者對(duì)互聯(lián)網(wǎng)話題進(jìn)行多層面界定。狹義視角認(rèn)為互聯(lián)網(wǎng)話題形成于各大新聞門戶網(wǎng)站,新聞媒體會(huì)不定時(shí)發(fā)布新聞報(bào)道,來闡述和跟蹤現(xiàn)實(shí)社會(huì)中發(fā)生的事件;廣義視角認(rèn)為互聯(lián)網(wǎng)話題形成于互聯(lián)網(wǎng)中各種各樣的應(yīng)用,例如新聞網(wǎng)站、BBS論壇、微博、博客、社區(qū)網(wǎng)站等。借鑒其定義方法,從廣義層面,認(rèn)為在線話題為:來源于各類在線社交網(wǎng)絡(luò)平臺(tái),由一個(gè)種子事件、活動(dòng)引發(fā)的與之直接相關(guān)的事件或活動(dòng)。

        2.2在線群體(online group)與網(wǎng)絡(luò)群體(network group)

        在線群體的定義是本研究的基礎(chǔ)問題。通過查閱文獻(xiàn)發(fā)現(xiàn),關(guān)于研究對(duì)象學(xué)者們提出了不同的說法,如“在線群體”、“網(wǎng)絡(luò)群體”、“網(wǎng)民”等。為避免模糊不清的用詞干擾后續(xù)研究,將對(duì)其進(jìn)行明確界定。

        網(wǎng)絡(luò)群體,存在于網(wǎng)絡(luò)虛擬社會(huì)中,和現(xiàn)實(shí)生活中社會(huì)群體所處的空間雖不同,但也有許多相同之處。學(xué)者們分別從與現(xiàn)實(shí)社會(huì)群體的延伸和重組關(guān)系、存在的基礎(chǔ)與環(huán)境、廣義與狹義范圍內(nèi)的聚集動(dòng)機(jī)、行為和過程等角度對(duì)其剖析。而在線群體,存在于在線社交網(wǎng)絡(luò)中。與傳統(tǒng)Web網(wǎng)絡(luò)最大的不同在于人作為主體,掌握了主動(dòng)權(quán),自主創(chuàng)造內(nèi)容信息,并自由選擇希望接受的信息。文獻(xiàn)[19]認(rèn)為在線群體是基于互聯(lián)網(wǎng)的大規(guī)模、自發(fā)形成的集體,其成員之間分享共同的興趣、經(jīng)驗(yàn)、信仰等。文獻(xiàn)[20]則認(rèn)為其是具有目標(biāo)導(dǎo)向的,有明顯群體邊界的,并且能夠社會(huì)化組織個(gè)體活動(dòng)的系統(tǒng)。Matzat[21]曾定義在線群體為通過CMC(Computer Mediated Communication)工具,出于族群成員的共同利益,圍繞至少一個(gè)話題進(jìn)行單向的傳播和雙向的交流的一群人。

        在定義中,本文重點(diǎn)強(qiáng)調(diào)了兩者存在的基本條件的差異、存在目的和內(nèi)部的交流互動(dòng)。認(rèn)為網(wǎng)絡(luò)群體為個(gè)體在網(wǎng)絡(luò)社會(huì)中因工作、興趣、價(jià)值取向、信仰、特殊需要或其他目的,通過網(wǎng)絡(luò)互動(dòng)結(jié)合起來進(jìn)行有目的的活動(dòng)的集體;在線群體為個(gè)體在共同興趣、關(guān)注、需要、利益等因素驅(qū)動(dòng)下,基于在線社交網(wǎng)絡(luò),圍繞至少一個(gè)話題不斷交互而形成的網(wǎng)絡(luò)群體??梢赃@樣理解,后者是前者的一個(gè)子集,它的生存空間主要是在線社交網(wǎng)絡(luò)—網(wǎng)絡(luò)的子集中。

        為了直觀,本文進(jìn)一步將社會(huì)群體、網(wǎng)絡(luò)群體與在線群體間的關(guān)系可視化,見圖1。

        圖1 社會(huì)群體、網(wǎng)絡(luò)群體和在線群體關(guān)系圖

        3 基于社會(huì)系統(tǒng)響應(yīng)趨勢(shì)的在線群體分類方法介紹

        3.1理論基礎(chǔ)

        以文獻(xiàn)[22]提出的在外源性(exogenous)與內(nèi)源性(endogenous)沖擊推動(dòng)下的圖書銷量分布函數(shù)為基礎(chǔ),文獻(xiàn)[23]認(rèn)為信息爆發(fā)現(xiàn)象是由于消息等待時(shí)間呈無尺度分布和信息呈級(jí)聯(lián)傳播這兩個(gè)因素導(dǎo)致,并建立了可分類度量社會(huì)系統(tǒng)響應(yīng)的函數(shù)模型。在模型中作者不僅考慮了話題中事件的外源性因素和內(nèi)源性因素,還根據(jù)話題在網(wǎng)絡(luò)中的傳播性,進(jìn)一步將其細(xì)分為首要傳播性(critical)和次要傳播性(subcritical)。借助擁有500萬視頻資源的YouTube平臺(tái)數(shù)據(jù),通過對(duì)評(píng)論及時(shí)間的定量分析,得出個(gè)體在接觸信息和產(chǎn)生響應(yīng)之間的時(shí)間分布函數(shù):

        收看(視頻)的即時(shí)概率:

        Kwak等人[24]于2010年發(fā)表了一篇經(jīng)典論文,以所獲取的6058個(gè)Twitter話題的發(fā)展趨勢(shì)與生存周期為參考依據(jù),作者進(jìn)一步歸納出每類話題的表征,將此話題分類方式引向更深層次的探索。作者認(rèn)為外源性首要傳播型話題主要指爆炸性或頭條新聞,外源性次要傳播型話題通常具有主題標(biāo)簽,內(nèi)源性首要傳播型話題具有持續(xù)性的本質(zhì),而內(nèi)源性次要傳播型話題則在短暫期間內(nèi)引起極少人的關(guān)注。此外,作者還對(duì)4類話題占比進(jìn)行統(tǒng)計(jì)分析,具體結(jié)果,如表1所示。發(fā)現(xiàn)外源性首要傳播型話題的占比最大,而內(nèi)源性次要傳播型話題占比最少。可見,一個(gè)話題的發(fā)生在大多數(shù)情況下需要很強(qiáng)的外源影響力及互聯(lián)網(wǎng)用戶的廣泛傳播才能保持其生命力。

        表1文獻(xiàn)中4類話題分別占比[24](%)

        將學(xué)者們定量分析不同性質(zhì)的話題而總結(jié)出的分布規(guī)律,應(yīng)用到在線群體的研究中,轉(zhuǎn)化為可識(shí)別其所屬分類的定性方法,即通過觀測(cè)社會(huì)系統(tǒng)響應(yīng)函數(shù)的趨勢(shì),判斷話題本身所具備的性質(zhì),進(jìn)而對(duì)討論話題的群體進(jìn)行分類,即基于外源性首要傳播型話題的在線群體、基于外源性次要傳播型話題的在線群體、基于內(nèi)源性首要傳播型話題的在線群體、基于內(nèi)源性次要傳播型話題的在線群體。這種方法在相關(guān)領(lǐng)域研究中罕有使用,角度較新穎。

        3.2 關(guān)于內(nèi)源性與外源性的解釋

        尚未有文獻(xiàn)對(duì)外源性話題和內(nèi)源性話題做出具體的定義,本文將對(duì)其內(nèi)涵作出解釋。

        在計(jì)量模型范疇內(nèi),根據(jù)變量的性質(zhì)將其分為外生變量和內(nèi)生變量。內(nèi)生變量是其數(shù)值由計(jì)量經(jīng)濟(jì)模型所決定的變量,即模型求解的結(jié)果,而外生變量是其數(shù)值由模型以外決定的變量。在經(jīng)濟(jì)體系結(jié)構(gòu)中,外生變量又稱政策性變量,指在經(jīng)濟(jì)機(jī)制中受外部因素主要是政策因素影響;內(nèi)生變量,又叫非政策性變量,是指在經(jīng)濟(jì)機(jī)制內(nèi)部由純粹的經(jīng)濟(jì)因素所決定的變量。在管理學(xué)領(lǐng)域,認(rèn)為工作壓力分為內(nèi)源壓力和外源壓力。前者來自工作本身,由工作內(nèi)容、工作標(biāo)準(zhǔn)等因素造成,后者來自工作活動(dòng)以外由工作環(huán)境、人際關(guān)系等因素構(gòu)成[25]。在心理學(xué)領(lǐng)域,文獻(xiàn)[26]將注意分為內(nèi)源性注意和外源性注意。內(nèi)源性注意指根據(jù)觀察者的行為目標(biāo)或意圖來分配注意,外源性注意指觀察者的視野外部的信息所引起的注意定向。

        本文廣泛著眼于不同專業(yè)領(lǐng)域,理解內(nèi)源性和外源性的共通點(diǎn),并結(jié)合話題的獨(dú)特性對(duì)其性質(zhì)進(jìn)行分析。根據(jù)系統(tǒng)思想的啟示,將討論同一個(gè)在線話題的討論者群體抽象為一個(gè)系統(tǒng),即社會(huì)系統(tǒng)。一個(gè)話題在系統(tǒng)中流行度達(dá)到頂點(diǎn)的過程中,離不開內(nèi)源動(dòng)力與外源動(dòng)力的推動(dòng)。具備外源性的話題往往依靠系統(tǒng)外部不斷地輸入信息,來保持其生命力和新鮮感。圍繞話題的討論內(nèi)容根據(jù)持續(xù)更新的發(fā)展?fàn)顩r會(huì)不斷地衍化、豐富與擴(kuò)展。這類話題一般指突發(fā)事件或突然引發(fā)熱議的公共事件等。而具備內(nèi)源性的話題,往往受到本身屬性的影響,比如系統(tǒng)內(nèi)部成員對(duì)話題內(nèi)容的固有認(rèn)知、體會(huì)和情感等。這些內(nèi)生因素足以支撐其生存,所以稱之內(nèi)源性話題。這類話題一般指非突發(fā)性的、具有穩(wěn)定關(guān)注者的話題。

        話題的動(dòng)力機(jī)制對(duì)事件發(fā)展方向,影響力的形成有著至關(guān)重要,因此本文對(duì)討論不同類型話題的群體進(jìn)行細(xì)分研究,在輿情監(jiān)控領(lǐng)域確實(shí)是有益的嘗試。

        3.3操作步驟

        3.3.1社會(huì)系統(tǒng)響應(yīng)函數(shù)趨勢(shì)及其觀測(cè)平臺(tái)選擇

        響應(yīng)(response function)是指信息源本身會(huì)帶來的影響。社會(huì)系統(tǒng)響應(yīng)函數(shù)趨勢(shì)是指在線社交網(wǎng)絡(luò)中討論同一個(gè)在線話題的討論者群體由于網(wǎng)絡(luò)中的級(jí)聯(lián)影響,而產(chǎn)生動(dòng)態(tài)分支的過程,表現(xiàn)為網(wǎng)絡(luò)中的響應(yīng)變化。目前,可觀測(cè)社會(huì)系統(tǒng)響應(yīng)函數(shù)趨勢(shì)曲線的平臺(tái)有很多,常用的比如百度指數(shù)、Google Trends和微指數(shù)。實(shí)際研究中,可根據(jù)資料的特殊性和適用性,來選擇恰當(dāng)?shù)纳鐣?huì)系統(tǒng)響應(yīng)趨勢(shì)觀測(cè)平臺(tái)。

        3.3.2區(qū)分話題的外源性與內(nèi)源性

        在一個(gè)成熟的傳播網(wǎng)絡(luò)上,由于網(wǎng)絡(luò)外部或內(nèi)部所產(chǎn)生的信息不斷輸入,其流行度會(huì)呈現(xiàn)明顯的趨勢(shì)變化。外源性話題表現(xiàn)出冪率上升指數(shù)下降的趨勢(shì),內(nèi)源性話題則呈指數(shù)上升指數(shù)下降的趨勢(shì)變化。通過兩個(gè)案例來展現(xiàn)其差別,如圖2中所示。圖2(a)為發(fā)生于2004年12月26日的災(zāi)難性亞洲海嘯,圖2(b)為電影《哈利波特》。通過繪制互聯(lián)網(wǎng)搜索引擎中的搜索量變化圖來反映社會(huì)系統(tǒng)響應(yīng)趨勢(shì)。圖2(a)為具備“外源性”的典型話題,突如其來的高峰與稍緩慢的下降代表在線社交網(wǎng)絡(luò)的突發(fā)響應(yīng),是“外源性”的標(biāo)志。相比之下,圖2(b)體現(xiàn)了話題的“內(nèi)源性”,趨勢(shì)具備明顯的增長預(yù)示,在最高峰后的下降與之前的上升部分幾乎是對(duì)稱的。由此特征可以判斷話題的主要?jiǎng)恿碓础?/p>

        圖2 文獻(xiàn)中外源性與內(nèi)源性社會(huì)系統(tǒng)響應(yīng)趨勢(shì)圖舉例[23]

        3.3.3區(qū)分話題的首要傳播性與次要傳播性

        文獻(xiàn)[23]模擬出4類話題每日搜索量,如圖3。發(fā)現(xiàn)在外源動(dòng)力話題中,次要傳播型話題存在沒有前兆的快速增長,達(dá)到峰值后接近100%的快速下降;而首要傳播型話題,達(dá)到峰值后下降的速度比次要傳播型話題緩慢,持續(xù)時(shí)間較長,并且峰值的權(quán)重比例比次要傳播型話題稍小,約占80%。在內(nèi)源動(dòng)力話題中,首要傳播型話題的特點(diǎn)是具備明顯的增長前兆和緩慢衰減,這意味著峰值的權(quán)重占總體比例很小一部分,大約20%,并且明顯的前兆增長幾乎與隨后的緩慢下降對(duì)稱;而次要傳播型話題由于短期內(nèi)的關(guān)注量較少,不易于形成明確的趨勢(shì)增長與衰退規(guī)律,但與內(nèi)源性首要傳播型話題相較,可顯而易見發(fā)現(xiàn)區(qū)別,故可用排除法來確定此類話題。為了更清晰地明確識(shí)別過程,實(shí)際操作時(shí)可遵循圖4中流程。

        圖3 文獻(xiàn)中4類話題每日累計(jì)峰值圖[23]

        圖4 判斷在線話題分類的流程圖

        4 在線社交網(wǎng)站中各類話題的分布研究

        4.1話題選取

        運(yùn)用本文介紹的方法,討論在線社交網(wǎng)站中,不同平臺(tái)中話題的分布情況。選取了新浪微博與百度貼吧,并分別運(yùn)用微指數(shù)、百度指數(shù)觀測(cè)話題趨勢(shì)。新浪微博中微話題的24小時(shí)話題榜選取11月9日的前500個(gè)話題。在百度貼吧提取11月7日-11月9日熱門貼吧的中心詞作為話題。

        4.2 數(shù)據(jù)清洗

        依次去掉(1)重復(fù)話題、(2)微指數(shù)和百度指數(shù)還未收錄的話題、(3)正處于上升階段即目前尚觀測(cè)不出完整趨勢(shì)的話題,分別剩余194個(gè)新浪微博話題和72個(gè)百度貼吧話題。

        4.3 定性判斷

        根據(jù)前文提出的流程方法,觀測(cè)每個(gè)話題完整的生命周期。

        在具體操作時(shí),最理想的情況是該話題擁有一個(gè)明顯清晰的趨勢(shì)曲線,在話題生命周期中,除主要波動(dòng)期外的觀測(cè)期內(nèi)沒有干擾判斷的波動(dòng),如圖5所示。

        圖5 實(shí)際中理想情況舉例

        但有時(shí)趨勢(shì)曲線并不明確或不易識(shí)別,因此,本文嘗試對(duì)這些情況進(jìn)行分類討論:

        (1)較易于判斷的趨勢(shì)情況如圖6所示,波動(dòng)雖多,但是大部分波動(dòng)極差較小可忽略不計(jì)。通過找到生命周期內(nèi)極差最大且峰值最高的與眾不同的完整波動(dòng)期,以此時(shí)間周期來判斷其話題性質(zhì)較為精確。

        圖6 實(shí)際情況舉例1

        (2)在觀測(cè)時(shí)間范圍內(nèi),波動(dòng)較多,且波動(dòng)期內(nèi)極差稍大不可忽略。但卻擁有明顯的高峰,可以分辨出峰值最高且觀測(cè)期內(nèi)極差最大的周期(見圖7(a)),此時(shí)應(yīng)以此周期為主要分析對(duì)象來判斷其類型;當(dāng)最高峰值有多個(gè)且相鄰時(shí),可將此連續(xù)高峰看成一個(gè)生命周期來進(jìn)行后續(xù)判斷(見圖7(b))。

        圖7 實(shí)際情況舉例2

        (3)當(dāng)觀測(cè)的時(shí)間范圍內(nèi),波動(dòng)較多,擁有多個(gè)高峰,且峰值較接近,無法分辨出峰值最大的周期時(shí)(見圖8)。這種情況時(shí),視為無明顯趨勢(shì)曲線。

        圖8 實(shí)際情況舉例3

        4.4研究結(jié)果

        為驗(yàn)證方法實(shí)用性,本研究運(yùn)用上述方法對(duì)4類話題進(jìn)行識(shí)別。同時(shí)邀請(qǐng)3位社交網(wǎng)絡(luò)分析領(lǐng)域?qū)<?,?duì)話題進(jìn)行人工分類。結(jié)果顯示,本方法的總準(zhǔn)確率為0.632,其中對(duì)外源性首要傳播型話題識(shí)別的準(zhǔn)確率為0.720,對(duì)外源性次要傳播型話題識(shí)別的準(zhǔn)確率為0.525,對(duì)內(nèi)源性首要傳播型話題識(shí)別的準(zhǔn)確率為0.643,對(duì)內(nèi)源性次要傳播型話題識(shí)別的準(zhǔn)確率為0.476,準(zhǔn)確率較為理想。另外,外源性首要傳播型話題的召回率為0.727,外源性次要傳播型話題的召回率為0.681,內(nèi)源性首要傳播型話題的召回率為0.509,內(nèi)源性次要傳播型話題的召回率為0.714,召回率比較理想。

        最終得到4類在線話題的占比分別占比如表2所示。對(duì)比兩個(gè)在線社交平臺(tái)中的話題分布,發(fā)現(xiàn)兩者的分類比例略有不同。相同的是,(1)兩個(gè)平臺(tái)中首要傳播型話題均多于次要傳播型話題,驗(yàn)證了話題的首要傳播性是維持其登上持續(xù)熱榜的重要因素;(2)內(nèi)源性次要傳播型話題均占少量比例,可見缺乏爆發(fā)性與傳播性的話題只能引起小眾的討論,并不廣泛。

        表2新浪微博和百度貼吧中4類話題分別占比

        不同的是,新浪微博平臺(tái)中外源性話題較多,而百度貼吧中內(nèi)源性話題較多,非常符合兩個(gè)平臺(tái)的定位與宗旨。新浪微博可以讓你“隨時(shí)隨地發(fā)現(xiàn)新鮮事!”,人們期待在這里看到最新、最全的咨訊內(nèi)容,尤其對(duì)爆發(fā)性的突發(fā)事件感興趣,所以熱榜中外源性話題居多。文獻(xiàn)[27]也認(rèn)為新浪微博是信息發(fā)布和分享、人際傳播交流的新渠道,面向熟悉的人或全體公眾快速地分享“即時(shí)”信息,在此興起的話題大多借助了外源推動(dòng)力,因此外源性話題較多。而百度貼吧是“以興趣主題聚合志同道合者的互動(dòng)平臺(tái)”,最熱門的討論內(nèi)容恰恰是人們?nèi)粘K鶡釔?、關(guān)心的事物,所以內(nèi)源性話題較多。對(duì)此結(jié)果,其他學(xué)者也曾從不同角度論證過,如文獻(xiàn)[28]通過對(duì)粉絲文化變遷的解讀,將百度貼吧定位為一個(gè)為粉絲的聚集而誕生的快速、定向性強(qiáng)的渠道,在這里粉絲很容易找到與其興趣相同的“粉絲”;文獻(xiàn)[29]認(rèn)為百度貼吧具備網(wǎng)絡(luò)趣緣群體的基本特征,在此聚集起來的群體有廣泛性、異質(zhì)性、匿名性等特點(diǎn),群體成員平時(shí)聯(lián)系不頻繁,很難建立起親密的關(guān)系,往往因?yàn)橥粋€(gè)話題而聚集在一起討論??梢?,兩個(gè)平臺(tái)的網(wǎng)站定位十分不同,百度貼吧成員主要因?yàn)閷?duì)話題本身的興趣而聚集起來,而新浪微博成員則是出于對(duì)新鮮話題的獵奇心態(tài),由此,也造成了內(nèi)外源話題得比例不同。

        統(tǒng)計(jì)結(jié)果與文獻(xiàn)中提到的分類占比略有不同,主要差別是內(nèi)源性首要傳播型話題數(shù)量明顯增長,外源性次要傳播型話題比例降低。造成差異的原因可能為本研究中話題均選擇于熱門話題中24小時(shí)熱門榜單和持續(xù)熱門的話題,上榜話題持續(xù)時(shí)間較長,因此次要傳播型話題相對(duì)較少,且話題數(shù)量基數(shù)不同。

        5 結(jié)束語

        依據(jù)國外學(xué)者們的定量實(shí)證研究,結(jié)合在線社交網(wǎng)絡(luò)的獨(dú)特性和所討論話題的差異性,本文介紹了基于社會(huì)響應(yīng)函數(shù)的在線群體分類方法。簡單概括為首先根據(jù)話題趨勢(shì)圖中是否具備突如其來的快速增長來區(qū)分在線話題的內(nèi)、外源性,再根據(jù)下降趨勢(shì)和持續(xù)時(shí)間來辨別其首要傳播性和次要傳播性,以此將在線群體分為4大類基于外源性首要傳播型話題的在線群體、基于外源性次要傳播型話題的在線群體、基于內(nèi)源性首要傳播型話題的在線群體和基于內(nèi)源性次要傳播型話題的在線群體。此外,提出了具體的操作流程框架,解析了可能遇到的常見狀況。

        運(yùn)用此方法抽樣估計(jì)出以新浪微博和百度貼吧為代表的在線社交網(wǎng)站中每類話題的分布情況,發(fā)現(xiàn)新浪微博平臺(tái)的用戶更加熱衷于討論新鮮感十足的外源性話題,而百度貼吧平臺(tái)的用戶更關(guān)注以自身興趣為中心的內(nèi)源性話題。同時(shí),驗(yàn)證了話題的首要傳播性更利于幫助話題登上持續(xù)時(shí)間長的熱榜。

        然而本文也存在一定的局限性,此方法雖然是基于之前學(xué)者們定量研究得出的結(jié)論,并采用與專家交流經(jīng)驗(yàn)的方法進(jìn)行了實(shí)證運(yùn)用,但是僅作為初步科學(xué)識(shí)別在線話題類型的定性研究方法。介紹此方法的目的在于能夠使研究人員快速地、便捷地對(duì)在線話題事件類型做出科學(xué)判斷。未來還需要在以下幾方面進(jìn)行進(jìn)一步研究:(1)目前觀測(cè)社會(huì)響應(yīng)系統(tǒng)函數(shù)的平臺(tái)集中于少量互聯(lián)網(wǎng)搜索引擎提供的搜索指數(shù)查詢平臺(tái),對(duì)在線話題的收錄數(shù)量有限,無法涵蓋全部在線話題,需進(jìn)一步擴(kuò)大觀測(cè)平臺(tái)的選擇范圍;(2)此方法對(duì)觀測(cè)數(shù)據(jù)要求較高,要求函數(shù)中必須可體現(xiàn)出一個(gè)完整的話題生命周期。下一步可嘗試結(jié)合定量分析,預(yù)測(cè)正處于發(fā)展階段的在線話題的未來發(fā)展趨勢(shì);(3)由于定性方法的局限性,只能大致根據(jù)話題趨勢(shì)判斷出其性質(zhì),若在實(shí)際操作時(shí)遇到模棱兩可、無法確定的情況,還需考慮依據(jù)專家經(jīng)驗(yàn)來進(jìn)一步明確,未來需通過大量基于此方法的實(shí)證研究來總結(jié)補(bǔ)充完善此方法,使之在快速有效的基礎(chǔ)上能夠更加精確細(xì)致、盡可能客觀周全。

        [1] BON Gustave Le. The Crowd: A Study of The Popular Mind[M]. New York: The Macmillan Co., 1896: 11-43.

        [2] ARMSTRONG A and HAGELIII J H. The real value of online communities[J]., 1996, 74(3): 85-95.doi: 10.12691/ijefm-2-2-2.

        [3] 曹玖新, 陳高君, 吳江林, 等. 基于多維特征分析的社交網(wǎng)絡(luò)意見領(lǐng)袖挖掘[J]. 電子學(xué)報(bào), 2016, 44(4): 898-905. doi: 10. 3969/j.issn.0372-2112.2016.04.021.

        CAO Jiuxin, CHEN Gaojun, WU Jianglin,Multi- feature based opinion leader mining in social networks[J]., 2016, 44(4): 898-905.doi: 10.3969/ j.issn.0372-2112.2016.04.021.

        [4] 吳信東, 李毅, 李磊. 在線社交網(wǎng)絡(luò)影響力分析[J]. 計(jì)算機(jī)學(xué)報(bào), 2014(4): 735-752.

        WU Xindong, LI Yi, and LI Lei. Influence analysis of online social networks[J]., 2014(4): 735-752.

        [5] 李東方, 俞能海, 尹華罡. 一種Web 2.0環(huán)境下互聯(lián)網(wǎng)熱點(diǎn)挖掘算法[J]. 電子與信息學(xué)報(bào), 2010, 32(5): 1141-1145.doi: 10. 3724/SP.J.1146.2009.00641.

        LI Dongfang, YU Nenghai, and YIN Huagang. Mining hot topic on Internet under web 2.0[J].&, 2010, 32(5): 1141-1145. doi: 10. 3724 /SP.J.1146.2009.00641.

        [6] ZHAO L, LI Y, LIU X,. A graph-based bursty topic detection approach in user-generated texts[C]. IEEE Web Information System and Application Conference, Tianjin, China, 2015: 273-278. doi: 10.1109/WISA.2014.57.

        [7] ZHANG C, WANG H, CAO L,. A hybrid term-term relations analysis approach for topic detection[J].-, 2015, 93(11): 109-120.doi: 10.1016/j.knosys.2015.11.006.

        [8] 劉權(quán), 郭武. 基于核主成分分析的話題跟蹤系統(tǒng)[J]. 清華大學(xué)學(xué)報(bào): 自然科學(xué)版, 2013(6): 865-868.

        LIU Quan and GUO Wu. Topic tracking system based on kernel principal component analysis[J].:, 2013(6): 865-868.

        [9] 謝麗星, 周明, 孫茂松. 基于層次結(jié)構(gòu)的多策略中文微博情感分析和特征抽取[J]. 中文信息學(xué)報(bào), 2012, 26(1): 73-83.

        XIE Lixing, ZHOU Ming, and SUN Maosong. Sentiment analysis and feature extraction of Chinese micro-blog based on hierarchical structure[J]., 2012, 26(1): 73-83.

        [10] REN Yafeng, WANG Ruimin, and JI Donghong. A topic- enhanced word embedding for twitter sentiment classification [J]., 2016, 24(7): 1031-1040.doi: 10. 1016/j.ins.2016.06.040.

        [11] 劉玉新. Web2.0互聯(lián)網(wǎng)在線話題發(fā)現(xiàn)和熱度評(píng)估[D]. [碩士論文], 華南理工大學(xué), 2013: 23-45.

        LIU Yuxin. Web2.0 Internet online topic discovery and hotness evaluation[D]. [Master dissertation], South China University of Technology, 2013: 23-45.

        [12] 龍志祎, 程葳, 沈俊輝. TDT中新發(fā)現(xiàn)話題的分類研究與實(shí)現(xiàn)[J]. 武漢理工大學(xué)學(xué)報(bào): 信息與管理工程版, 2009, 5(5): 762-765.

        LONG Zhiyi, CHEN Wei, and SHEN Junhui. Research and implementation of new detected topic classification in TDT technology[J].:&, 2009, 5(5): 762-765.

        [13] 劉寶忠. 微博客在線社會(huì)網(wǎng)絡(luò)的特性研究[D]. [碩士論文], 西安理工大學(xué), 2011: 32-35.

        LIU Baozhong. The research on the characteristics of microblog[D]. [Master dissertation], Xi,an University of Technology, 2011: 32-35.

        [14] 張永軍, 劉金嶺, 馬甲林. 中文短信文本信息流中多話題的分類抽取[J]. 現(xiàn)代圖書情報(bào)技術(shù), 2014, 30(Z1): 101-106.

        ZHANG Yongjun, LIU Jinling, and MA Jialin. Classification of multi topic extraction based on Chinese short information text message flow[J]., 2014, 30(Z1): 101-106.

        [15] 易欣. “微話題”的社會(huì)語言學(xué)解讀[J]. 北方文學(xué)旬刊, 2013(6): 143-145.

        YI Xin. A sociolinguistic interpretation of the “micro topic”[J]., 2013(6): 143-145.

        [16] 張萌. 關(guān)于新浪微博熱門話題的分析研究[D]. [碩士論文], 山東大學(xué), 2015: 11-24.

        ZHANG Meng. The analysis of the hot topics on Sina microblog[D]. [Master dissertation], Shandong University, 2015: 11-24.

        [17] 洪宇, 張宇, 劉挺, 等. 話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J]. 中文信息學(xué)報(bào), 2007, 21(6): 71-87.doi: 10.3969/j.issn.1003- 0077.2007.06.011.

        HONG Yu, ZHANG Yu, LIU Ting,. Review on the evaluation and research of topic detection and tracking[J]., 2007, 21(6): 71-87. doi: 10.3969/j.issn.1003-0077.2007.06.011.

        [18] ELLISON N B. Social network sites: Definition, history, and scholarship[J]., 2007, 13(1): 210-230.doi: 10.111/j.1083- 6101.2007.00393x.

        [19] SPROULL L. Online Communities[M]. New York: Handbook of Computer Networks: Distributed Networks, Network Planning, Control, Management, and New Trends and Applications, 2012: 898-914.doi: 10.1002/047148296X. tie128.

        [20] ALDRICH H E and RUEF M. Organizations Evolving[M]. London: SAGE Publications Ltd,2006: 121-123. doi: 10. 4135/9781446212509.

        [21] MATZAT U. A theory of relational signals in online groups [J].&, 2009, 11(3): 375-394.doi: 10.1177/ 1461444808101617.

        [22] SORNETTE D, DESCHATRES F, GILBERT T,. Endogenous versus exogenous shocks in complex networks:an empirical test using book sale rankings[J]., 2004, 93(22): 211-218.doi: 10.1103/PhysRevLett. 93.228701.

        [23] CRANE R. Robust dynamic classes revealed by measuring the response function of a social system[J]., 2008, 105(41): 15649-15653.doi: 10.1073/pnas.0803685105.

        [24] KWAK H, LEE C, PARK H,. What is twitter, a social network or a news media?[C].the 19th International World Wide Web (WWW) Conference,Raleigh, NC, USA, 2010: 591-600.

        [25] 許小東. 管理者工作內(nèi)源壓力與外源壓力的結(jié)構(gòu)模型研究[J]. 管理工程學(xué)報(bào), 2007, 21(1): 3-40.

        XU Xiaodong. A structure modeling study on the job intrinsic stressors and extrinsic stressors of the managers[J]., 2007, 21(1): 3-40.

        [26] POSNER M I. Orienting of attention[J]., 2007, 32(1): 3-25.

        [27] 宋恩梅, 左慧慧. 新浪微博中的“權(quán)威”與“人氣”: 以社會(huì)網(wǎng)絡(luò)分析為方法[J]. 圖書情報(bào)知識(shí), 2012(3): 43-54.

        SONG Enmei and ZUO Huihui.“Authority” and “popularity” in micro-blog Sina: A social network analysis method[J].,&, 2012(3): 43-54.

        LI Shanshan.Baidu Tieba 10 anniversary, for the interest and life-on the BBS ten years fans cultural changes[J]., 2014(10): 202-204.

        LU Shuang.Analysis of the characteristics of the network interest margin group-Baidu Tieba posted as an example[J]., 2015(3): 47-48.

        Research on Online Group ClassificationBased on the Response Function of Social System

        LIU Jiaqi①Q(mào)I Jiayin②③①

        (Institute of Economic Management, Beijing University of Posts and Telecommunications, Beijing 100876, China)②(Key Laboratory of Trustworthy Distributed Computing and Service, Beijing University of Posts and Telecommunications, Beijing 100876, China)③(Institute of Business Administration, Shanghai University of International Business and Economics,Shanghai 201620, China)

        Devoted to enriching the research system of online group, and laying the foundation for exploring deep scientific problem in the future, this paper discusses the definition of online group, online topic, common classification methods, and primarily introduces a new qualitative method of online topic classification based on observing the trend of a social system response function. Through this method, online topic discussed by online group can be divided into exogenous critical topic, exogenous subcritical topic, endogenous critical topic, and endogenous subcritical topic. The standardized steps to this method are put forward, and it is figured out that the problems may occur when applying it to the practice. What’s more, this method is tried to estimate the distribution of four types of topics in the two representatives of online social network platform “Sina microblog” and “Baidu Tieba”.

        Social network; Online group; Online topic; Qualitative classification; Response function of social system

        G206.3; TP311

        A

        1009-5896(2016)09-2141-09

        10.11999/JEIT160515

        2016-05-23;

        2016-07-22;

        2016-08-09

        國家973基礎(chǔ)重大課題(SQ2012CB037347),國家自然科學(xué)基金(71231002)

        The Major State Basic Research Development Program of China (973 Program)(SQ2012CB037347), The National Natural Science Foundation of China (71231002)

        齊佳音 qijiayin@139.com

        劉嘉琪: 女,1993年生,博士生,研究方向?yàn)樯鐣?huì)網(wǎng)絡(luò)分析、在線用戶行為分析.

        齊佳音: 女,1972年生,博士生導(dǎo)師,研究方向?yàn)樵诰€用戶關(guān)系管理、非常規(guī)突發(fā)事件應(yīng)急管理、互聯(lián)網(wǎng)輿情管理.

        猜你喜歡
        分類
        2021年本刊分類總目錄
        分類算一算
        垃圾分類的困惑你有嗎
        大眾健康(2021年6期)2021-06-08 19:30:06
        星星的分類
        我給資源分分類
        垃圾分類,你準(zhǔn)備好了嗎
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        按需分類
        教你一招:數(shù)的分類
        日韩亚洲国产中文字幕| 无码国产精品一区二区vr老人 | 蜜臀av一区二区三区精品 | 国产精品女丝袜白丝袜| 久久成人永久婷婷99精品| 国产亚洲精品第一综合另类| 人妻献身系列第54部| 国产欧美另类精品久久久| 日本一二三区在线视频观看| 日本中文一区二区在线观看| 久久久av精品波多野结衣| 午夜免费福利在线观看| 亚洲中文字幕不卡一区二区三区| 国产精品成人一区二区不卡| 日本亚洲欧美色视频在线播放| 久久AⅤ无码精品为人妻系列 | 国产嫖妓一区二区三区无码| 人妻无码ΑV中文字幕久久琪琪布 尤物AV无码色AV无码麻豆 | 草莓视频一区二区精品| 自拍偷拍一区二区三区四区| 国产精品女直播一区二区| 性生交大全免费看| 无码一区东京热| 精品人妻av中文字幕乱| 亚洲精品第一国产综合精品 | 无码不卡高清毛片免费| 精品国产一区二区三区男人吃奶| 人妻少妇中文字幕久久| 国产精品视频露脸| 国产自产c区| 国产精品日韩亚洲一区二区| 国产精品成人免费视频一区| 狠狠噜天天噜日日噜| 偷拍一区二区三区在线观看| 国产精品一区二区三久久不卡| 丁香花在线影院观看在线播放| 日韩激情网| 亚洲高清国产成人精品久久| 欧美成人精品午夜免费影视| 337p日本欧洲亚洲大胆色噜噜| 偷偷夜夜精品一区二区三区蜜桃|