摘要:通過量化微博傳播的相關(guān)指標,篩選出具有代表性的30位新浪微博意見領(lǐng)袖,抓取約50余萬字的原創(chuàng)微博語料建立語料庫,分析了不同職業(yè)、學(xué)歷、年齡、性別的微博意見領(lǐng)袖在詞匯密度、詞匯變化性、詞類離散度、微博活躍度方面的組間差異,發(fā)現(xiàn)意見領(lǐng)袖的身份特征與其話語傳播特征之間存在密切關(guān)聯(lián),相關(guān)統(tǒng)計數(shù)據(jù)和研究結(jié)論可為新媒體語言監(jiān)測、網(wǎng)絡(luò)監(jiān)管和輿情監(jiān)測提供信息參考。
關(guān)鍵詞:新媒體;影響力;詞匯密度;離散度;活躍度
中圖分類號:G206.3;H13
文獻標識碼:ADOI:10.3963/j.issn.16716477.2016.05.0008
“意見領(lǐng)袖”(Opinion Leader)的概念最早由美國傳播學(xué)學(xué)者Lazarsfeld在其著作“The People’s Choice”中提出[1]。近年來,隨著互聯(lián)網(wǎng)的發(fā)展,尤其是社交網(wǎng)絡(luò)的迅猛發(fā)展,新媒體意見領(lǐng)袖在信息傳播中的作用更加重要。據(jù)中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)2015年7月22日發(fā)布的《第36次中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告》顯示,“2015年上半年,微博客用戶中,使用新浪微博的用戶占69.4%,一至五級城市的使用率都在65%以上?!盵2]相關(guān)研究表明,微博作為網(wǎng)絡(luò)輿論的最主要陣地之一,其意見領(lǐng)袖在突發(fā)事件的信息傳播 [3]、話語權(quán)的實現(xiàn)[4]、網(wǎng)絡(luò)輿論及口碑效應(yīng)的影響力[56]等方面具有重要作用,研究微博等社交網(wǎng)絡(luò)中意見領(lǐng)袖的話語傳播特征對新媒體語言監(jiān)測也具有重要意義。
微博意見領(lǐng)袖通過原創(chuàng)、轉(zhuǎn)發(fā)或評論來表達對社會事件的觀點,以個人號召力影響信息傳播,具有獨特的話語傳播特征。本文依據(jù)自制的2015年新浪微博意見領(lǐng)袖排行榜,建立一個小型語料庫,并根據(jù)行業(yè)、學(xué)歷、年齡、性別四種身份特征將其分組,使用Corpus Word Parser、CCRL、SPSS軟件對語料進行分詞、詞性標注和統(tǒng)計分析,通過詞匯密度、詞匯變化性、詞類離散度等詞匯計量特征以及微博活躍度等傳播指數(shù),對比不同身份特征的新媒體意見領(lǐng)袖話語傳播特征,分析其組間差異,為網(wǎng)絡(luò)監(jiān)管、輿情監(jiān)測及引導(dǎo)提供信息參考。
一、意見領(lǐng)袖語料庫建設(shè)
微博平臺上具有輿論影響力的人群包括社會名人、機構(gòu)、網(wǎng)絡(luò)紅人和其他大V等,但是有影響力的用戶并不全是微博意見領(lǐng)袖。目前,暫無較權(quán)威的微博意見領(lǐng)袖排行榜,從多家機構(gòu)已發(fā)布的中國微博意見領(lǐng)袖排行榜看,存在行業(yè)覆蓋面窄、參照時間短等弊端,不利于進行社會語言學(xué)分析。本文為考察不同身份特征意見領(lǐng)袖的話語傳播特征,篩選出30位不同社會屬性的意見領(lǐng)袖,制定了覆蓋面較全的2015年微博意見領(lǐng)袖排行榜和語料庫。具體步驟如下:
第一步,以環(huán)球網(wǎng)論壇在2015年2-3月間4次公布的“新浪微博意見領(lǐng)袖百強排行榜” 為依據(jù),收集了榜單中所有賬戶在2015年1月1日-4月30日期間的全部微博,包括發(fā)博時間、轉(zhuǎn)發(fā)量、評論數(shù)、回帖數(shù)、點贊數(shù)等相關(guān)信息。
第二步,確定兩個一級量化指標和七個二級量化指標。由于微博意見領(lǐng)袖具有主題依賴性的特點[7],即在某一主題內(nèi)特別活躍并且在該主題內(nèi)具有極大影響力的用戶。因此,本文將“用戶影響力”和“用戶活躍度”作為衡量微博意見領(lǐng)袖的兩個一級指標?!坝脩粲绊懥Α卑ā氨晦D(zhuǎn)發(fā)數(shù)、被評論數(shù)、被提及數(shù)”3個二級指標,“用戶活躍度”包括“原創(chuàng)數(shù)”、“自回帖數(shù)”、“回他人貼數(shù)”、“活躍天數(shù)”4個二級指標。
第三步,量化相關(guān)指標。影響力的計算公式:Influence影響力=V被轉(zhuǎn)發(fā)*W1+V被評論*W2+V被提及*W3,活躍度的計算公式:Activity活躍度=V原創(chuàng)數(shù)*W4+V自回帖數(shù)*W5+V回他人貼數(shù)*W6+V天數(shù)*W7。本文采用美國學(xué)者T.L.saaty提出的AHP層次分析法確定W1-7各指標的權(quán)重,并結(jié)合劉志明、劉魯制定的權(quán)重數(shù)據(jù)及計算方法進行量化[7]。
第四步,根據(jù)計算結(jié)果,篩選出前50名微博意見領(lǐng)袖,然后參考近兩年行業(yè)微博情況報告、微博名人排行榜、新浪微博名人堂等資料,分析得到微博意見領(lǐng)袖的14個行業(yè)分布,權(quán)衡行業(yè)、年齡、學(xué)歷、性別的人數(shù)比例后,制定出囊括了30人的“新浪微博意見領(lǐng)袖排行榜”(排名不分前后),見表1。
第五步,將30位微博意見領(lǐng)袖在2015年1-4月期間的原創(chuàng)微博建立小型語料庫,共7091條,總計496 917字。根據(jù)行業(yè)、學(xué)歷、年齡、性別四個類別對語料進行分類,使用教育部語言文字應(yīng)用研究所研制的“Corpus Word Parser”軟件對語料進行分詞、詞類統(tǒng)計,用EXCEL計算詞匯密度、詞匯變化性、詞類標準偏差、微博活躍度,對詞匯豐富性和微博傳播指數(shù)進行全面綜合的分析和組間計量對比,分析不同身份特征新媒體意見領(lǐng)袖的話語傳播特征。
二、詞匯密度組間差異
Arnaud[8],Linnarud[9],Laufer Nation[10]309,Read[11]等國外學(xué)者先后提出多種測量“詞匯豐富性”(lexical richness)的數(shù)理統(tǒng)計方法,考察語言使用者在自由言語產(chǎn)出中使用詞匯的豐富程度。王立非、孫曉坤[12],崔艷嫣、王同順[13],張艷、陳紀梁[14]等國內(nèi)研究者也都基本上采用國外提出的詞型標記比和詞頻概貌的測量手段。Read[11]認為詞匯豐富性包含詞匯密度、詞匯變化性、詞匯復(fù)雜性(表達精確性)、錯誤數(shù)量四種測量維度,這一觀點得到較為廣泛的認可。四類測量方法中,詞匯復(fù)雜性和錯誤數(shù)量多用來測量語言習(xí)得的效果,因此,本文將采用詞匯密度、詞匯變化性的測量方法,考察微博意見領(lǐng)袖的詞匯豐富性。
(一)詞匯密度及其測量方法
Holmes認為,語篇的作者本身擁有一定量的詞匯存儲,而且偏愛使用一些詞匯,作者的詞匯量反映在詞匯的出現(xiàn)頻率中,詞匯頻率分布的測試可以應(yīng)用到不同類別作者的比較分析之中[15]。詞匯密度作為一個語言特征,是衡量單位篇章信息含量的尺度,在一定程度上反映了語言材料傳播的信息量和感知難度,而且測量結(jié)果穩(wěn)定,不會受到語篇長度的影響,經(jīng)常被用來區(qū)別語體風(fēng)格[14,1617]。Halliday認為,詞匯密度反映的是句中實詞所占的比例。詞匯密度越大,所載的信息量也越大。反之, 信息量就越少[18]。陳會軍認為,詞匯密度過低會影響信息的表達質(zhì)量和篇章體裁的準確體現(xiàn),詞匯密度過高會增加人們對篇章的感知難度[16]57。
詞匯密度( lexical density)計算公式最早由Ure提出,“詞匯密度=篇章中的實詞詞項數(shù)量÷篇章單詞總量*100%”,計算結(jié)果為篇章中每百字中所包含的實詞詞項數(shù)量[19],這一測量方法也是目前運用最多的傳統(tǒng)計算方法。Halliday提出了新的計算方法,“詞匯密度=詞項數(shù)量÷篇章小句總量*100%”,他認為計算單位小句內(nèi)實詞所占的百分比,比Ure計算篇章的詞匯密度更能準確地體現(xiàn)單位篇章的信息含量。
(二)意見領(lǐng)袖詞匯密度
1.不同行業(yè)的組間比較。為有效地進行組間差異比較,首先將30位意見領(lǐng)袖所在的14種職業(yè)合并為“黨政、經(jīng)濟、文化、公知、文藝、宗教、自由職業(yè)”7個領(lǐng)域,然后統(tǒng)計出各領(lǐng)域意見領(lǐng)袖在各詞類的詞種數(shù)、頻次、句子總數(shù)等方面的數(shù)據(jù),進而測量不同類別意見領(lǐng)袖微博文本的詞匯密度。本文同時采用Ure和Halliday的測量方法分別計算各行業(yè)的詞匯密度,統(tǒng)計數(shù)據(jù)如表2:
兩種測量結(jié)果都顯示,本科學(xué)歷意見領(lǐng)袖的詞匯密度最低,博士以及本科以下學(xué)歷的詞匯密度居中,碩士學(xué)歷的詞匯密度最高。說明詞匯密度的大小與學(xué)歷層次高低之間不存在線性相關(guān)。
3.不同年齡段的組間比較。本文篩選的30位微博意見領(lǐng)袖,其年齡主要集中在40-60歲間,30歲左右的人數(shù)較少。因此,本文將意見領(lǐng)袖按年齡分為兩大類:五十歲以下的中青年與五十歲以上的中老年。詞匯密度(U)計算結(jié)果顯示,中青年組為17.82%,中老年組為17.43%;詞匯密度(H)計算結(jié)果顯示,中青年組為2.9613,中老年組為2.5343。中青年組意見領(lǐng)袖詞匯密度整體上略高于中老年組,但是差距比較小。
4.不同性別的組間比較。性別語言研究一直是社會語言學(xué)的研究熱點,同時也是心理學(xué)、社會學(xué)、人類學(xué)等多個學(xué)科領(lǐng)域所關(guān)注的研究課題。近年來,學(xué)界逐漸把性別語言差異研究的重點轉(zhuǎn)向了交際中的話語模式等方面。Wardhaugh認為,男女兩性在話語模式上存在著不同程度的差異,具有不同的風(fēng)格,主要表現(xiàn)在話題的選擇、話語量大小與話輪的控制及交際策略方面[22]。其中,話語量的研究主要是比較兩性說話的時長或文本長度,不同于詞匯密度所反映的信息量。目前,還未見從詞匯密度比較兩性話語信息大小的相關(guān)研究。從詞匯密度分析兩性的信息量差異,可以豐富性別語言關(guān)于話語模式的研究。
詞匯密度(U)計算結(jié)果顯示,男性意見領(lǐng)袖為14.48%,女性為24.94%;詞匯密度(H)計算結(jié)果顯示,男性為2.2171,女性為3.7124。兩種測量方式都說明,女性意見領(lǐng)袖比男性意見領(lǐng)袖的詞匯密度要高,女性的信息量更大。Coates[23]、Romaine[24]、許力生[25]、Tannen[26]、王宇波[27]164等都認為男性話語量高于女性??梢?,詞匯密度反映的信息量與話語量是表現(xiàn)話語特征的兩個不同維度。男性話語量相對較大,但是信息量相對較小,女性則相反。
三、詞匯變化性比較
(一)詞匯變化性及測量方法
詞匯變化性,即詞匯多樣性(lexical diversity),是反映作者詞匯豐富性的一個非常重要的指標,通常用來測量篇章詞匯的使用范圍或種類,數(shù)據(jù)可以反映語言使用者用詞是否豐富多樣、是否較少重復(fù)等,數(shù)值越高表明用詞范圍越廣。
傳統(tǒng)計算詞匯變化性方法是通過類符(Type)和形符(Tokens)的比值來測量(TTR),即語篇中所有不同的單詞在連續(xù)呈現(xiàn)的單詞總數(shù)中所占的百分比[10]309。不過,這種傳統(tǒng)的TTR算法雖然簡單,但計算結(jié)果會受到文本長度的影響。當(dāng)文本長度增加時,TTR比值會隨之降低,不能很好地測量不同文本長度下的詞匯復(fù)雜性[28],其信度一直以來備受質(zhì)疑。Dugast提出了更為復(fù)雜的Uber index測量方法[29],計算公式為:
Uber index U=(log Tokens)\+2/
(log Tokens-log Types)
Tweedie Baayen認為這一公式為詞匯變化性提供了相對精確的測量方法[30],且“不受文本長短的影響”[31]。Jarvis[32]、McCarthy[33]認為Uber index的信度較好,因此,本文采用該方法測量意見領(lǐng)袖的詞匯變化性。
(二)意見領(lǐng)袖詞匯變化性
詞匯變化性可以用來評估意見領(lǐng)袖的詞匯知識及其語言輸出中的詞匯變化特點,不同職業(yè)意見領(lǐng)袖詞匯多樣性的測量結(jié)果見表4。
測量結(jié)果顯示,自由職業(yè)意見領(lǐng)袖的詞匯變化性最大,詞匯知識最豐富。宗教詞匯變化性最小,詞匯知識相對匱乏。這一傾向和詞匯密度的測量結(jié)果具有相似性,自由職業(yè)在所有類別中的詞匯變化性和詞匯密度最大,宗教類最小。
不同學(xué)歷層次意見領(lǐng)袖的詞匯變化性中,碩士學(xué)歷最高,為34.86,其次是本科以下和博士,分別為33.84和32.90,本科學(xué)歷最低,為29.42。這一傾向與詞匯密度也相似,說明微博意見領(lǐng)袖的學(xué)歷變化與詞匯密度、詞匯變化性的高低不呈線性相關(guān)。
不同年齡段、不同性別意見領(lǐng)袖之間的詞匯變化性差距較小。中青年組略高于中老年組,分別為30.08和30.05;男性詞匯多樣性略高于女性,分別為29.71和29.27。年齡組的詞匯多樣性高低與其詞匯密度高低具有同一傾向,中青年組都高于老年組,說明中青年意見領(lǐng)袖微博內(nèi)容更為廣泛,微博文本的詞種數(shù)更多。不同性別意見領(lǐng)袖的詞匯多樣性高低與其詞匯密度高低不一致。在詞匯變化性上,女性低于男性,但是在詞匯密度上,女性卻高于男性。說明男性的詞匯知識更豐富,微博涉及的主題更多,內(nèi)容更為廣泛,詞種更豐富。
(三)詞類離散度比較
詞匯變化性作為測量語篇詞匯豐富程度的一個維度,依據(jù)的是詞種數(shù)和詞總數(shù)兩個變量,只能反映詞匯的整體情況,無法測量不同詞類使用狀況。由于不同類型的微博在詞類和詞頻上存在差異,因此各詞類的使用狀況能夠反映作者的文本風(fēng)格特征。為了進一步考察意見領(lǐng)袖的詞類變化性,本文以各詞類出現(xiàn)的頻次在詞總數(shù)中所占百分比為依據(jù),計算各詞類數(shù)據(jù)之間的標準偏差。標準偏差代表了一組數(shù)據(jù)的離散程度,可以用來衡量作者的詞類多樣性。標準偏差越大,數(shù)值偏離平均值就越多,離散度就越高,名詞、動詞的比例相對較高,其他詞類比例較低;反之,如果標準差相對較小,離散程度就較低,各詞類分布相對均衡,連詞、嘆詞、擬聲詞等詞類使用比例增大。
對意見領(lǐng)袖的詞類離散度測量后發(fā)現(xiàn):1.不同行業(yè)的標準偏差由大到小排序為:自由職業(yè)(0.1089)、公知(0.1078)、政黨(0.1054)、經(jīng)濟(0.0983)、文化(0.0970)、文藝(0.0924)、宗教(0.0886)。這一序列與詞匯變化性、詞匯密度的序列相似,自由職業(yè)仍然居首。自由職業(yè)類的名詞和動詞的比例高達33.94%和27.33%。離散度最小的宗教類,名詞和動詞的比例降低到27%和24%。2.不同學(xué)歷層次意見領(lǐng)袖的詞類離散度與學(xué)歷具有密切聯(lián)系,學(xué)歷越高,詞類離散度越高。標準偏差由大到小排序為:博士學(xué)歷(0.1071)、碩士學(xué)歷(0.1016)、本科學(xué)歷(0.1000)、本科以下(0.0912)。3.不同年齡段的測量顯示,中老年意見領(lǐng)袖的詞類離散度為0.1032,略高于中青年組的0.0971。4.不同性別組的測量顯示,男性意見領(lǐng)袖的詞類離散度為0.1017,高于女性的0.896。可見,不同職業(yè)、性別的意見領(lǐng)袖,他們的詞類離散度高低和詞匯變化性大小具有相同傾向,而不同學(xué)歷、年齡的意見領(lǐng)袖則沒有。
詞類離散度的高低受到低頻詞類使用比例的影響,實詞中的名詞、動詞、形容詞,虛詞中的助詞都是出現(xiàn)頻次較高的詞類,而虛詞中的介詞、連詞、嘆詞、擬聲詞,實詞中的量詞都是出現(xiàn)頻次較低的詞類。當(dāng)前者比例降低,后者比例增高時,離散度就會降低??疾彀l(fā)現(xiàn),在職業(yè)中的宗教類、學(xué)歷層次中的本科以下、年齡段中的中青年組,以及性別分類中的女性組中,意見領(lǐng)袖的名詞、動詞等高頻詞類出現(xiàn)的比例較低,而嘆詞、連詞等低頻詞類較高。例如女性意見領(lǐng)袖的嘆詞和副詞比例明顯高于男性,嘆詞分別為0.16%, 0.14%,副詞9.37%,6.28%。馬琰[34]、王宇波[27]研究也發(fā)現(xiàn)女性嘆詞的使用頻率明顯高于男性,王德春等認為女性比男性更多地使用副詞,以及起強調(diào)作用的詞語[35]。
四、詞匯豐富度與活躍度關(guān)系
微博的活躍度和傳播度反映了賬號的傳播能力和傳播效果,可以通過微博傳播指數(shù)BCI(Microblog Communication Index)進行測量①。本文對意見領(lǐng)袖活躍度的分析采用BCI指數(shù)進行評估,利用其中的推送活躍度指數(shù)W1進行計算,公式為W1=30%×ln(X1+1)+70%×ln(X2+1),其中X1為發(fā)博數(shù),X2為原創(chuàng)微博數(shù)。通過活躍度的測量,進而分析活躍度與詞匯豐富性的關(guān)聯(lián)。
每組意見領(lǐng)袖的活躍度是組內(nèi)每位意見領(lǐng)袖W1指數(shù)之和的平均數(shù)。不同職業(yè)意見領(lǐng)袖的微博活躍度由高到低排序為:宗教(7.05)、經(jīng)濟(6.89)、公知(6.55)、文化(6.54)、黨政(5.49)、文藝(4.40)、自由職業(yè)(3.19);不同學(xué)歷層次意見領(lǐng)袖的微博活躍度由高到低排序為:本科(5.63)、博士(5.36)、碩士(4.89)、本科以下(4.56);年齡組中,中老年意見領(lǐng)袖為5.42,中青年為5.23;性別組中,女性意見領(lǐng)袖為133.93,男性為117.99。
將意見領(lǐng)袖的微博活躍度與詞匯密度、詞匯變化性、詞類離散度的測量結(jié)果比較后發(fā)現(xiàn),微博活躍度越高的職業(yè),其詞匯密度、詞匯變化性和詞類離散度越低;從學(xué)歷差異看,活躍度與詞匯密度正相關(guān),與詞匯變化性負相關(guān);從年齡差異看,中老年組的微博活躍度、詞類離散度比中青年組高,但是詞匯密度和詞匯變化性卻低于中青年組;從性別差異看,女性的活躍度和詞匯密度比男性略高,但是詞匯多樣性和詞匯離散度卻低于男性。
五、結(jié)語
本文依據(jù)微博的傳播特點,量化相關(guān)指標,篩選出了具有代表性的微博意見領(lǐng)袖,分別測量了不同行業(yè)、學(xué)歷、年齡、性別的微博意見領(lǐng)袖在詞匯密度、詞匯變化性、詞類離散度、微博活躍度等話語傳播特征。研究發(fā)現(xiàn),不同類型意見領(lǐng)袖的話語傳播特征存在明顯的組間差異。雖然本文得到了一些有益的結(jié)論,但是對微博意見領(lǐng)袖話語特征的分析還不夠全面,如何采用更有效的方法識別微博意見領(lǐng)袖,對新媒體意見領(lǐng)袖進行長期跟蹤和觀察,促進新媒體語言規(guī)范化發(fā)展,監(jiān)控及引導(dǎo)微博意見領(lǐng)袖的言論等方面,仍有待下一步的深入研究。
注釋:
①BCI指數(shù)依據(jù)《中國移動互聯(lián)網(wǎng)發(fā)展報告(2015)》的計算方法,BCI包括活躍度W1和傳播度W2兩個二級指標,其中W1又包括發(fā)博數(shù)X1和原創(chuàng)微博數(shù)X2兩個三級指標。
[參考文獻]
[1]Lazarsfeld, P. F., Berelson, B., Gaudet, H. The People’s Choice[M]. New York: Columbia University Press,1948.
[2]國家互聯(lián)網(wǎng)絡(luò)信息中心.第36次中國互聯(lián)網(wǎng)絡(luò)發(fā)展狀況統(tǒng)計報告[EB/OL].(20150722)[20160315].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201507/P020150723549500667087.pdf
[3]姜珊珊,李欲曉,徐敬宏.非常規(guī)突發(fā)事件網(wǎng)絡(luò)輿情中的意見領(lǐng)袖分析[J].情報理論與實踐,2010,33(12):101104.
[4]Lee, N.Y. Kim, Y. The spiral of silence and journalists’ outspokenness on Twitter[J]. Asian Journal of Communication. 2014,24(3):262278.
[5]Peng, Y., Li, J., Xia, H., Qi, S., LI, J. The effects of food safety issues released by we media on consumers’ awareness and purchasing behavior: A case study in China[J]. Food Policy, 2015,51:4452.
[6]元志潤.在網(wǎng)絡(luò)口碑溝通中的意見領(lǐng)袖(Opinion Leader)研究:以韓國超級博客(Power Blog)為例[D].上海:復(fù)旦大學(xué),2011.
[7]劉志明,劉魯.微博網(wǎng)絡(luò)輿情中的意見領(lǐng)袖識別及分析[J].系統(tǒng)工程,2011(6):816.
[8]Arnaud,P.J.L.. The lexical richness of L2 written productions and the validity of vocabulary tests[M]∥In Culhane T, Klein B C Stevenson D K (eds.). Practice and Problems in Language Testing: Papers from the International Symposium on Language Testing. Colchester: University of Essex,1984. 1428.
[9]Linnarud,M. Lexis in Composition. A Performance Analysis of Swedish Learners’ Written English ( Lund Studies in English 74)[M]. Lund: CWK Gleerup,1986.
[10]Laufer,B.Nation,P. Vocabulary size and use: Lexical richness in L2 written production[J]. Applied Linguistics,1995,16(3): 307322.
[11]Read,J. Assessing Vocabulary[M]. Cambridge: Cambridge University Press,2000.
[12]王立非,孫曉坤.漢語寫作能力對英語寫作質(zhì)量的影響[J].外語與外語教學(xué),2005(4):2429.
[13]崔艷嫣,王同順.接受性詞匯量、產(chǎn)出性詞匯量與詞匯深度知識的發(fā)展路徑及其相關(guān)性研究[J].現(xiàn)代外語,2006(4):392400.
[14]張艷,陳紀梁.言語產(chǎn)出中詞匯豐富性的定量測量方法[J].外語測試與教學(xué),2012(3):3440.
[15]Holmes, D. I. “The Analysis of Literary Style: A Review,” Journal of the Royal Statistical Society, Series A, 1985,148:328341.
[16]陳會軍.詞匯密度與難易度感知:科學(xué)論文及其摘要的對比研究[J].外語與外語教學(xué),2003(4):5657.
[17]李小鳳.從詞匯密度看電視語體的階列[J].現(xiàn)代傳播,2010(12):164165.
[18]Halliday, M. Spoken and Written Language[M].Oxford: Oxford University Press, 1985.
[19]Ure, J. Lexical density and register differentiation[M]∥In G. Perren and J.L.M. Trim (eds), Applications of Linguistics.London: Cambridge University Press,1971:443452.
[20]宋婧婧.現(xiàn)代漢語口語詞研究:兼論對外漢語口語詞教學(xué)[D].北京:中國傳媒大學(xué),2011.
[21]蔡瑋.新聞類語篇研究的語體學(xué)意義[D].上海:復(fù)旦大學(xué),2004.
[22]Wardhaugh, Ronald. An introduction to sociolinguistics, 6th Edition Blackwell Publishing, 2010.
[23]Coats, J. Women, Men and Language: A Social Linguistic Account of Sex Differences. London: Longman, 1986.
[24]Romanine, S. Language in Society: An Introduction to Social linguistics[M]. London: Oxford University Press, 1994.
[25]許力生.話語風(fēng)格上的性別差異研究[J].外國語,1997(1):4348.
[26]Tannen, D. You just don’t understand: Women and men in conversation[M]. New York: William Morrow,2007.
[27]王宇波.基于網(wǎng)絡(luò)媒體監(jiān)測語料庫(漢語)的性別語言差異實證研究[D].武漢:華中師范大學(xué),2011.
[28]陸蕓.詞匯豐富性測量方法及計算機程序開發(fā):回顧與展望[J].南京工業(yè)大學(xué)學(xué)報:社會科學(xué)版,2012(2):104108.
[29]Dugast,D. Sur quoi se fonde la notion d’etendue theoretique du vocabulaire?[J]. Le Francais Moderne, 1978,46:2532.
[30]Tweedie,F(xiàn). R.Baayen. How variable may a constant be? Measures of lexical richness in perspective[J]. Computers the Humanities, 1998,32(5):323352.
[31]Vermeer, A. Coming to grips with lexical richness in spontaneous speech data. Language Testing, 2000,17(1):6583.
[32]Jarvis S. Short texts, bestfitting curves and new measures of lexical diversity[J]. Language Testing, 2002,19(1): 5784.
[33]McCarthy, P. M. An Assessment of the Range and Usefulness of Lexical Diversity Measures and the Potential of the Measure of Textual, Lexical Diversity (MTLD)[D]. Memphis Tennessee: University of Memphis Ph.D Dissertation, 2005:158.
[34]馬琰.漢語恭維語中的性別語言實證研究[J].商洛學(xué)院學(xué)報,2009(5):5762.
[35]王德春,孫汝建,姚遠.社會心理語言學(xué)[M].上海:上海外語教育出版社,1995:214.
(責(zé)任編輯文格)
Abstract:
The paper screens out 30 representative opinion leaders of Sina microblog through quantifying relevant indexes of microblog transmission, then builds a corpus by grasping original microblogs with more than 500,000 characters in order to analyze intergroup differences in aspects of lexical density, lexical variation, dispersion of parts of speech and activeness of microblogging between different occupations, education, ages as well as genders. The study finds out that identity characteristics of opinion leaders are closely associated with the features of their discourse transmission, and both relevant statistical data and research conclusions provides new media language monitoring, Internet censorship and opinion supervision with reference information.
Key words: new media; influence; lexical density; dispersion; activeness