亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        新浪微博與Twitter的特性對(duì)比研究

        2018-09-29 02:38:04秦海龍劉挺

        秦海龍 劉挺

        摘 要:隨著微博客服務(wù)的流行,越來(lái)越多的用戶(hù)在微博上用其在線(xiàn)賬號(hào)進(jìn)行交流,使真實(shí)世界的人們和微博中的用戶(hù)形成了一一映射。無(wú)論是新浪微博本身還是新浪微博中的用戶(hù)都有很多獨(dú)特的特性。本文利用新浪微博用戶(hù)關(guān)系網(wǎng)絡(luò)中的弱連接組件(Weakly Connected Component)對(duì)新浪微博的很多重要特性進(jìn)行了討論。同時(shí),又進(jìn)一步分析了新浪微博與Twitter在網(wǎng)絡(luò)結(jié)構(gòu)和同質(zhì)性方面的相同點(diǎn)和區(qū)別。與Twitter相比,新浪微博的關(guān)系分布指數(shù)不對(duì)稱(chēng),同質(zhì)性也更低,并且本次研究還在新浪微博中發(fā)現(xiàn)了中國(guó)用戶(hù)的“北漂”現(xiàn)象,這些都反映出中國(guó)社會(huì)和用戶(hù)獨(dú)有的特征。

        關(guān)鍵詞:社會(huì)特征; 社交網(wǎng)絡(luò)結(jié)構(gòu); 關(guān)系網(wǎng)絡(luò)分析

        Abstract: As the blooming of microblog services, users are favorable to communicate with each other using their virtual accounts. Therefore, the mapping between the real world and the social network is established through interactions among users on microblog. On Sina Weibo, there are many special features and distinct characteristics on the microblog platform, the user scale and the user habit. This paper aims to explore important properties and analyzes relationship networks on Sina Weibo using the Weakly Connected Component(0.12 billion users) of relationship networks as clues. The paper proposes similarities and differences of features between Twitter and Sina Weibo about network structures. Comparing with Twitter, the paper concludes that there are more asymmetric degree distributions, low reciprocity and the phenomenon of gathering toward Beijing and so on. Meanwhile, these properties can also implicate several characteristics of Chinese society and user habits.

        Key words: social characteristics; social network topology; relationship network analysis

        引言

        近年來(lái),多種類(lèi)型的社交網(wǎng)絡(luò)遍布全球,在這些社交網(wǎng)絡(luò)中,可以隨時(shí)隨地看到朋友和喜歡的明星發(fā)布的最新消息。和傳統(tǒng)媒體相比,社交網(wǎng)絡(luò)中信息的傳播速度要快很多,用戶(hù)可以用文本、圖片、地理位置等信息隨時(shí)分享身邊發(fā)生的事情。

        微博客是最流行社交網(wǎng)絡(luò)服務(wù)之一,簡(jiǎn)稱(chēng)微博,通常用戶(hù)在微博中的關(guān)注關(guān)系都是單向的。用戶(hù)可以在微博上關(guān)注任何人,用戶(hù)發(fā)布的信息也可以被追隨支持其本人的所有粉絲看到[1]。目前為止,有上億用戶(hù)每天在微博中發(fā)布信息、同時(shí)關(guān)注著各類(lèi)好友,其中包括很多名人、媒體、政府機(jī)構(gòu)等,因此用戶(hù)在和朋友交流的同時(shí)還可以閱讀大量的新聞。全球范圍來(lái)看,Twitter是最大的微博客服務(wù),在中國(guó),新浪微博則是最流行的微博服務(wù)。在2012年的全球移動(dòng)互聯(lián)網(wǎng)大會(huì)上,新浪微博官方宣布旗下的用戶(hù)已經(jīng)超過(guò)了3億。

        大量的新浪微博用戶(hù)在互聯(lián)網(wǎng)中形成了各種社區(qū),用戶(hù)在線(xiàn)上的很多關(guān)系和線(xiàn)下的真實(shí)社交關(guān)系保持一致,比如同學(xué)、同事等。另外,用戶(hù)發(fā)布的微博也可以反映用戶(hù)的個(gè)人興趣。因此可以通過(guò)分析微博中的社交關(guān)系來(lái)總結(jié)一些社會(huì)因素。這種方法不僅比傳統(tǒng)社會(huì)研究方法收集數(shù)據(jù)的速度更顯快捷,而且通過(guò)研究還可以提取得到微博中的一些獨(dú)特性質(zhì)。

        學(xué)術(shù)界已經(jīng)針對(duì)微博客服務(wù)開(kāi)展了大量研究,特別是基于Twitter平臺(tái)的研究。這些研究重點(diǎn)分析Twitter中的用戶(hù)網(wǎng)絡(luò)結(jié)構(gòu)以及結(jié)構(gòu)屬性對(duì)用戶(hù)行為的影響。一些研究對(duì)比了新浪微博和Twitter的特性,但是Twitter中很多獨(dú)有特性卻并未在新浪微博中得到充分的驗(yàn)證和分析。中西方的文化不同導(dǎo)致了2種微博客服務(wù)中的關(guān)系網(wǎng)絡(luò)也存在一定差異,理解這些差別是新浪微博中用戶(hù)分析和社會(huì)化營(yíng)銷(xiāo)的基礎(chǔ)。本文分析了新浪微博中的大規(guī)模用戶(hù)網(wǎng)絡(luò),總結(jié)了新浪微博和Twitter在網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上的差別,同時(shí)也進(jìn)一步分析了導(dǎo)致這些差別的原因,而且這些差別也可以反映中國(guó)用戶(hù)的很多特性。本次研究的數(shù)據(jù)集中包括1.2億新浪微博用戶(hù),這個(gè)數(shù)據(jù)規(guī)模遠(yuǎn)遠(yuǎn)大于已有的Twitter和新浪微博相關(guān)研究的數(shù)據(jù)量,所以本文的最終結(jié)論更能反映出新浪微博的真實(shí)特性,而且,大規(guī)模數(shù)據(jù)也能夠保證新浪微博中的用戶(hù)多樣性。

        1 相關(guān)工作

        近年來(lái),關(guān)于社交網(wǎng)絡(luò)中拓?fù)浣Y(jié)構(gòu)的相關(guān)研究已成為學(xué)界焦點(diǎn)。Newman歸納了學(xué)術(shù)網(wǎng)絡(luò)中一些獨(dú)有的結(jié)構(gòu)特性[2-3]。Donato分析了萬(wàn)維網(wǎng)的結(jié)構(gòu)特征[4],Holme對(duì)一家在線(xiàn)約會(huì)網(wǎng)站中網(wǎng)絡(luò)結(jié)構(gòu)隨時(shí)間的變化進(jìn)行了討論[5]。Liben-Nowell為社交網(wǎng)絡(luò)中的用戶(hù)行為建立了理論模型[6],Ahn則深入剖析了Cyworld、MySpace和Orkut中的網(wǎng)絡(luò)屬性[7]。而且,Alan又將社交網(wǎng)絡(luò)的結(jié)構(gòu)與其它類(lèi)型的網(wǎng)絡(luò)設(shè)計(jì)提出了應(yīng)用比較,這項(xiàng)工作的主要平臺(tái)是Orkut、YouTube和Flickr,并不包括微博客服務(wù)[8]。文獻(xiàn)[9]探討了Twitter中用戶(hù)的增長(zhǎng)率和用戶(hù)分布,并用HITS算法對(duì)用戶(hù)進(jìn)行了分類(lèi)。而且文獻(xiàn)[1]還分析了Twitter中的網(wǎng)絡(luò)結(jié)構(gòu)和用戶(hù)特征,包括關(guān)注人數(shù)量、粉絲數(shù)量和微博數(shù)的關(guān)系,也研究了微博的轉(zhuǎn)發(fā)特征。

        新浪微博引發(fā)使用熱潮后,與其有關(guān)的研究工作也在不斷涌現(xiàn)。Louis對(duì)比了Twitter和新浪微博的文本內(nèi)容[10],同時(shí)還高效甄別了新浪微博中的一些虛假賬號(hào)[11]。文獻(xiàn)[12]闡述了2個(gè)微博客服務(wù)中訪(fǎng)問(wèn)行為的不同點(diǎn),文獻(xiàn)[13]則比較了2種微博客服務(wù)中不同的功能。然而,新浪微博中很多可以表征中國(guó)用戶(hù)習(xí)慣的重要特性并未得到應(yīng)有重視和充分分析。

        2 數(shù)據(jù)采集

        如文獻(xiàn)[8]描述的那樣,獲得一個(gè)社交網(wǎng)絡(luò)的全網(wǎng)數(shù)據(jù)并不現(xiàn)實(shí)。為此,研究爬取了新浪微博中用戶(hù)關(guān)系網(wǎng)絡(luò)中的弱連接組件(Weakly Connected Component,WCC)來(lái)代替全網(wǎng)數(shù)據(jù)。新浪微博的WCC包含123 683 313名用戶(hù)和與其對(duì)應(yīng)的個(gè)人資料以及好友列表,在此基礎(chǔ)上也特別證明了未包括在WCC之中的用戶(hù)并不是新浪微博的活躍用戶(hù),當(dāng)然缺少這些用戶(hù)就不會(huì)對(duì)分析結(jié)果產(chǎn)生影響。

        由于新浪微博API的限制,研究中只能獲取每個(gè)用戶(hù)的最后5 000個(gè)粉絲,為了提供現(xiàn)實(shí)完整數(shù)據(jù),同時(shí)還獲取了用戶(hù)的關(guān)注者信息,后者可以反過(guò)來(lái)對(duì)用戶(hù)粉絲進(jìn)行補(bǔ)全。

        其后,即隨機(jī)選擇了10 000個(gè)用戶(hù)ID來(lái)驗(yàn)證數(shù)據(jù)中的用戶(hù)完全性,結(jié)果顯示將近一半的用戶(hù)已在本文提取的數(shù)據(jù)集中,而且又繼續(xù)分析了那些不在數(shù)據(jù)集中的用戶(hù)ID,結(jié)果表明其中的絕大多數(shù)均為不活躍用戶(hù)。

        3 用戶(hù)關(guān)系與用戶(hù)資料分析

        共有123 683 313名用戶(hù)在本文研究的數(shù)據(jù)集中,不是每名用戶(hù)都有完整的資料,以下分析中即挑選了具有相對(duì)完整資料的用戶(hù)。

        3.1 關(guān)注好友與粉絲

        研究時(shí),獲得了新浪微博WCC中用戶(hù)的所有關(guān)注好友和粉絲,新浪微博中每名用戶(hù)的關(guān)注人數(shù)上限為2 000。圖1為關(guān)注用戶(hù)的累積概率分布曲線(xiàn),結(jié)果表明用戶(hù)人數(shù)和其關(guān)注的人數(shù)是呈反比的。其中,69.5%的用戶(hù)的關(guān)注數(shù)量多于10個(gè)人。將近30%的用戶(hù)為不活躍用戶(hù),并且只關(guān)注很少的幾個(gè)好友。

        另外,僅僅27%的用戶(hù)關(guān)注了超過(guò)50個(gè)好友,是關(guān)注好友超過(guò)100個(gè)的人數(shù)的2倍。關(guān)注好友超過(guò)100人的用戶(hù)明顯減少,這表明大多數(shù)用戶(hù)的關(guān)注好友均將少于100,很多用戶(hù)只是關(guān)注現(xiàn)存的真實(shí)好友和一些權(quán)威媒體。

        圖2為用戶(hù)粉絲的累積概率分布曲線(xiàn),可以看出,用戶(hù)數(shù)量和其粉絲數(shù)量是呈反比的,這說(shuō)明新浪微博的大多數(shù)用戶(hù)都是草根用戶(hù),權(quán)威用戶(hù)和名人只占很少的一部分。只有0.08%的用戶(hù)粉絲超過(guò)了1萬(wàn),只有9個(gè)人的粉絲數(shù)超過(guò)了1 000萬(wàn)。

        新浪微博中的關(guān)注好友和粉絲好友都符合冪律分布,并且微博中的關(guān)系網(wǎng)絡(luò)都屬于無(wú)標(biāo)度網(wǎng)絡(luò)。關(guān)注好友分布的冪指數(shù)為1.574,粉絲好友分布擬合曲線(xiàn)的冪指數(shù)為1.041。與此同時(shí)又計(jì)算了數(shù)據(jù)集中認(rèn)證用戶(hù)的2個(gè)好友分布,結(jié)果和上面2個(gè)冪指數(shù)保持一致。由此則說(shuō)明了一些認(rèn)證用戶(hù)的關(guān)注好友也遠(yuǎn)遠(yuǎn)多于粉絲。

        3.2 互粉率

        有針對(duì)性地,研究又設(shè)計(jì)對(duì)比了新浪微博和Twitter的用戶(hù)互粉率,一個(gè)用戶(hù)的互粉率為互粉好友占關(guān)注好友和粉絲好友的比例。為此研究分析了95 489 041名用戶(hù)的互粉好友,結(jié)果如圖3所示,用戶(hù)數(shù)隨著互粉率的增多而迅速下降。新浪微博中的用戶(hù)互粉率只有17.30%,說(shuō)明了大部分社交關(guān)系都是單向關(guān)系。

        3.3 同質(zhì)性

        文獻(xiàn)[1]指出社交網(wǎng)絡(luò)中的互粉好友都存在一定的同質(zhì)性,本文在新浪微博中也證明了這一結(jié)論,具體可如圖4、圖5所示。

        由圖4、圖5可知,這2個(gè)圖表明了用戶(hù)的好友數(shù)量(關(guān)注和粉絲)與其互粉好友的朋友數(shù)量是正相關(guān)的。這表明對(duì)于一個(gè)擁有很多好友的用戶(hù)來(lái)說(shuō),該人的朋友也擁有很多好友。就是說(shuō),新浪微博中好友之間的社會(huì)地位是相似的。

        3.4 地理分布

        由表1所示,通過(guò)所有用戶(hù)的地理信息可以看出,發(fā)達(dá)地區(qū)的用戶(hù)要遠(yuǎn)遠(yuǎn)多于不發(fā)達(dá)地區(qū)的用戶(hù),沿海地區(qū)的用戶(hù)數(shù)量明顯多于內(nèi)陸地區(qū),東部的用戶(hù)數(shù)量明顯多于西部(“其它”為省份不明)。新浪微博的這種性質(zhì)反映出中國(guó)整體的經(jīng)濟(jì)發(fā)展?fàn)顩r。其中,用戶(hù)最多的省份為廣東省。

        此外,研究也對(duì)海外用戶(hù)進(jìn)行了分析,統(tǒng)計(jì)中僅占新浪微博全部用戶(hù)的5%左右,表2為這些海外用戶(hù)地理位置的排名。可以看出亞洲國(guó)家的用戶(hù)相對(duì)較多,并且發(fā)達(dá)國(guó)家的用戶(hù)明顯多于發(fā)展中國(guó)家。

        綜上可知,通過(guò)用戶(hù)的地理信息發(fā)現(xiàn)了新浪微博好友之間具有很強(qiáng)的地理同質(zhì)性,根據(jù)用戶(hù)互粉好友依照省份的排序來(lái)看,互粉好友省份第一的地理位置跟用戶(hù)的省份相同,海外用戶(hù)的互粉好友大多也都在海外。有趣的是,各個(gè)省份用戶(hù)互粉好友地理位置排名第二位的都是北京(北京用戶(hù)互粉好友排名第一地理位置為北京)。這就說(shuō)明用戶(hù)與其互粉好友具有很強(qiáng)的地理同質(zhì)性,同時(shí)可以看出,大量的用戶(hù)從全國(guó)各地到北京學(xué)習(xí)和工作,這種同質(zhì)性可以體現(xiàn)出中國(guó)的大城市聚集現(xiàn)象(北漂)。

        4 新浪微博與Twitter對(duì)比

        盡管新浪微博與Twitter都屬于微博客服務(wù),但是用戶(hù)習(xí)慣導(dǎo)致了二者之間還是呈現(xiàn)很大的區(qū)別。研究中總結(jié)了這些主要區(qū)別,最終設(shè)計(jì)結(jié)果可見(jiàn)表3。

        新浪微博的好友分布的2個(gè)冪指數(shù)比傳統(tǒng)網(wǎng)絡(luò)和其它社交網(wǎng)絡(luò)都要小[8-9],說(shuō)明了研究選取數(shù)據(jù)集中的用戶(hù)分布更加均勻。在Twitter中,關(guān)注好友和粉絲好友的分布冪指數(shù)是一樣的,而新浪微博中關(guān)注好友的冪指數(shù)更大,這是由新浪微博中2 000人的關(guān)注上限導(dǎo)致的,而粉絲數(shù)量是沒(méi)有上限的,所以關(guān)注好友分布的擬合曲線(xiàn)更加陡峭。而Twitter對(duì)關(guān)注和粉絲都沒(méi)有設(shè)置上限。通過(guò)結(jié)果,還并行分析了新浪微博中的互粉率要低于Twitter,同質(zhì)性方面,新浪微博更加突出了中國(guó)用戶(hù)的大城市聚集現(xiàn)象。

        5 結(jié)束語(yǔ)

        本文用新浪微博中用戶(hù)網(wǎng)絡(luò)的弱連接組件對(duì)用戶(hù)的行為進(jìn)行了分析,由于本次研究的數(shù)據(jù)集遠(yuǎn)遠(yuǎn)大于已有工作,所以文中的分析結(jié)果更能代表新浪微博中用戶(hù)的真實(shí)特性。

        本文證明了新浪微博的用戶(hù)關(guān)系網(wǎng)絡(luò)為無(wú)尺度網(wǎng)絡(luò),相對(duì)于Twitter的互粉率較低,并且可以體現(xiàn)出地域同質(zhì)性和中國(guó)的大城市聚集現(xiàn)象。新浪微博的國(guó)內(nèi)用戶(hù)更多地分布在發(fā)達(dá)地區(qū),海外用戶(hù)占比大約5%左右。

        同時(shí),一般社交網(wǎng)絡(luò)用戶(hù)的關(guān)注和粉絲分布的冪指數(shù)相當(dāng),而由于新浪微博對(duì)關(guān)注好友設(shè)置了上限,所以關(guān)注好友的冪指數(shù)相對(duì)較大。

        在今后的工作中,將會(huì)對(duì)新浪微博的文本和社區(qū)展開(kāi)后續(xù)深入研究,嘗試發(fā)現(xiàn)更多有價(jià)值的用戶(hù)性質(zhì)。

        參考文獻(xiàn)

        [1] HAEWOON K, CHANGHYUN L, HOSUNG P, et al. What is Twitter, a social network or a news media [C]//Proceedings of ACM International Conference on WWW. Raleigh:ACM, 2010: 591-600.

        [2] NEWMAN M E J. Scientific collaboration networks. I. Network construction and fundamental results[J]. Physical Review E, 2001, 64:016131/1-016131/8.

        [3] NEWMAN M E J, PARK J. Why social networks are different from other types of networks[J]. Physical Review E, 2003, 68:031622/1-031622/9.

        [4] DONATO D, LAURA L, LEONARDI S, et al. Large scale properties of the webgraph[J]. European Physical Journal B, 2004, 38:239-243.

        [5] HOLME P, EDLING C, LILJEROS F. Structure and time evolution of an Internet dating community[J]. Social Networks, 2004, 26:155-174.

        [6] LIBEN-NOWELL D, NOVAK J, KUMAR R, et al. Geographic routing in social networks[J]. Proceedings of the National Academy of Sciences, 2005, 102(33):11623-11628.

        [7] AHN Y, HAN S, KWAK S, et al. Analysis of topological characteristics of huge online social networking services[C] //Proceedings of ACM International Conference on WWW. Banff:ACM, 2007: 835-844.

        [8] ALAN M, MASSIMILIANO M, KRISHNA P, et al. Measurement and analysis of online social networks[C] //Proceedings of the 7th ACM SIGCOMM Conference on Internet measurement. San Diego:ACM, 2007: 29-42.

        [9] AKSHAY J, XIAODAN S, TIM F, et al. Why we Twitter: Understanding microblogging usage and communities[C] //Proceedings of Joint 9th WEBKDD and 1st SNAKDD Workshop ′07. New York:ACM, 2007: 56-65.

        [10]LOUIS Y, SITARAM A, HUBER MAN B A. What trends in Chinese social media[C]//Proceedings of the 5th SNAKDD Workshop'11. San Diego:ACM, 2011:1-10.

        [11]LOUIS Y, SITARAM A, HUBERMAN B A. Artificial inflation: The true story of trends in Sina Weibo[J]. arXiv preprint arXiv: 1202.0327,2012.

        [12]QI G, FABIAN A, GEERT-JAN H, et al. A comparative study of users' microblogging behavior on Sina Weibo and Twitter[C]//Proceedings of International Conference on User Modeling and Personalization. Montreal:ACM, 2012: 88-101.

        [13]CHEN Shaoyong, ZHANG Huanmin, LIN Min, et al. Comparision of microblogging service between Sina Weibo and Twitter[C]//International Conference on Computer Science and Network Technology. Harbin:IEEE, 2011: 2259-2263.

        国产麻无矿码直接观看| av影院手机在线观看| 亚洲精品国精品久久99热| 国产超碰人人模人人爽人人喊| 连续高潮喷水无码| 日本高清无卡一区二区三区| 久久久久久久久无码精品亚洲日韩 | 蜜臀aⅴ永久无码一区二区| 黄色潮片三级三级三级免费| 国产精品久久精品第一页| 国产啪精品视频网站| 最新欧美一级视频| 亚洲一区二区三区熟妇| 蜜臀av色欲a片无码精品一区| 国产精品国产三级国av| 久久中文字幕久久久久91| 日韩高清不卡一区二区三区| 东北老女人高潮大喊舒服死了| 欧美一级三级在线观看| 日韩精品一二区在线视频| 日韩精品视频久久一区二区 | 亚洲av日韩一卡二卡| 日韩欧美人妻一区二区三区| 国产又色又爽又刺激视频 | 亚洲精品一区网站在线观看| 九一精品少妇一区二区三区| 夜夜春亚洲嫩草影院| 亚洲AV日韩AV永久无码电影| 亚洲av网站首页在线观看| 日本一区二区三级在线观看| 少妇无码太爽了不卡视频在线看| 国产亚洲精品福利在线| 亚洲精品中文字幕91| 正在播放强揉爆乳女教师| 亚洲欧美日韩中文天堂| 亚洲一区久久久狠婷婷| 天天做天天爱夜夜爽毛片毛片 | 精品人妻中文字幕一区二区三区| 中文字幕亚洲乱码熟女1区| 国产精品18久久久久久麻辣| 粉嫩高中生无码视频在线观看|