徐 翔,敖子棋,史靜遠(yuǎn),王曉虹
1.同濟(jì)大學(xué) 藝術(shù)與傳媒學(xué)院,上海 200092
2.復(fù)旦大學(xué) 新聞學(xué)院,上海 200433
信息繭房(information cocoons)的相關(guān)理論最早由桑斯坦[1]8提出,該理論認(rèn)為用戶會(huì)因選擇性心理使自己桎梏于如蠶繭一般的屏障中,與外界多樣化信息隔絕。這一效應(yīng)被認(rèn)為是用戶在媒介個(gè)性化使用上的高度自治化帶來(lái)的副作用。學(xué)者們提到信息“繭房”時(shí),往往都會(huì)談及信息偏食導(dǎo)致的視野局限。長(zhǎng)此以往,深陷“繭房”窠巢之中的用戶會(huì)因偏食形成某種狹隘的價(jià)值觀和認(rèn)知結(jié)構(gòu),導(dǎo)致其發(fā)布的帖文在“繭房”內(nèi)呈現(xiàn)出同質(zhì)化、極端化傾向。然而,跳出個(gè)體“繭房”,甚至群體圈層之外,把目光放遠(yuǎn)到整個(gè)網(wǎng)絡(luò)社會(huì)層面時(shí),用戶生產(chǎn)的信息內(nèi)容的“繭房”到底是異質(zhì)化還是同質(zhì)化的?盡管這一問(wèn)題還存在爭(zhēng)論,但一般認(rèn)為,隨著“繭房”程度的加深,要么每個(gè)個(gè)體內(nèi)容生產(chǎn)中的“繭房”是趨異化而非趨同的,要么認(rèn)為用戶生產(chǎn)內(nèi)容時(shí)本就容易隨機(jī)地陷入各種細(xì)分性、差異性的“繭房”因而不存在“繭房程度越深就越趨同”的問(wèn)題。
本文提出并加以實(shí)證檢驗(yàn)的核心觀點(diǎn)是:在社交網(wǎng)絡(luò)的內(nèi)容生產(chǎn)中,隨著用戶所生產(chǎn)的信息內(nèi)容的“繭房”程度的加深,各“繭房”之間是彼此趨同化而非趨異化的,用戶在朝向“同出一轍”的“繭房”發(fā)生趨同,而非朝向“千人千面”的“繭房”產(chǎn)生趨異。這個(gè)觀點(diǎn)似乎并不符合直觀經(jīng)驗(yàn),也和一般關(guān)于“信息繭房”“過(guò)濾氣泡”等的觀點(diǎn)都存在差異。本文將基于典型社交媒體之一的新浪微博樣本,對(duì)于“個(gè)體所陷入的‘繭房’是越長(zhǎng)越像而非各有不同”的觀點(diǎn),從三個(gè)關(guān)鍵子假設(shè)及其內(nèi)部關(guān)系進(jìn)行考察與檢驗(yàn)。
在生活中,人們常常會(huì)主動(dòng)接觸、閱讀、點(diǎn)擊和發(fā)布與自己興趣偏好符合的內(nèi)容,導(dǎo)致自己陷入信息窄化和認(rèn)知狹隘的風(fēng)險(xiǎn)之中,這一現(xiàn)象在學(xué)界受到了廣泛關(guān)注。目前,國(guó)內(nèi)外學(xué)界對(duì)于信息“繭房”的研究主要從選擇性接觸、信息窄化、群體極化、政治偏見(jiàn)、種族主義、媒介素養(yǎng)等角度進(jìn)行探索,與之密切相關(guān)的概念還有“回音室”效應(yīng)(echo chambers)、“過(guò)濾氣泡”(filter bubble)等。信息“繭房”強(qiáng)調(diào)個(gè)體選擇,“回音室”效應(yīng)強(qiáng)調(diào)群體封閉,而“過(guò)濾氣泡”則回應(yīng)了目前正被學(xué)術(shù)界熱議的說(shuō)法,即算法技術(shù)加劇了信息“繭房”的產(chǎn)生和泛化。在實(shí)踐中,這三者的研究本質(zhì)上都可以歸結(jié)于“網(wǎng)絡(luò)信息同質(zhì)化”[2]。Kossinets等[3]都認(rèn)可同圈層內(nèi)興趣愛(ài)好一致的用戶會(huì)逐漸趨同,社交網(wǎng)絡(luò)中的個(gè)體之間存在著一種同質(zhì)性的關(guān)系。
用戶內(nèi)容生產(chǎn)的信息“繭房”到底是同質(zhì)化的還是異質(zhì)化的呢?現(xiàn)有研究對(duì)兩方面均有涉及,但支持信息“繭房”的異質(zhì)化觀點(diǎn)較多。Web 2.0時(shí)代媒體權(quán)力的下放和消解讓用戶更加主動(dòng)地參與到傳播的各個(gè)鏈路當(dāng)中,用戶的互動(dòng)特征突出呈現(xiàn)出其在信息消費(fèi)中的能動(dòng)性,自媒體用戶生產(chǎn)內(nèi)容(user-generated content,UGC)和網(wǎng)絡(luò)微名人(micro-celebrity)的出現(xiàn)描繪出更平民化的“人人皆媒體”的傳播圖景。許多研究者認(rèn)為和以前相比,人們所閱讀、接收、發(fā)布和討論的信息內(nèi)容大大擴(kuò)增,又由于不同個(gè)體的興趣愛(ài)好并不一致,其感興趣的議題也并不相同,所以在信息“繭房”等效應(yīng)的影響下,公眾輿論呈現(xiàn)出分眾化、圈層化和異質(zhì)化的傳播格局。如Alstyne等[4]認(rèn)為同質(zhì)化的小社群之間的溝通導(dǎo)致圈層內(nèi)的專業(yè)化,導(dǎo)致跨群組交流異常困難,群組間逐漸趨異;湯景泰等[5]認(rèn)為分散的社交媒體用戶會(huì)在興趣、身份認(rèn)同、政治立場(chǎng)等因素的驅(qū)使下形成多個(gè)交流的圈層,“因圈層的排斥性與防御性較強(qiáng)、他者信息流通不暢,可能形成‘回音室’”。姚文康[6]認(rèn)為,信息“繭房”導(dǎo)致群體因?yàn)槿鄙佼愘|(zhì)觀點(diǎn)的接觸而呈現(xiàn)出異質(zhì)性。
從表面上看,流動(dòng)的、消除確定性的網(wǎng)絡(luò)技術(shù)邏輯,確實(shí)可能在互聯(lián)網(wǎng)早期階段導(dǎo)致用戶內(nèi)容生產(chǎn)的異質(zhì)化和分散化。然而也有研究認(rèn)為用戶“繭房”之間具有同質(zhì)化趨向,支持這一觀點(diǎn)的研究主要從信息同質(zhì)化和群體因素兩部分進(jìn)行討論。前者的相關(guān)研究主要認(rèn)為信息同質(zhì)化會(huì)間接影響用戶的價(jià)值認(rèn)同,進(jìn)而促進(jìn)“繭房的同質(zhì)化”[7]。一是指出信息發(fā)布環(huán)節(jié)的內(nèi)容同質(zhì)化。如Pinto 等[8]通過(guò)實(shí)證檢驗(yàn)發(fā)現(xiàn),媒體議程和公共議程相互影響,并且存在媒體框架設(shè)置等問(wèn)題導(dǎo)致公共議程的單一化。Nechushtai 等[9]在近期對(duì)氣候報(bào)道的研究中發(fā)現(xiàn),新聞議程仍然受幾家主要媒體控制,來(lái)自他們的信息會(huì)被各網(wǎng)絡(luò)平臺(tái)重點(diǎn)推薦,“即使對(duì)有不同內(nèi)容傾向的用戶,過(guò)濾氣泡仍會(huì)分發(fā)給他們相似的內(nèi)容”。Lee[10]發(fā)現(xiàn)社交網(wǎng)絡(luò)中博客議程和主流媒體議程的趨同化。宋建武等[11]從垂直互文性和水平互文性兩個(gè)維度分析了微信新聞公眾號(hào)所呈現(xiàn)出的同質(zhì)化表征。傳統(tǒng)的業(yè)界規(guī)矩和慣習(xí)形成了小媒體、自媒體在內(nèi)容篩選上向大媒體看齊的現(xiàn)象,加劇同質(zhì)化信息在各家傳統(tǒng)媒體上的流行,導(dǎo)致用戶在接收信息時(shí)潛移默化地形成某種趨同化的認(rèn)知結(jié)構(gòu),進(jìn)而影響到其發(fā)布帖文的傾向。二是一定程度上涉及社交媒體中的“繭房”同質(zhì)化現(xiàn)象。有學(xué)者提出社交網(wǎng)站對(duì)成員的“顯式行為矯正與規(guī)訓(xùn)”[12],即同一社交網(wǎng)絡(luò)平臺(tái)具有某種共通的溝通標(biāo)準(zhǔn),導(dǎo)致用戶的內(nèi)容生產(chǎn)并未呈現(xiàn)任意和自由多樣的演進(jìn)形態(tài),而是趨向于和該平臺(tái)保持一致。由此可進(jìn)一步推論,這種社交網(wǎng)絡(luò)的潛在規(guī)約很有可能讓用戶內(nèi)容生產(chǎn)的多樣性減少,并使得各用戶內(nèi)容趨于某種共同特征和具有相通性的束縛之中。三是認(rèn)為算法技術(shù)導(dǎo)致“繭房”趨同化,推薦系統(tǒng)加劇信息同質(zhì)化。如Hosanagar 等[13]認(rèn)為,算法推薦雖然在一定程度上強(qiáng)化了小眾興趣愛(ài)好群體的娛樂(lè)需求,使用戶形成一個(gè)個(gè)分散的小眾群體,但是在整體上用戶的消費(fèi)內(nèi)容會(huì)越來(lái)越相似,并且逐步趨近于一個(gè)整體,“個(gè)性化并沒(méi)有把網(wǎng)絡(luò)分裂成一個(gè)個(gè)孤立的小‘繭房’,它雖是一種幫助用戶擴(kuò)大興趣的工具,但又使得人們的消費(fèi)興趣變得與他人更相似”。延展到信息消費(fèi)領(lǐng)域這一觀點(diǎn)也得到印證。Airoldi 等[14]對(duì)UGC 平臺(tái)“推薦觀看”音樂(lè)視頻之間的關(guān)聯(lián)網(wǎng)絡(luò)的研究表明,網(wǎng)絡(luò)平臺(tái)基于用戶最頻繁的共同瀏覽量來(lái)關(guān)聯(lián)和推薦相似視頻,從而塑造出一個(gè)彼此關(guān)聯(lián)的視頻集群,結(jié)果表明這些集群具有很強(qiáng)的內(nèi)容同質(zhì)性。
群體因素對(duì)“繭房”同質(zhì)化研究也十分重要,這部分研究大多從用戶在群體中的印象管理、風(fēng)險(xiǎn)感知、利益感知等心理層面探討其發(fā)布信息時(shí)的同質(zhì)化傾向。一是出于社交網(wǎng)絡(luò)中自我形象管理的需要而選擇趨同化。如Pedroni等[15]發(fā)現(xiàn)隨著好友數(shù)量的增加,人們傾向于更多地與所有人都感興趣的內(nèi)容交互,以保護(hù)自己的形象。Hasen 等[16]165-179對(duì)Facebook 用戶內(nèi)容生產(chǎn)的研究表明,人們傾向于選擇多數(shù)人都感興趣的內(nèi)容進(jìn)行交互,以此凸顯個(gè)人身份中受大多數(shù)好友欣賞的部分,以保護(hù)或提升自己在社交平臺(tái)的形象。二是出于群體內(nèi)感知到的壓力使得用戶選擇與群體保持一致。Su 等[17]研究發(fā)現(xiàn)人們通常通過(guò)觀察性學(xué)習(xí)行為更新和表達(dá)自己的觀點(diǎn),所以通常在發(fā)聲時(shí)會(huì)受到輿論的影響而修改自我的意見(jiàn)。Jun 等[18]測(cè)試了在社交網(wǎng)絡(luò)平臺(tái)上感知他人的存在是如何影響個(gè)人評(píng)估信息的方式的。Mcewan 等[19]還提出了“自我涉入程度(ego-involvement)”的概念,認(rèn)為在特定議題的討論中尋求與自己一致觀點(diǎn)的群體的行為,會(huì)表現(xiàn)出個(gè)體對(duì)于某一問(wèn)題的自我涉入程度,并且參與群體的時(shí)間越長(zhǎng),該值越高。三是發(fā)現(xiàn)了用戶感知到社交網(wǎng)絡(luò)平臺(tái)的特點(diǎn)后主動(dòng)趨同的行為。Mikal 等[20]發(fā)現(xiàn)網(wǎng)民受到公開(kāi)溝通行為標(biāo)準(zhǔn)的顯式行為矯正,即在網(wǎng)站中存在著一種公開(kāi)的溝通行為標(biāo)準(zhǔn),用戶會(huì)不約而同地遵守這一標(biāo)準(zhǔn),相應(yīng)地修改自己的內(nèi)容,使之趨同于網(wǎng)站內(nèi)容。后續(xù)的研究還發(fā)現(xiàn),匿名條件下的網(wǎng)絡(luò)用戶在受到與群體顯著社會(huì)身份一致的行為期望時(shí),更有可能表現(xiàn)出符合群體規(guī)范的行為。總體而言,這些研究對(duì)本文具有啟發(fā)作用,但仍存在巨大的挖掘空間:他們大多未能跳脫出群體內(nèi)的視角來(lái)探討更廣闊的網(wǎng)絡(luò)社會(huì)層面下,群體因素對(duì)“繭房”同質(zhì)化的影響。實(shí)際上,網(wǎng)絡(luò)社會(huì)是一個(gè)具有主流價(jià)值觀、社會(huì)心態(tài)和情感結(jié)構(gòu)的大群體,在這個(gè)社會(huì)群體的互動(dòng)中,人們通常會(huì)受到上述因素的影響而更新和表達(dá)自己的觀點(diǎn),從而體現(xiàn)出在內(nèi)容發(fā)布上的趨同特征。
許多研究都論證了同質(zhì)化程度越高的信息環(huán)境中,越能夠形成具有高熱度、高流量的社會(huì)中心議題。比如Nikolov 等[21]發(fā)現(xiàn)社交網(wǎng)絡(luò)平臺(tái)呈現(xiàn)出高水平的流行度和同質(zhì)化偏向。他們通過(guò)量化兩個(gè)概念得出結(jié)論:一是同質(zhì)性偏向,即用戶從狹窄的信息源中消費(fèi)內(nèi)容的趨勢(shì);二是流行性偏向,即熱門新聞內(nèi)容的選擇性曝光程度。通過(guò)實(shí)證分析發(fā)現(xiàn),這兩個(gè)概念具有一定的相關(guān)關(guān)系。Qin 等[22]認(rèn)為社交網(wǎng)絡(luò)的一大特征是同質(zhì)驅(qū)動(dòng)性(homophily-driven)。由于社會(huì)信息的擴(kuò)散是盲目隨機(jī)的,所以越是同質(zhì)化的信息交流環(huán)境,越容易形成傳播廣、熱度高的社會(huì)議題。Scheufele 等[23]認(rèn)為現(xiàn)代社會(huì)的信息是通過(guò)大量讀者評(píng)論、Facebook 上的“點(diǎn)贊”以及某篇報(bào)道被“轉(zhuǎn)發(fā)”等方式進(jìn)行傳播的,這導(dǎo)致社交網(wǎng)絡(luò)呈現(xiàn)出一種趨同化的、群體性偏好的內(nèi)容取向。
區(qū)別于傳統(tǒng)媒介,社交媒體平臺(tái)是各類偶發(fā)性信息和意見(jiàn)交換的空間,用戶被與熟人網(wǎng)絡(luò)不同的“弱連接”方式聯(lián)結(jié)起來(lái)?;谶@樣的傳播邏輯,試圖發(fā)現(xiàn)這種社會(huì)中心議題的研究主要從用戶特征和環(huán)境特點(diǎn)的角度開(kāi)展。Fletcher等[24]發(fā)現(xiàn)即使用戶的自我選擇權(quán)力變大,他們還是會(huì)選擇(或是“偶遇”)被多數(shù)人關(guān)注的“主流信息”。Bar-Gill 等[25]總結(jié)了對(duì)“回音室”敏感的人群的主要特點(diǎn),一是在搜索過(guò)程中很少進(jìn)行探索,二是在內(nèi)容選擇上注重其流行程度。故陷入“繭房”程度越深的用戶,所接收的信息內(nèi)容也越流行、越多人關(guān)注、處于社會(huì)輿論場(chǎng)越中心的議題,其發(fā)布的信息也越貼合這些議題。所以,Lee[26]認(rèn)為盡管信息渠道是多樣化的,但人們?nèi)钥赡茉谥髁髅襟w和互聯(lián)網(wǎng)新聞媒體上接收相當(dāng)穩(wěn)定的信息。
對(duì)于互聯(lián)網(wǎng)環(huán)境特點(diǎn),相關(guān)研究突出了對(duì)這種演變機(jī)制的討論,主要從組織傳播、網(wǎng)絡(luò)結(jié)構(gòu)和社會(huì)共識(shí)等角度展開(kāi)探索。程士安等[27]認(rèn)為信息“繭房”是信息聚合、共識(shí)達(dá)成的現(xiàn)代社會(huì)組織的最小單位,它具備Web 2.0時(shí)代下網(wǎng)絡(luò)組織關(guān)系的“紐帶”和“鎖扣”特征。在生活中,具備該特征的信息“繭房”以驚人的速度吸引、聚合、黏著同類信息需求的人群,通過(guò)某一信息的多次共享編碼與解碼的過(guò)程,形成相似的子“繭房”,“最終在特定的大‘繭房’平臺(tái)上交流并達(dá)成共識(shí)”。子“繭房”之間的這種黏合性,實(shí)際上表現(xiàn)為前文所論述的用戶生產(chǎn)內(nèi)容的同質(zhì)性,所謂的大“繭房”也就是社交媒體平臺(tái)上對(duì)于某一熱門議題的集中討論。從這一觀點(diǎn)出發(fā),似乎可以認(rèn)為,社交媒體上的用戶都在有序地朝向某一大“繭房”所在的中心節(jié)點(diǎn)趨近。從網(wǎng)絡(luò)結(jié)構(gòu)的角度出發(fā),有研究發(fā)現(xiàn)“信息窄化下的社交網(wǎng)絡(luò)呈現(xiàn)出星形結(jié)構(gòu)”[28],中心節(jié)點(diǎn)的影響越強(qiáng),則“回音室”效果越強(qiáng)。Webster等[29]將這個(gè)中心節(jié)點(diǎn)具體化為最受媒體和大眾關(guān)注的新聞內(nèi)容,這為主流新聞作為中心節(jié)點(diǎn)的說(shuō)法提供了參考價(jià)值。這些研究都在一定層面上論述了社會(huì)輿論信息中心的存在,但還缺少將信息中心與用戶的信息窄化結(jié)合的討論。個(gè)體信息窄化是如何受到社會(huì)公共性、公共信息和公共焦點(diǎn)的共同影響而形成的?這種“窄化”是否是一種“公共性的窄化”而非“個(gè)體性的窄化”?這些都是亟待解決的問(wèn)題。
總體而言,這些相關(guān)研究為本文提出用戶內(nèi)容生產(chǎn)中所形成的信息“繭房”趨同化觀點(diǎn)提供了參考,也留下了繼續(xù)挖掘的空間。本文不僅關(guān)注用戶是否處于“繭房”中、處于何種“繭房”中、因何處于“繭房”中,還關(guān)注“繭房”之間的關(guān)系。因此,“繭房”是否趨同、如何趨同是本文要探討的核心問(wèn)題。
本文的核心問(wèn)題是探討隨著用戶生產(chǎn)的信息內(nèi)容的“繭房”程度的加深,“繭房”之間是呈現(xiàn)趨同化還是異質(zhì)化,抑或無(wú)明顯規(guī)律?如果是趨同化,是怎樣趨同的?結(jié)合理論和文獻(xiàn)分析,本文從3 個(gè)關(guān)鍵假設(shè)、2 個(gè)推論及這五者的整體關(guān)系,基于新浪微博的用戶數(shù)據(jù)樣本進(jìn)行實(shí)證檢驗(yàn)。
為了方便描述用戶在社交平臺(tái)上內(nèi)容生產(chǎn)中的“繭房”程度,引入“繭房度”(degree of cocoon)這一概念來(lái)形容個(gè)體生產(chǎn)的信息內(nèi)容自我重復(fù)化、相似化的程度。即“繭房度”越高的用戶,其生產(chǎn)的內(nèi)容越是陷入相似性的窠臼,多樣性和異質(zhì)性越少。在此基礎(chǔ)上,把具有與某用戶相近“繭房度”的個(gè)體稱為該用戶的“相鄰繭房”(adjacent cocoons),將全體用戶中“繭房度”最高,即自我重復(fù)度最高的、處于“頂部”的用戶稱為“頂部繭房”(top cocoons)。同時(shí)需要強(qiáng)調(diào),這里的“繭房度”是針對(duì)用戶所生產(chǎn)的內(nèi)容的重復(fù)度來(lái)衡量的,而不是接收信息、進(jìn)行信息的選擇性接觸的“繭房度”。此外,結(jié)合前文關(guān)于公共性的社會(huì)信息中心及其對(duì)于個(gè)體議題的作用力,提出社交網(wǎng)絡(luò)中的“社會(huì)信息中心”(social information center)這一概念,用于描述在社交網(wǎng)絡(luò)公共領(lǐng)域中具有中心性、高熱度、高流量的公共信息,或者說(shuō)是公共領(lǐng)域的中心信息。
用戶所生產(chǎn)的信息內(nèi)容的“繭房”不是隨意地、彼此隔絕地、異質(zhì)地形成的,而是在復(fù)雜多變的傳播生態(tài)中朝向某個(gè)社會(huì)信息中心靠攏,這導(dǎo)致“繭房”之間表現(xiàn)出同質(zhì)化傾向。個(gè)體在內(nèi)容生產(chǎn)時(shí)不是陷入任意的“繭房”,而是在趨同于某種社會(huì)信息中心的過(guò)程中增強(qiáng)自身的“繭房度”;或者說(shuō),用戶的“繭房度”越高,其所生產(chǎn)的信息內(nèi)容就越趨同于社會(huì)信息中心。據(jù)此,本文提出假設(shè)1:
假設(shè)1:用戶個(gè)體的“繭房度”越高,該用戶所生產(chǎn)的信息內(nèi)容就越趨同于社會(huì)信息中心的內(nèi)容。
如果假設(shè)1 成立,即個(gè)體的“繭房”隨著“繭房度”的提高而呈現(xiàn)出越來(lái)越同質(zhì)化的趨勢(shì),并且都趨同于社會(huì)信息中心,那么“繭房度”最高的用戶也是最接近社會(huì)信息中心的用戶。微博這類社交媒體中的“頂部繭房”盡管不能等同于社會(huì)信息中心,卻最接近社會(huì)信息中心。換而言之,大家在朝向“廣場(chǎng)中心”奔跑的過(guò)程中,盡管跑在最前面的“排頭兵”并非直接的“廣場(chǎng)中心”,但由于它是最靠近中心的,這樣大家就會(huì)顯現(xiàn)出朝向“排頭兵”奔跑的態(tài)勢(shì)。據(jù)此,本文提出假設(shè)2:
假設(shè)2:用戶個(gè)體的“繭房度”越高,其與“頂部繭房”的內(nèi)容相似度越高。
既然個(gè)體的“繭房度”越高就越趨同于社會(huì)信息中心的內(nèi)容特征,也越是趨同于“頂部繭房”,那么就意味著,越是高“繭房度”的個(gè)體,越是和某種共同“標(biāo)的”、某種有限的共通“繭房模板”越長(zhǎng)越像,也即越是削弱自身的異質(zhì)性。所以可以推論:高程度的“繭房”彼此更為相似,低程度的“繭房”由于可以保留更多異質(zhì)性和獨(dú)特性因而彼此之間的相似度會(huì)更低,或者只是趨于某種隨機(jī)的個(gè)體相似度。據(jù)此,本文提出假設(shè)3:
假設(shè)3:用戶個(gè)體的“繭房度”越高,則彼此之間的內(nèi)容發(fā)布主題越相似。
如果假設(shè)1 和假設(shè)2 都成立,把假設(shè)2 中的“用戶繭房度”根據(jù)假設(shè)1替換為“用戶個(gè)體與社會(huì)信息中心的內(nèi)容相似度”,則可提出假設(shè)4:
假設(shè)4:用戶個(gè)體與社會(huì)信息中心的內(nèi)容相似度越高,則它與“頂部繭房”的內(nèi)容越相似。
如果假設(shè)1和假設(shè)3成立,把假設(shè)3中的“用戶繭房度”根據(jù)假設(shè)1 替換為“用戶個(gè)體與社會(huì)信息中心的內(nèi)容相似度”,則可提出假設(shè)5:
假設(shè)5:用戶個(gè)體與社會(huì)信息中心的內(nèi)容相似度越高,則它與“相鄰繭房”的內(nèi)容越相似。
上述5 個(gè)假設(shè)具有一定的內(nèi)部邏輯結(jié)構(gòu)。其一,假設(shè)1 的成立是提出假設(shè)2 的基礎(chǔ),假設(shè)1 和假設(shè)2 的成立共同作為提出假設(shè)3的基礎(chǔ),在假設(shè)1和假設(shè)2的基礎(chǔ)上可以提出假設(shè)4,在假設(shè)1和假設(shè)3的基礎(chǔ)上可以提出假設(shè)5。其二,假設(shè)1、假設(shè)2、假設(shè)3 為核心論點(diǎn),而假設(shè)4和假設(shè)5 則是輔助性的推論。前3 個(gè)假設(shè)支撐著關(guān)于“繭房趨同化”的根本命題,而后2 個(gè)假設(shè)是前3 個(gè)假設(shè)的內(nèi)在自然的延伸,而且也使得后文的路徑分析形成更為整體化的結(jié)構(gòu)。
根據(jù)新浪微博數(shù)據(jù)中心發(fā)布的《2018 微博用戶發(fā)展報(bào)告》,新浪微博月活躍用戶4.62億,月閱讀量過(guò)百億領(lǐng)域達(dá)32個(gè)??梢?jiàn),微博已經(jīng)成為目前中國(guó)最具影響力的代表性社交媒體平臺(tái)之一,故本文選取這一平臺(tái)作為數(shù)據(jù)抓取的對(duì)象。采取成本相對(duì)較低的多階段抽樣,抓取工具為八爪魚軟件以及自行采取selenium模塊編寫的網(wǎng)絡(luò)爬蟲。首先,從新浪微博首頁(yè)47 個(gè)內(nèi)容版塊中,每個(gè)版塊每天早晚各抓取1次,持續(xù)1個(gè)月,獲得65 650條“種子”帖。種子帖廣泛而大致均勻地分布在這47個(gè)版塊中,如圖1所示。
圖1 新浪微博種子帖在47 個(gè)版塊中的分布
以種子帖為基礎(chǔ)做第一階段“滾雪球”抽樣的擴(kuò)散,抓取并采集這些種子帖共5 053 998條評(píng)論及其評(píng)論者。通過(guò)“滾雪球”抽樣得到的評(píng)論者和原種子帖發(fā)布者經(jīng)清洗、去重后,形成3 501 153 個(gè)用戶的初始庫(kù)。從庫(kù)中隨機(jī)選取87 739 個(gè)有效用戶(剔除無(wú)效用戶之后剩下的種子數(shù)),由此開(kāi)展第二階段的“滾雪球”抽樣,從每人的前5 頁(yè)被關(guān)注者中隨機(jī)抽出2 名。對(duì)上述用戶橫向比較口徑進(jìn)行統(tǒng)一。其一是時(shí)間選取在2018 年1 月1 日—2018 年12 月31 日這一年發(fā)布的帖子,其二是每個(gè)用戶隨機(jī)選取在上述一年發(fā)布的300 條帖子,少于該數(shù)量的用戶不納入分析。然后,隨機(jī)選取滿足條件的20 000 個(gè)用戶作為最終“粉絲”。以剩下的這些用戶作為研究樣本,其“粉絲”規(guī)模、發(fā)微博數(shù)、關(guān)注他人數(shù)等指標(biāo)分布具有廣泛性與代表性。樣本用戶的特征分布見(jiàn)表1。
表1 樣本用戶的特征分布
把帖子轉(zhuǎn)換為向量后計(jì)算兩條帖子之間的余弦相似度。對(duì)于帖子內(nèi)容的向量化,本文采用在業(yè)界和學(xué)界有廣泛成熟應(yīng)用、快速和穩(wěn)定的Word2vec詞向量及其平均池化的方式進(jìn)行。Word2vec 是Mikolov 等[30]在2013年提出的淺層神經(jīng)網(wǎng)絡(luò)語(yǔ)言模型,通過(guò)無(wú)監(jiān)督訓(xùn)練方式將文本數(shù)據(jù)轉(zhuǎn)化為低維實(shí)數(shù)向量,將語(yǔ)義、語(yǔ)法信息經(jīng)過(guò)語(yǔ)言模型訓(xùn)練,投射到若干維的向量空間中,以此完成文本的結(jié)構(gòu)化處理。Word2vec 不僅可以在百萬(wàn)數(shù)量級(jí)的詞典和上億的數(shù)據(jù)集上進(jìn)行高效訓(xùn)練,還能有效解決文本高維稀疏性和忽略潛在語(yǔ)義的問(wèn)題。對(duì)于句子采用Word2vec 詞向量方法經(jīng)簡(jiǎn)單等權(quán)平均而轉(zhuǎn)換得到的句子向量具有良好的效果。Shen 等[31]的研究將簡(jiǎn)單詞向量模型(SWEM),即對(duì)上述的詞向量進(jìn)行等權(quán)求平均向量的方法,與循環(huán)和卷積網(wǎng)絡(luò)進(jìn)行比較發(fā)現(xiàn),在大多數(shù)情況下SWEM表現(xiàn)出更高性能。
本文使用Gensim 模塊編寫代碼進(jìn)行Word2vec 中CBOW 模型的設(shè)置與訓(xùn)練。Word2vec 使用的語(yǔ)料采用課題組自行抓取的中文語(yǔ)料庫(kù),來(lái)源包括媒體新聞庫(kù)、網(wǎng)絡(luò)論壇帖子、經(jīng)典名著和文學(xué)文本等,訓(xùn)練結(jié)果包括5 830 979個(gè)詞匯的嵌入式表示,效果良好。
對(duì)于內(nèi)容相似度的計(jì)算首先需要把微博帖子的短文本轉(zhuǎn)為向量。對(duì)樣本中的帖子采取當(dāng)前常用而效果優(yōu)良的Jieba軟件進(jìn)行分詞,然后利用Word2vec將分詞后的每一個(gè)詞轉(zhuǎn)換成一個(gè)300 維的詞向量,對(duì)這些詞的詞向量經(jīng)過(guò)平均池化后得到該帖子、短文本的語(yǔ)句向量。
“繭房度”(DC),在實(shí)際操作中具體表現(xiàn)為抓取到的每個(gè)用戶帖文之間的同質(zhì)化程度。如果一個(gè)用戶所發(fā)布的帖文都是高度相似的,比如都是美食類信息,很少有經(jīng)濟(jì)、體育等其他類的信息,那么可以認(rèn)為用戶內(nèi)容發(fā)布的信息“繭房”同質(zhì)化程度非常高。余弦相似度更好地適應(yīng)于高維數(shù)據(jù)和稀疏數(shù)據(jù),在文本挖掘中也是常用的經(jīng)典方法:
其中,計(jì)算任意兩條帖子ti和tj之間余弦相似度的方式表示為R(ti,tj),i、j表示任意兩條帖文,i≠j。
與社會(huì)信息中心的內(nèi)容相似度(Ssc),指的是個(gè)人發(fā)布信息的帖文與抓取到的總體數(shù)據(jù)中熱度最高的帖子之間的相似程度。熱度的計(jì)算方式是把帖子的轉(zhuǎn)發(fā)數(shù)、點(diǎn)贊數(shù)、評(píng)論數(shù)這3 個(gè)指標(biāo)分別經(jīng)由log2(x+1)轉(zhuǎn)換,然后進(jìn)行Min-Max歸一化處理各自轉(zhuǎn)為[0,1]區(qū)間內(nèi)的值,最后對(duì)歸一化之后的3個(gè)指標(biāo)求等權(quán)平均值作為該帖子熱度。本文將社會(huì)信息中心指標(biāo)的范圍規(guī)定為總體帖子中熱度最高的前10 萬(wàn)條之內(nèi)。由于所選取的是2018年全年的帖子,樣本數(shù)高達(dá)2 011.74 萬(wàn)條,因此選擇熱度最高的前10萬(wàn)條可以充分代表“熱帖”所討論的內(nèi)容,反映社會(huì)公共領(lǐng)域關(guān)注的議題,體現(xiàn)出社會(huì)信息中心的內(nèi)容特征,既具有充分的規(guī)模,不至于只局限于過(guò)度狹小的議題取樣范圍,又保持了充分的“頂部”熱度。其計(jì)算公式為
其中,n1代表個(gè)體的微博帖文數(shù),n2代表處于全體樣本中熱度最高的若干條帖子,這里取最高的10 萬(wàn)條帖文。
與“頂部繭房”相似度(Stc),指的是個(gè)人發(fā)布信息的帖文與抓取到的總體數(shù)據(jù)中“繭房度”最高的前k個(gè)用戶之間的相似程度,本文取k=30。一方面,30 個(gè)用戶在全體的20 000 個(gè)樣本中是非常少的一部分,可以充分表現(xiàn)出頂部區(qū)別于中部和尾部的特殊性,這個(gè)值不能過(guò)大,否則就擴(kuò)大和含糊了頂部的邊界;另一方面,當(dāng)k≥30的時(shí)候,在社會(huì)科學(xué)意義上一般可以認(rèn)定為不屬于小樣本,統(tǒng)計(jì)特征和檢驗(yàn)具有穩(wěn)定性。計(jì)算公式為
其中,k取30,即取全體用戶中“繭房度”最高的30個(gè)用戶。
與“相鄰繭房”相似度(Sac),指的是個(gè)人帖文與其“繭房度”最為相近的k個(gè)用戶的內(nèi)容相似度。本文計(jì)算中,這里的k同樣取30。
基于文獻(xiàn)回顧和變量測(cè)量,本文擬通過(guò)如圖2 所示的檢驗(yàn)?zāi)P蛠?lái)分析“繭房度”、與社會(huì)信息中心的內(nèi)容相似度、與“頂部繭房”相似度以及與“相鄰繭房”相似度4個(gè)變量之間的關(guān)系。前文5個(gè)假設(shè)具體化的可檢驗(yàn)形式整理如下:
圖2 本文假設(shè)的檢驗(yàn)?zāi)P?/p>
H1:“繭房度”正相關(guān)于與社會(huì)信息中心的內(nèi)容相似度。
H2:“繭房度”正相關(guān)于與“頂部繭房”相似度。
H3:“繭房度”正相關(guān)于與“相鄰繭房”相似度。
H4:與社會(huì)信息中心的內(nèi)容相似度正相關(guān)于與“頂部繭房”相似度。
H5:與社會(huì)信息中心的內(nèi)容相似度正相關(guān)于與“相鄰繭房”相似度。
首先,對(duì)“繭房度”、與社會(huì)信息中心的內(nèi)容相似度、與“頂部繭房”相似度、與“相鄰繭房”相似度等4 個(gè)變量進(jìn)行相關(guān)性分析,探討其之間是否存在一定程度上的共變性。此處采用皮爾遜相關(guān)分析方法,并進(jìn)行雙尾檢驗(yàn),分析結(jié)果見(jiàn)表2。從中可見(jiàn),“繭房度”和與社會(huì)信息中心的內(nèi)容相似度之間呈顯著的正相關(guān),和與“頂部繭房”相似度之間呈現(xiàn)顯著的正相關(guān),和與“相鄰繭房”相似度之間呈現(xiàn)顯著的正相關(guān);與社會(huì)信息中心的內(nèi)容相似度和與“頂部繭房”相似度呈現(xiàn)顯著的正相關(guān),和與“相鄰繭房”相似度呈現(xiàn)顯著的正相關(guān)??傮w而言,這4個(gè)變量之間是存在某種共變性的,這也為后續(xù)研究在模型中進(jìn)行路徑分析和比較提供了參考。
表2 4 個(gè)主要變量之間的相關(guān)性檢驗(yàn)結(jié)果
其次,使用AMOS 軟件進(jìn)行路徑分析。在進(jìn)行路徑分析時(shí),需要先將數(shù)據(jù)進(jìn)行正態(tài)化處理再納入模型中。計(jì)算方式采取最大似然法(maximum likelihood,ML)。模型的主要擬合結(jié)果見(jiàn)表3。從中可見(jiàn),模型的RMSEA=0.006<0.008,CFI=0.998>0.9,TLI=0.981>0.9。雖然有部分指標(biāo)略有超出,但都在可接受范圍之內(nèi),整體來(lái)看模型擬合度優(yōu)良,可以被接受。
表3 模型擬合結(jié)果
根據(jù)之前提出的假設(shè)構(gòu)想和變量思考,將捕捉到的數(shù)據(jù)進(jìn)行各項(xiàng)計(jì)算處理后納入模型,得到了表4 所示的分析結(jié)果。從中可見(jiàn),假設(shè)H1“繭房度”正相關(guān)于與社會(huì)信息中心的內(nèi)容相似度獲得支持(β=0.532,P<0.001);假設(shè)H2“繭房度”正相關(guān)于與“頂部繭房”相似度獲得支持(β=0.689,P<0.001);假設(shè)H3“繭房度”正相關(guān)于與“相鄰繭房”相似度獲得支持(β=0.614,P<0.001);假設(shè)H4 與社會(huì)信息中心的內(nèi)容相似度正相關(guān)于與“頂部繭房”相似度獲得支持(β=0.161,P<0.001);假設(shè)H5 與社會(huì)信息中心的內(nèi)容相似度正相關(guān)于與“相鄰繭房”相似度獲得支持(β=0.291,P<0.001)??傮w而言,檢驗(yàn)結(jié)果與前文對(duì)于5個(gè)假設(shè)及其內(nèi)部關(guān)系的闡述相吻合。
表4 路徑分析結(jié)果
以上結(jié)果顯示:首先,假設(shè)H1 也即本研究的關(guān)鍵假設(shè)得到了驗(yàn)證,“繭房度”實(shí)際上顯著地影響了與社會(huì)信息中心的內(nèi)容相似度;其次,“繭房度”也和與“頂部繭房”相似度、與“相鄰繭房”相似度兩個(gè)變量之間均存在明顯關(guān)系,足見(jiàn)“繭房度”無(wú)論是對(duì)于其他三個(gè)變量還是對(duì)整個(gè)模型都具有基礎(chǔ)性意義;最后,與社會(huì)信息中心的內(nèi)容相似度(Ssc)的強(qiáng)化對(duì)于與“頂部繭房”相似度(Stc)和與“相鄰繭房”相似度(Sac)都具有關(guān)鍵作用,構(gòu)成顯著且關(guān)鍵的中介路徑。
本文基于典型社交媒體之一的新浪微博樣本,對(duì)于“個(gè)體所陷入的‘繭房’是越長(zhǎng)越像而非各有不同”的觀點(diǎn),從三個(gè)關(guān)鍵子假設(shè)及其內(nèi)部關(guān)系進(jìn)行考察與檢驗(yàn),主要結(jié)論如下。第一,社交空間中各個(gè)用戶所生產(chǎn)的信息內(nèi)容的“繭房”會(huì)因陷入一種公共性的“回音室”中而呈現(xiàn)出同質(zhì)化趨勢(shì),用戶個(gè)體的“繭房度”越高則表示其受限于這種公共“繭房”的程度越深,其內(nèi)容與社會(huì)信息中心的內(nèi)容越相似,并使得各個(gè)“繭房”在趨向共同標(biāo)的的過(guò)程中發(fā)生個(gè)性化的消減、趨同性的增強(qiáng)。第二,個(gè)體在“繭房度”增高且與社會(huì)信息中心趨近的過(guò)程中,會(huì)導(dǎo)致與“頂部繭房”的內(nèi)容相似度的提高。第三,個(gè)體在趨近“頂部繭房”和社會(huì)信息中心的過(guò)程中,彼此之間會(huì)變得越來(lái)越相似,在實(shí)踐中具體表現(xiàn)為個(gè)體“繭房”與其“相鄰繭房”之間內(nèi)容相似度的提高。第四,由于以上三種趨同路徑具有統(tǒng)一性和一致性,所以形成個(gè)體的“繭房度”、與社會(huì)信息中心的內(nèi)容相似度、與“頂部繭房”的內(nèi)容相似度、與“相鄰繭房”的內(nèi)容相似度這4 個(gè)變量之間存在同步共變的關(guān)系。
互聯(lián)網(wǎng)時(shí)代賦予了傳播學(xué)新的使命和機(jī)遇,以連接和網(wǎng)絡(luò)為核心的傳播邏輯正在形塑著如今的媒體生態(tài),用戶的自主權(quán)和能動(dòng)性隨著技術(shù)的發(fā)展大大擴(kuò)增。傳統(tǒng)研究視野下,許多學(xué)者分別從信息窄化和意見(jiàn)極化的角度關(guān)注到信息“繭房”現(xiàn)象,并認(rèn)為它是作為受眾異質(zhì)化、分散化、圈層化的象征之一。實(shí)際上,用戶在日常生活中以不同的傳播邏輯構(gòu)筑起自己的信息接收網(wǎng)絡(luò),影響其信息獲取和信息生產(chǎn)的因素豐富多樣。同時(shí),只有更多的用戶共同關(guān)注并討論同一個(gè)話題,才能夠形成網(wǎng)絡(luò)社會(huì)中的公共輿論場(chǎng)。本文從用戶生產(chǎn)的信息“繭房”同質(zhì)化現(xiàn)象切入,發(fā)現(xiàn)隨著用戶所生產(chǎn)的信息內(nèi)容的“繭房度”增高,各“繭房”之間呈現(xiàn)出彼此趨同化而非趨異化的格局。同時(shí)采用實(shí)證分析加以驗(yàn)證,在文獻(xiàn)回顧的基礎(chǔ)上,通過(guò)構(gòu)建信息“繭房”趨同路徑模型來(lái)闡述它們之間的復(fù)雜動(dòng)態(tài)關(guān)系。但新的結(jié)論也觸發(fā)了新的需要探討的問(wèn)題,這種同步共變的關(guān)系會(huì)使網(wǎng)絡(luò)社會(huì)產(chǎn)生怎樣的變化?這種同質(zhì)化現(xiàn)象背后又映射出哪些現(xiàn)實(shí)生活的問(wèn)題?此外,本文也局限于一個(gè)社交平臺(tái),即基于微博數(shù)據(jù)生態(tài)下,這些結(jié)論是否在其他社交媒體上也能得到支持,期待后續(xù)能有進(jìn)一步的回答。
西安交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2022年3期