亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        “用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”模型*
        ——微博推薦流的運(yùn)作機(jī)制探析

        2022-08-12 06:03:20陳逸君
        關(guān)鍵詞:感興趣好友類(lèi)別

        —陳逸君—

        近年來(lái),Google、Facebook、微博和今日頭條等技術(shù)公司轉(zhuǎn)型而來(lái)的“平臺(tái)媒體”①(platish?ers)正在成為用戶(hù)獲取資訊的重要渠道。面對(duì)海量信息,即便平臺(tái)媒體也無(wú)法將全部?jī)?nèi)容提供給所有用戶(hù),技術(shù)公司轉(zhuǎn)而通過(guò)算法完成對(duì)內(nèi)容的取舍與適配。然而,比起傳統(tǒng)媒體時(shí)代以記者編輯為代表的“把關(guān)人”嚴(yán)格遵循組織機(jī)構(gòu)一套章程標(biāo)準(zhǔn)②,平臺(tái)媒體對(duì)信息的處理更像一個(gè)不可接近的“黑箱”③,商業(yè)秘密保護(hù)和防止惡意入侵是此類(lèi)科技公司拒絕公布“把關(guān)”過(guò)程的常見(jiàn)做法。④

        如若不能及時(shí)打開(kāi)“黑箱”,也就無(wú)法對(duì)平臺(tái)媒體的價(jià)值標(biāo)準(zhǔn)予以修正。目前,對(duì)Face?book、Twitter等西方平臺(tái)媒體的運(yùn)作機(jī)制,學(xué)界已積累了較為豐富的研究成果,而非西方語(yǔ)境下除少數(shù)面向今日頭條⑤、微博熱搜⑥的實(shí)證分析外,對(duì)平臺(tái)媒體的解讀大多基于主觀判斷,較少采用量化或田野調(diào)查的方式進(jìn)行驗(yàn)證。本文選取微博“推薦流”作為平臺(tái)媒體的代表,通過(guò)98名微博活躍用戶(hù)的近10萬(wàn)條數(shù)據(jù)結(jié)合他們的問(wèn)卷調(diào)查結(jié)果,揭示微博推薦流的核心運(yùn)作機(jī)制。微博是中國(guó)社交媒體的超級(jí)平臺(tái)之一,2021年微博月活躍用戶(hù)達(dá)5.73億,日活躍用戶(hù)2.49億⑦,網(wǎng)民通過(guò)微博獲取新聞的比例達(dá)35.6%⑧,高于新聞客戶(hù)端獲取新聞的比例。作為中國(guó)輿論風(fēng)向標(biāo)的社交媒體,微博引入內(nèi)容推薦的時(shí)間較早,其算法核心產(chǎn)品——微博“推薦流”,在經(jīng)歷數(shù)次代碼迭代后也相對(duì)走向成熟。

        一、算法推斷:搭建從用戶(hù)興趣到內(nèi)容呈現(xiàn)的新路徑

        如今人們身處高度可選擇的媒介環(huán)境之中,用戶(hù)擁有自由獲取感興趣內(nèi)容的權(quán)利。相關(guān)研究也證明,興趣主導(dǎo)了用戶(hù)的信息選擇⑨,網(wǎng)絡(luò)化媒介為用戶(hù)搭建起一個(gè)“興趣決定內(nèi)容”的信息世界(見(jiàn)圖1的“直接模型”部分)。

        圖1 “用戶(hù)興趣—內(nèi)容呈現(xiàn)”的直接模型和“用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”的間接模型

        隨著平臺(tái)媒體在訊息分配過(guò)程中占據(jù)主導(dǎo)地位,不具備預(yù)先獲取用戶(hù)喜好能力的平臺(tái)媒體只能依托算法根據(jù)各類(lèi)可挖掘、可計(jì)算和可測(cè)量的“數(shù)字痕跡”(digital trace data)對(duì)用戶(hù)興趣作判斷。筆者將上述環(huán)節(jié)稱(chēng)為算法推斷,并假設(shè)算法推斷扮演了介于用戶(hù)興趣與內(nèi)容呈現(xiàn)之間的角色。據(jù)此,構(gòu)建“用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”的間接模型,用戶(hù)從原來(lái)“主動(dòng)獲取感興趣內(nèi)容”變?yōu)楸粍?dòng)接收由“算法推斷用戶(hù)可能感興趣的內(nèi)容”(見(jiàn)圖1中“間接模型”部分)。

        傳統(tǒng)觀點(diǎn)認(rèn)為,在信息自治的環(huán)境中,個(gè)人選擇對(duì)內(nèi)容呈現(xiàn)起決定作用,因此用戶(hù)對(duì)什么感興趣就會(huì)獲取怎樣的內(nèi)容。平臺(tái)媒體打破這一格局,伴隨算法推斷過(guò)程的介入,用戶(hù)興趣不再由用戶(hù)的天然屬性決定,而是外化為轉(zhuǎn)評(píng)贊、停留時(shí)長(zhǎng)等一系列可能被算法標(biāo)記為有效計(jì)數(shù)的表征向量。那么此時(shí)算法判斷的用戶(hù)興趣與用戶(hù)的真實(shí)興趣是否保持一致?如不一致,用戶(hù)興趣與算法推斷誰(shuí)決定了內(nèi)容推薦?回答上述問(wèn)題是“開(kāi)箱”平臺(tái)媒體運(yùn)作機(jī)制的前提。

        二、算法推斷的影響因素

        根據(jù)間接模型假設(shè),決定內(nèi)容呈現(xiàn)的未必是用戶(hù)興趣,而是算法推斷的用戶(hù)興趣,那么又有哪些因素決定了算法推斷?

        用戶(hù)的發(fā)布/轉(zhuǎn)發(fā)、收藏和點(diǎn)贊行為數(shù)據(jù)是后臺(tái)最易獲取且可能被解讀為用戶(hù)對(duì)該內(nèi)容感興趣的信號(hào)。本文將上述用戶(hù)產(chǎn)生的行為數(shù)據(jù)統(tǒng)稱(chēng)為用戶(hù)自主行為,并猜測(cè)用戶(hù)自主行為是算法推斷用戶(hù)興趣的重要依據(jù)。

        大量研究表明,個(gè)體傾向與那些具有相同社會(huì)人口特征⑩、行為/價(jià)值觀的人交往并保持聯(lián)系。根據(jù)用戶(hù)好友的興趣反推用戶(hù)興趣,這一思路已經(jīng)證實(shí)被多個(gè)平臺(tái)媒體所采納,如一項(xiàng)針對(duì)Facebook公開(kāi)專(zhuān)利的文本分析顯示,其系統(tǒng)會(huì)從用戶(hù)朋友發(fā)布的動(dòng)態(tài)以及朋友的興趣出發(fā)推斷用戶(hù)興趣所在。同樣作為社交媒體的微博,曾經(jīng)在多個(gè)公開(kāi)場(chǎng)合強(qiáng)調(diào)社交關(guān)系對(duì)于算法推薦的重要性。微博AI Lab資深算法專(zhuān)家張俊林表示,“親密的社交關(guān)系往往蘊(yùn)涵著潛在的興趣關(guān)聯(lián)”。本研究猜測(cè)社交關(guān)系是算法推斷的另一個(gè)重要依據(jù)。

        綜上,筆者搭建了微博“推薦流”運(yùn)作機(jī)制的完整模型(如圖2所示)。首先是“用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”部分(H1—H3),由于用戶(hù)通過(guò)微博展現(xiàn)自我興趣的空間有限、算法存在錯(cuò)誤描繪用戶(hù)肖像的幾率,可能出現(xiàn)用戶(hù)的真實(shí)興趣與算法推斷的用戶(hù)興趣不符的情況,因此提出:

        圖2 “用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”完整模型

        H1.用戶(hù)的真實(shí)興趣與算法推斷的用戶(hù)興趣并非在所有興趣領(lǐng)域都呈現(xiàn)顯著相關(guān)。

        根據(jù)間接模型,算法參照“數(shù)字痕跡”對(duì)用戶(hù)興趣作判斷后,“推薦流”依托算法推斷而非用戶(hù)的真實(shí)興趣進(jìn)行內(nèi)容推薦,因此提出:

        H2.算法推斷某領(lǐng)域用戶(hù)興趣與某領(lǐng)域的內(nèi)容呈現(xiàn)存在顯著相關(guān)性;

        H3.用戶(hù)真實(shí)興趣與內(nèi)容推薦并非在所有興趣領(lǐng)域都呈現(xiàn)顯著相關(guān)性。

        其次是算法推斷的影響因素部分(H4—H6),猜測(cè)影響算法推斷的第一個(gè)因素是用戶(hù)自主行為,提出:

        H4.用戶(hù)對(duì)某領(lǐng)域內(nèi)容進(jìn)行的發(fā)布/轉(zhuǎn)發(fā)、點(diǎn)贊和收藏,與算法推斷用戶(hù)對(duì)某領(lǐng)域的興趣存在顯著相關(guān)性。

        猜測(cè)第二個(gè)影響因素是“社交關(guān)系”。格蘭諾維特(Granovetter)將社交關(guān)系劃分為“強(qiáng)關(guān)系”和“弱關(guān)系”,認(rèn)為用戶(hù)的關(guān)系強(qiáng)度體現(xiàn)在用戶(hù)間的親密程度和接觸頻率。本研究將微博中與用戶(hù)相互關(guān)注的好友視作“強(qiáng)關(guān)系”,與用戶(hù)呈現(xiàn)單向關(guān)注的大V則更符合“弱關(guān)系”,同時(shí)考察“強(qiáng)關(guān)系”與“弱關(guān)系”對(duì)算法推斷的影響提出研究假設(shè):

        H5.與用戶(hù)呈“弱關(guān)系”的人對(duì)某領(lǐng)域的興趣情況,會(huì)顯著影響算法推斷該用戶(hù)對(duì)相關(guān)領(lǐng)域的興趣;

        H6.與用戶(hù)呈“強(qiáng)關(guān)系”的人對(duì)某領(lǐng)域的興趣情況,會(huì)顯著影響算法推斷該用戶(hù)對(duì)相關(guān)領(lǐng)域的興趣。

        三、研究方法

        (一)數(shù)據(jù)與樣本描述

        本研究采用深度訪談、問(wèn)卷調(diào)查與抓取98名微博用戶(hù)的99476條數(shù)據(jù)相結(jié)合的方式,共同揭示微博推薦流的運(yùn)作機(jī)制。出于數(shù)據(jù)隱私保護(hù),微博不會(huì)向他人或機(jī)構(gòu)展示任何用戶(hù)的后臺(tái)數(shù)據(jù),盡管用戶(hù)發(fā)布的內(nèi)容、關(guān)注列表、點(diǎn)贊等信息作為公開(kāi)數(shù)據(jù)可被直接獲取,但本研究中最為關(guān)鍵的內(nèi)容呈現(xiàn)即微博為用戶(hù)推薦了什么是除用戶(hù)外,任何人都無(wú)法獲取的。面對(duì)內(nèi)容呈現(xiàn)的采集困難,有學(xué)者采用問(wèn)卷調(diào)查通過(guò)受訪者“自我報(bào)告”(self?report)過(guò)去一周在平臺(tái)媒體上看到有關(guān)某領(lǐng)域話題的頻率(1=從不,5=經(jīng)常)得到內(nèi)容推薦的情況。鑒于不同受訪者對(duì)頻率的認(rèn)知差異,這一形式易受主觀因素干擾。本研究在征得用戶(hù)知情同意的基礎(chǔ)上獲取他們的微博賬號(hào)及密碼,經(jīng)由用戶(hù)注冊(cè)時(shí)綁定的手機(jī)驗(yàn)證后登錄,通過(guò)八爪魚(yú)抓取“推薦流”的實(shí)時(shí)內(nèi)容,較好地避免了用戶(hù)主觀作答帶來(lái)的不準(zhǔn)確性。

        自2020年10月至11月,筆者發(fā)動(dòng)親友并依托“滾雪球”的方式共征集108個(gè)微博賬號(hào),在排除非活躍用戶(hù)后得到98名活躍用戶(hù)的微博賬號(hào)使用權(quán)(n=98)。分別于10月31日、11月1日、11月28日(三日均無(wú)重大事件,排除該時(shí)間段內(nèi)微博集中推薦某類(lèi)特定內(nèi)容)登錄賬號(hào),并對(duì)每個(gè)賬號(hào)抓取包括:推薦廣告(不少于50條)、熱門(mén)推薦(不少于400條)、推薦關(guān)注的人列表(不少于100位)、轉(zhuǎn)發(fā)/發(fā)布的微博(全部或不少于100條)、點(diǎn)贊(全部或不少于100條)、收藏(全部或不少于100條)和關(guān)注的人所發(fā)布的微博(不少于100條)。98個(gè)賬號(hào)共抓取廣告4971條、熱門(mén)推薦38755條、關(guān)注的人15822位(其中與用戶(hù)呈現(xiàn)“弱關(guān)系”11352人)、轉(zhuǎn)發(fā)/發(fā)布的微博9561條、點(diǎn)贊4999條、收藏2569條、關(guān)注的人發(fā)布的微博11447條,共獲得有效數(shù)據(jù)99476條。此外,所有用戶(hù)完成一份問(wèn)卷星平臺(tái)的調(diào)查問(wèn)卷。

        在“推薦流”中大部分推薦內(nèi)容和博主的興趣領(lǐng)域都被微博打上了自帶標(biāo)簽,筆者對(duì)微博中所有出現(xiàn)的標(biāo)簽進(jìn)行記錄,一共52類(lèi)興趣標(biāo)簽,按相同主題合并同類(lèi)項(xiàng)后劃分為9大類(lèi)別(1=新聞消息類(lèi),2=金融科技類(lèi),3=教育衛(wèi)生類(lèi),4=人文藝術(shù)類(lèi),5=娛樂(lè)明星類(lèi),6=娛樂(lè)產(chǎn)業(yè)類(lèi),7=體育競(jìng)技類(lèi),8=日常生活類(lèi),9=時(shí)尚美妝類(lèi))(見(jiàn)表1)。參照內(nèi)容編碼表對(duì)所抓取的98名用戶(hù)數(shù)據(jù)進(jìn)行編碼后,按四分位數(shù)法將連續(xù)數(shù)據(jù)轉(zhuǎn)換為等級(jí)資料,通過(guò)有序Lo?gistic回歸分析證明各變量間的關(guān)系。

        表1 微博內(nèi)容編碼表

        (二)測(cè)量

        1.問(wèn)卷部分

        (1)人口統(tǒng)計(jì)學(xué)

        本研究調(diào)查樣本來(lái)自98名微博用戶(hù),受訪者中男性占48%,女性占52%。受訪者的年齡段集中于26—30歲(SD=0.0774),受教育程度中位值為“碩士”。受訪者主要為在校學(xué)生(37.7%)、專(zhuān)業(yè)技術(shù)人員(20.4%)和企業(yè)管理人員(19.3%)。

        (2)用戶(hù)興趣

        為測(cè)量用戶(hù)對(duì)某領(lǐng)域的真實(shí)興趣,調(diào)查問(wèn)卷要求受訪者對(duì)時(shí)事、社會(huì)、財(cái)經(jīng)等不同領(lǐng)域的興趣進(jìn)行評(píng)分(采用五級(jí)量表測(cè)量,1=完全不感興趣,5=非常感興趣)。參照編碼表將問(wèn)卷中涉及的領(lǐng)域合并為9個(gè)類(lèi)別,按四分位數(shù)法換為等級(jí)資料,從而得到98名用戶(hù)對(duì)9個(gè)類(lèi)別的真實(shí)興趣情況。9個(gè)類(lèi)別問(wèn)卷Cronbach′sα系數(shù)值分別為0.82,0.76,0.68,0.84,0.67,0.81,0.75,0.82,0.84及總體量表的Cronbach′sα系數(shù)值為0.94。

        2.用戶(hù)數(shù)據(jù)部分

        (1)算法推斷

        算法推斷的過(guò)程與結(jié)果被嚴(yán)格保密,雖然無(wú)法從科技公司手中獲取后臺(tái)為不同用戶(hù)打上的興趣標(biāo)簽,但我們可以從其他途徑得到啟發(fā)。一項(xiàng)公開(kāi)專(zhuān)利指出,為幫助廣告商精準(zhǔn)尋求潛在買(mǎi)主,擴(kuò)大社交媒體的商業(yè)價(jià)值,微博主要根據(jù)當(dāng)前系統(tǒng)為用戶(hù)標(biāo)識(shí)的興趣標(biāo)簽來(lái)確定他們的廣告主題。微博會(huì)把算法推斷的結(jié)果用于廣告投放,因此通過(guò)觀察用戶(hù)接收的廣告類(lèi)型,可逆向判斷該用戶(hù)被后臺(tái)打上了什么興趣標(biāo)簽。抓取用戶(hù)的推薦內(nèi)容并從中篩選出廣告部分進(jìn)行分類(lèi)。

        除了考察廣告,“可能感興趣的人”(后改名為“推薦關(guān)注”)是反映算法推斷用戶(hù)興趣的另一途徑。由于其推薦依據(jù)是“用戶(hù)可能感興趣”,因此通過(guò)觀察“推薦關(guān)注”的類(lèi)型,也可逆向判斷該用戶(hù)被后臺(tái)打上什么興趣標(biāo)簽。抓取每位用戶(hù)的“推薦關(guān)注”并進(jìn)行分類(lèi)。

        (2)內(nèi)容呈現(xiàn)

        內(nèi)容推薦是微博“推薦流”在某個(gè)時(shí)刻呈現(xiàn)給用戶(hù)的內(nèi)容,抓取用戶(hù)推薦流中的內(nèi)容并進(jìn)行分類(lèi)。

        (3)用戶(hù)自主行為

        微博可直接獲取的用戶(hù)自主行為包括:點(diǎn)贊、收藏和該用戶(hù)發(fā)布/轉(zhuǎn)發(fā)的內(nèi)容,分別來(lái)自微博中“我的贊”“我的收藏”和“我的微博”。抓取上述內(nèi)容進(jìn)行分類(lèi)。

        (4)社交關(guān)系

        本研究將與用戶(hù)相互關(guān)注的人定義為與用戶(hù)存在“強(qiáng)關(guān)系”。筆者在對(duì)98名用戶(hù)匿名編號(hào)后隨機(jī)抽取13名用戶(hù),登錄其微博賬號(hào)并手動(dòng)記錄每一位與該用戶(hù)存在相互關(guān)注關(guān)系的好友的興趣領(lǐng)域。微博會(huì)自動(dòng)根據(jù)用戶(hù)好友的關(guān)注列表生成一張他的興趣領(lǐng)域分布圖(見(jiàn)圖3)。對(duì)每位用戶(hù)所有好友的興趣領(lǐng)域進(jìn)行分類(lèi)統(tǒng)計(jì)。

        圖3 微博為每位用戶(hù)好友標(biāo)識(shí)的興趣領(lǐng)域

        接著,筆者抓取每位用戶(hù)的“關(guān)注的人”所發(fā)布的微博,手動(dòng)排除非大V賬號(hào)(轉(zhuǎn)評(píng)贊數(shù)量均<5,粉絲數(shù)量<5000,且經(jīng)驗(yàn)證不帶大V認(rèn)證的用戶(hù))后,獲取的就是與該用戶(hù)存在“弱關(guān)系”的博主發(fā)布的內(nèi)容,同樣對(duì)其進(jìn)行分類(lèi)處理。

        四、研究結(jié)果

        本研究旨在探討微博“推薦流”的運(yùn)作機(jī)制,并猜測(cè)它與互聯(lián)網(wǎng)為用戶(hù)搭建的“興趣決定內(nèi)容”這一高度自由的信息環(huán)境不同,用戶(hù)從原來(lái)主動(dòng)獲取感興趣的內(nèi)容變?yōu)楸粍?dòng)接收由算法推斷用戶(hù)可能感興趣的內(nèi)容。鑒于此,筆者在“用戶(hù)興趣—內(nèi)容呈現(xiàn)”這一直接模型的基礎(chǔ)上,建立了“用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”的間接模型。本文首先對(duì)間接模型的猜想進(jìn)行論證,其次探索哪些因素會(huì)對(duì)算法推斷產(chǎn)生影響。

        (一)“用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”部分的論證

        1.用戶(hù)興趣與內(nèi)容呈現(xiàn)

        問(wèn)卷調(diào)查顯示,41.8%的受訪者表示“微博經(jīng)常會(huì)推送一些用戶(hù)不感興趣的內(nèi)容”。從受訪者的主觀作答中,可明顯感知“用戶(hù)興趣”與“內(nèi)容呈現(xiàn)”之間存在斷裂。筆者以“用戶(hù)興趣”(即通過(guò)問(wèn)卷獲取的用戶(hù)真實(shí)興趣)為自變量,“熱門(mén)推薦”作為因變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):9個(gè)類(lèi)別中只有金融科技類(lèi)(β=0.690,p<0.001)、娛樂(lè)明星類(lèi)(β=0.945,p=0.009)和體育競(jìng)技類(lèi)(β=0.912,p<0.001)的用戶(hù)興趣與內(nèi)容呈現(xiàn)存在顯著正相關(guān)性,其余6類(lèi)的用戶(hù)興趣均與內(nèi)容呈現(xiàn)之間不存在顯著相關(guān)關(guān)系(如表2所示)。用戶(hù)對(duì)某領(lǐng)域的真實(shí)興趣與該領(lǐng)域的內(nèi)容呈現(xiàn)不存在必然聯(lián)系,H3得到驗(yàn)證。

        2.用戶(hù)興趣與算法推斷

        如前所述,算法推斷的測(cè)量方式有兩種:一是根據(jù)用戶(hù)的廣告推送類(lèi)別推測(cè)算法對(duì)用戶(hù)興趣的判斷,二是根據(jù)微博“推薦關(guān)注”的分類(lèi)來(lái)反映算法對(duì)用戶(hù)興趣的判斷。筆者對(duì)這兩種途徑都進(jìn)行了檢驗(yàn)。在廣告抓取過(guò)程中我們發(fā)現(xiàn):第一,同一用戶(hù)的廣告內(nèi)容存在大量重復(fù),去重后每位用戶(hù)收到的廣告種類(lèi)有限,現(xiàn)有廣告類(lèi)型不能全面地反映用戶(hù)特征;第二,同一時(shí)段內(nèi)不同用戶(hù)都收到如“鉑金鉆戒”“蘭蔻粉水”“防脫生發(fā)”等無(wú)差別廣告投放,與原先設(shè)想的精準(zhǔn)投放有所出入。

        推薦流的非個(gè)性化廣告投放也得到了多數(shù)受訪者的驗(yàn)證。問(wèn)卷調(diào)查顯示,63.3%的受訪者表示微博廣告推送不太符合個(gè)人需求。統(tǒng)計(jì)結(jié)果也佐證了這一觀點(diǎn),以“用戶(hù)興趣”為自變量,受訪者接收的廣告作為代表算法推斷的因變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):在用戶(hù)接收的廣告類(lèi)型中,除金融科技類(lèi)(β=0.563,p=0.003)和時(shí)尚美妝類(lèi)(β=-1.461,p=0.007)外,其他7個(gè)類(lèi)別的廣告推送均與用戶(hù)的真實(shí)興趣無(wú)顯著相關(guān)性。其中時(shí)尚美妝類(lèi)的回歸系數(shù)為負(fù),說(shuō)明即便對(duì)時(shí)尚美妝不感興趣的用戶(hù),也同樣可能會(huì)被投放化妝品、潮流服飾等廣告,消費(fèi)單品類(lèi)廣告已經(jīng)成為推薦流中的普遍現(xiàn)象(見(jiàn)表3)。上述結(jié)果說(shuō)明,用戶(hù)的真實(shí)興趣與廣告推送的關(guān)聯(lián)性不強(qiáng)。

        表3 有序Logistic回歸:用戶(hù)興趣與算法推斷

        為何會(huì)出現(xiàn)這一現(xiàn)象?在對(duì)新浪首席信息官王巍的訪談中,他承認(rèn)“微博存在廣告競(jìng)價(jià)”(2020年10月28日),廣告的投放量與廣告商的投入密切相關(guān),這是造成無(wú)差別廣告的重要原因之一。更微妙的是,2019年微博向美國(guó)證券交易委員會(huì)遞交的財(cái)報(bào)顯示,阿里巴巴目前作為微博的第二大股東,持股30.2%且擁有15.8%的投票權(quán)。因此不排除具有高度話語(yǔ)權(quán)的阿里系在廣告投放過(guò)程中對(duì)微博施壓。

        一方面是微博“推薦流”并未完全根據(jù)用戶(hù)特征來(lái)確定廣告主題,另一方面目前所能收集到的廣告類(lèi)型十分有限,難以描繪用戶(hù)完整的興趣維度。鑒于上述原因,我們認(rèn)為用戶(hù)的廣告分類(lèi)并不適用于衡量算法推斷,因此在本研究中筆者以“推薦關(guān)注”的分類(lèi)情況作為反映算法推斷的變量?!巴扑]關(guān)注的人”本質(zhì)上就是基于算法推斷的用戶(hù)興趣的結(jié)果,王巍也承認(rèn)“用戶(hù)(興趣)標(biāo)簽是作為‘推薦關(guān)注’最為重要的依據(jù)(2020年12月15日)”。以用戶(hù)興趣為自變量,算法推斷(推薦關(guān)注的人)作為因變量進(jìn)行Logistic回歸分析后發(fā)現(xiàn):只有在體育競(jìng)技類(lèi)(β=1.020,p<0.001)和時(shí)尚美妝類(lèi)(β=0.735,p=0.022)中用戶(hù)興趣與算法推斷之間存在顯著正相關(guān)關(guān)系,其余7個(gè)類(lèi)別均未表現(xiàn)出顯著相關(guān)性(見(jiàn)表3)。這一結(jié)果說(shuō)明,用戶(hù)的真實(shí)興趣與算法推斷的用戶(hù)興趣之間存在一定的“間隙”,算法在判斷用戶(hù)偏好時(shí)可能出現(xiàn)誤判,H1得到驗(yàn)證。

        為何會(huì)產(chǎn)生誤判?筆者根據(jù)問(wèn)卷梳理了一些可能造成用戶(hù)真實(shí)興趣與算法推斷用戶(hù)興趣差異的原因:人情面子(51.9%的受訪者表示,更傾向?yàn)g覽或?yàn)椤芭c自己密切相關(guān)的人,如親人或好友發(fā)布的微博”點(diǎn)贊)、微博的類(lèi)型(54.1%的受訪者對(duì)“娛樂(lè)八卦類(lèi)的軟資訊都不太點(diǎn)贊”;43.9%的受訪者在看到體現(xiàn)社會(huì)價(jià)值、人生意義的微博時(shí)會(huì)轉(zhuǎn)發(fā)點(diǎn)贊)和微博的實(shí)際效用(34.7%的受訪者表示“看到教育培訓(xùn)相關(guān)的資訊會(huì)瀏覽收藏,以更好地應(yīng)對(duì)升學(xué)和職場(chǎng)”;39.8%的受訪者“會(huì)收藏深度好文以增加談資”)都可能成為自身興趣之外,用戶(hù)轉(zhuǎn)評(píng)贊等行為產(chǎn)生的原因,而正是通過(guò)“解讀”這些行為,微博對(duì)用戶(hù)興趣的判斷產(chǎn)生了偏差。

        3.算法推斷與內(nèi)容呈現(xiàn)

        在對(duì)算法推斷和內(nèi)容呈現(xiàn)進(jìn)行Logistic回歸分析后發(fā)現(xiàn):所有9個(gè)類(lèi)別即新聞消息類(lèi)(β=0.422,p<0.001)、金融科技類(lèi)(β=0.487,p<0.001)、教育衛(wèi)生類(lèi)(β=0.425,p<0.001)、人文藝術(shù)類(lèi)(β=0.331,p=0.007)、娛樂(lè)明星類(lèi)(β=0.523,p<0.001)、娛樂(lè)產(chǎn)業(yè)類(lèi)(β=0.407,p=0.001)、體育競(jìng)技類(lèi)(β=0.859,p<0.001)、日常生活類(lèi)(β=0.616,p=0.002)和時(shí)尚美妝類(lèi)(β=1.032,p<0.001)的算法推斷均與內(nèi)容呈現(xiàn)之間存在顯著正相關(guān)關(guān)系(見(jiàn)表2),提示算法一旦判斷用戶(hù)對(duì)某領(lǐng)域感興趣,那么用戶(hù)將看到更多有關(guān)該領(lǐng)域的內(nèi)容推薦,H2得到驗(yàn)證。

        綜上,筆者搭建了微博“推薦流”的“用戶(hù)興趣—算法推斷—內(nèi)容呈現(xiàn)”間接模型:用戶(hù)的真實(shí)興趣與算法推斷的用戶(hù)興趣之間存在“間隙”(H1成立),算法推斷某領(lǐng)域用戶(hù)的興趣與某領(lǐng)域的內(nèi)容呈現(xiàn)存在顯著正相關(guān)性(H2成立),用戶(hù)的真實(shí)興趣與內(nèi)容呈現(xiàn)不存在必然聯(lián)系(H3成立)。該模型說(shuō)明,“推薦流”打破了“興趣決定內(nèi)容”這一傳統(tǒng)認(rèn)知,最終決定內(nèi)容推薦的不是用戶(hù)的真實(shí)興趣,而是算法所推斷的用戶(hù)興趣,并且“微博認(rèn)識(shí)的你”與“你認(rèn)識(shí)的你”之間存在差異。

        (二)算法推斷影響因素部分的論證

        以算法推斷為因變量,發(fā)布/轉(zhuǎn)發(fā)、收藏、點(diǎn)贊三種用戶(hù)自主行為作為自變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):所有9個(gè)類(lèi)別中,除日常生活類(lèi)(p=0.447)外,其他8個(gè)類(lèi)別即新聞消息類(lèi)(p=0.003)、金融科技類(lèi)(p=0.001)、教育衛(wèi)生類(lèi)(p<0.001)、人文藝術(shù)類(lèi)(p=0.001)、娛樂(lè)明星類(lèi)(p<0.001)、娛樂(lè)產(chǎn)業(yè)類(lèi)(p=0.003)、體育競(jìng)技類(lèi)(p<0.001)和時(shí)尚美妝類(lèi)(p=0.001)的用戶(hù)自主行為均與算法推斷呈現(xiàn)顯著相關(guān)性(見(jiàn)表4),提示用戶(hù)對(duì)某領(lǐng)域的發(fā)布/轉(zhuǎn)發(fā)、收藏和點(diǎn)贊行為會(huì)影響算法判斷用戶(hù)對(duì)該領(lǐng)域的興趣,證明用戶(hù)自主行為是微博“推薦流”進(jìn)行用戶(hù)興趣推斷的重要依據(jù),H4得到驗(yàn)證。

        以“弱關(guān)系”為自變量,“算法推斷”作為因變量進(jìn)行Logistic回歸分析發(fā)現(xiàn):在與用戶(hù)呈現(xiàn)“弱關(guān)系”的人發(fā)布的微博內(nèi)容中,所有9個(gè)類(lèi)別即新聞消息類(lèi)(β=0.811,p<0.001)、金融科技類(lèi)(β=0.527,p<0.001)、教育衛(wèi)生類(lèi)(β=0.395,p=0.003)、人文藝術(shù)類(lèi)(β=0.415,p=0.001)、娛樂(lè)明星類(lèi)(β=0.475,p=0.011)、娛樂(lè)產(chǎn)業(yè)類(lèi)(β=0.646,p<0.001)、體育競(jìng)技類(lèi)(β=1.075,p<0.001)、日常生活類(lèi)(β=0.467,p=0.002)和時(shí)尚美妝類(lèi)(β=0.635,p<0.001)與算法推斷均存在顯著正相關(guān)性(如表4所示)??梢?jiàn)當(dāng)用戶(hù)關(guān)注的大V發(fā)布越多有關(guān)某領(lǐng)域的內(nèi)容時(shí),算法越傾向于判斷該用戶(hù)也會(huì)對(duì)這一領(lǐng)域感興趣,由此證明“弱關(guān)系”也是微博推薦流進(jìn)行用戶(hù)興趣推斷的重要依據(jù),H5得到驗(yàn)證。

        表4 有序Logistic回歸:用戶(hù)自主行為、弱關(guān)系與算法推斷

        最后考察“強(qiáng)關(guān)系”對(duì)算法推斷的影響。在對(duì)98名用戶(hù)進(jìn)行匿名編號(hào)后,隨機(jī)抽取其中13名作為樣本(編號(hào):11、26、27、28、30、31、32、39、41、42、46、51、53)。記錄13個(gè)賬號(hào)中每一位與用戶(hù)存在“相互關(guān)注”的好友的興趣領(lǐng)域。取每行頻率最高的類(lèi)別,組成該用戶(hù)所有好友最感興趣的項(xiàng)目列表。根據(jù)編碼表將項(xiàng)目合并同類(lèi)項(xiàng),得到該用戶(hù)所有好友在9個(gè)類(lèi)別中最感興趣的項(xiàng)目列表。重復(fù)此操作,獲得13名用戶(hù)的所有好友在9個(gè)類(lèi)別中最感興趣的項(xiàng)目情況并將其百分比化(如表5所示)。

        表5 用戶(hù)好友的最感興趣項(xiàng)目百分比統(tǒng)計(jì)表(%)

        將用戶(hù)好友最感興趣的項(xiàng)目分類(lèi)結(jié)果與算法推斷進(jìn)行相關(guān)性分析,結(jié)果顯示:在與用戶(hù)呈現(xiàn)“強(qiáng)關(guān)系”的人所最感興趣的項(xiàng)目類(lèi)別中,大部分類(lèi)別與算法推斷無(wú)顯著相關(guān)性,只有人文藝術(shù)類(lèi)(r=0.71,p=0.007)、娛樂(lè)明星類(lèi)(r=0.63,p=0.022)和時(shí)尚美妝類(lèi)(r=0.71,p=0.006)的用戶(hù)好友最感興趣的項(xiàng)目與算法推斷存在顯著正相關(guān)關(guān)系。此外,娛樂(lè)產(chǎn)業(yè)類(lèi)(r=-0.56,p=0.048)中的用戶(hù)好友興趣與算法推斷呈現(xiàn)顯著負(fù)相關(guān)關(guān)系,說(shuō)明即便用戶(hù)好友對(duì)娛樂(lè)產(chǎn)業(yè)不感興趣,系統(tǒng)仍然可能判定該用戶(hù)對(duì)娛樂(lè)產(chǎn)業(yè)感興趣(如圖4所示)??梢?jiàn),用戶(hù)好友的興趣與算法推斷僅呈現(xiàn)部分相關(guān)性,H6不成立。

        圖4 用戶(hù)好友(強(qiáng)關(guān)系)最感興趣類(lèi)別與算法推斷的相關(guān)性分析

        五、總結(jié)

        本研究旨在考察微博“推薦流”的運(yùn)作機(jī)制,在明確提出算法推斷這一中間步驟的同時(shí),對(duì)影響算法推斷的各類(lèi)因素進(jìn)行了探究。根據(jù)分析結(jié)果可知。第一,微博“推薦流”打破了“興趣決定內(nèi)容”這一傳統(tǒng)認(rèn)知,決定內(nèi)容推薦的不是用戶(hù)的真實(shí)興趣,而是算法所推斷的用戶(hù)興趣。算法在判斷用戶(hù)偏好時(shí)可能出現(xiàn)誤判,“微博認(rèn)識(shí)的你”與“真實(shí)的你”之間存在差異。

        第二,算法推斷作為影響推薦流內(nèi)容呈現(xiàn)的核心要素,同時(shí)受到社交關(guān)系和用戶(hù)自主行為的影響。值得注意的是,在社交關(guān)系維度中與用戶(hù)呈現(xiàn)“強(qiáng)關(guān)系”的親友群組對(duì)于內(nèi)容類(lèi)別的喜好并未顯著地影響算法推斷,相反由大V構(gòu)成的“弱關(guān)系”群組成為決定微博推薦流如何判定用戶(hù)興趣的關(guān)鍵。在微博眼中,那些具有較高領(lǐng)域權(quán)威的明星、名人、機(jī)構(gòu)企業(yè)比起與用戶(hù)關(guān)系密切的好友或大部分普通用戶(hù)而言,更能影響甚至最終主導(dǎo)用戶(hù)所接收到的內(nèi)容。當(dāng)領(lǐng)域權(quán)威成為用戶(hù)獲取內(nèi)容推薦的重要參考指標(biāo)時(shí),“身份”“資本”和“權(quán)力”等現(xiàn)實(shí)社會(huì)中的劃分方式,在平臺(tái)媒體中被重新加以實(shí)踐。這種基于“關(guān)鍵少數(shù)法則”(vital few rule)所進(jìn)行的算法推斷可能會(huì)進(jìn)一步造成網(wǎng)絡(luò)空間中對(duì)弱小聲音、新聲音的抹除。

        需指出,由于微博賬號(hào)的獲取難度較大,本研究以98名用戶(hù)和抽樣的“強(qiáng)關(guān)系”作為研究樣本,研究結(jié)果的代表性可能有限,更為確切的結(jié)論需要更大規(guī)模的樣本予以支撐。

        注釋?zhuān)?/p>

        ① Glick,J.Rise of the Platishers.http://www.recode.net/2014/2/7/11623214/rise?of?the?platishers.2014-2-7.

        ② Gieber,W.News Is What Newspapermen Make It.In A.Lewis&D.M.White,(Eds.),People,Society and Mass Communication.New York:The Free Press.1964.pp.160-172.

        ③ Diakopoulos,N.Algorithmic Accountability Reporting:On the Investigation of Black Boxes.Tow Center for Digital Journalism.https://academiccom?mons.columbia.edu/doi/10.7916/D8ZK5TW2.2014-2-12.

        ④ Pasquale,F(xiàn).A.Restoring Transparency to Automated Authority.Journal on Telecommunications and High Technology Law,vol.9,2011.pp.235-256.

        ⑤ 王茜:《打開(kāi)算法分發(fā)的“黑箱”——基于今日頭條新聞推送的量化研究》,《新聞?dòng)浾摺罚?017年第9期,第7-14頁(yè)。

        ⑥ 王茜:《批判算法研究視角下微博“熱搜”的把關(guān)標(biāo)準(zhǔn)考察》,《國(guó)際新聞界》,2020年第7期,第26-48頁(yè)。

        ⑦ 每日經(jīng)濟(jì)新聞:《微博發(fā)布Q4及全年業(yè)績(jī):2021營(yíng)收22.6億美元 同比增長(zhǎng)34%》。https://weibo.com/ttarticle/p/show?id=230940474 3007546245214.2022年3月3日。

        ⑧ 中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心:《2016年中國(guó)互聯(lián)網(wǎng)新聞市場(chǎng)研究報(bào)告》,http://www.cac.gov.cn/2017-01/12/c_1121534556.htm.2017年1月12日。

        ⑨ Str?mb?ck,J.,Djerf-Pierre,M.,Shehata,A.The Dynamics of Political Interest and Newsmedia Consumption:ALongitudinal Perspective.International Journal of Public OpinionResearch,vol.25,no.4,2013.pp.414-435.

        ⑩ McPherson,M.,Smith?Lovin,L.,Cook,J.M.Birds of a Feather:Homophily in Social Networks.Annual Review of Sociology,vol.27,no.1,2001.pp.415-444.

        猜你喜歡
        感興趣好友類(lèi)別
        更 正
        含能材料(2021年1期)2021-01-10 08:34:34
        屬羊
        刪除好友
        雜文月刊(2017年20期)2017-11-13 02:25:06
        這樣的智能廚房臺(tái)面,你會(huì)感興趣嗎?
        服務(wù)類(lèi)別
        論類(lèi)別股東會(huì)
        商事法論集(2014年1期)2014-06-27 01:20:42
        中醫(yī)類(lèi)別全科醫(yī)師培養(yǎng)模式的探討
        夢(mèng)斷交易會(huì)
        聚合酶鏈?zhǔn)椒磻?yīng)快速鑒別5種常見(jiàn)肉類(lèi)別
        現(xiàn)在是幾點(diǎn)
        老同志之友(2009年9期)2009-06-29 05:25:36
        久久久久亚洲AV成人网毛片 | 久久久一本精品久久久一本| 亚洲高清一区二区三区在线播放| 国产精品日本一区二区在线播放| 国产伦精品一区二区三区| 国产小视频网址| 亚洲中文字幕国产综合| 亚洲国产精品婷婷久久| 极品少妇小泬50pthepon| 国产亚洲精品第一综合麻豆| av手机天堂| 自拍偷拍韩国三级视频| 日韩人妻熟女中文字幕a美景之屋 国产suv精品一区二区四 | 亚洲gv白嫩小受在线观看| 国产亚洲精品国看不卡| 日本老熟妇五十路一区二区三区| 国产精品国产三级国产av品爱网| 国产av一区二区精品久久凹凸| 狠狠色狠狠色综合网老熟女 | 富婆猛男一区二区三区| 国产免费av片无码永久免费| 国产成人精品午夜福利在线| 日本国主产一区二区三区在线观看| 成年人干逼视频水好多| 日夜啪啪一区二区三区| 国产精品短视频| 国产黄色三级三级三级看三级| 强奸乱伦影音先锋| 在线va免费看成| 国产三级视频在线观看视主播| 亚洲自拍偷拍一区二区三区 | 国产精品99无码一区二区| 免费av片在线观看网站| 日本啪啪一区二区三区| 人成在线免费视频网站| 免费人成视频xvideos入口| 纯肉无遮挡H肉动漫在线观看国产| 少妇又色又爽又刺激的视频| 国产精品乱码人妻一区二区三区| 女人做爰高潮呻吟17分钟| 青青草极品视频在线播放|