(上海交通大學(xué)媒體與傳播學(xué)院,上海 200240)
2018年4月9日,四款新聞資訊類應(yīng)用分別被下架整改。4月,聚合類新聞客戶端龍頭應(yīng)用今日頭條相繼被約談、整改四次,其間其主要應(yīng)用“內(nèi)涵段子”還被永久性封停。實際上,這一整改命令看似突然又實屬必然,早在2017年下半年,《人民日報》就曾連發(fā)三篇評論,《不能讓算法決定內(nèi)容》《別被算法困在信息繭房》《警惕算法走向創(chuàng)新的反面》。其矛頭都是指聚合類新聞客戶端最底層也是其最引以為傲的產(chǎn)品邏輯——依賴算法分發(fā)內(nèi)容。
本文在這樣的整改大背景下,對聚合類新聞客戶端的算法邏輯進行分析,再探討其存在主要問題的基礎(chǔ)上提出這一類以算法為主導(dǎo)的新聞客戶端的轉(zhuǎn)型方向。
聚合類新聞客戶端是指具有商業(yè)性質(zhì)的網(wǎng)絡(luò)科技公司等利用計算機的算法技術(shù)獲取并聚合新聞媒體發(fā)布的資訊內(nèi)容,并將閱讀量高、新聞價值屬性強的文章主動推送給用戶的應(yīng)用,它們本身不是新聞內(nèi)容的生產(chǎn)者,而是信息的推送者,例如今日頭條、一點資訊。根據(jù)中商情報網(wǎng)的數(shù)據(jù)統(tǒng)計結(jié)果顯示,截至2017年上半年,新聞資訊類下載量排行榜中,騰訊新聞領(lǐng)跑,今日頭條緊隨其后,天天快報、ZAKER、一點資訊等聚合類新聞客戶端均位列前十。
算法是聚合類新聞客戶端的核心配置,也是支撐這一支“隊伍”異軍突起的核心力量?;谒惴ǖ男侣劸酆?個性化推薦是聚合類新聞客戶端的傳播模式。
聚合類客戶端自己不生產(chǎn)新聞,而是通過網(wǎng)絡(luò)爬蟲技術(shù)從互聯(lián)網(wǎng)的各個角落抓取信息,匯總信息至自己的客戶端,匯總后的信息經(jīng)過機器化的處理打上標(biāo)簽,并劃分出每一個時刻的熱點新聞,經(jīng)過用戶圖譜分析后為用戶推送定制化的新聞。
一般來說,新聞的個性化推薦算法主要有三種。一是基于內(nèi)容的推薦,即用戶在使用社交媒體登陸今日頭條賬戶后,系統(tǒng)會挖掘用戶的基本信息,形成用戶的畫像,與此同時,對用戶的使用行為進行識別記憶,總結(jié)出用戶的興趣圖譜,計算每條新聞與用戶畫像的相似度,將相似度最高的新聞推薦給用戶;二是協(xié)同過濾推薦,推薦與受眾具有相同愛好的群體的信息;三是單因子推薦,基于新聞的點贊量、閱讀量等對新聞的重要程度進行排序,優(yōu)先推薦那些大眾關(guān)注度高、排名靠前的信息。
以算法分發(fā)為核心的客戶端,運行的關(guān)鍵邏輯在數(shù)據(jù)。相較于社交分發(fā),聚合類新聞客戶端的內(nèi)容被剝奪了粉絲基礎(chǔ),每一篇內(nèi)容都要重新賽跑。在生產(chǎn)者生產(chǎn)內(nèi)容后,同一批內(nèi)容會被先投放到一個較小的流量池,只有你的“數(shù)據(jù)”足夠可觀,才會被投放到更大的流量池,而通常,這些數(shù)據(jù)特指“點贊量、閱讀量、評論量”。在一家以“輕度內(nèi)容”為主要調(diào)性的客戶端中,用戶的閱讀習(xí)慣也會被培養(yǎng)成“輕度”,即“我點開你,只是為了輕松一下”,在這樣的氛圍下,“深度內(nèi)容”的廣泛傳播幾乎沒有可能性。
同樣地,基于算法圖譜的分發(fā)模式,在聚合類新聞客戶端上的內(nèi)容創(chuàng)造,可以說從一開始就是為了“迎合用戶”而存在。復(fù)制粘貼遠比原創(chuàng)來的簡易,標(biāo)題黨遠比深度黨的流量更廣。正如人民日報算法三評的文中說的一樣,對于普通的內(nèi)容生產(chǎn)者,如果想在這種平臺上生存下去,就只能一味迎合,而失去了獨立思考、深度觀察的能力,進而削弱整個社會的創(chuàng)造力。①
新聞傳播中的把關(guān)人是指那些在新聞媒介系統(tǒng)中居于決斷性的關(guān)鍵位置,對信息進行加工的人或組織②。在聚合類客戶端中,把關(guān)者的角色讓位于算法,“你是誰”決定了“推給你什么樣的內(nèi)容”。
《人民日報》關(guān)于算法的三評中第一評就是對算法把關(guān)進行集中批評,其認為大數(shù)據(jù)時代內(nèi)容的野蠻生長之勢加劇的主要原因就在于算法替代了傳統(tǒng)編輯,把關(guān)的唯一標(biāo)準就是信息能不能抓眼球。聚合類客戶端一直宣稱的是算法沒有價值觀,適用于媒體的新聞專業(yè)主義和新聞倫理規(guī)范并不適用于算法工程師或程序員,致使這一類客戶端成為了“低俗、媚俗”的代名詞。
信息繭房的概念由美國芝加哥大學(xué)教授桑斯坦在其著作《信息烏托邦》中提出,他認為在信息傳播過程中,公眾自身的信息需求并非是全方位的,公眾只注意自己選擇的東西和使自己愉悅的通信領(lǐng)域,久而久之會將自身桎梏于像蠶繭一般的“繭房”里③。
盡管用戶的選擇性心理與行為是造成繭房的內(nèi)在動因,但是算法推薦在無形中“剝奪”了用戶接收其他領(lǐng)域知識的機會。用戶的使用和算法的計算之間是一種頑固的循環(huán)。鄭州大學(xué)的王茜在其文章的調(diào)研中發(fā)現(xiàn),77名使用今日頭條的學(xué)生里,沒有兩個人收到過相同的信息。④即如果你沒有點擊過與籃球有關(guān)的信息,那么即使NBA界發(fā)生了再大的要事你也不會收到與此相關(guān)的新聞推送,如果你的圖譜里顯示你對這個領(lǐng)域沒有興趣,那么有可能你永遠都不會接收到來自這個領(lǐng)域的信息,每個人之間的信息都成了一座孤島。
算法推薦與信息繭房并非是一組不可調(diào)和的矛盾。在聚合類新聞客戶端中,信息會繭化的主要原因在于使用了“召回模型”層次的推薦算法,這種算法是依靠非常有限但又非常核心的基于“標(biāo)簽”的策略來判斷內(nèi)容是否可以入選⑤,推薦的邏輯相對簡單,才會很容易造成互動的“閉環(huán)”。
減免背負“信息繭房”的罵名就需要聚合類新聞客戶端在算法上進一步改進。例如完善用戶的興趣圖譜。在智能化時代,除了互聯(lián)網(wǎng)中的用戶數(shù)據(jù),傳感器獲取的物理信息系統(tǒng),如智能電網(wǎng)、智慧城市等系統(tǒng)數(shù)據(jù)以及科學(xué)數(shù)據(jù)同樣是用戶大數(shù)據(jù)的重要來源。⑥此外,在內(nèi)容標(biāo)簽上,改變基于熱度的推薦機制,增加更多的推薦維度,提高算法鑒別優(yōu)質(zhì)內(nèi)容的能力及對內(nèi)容進行準確分類的能力,減少推薦時的重復(fù)率。
盡管依靠算法可以很大程度上減輕人工勞動力,提高推薦效率,但“無價值觀”的冷機器彌補不了人文情懷的缺失。“人工+算法”的把關(guān)模式,可以讓人工編輯在算法推薦的基礎(chǔ)上,根據(jù)用戶的心理進行內(nèi)容的進一步篩選,提高精確度。一點資訊最早結(jié)合“搜索+推薦”,使用“人工+算法”的推薦模式。2018年1月,在經(jīng)過數(shù)次整改和警告后,今日頭條宣布規(guī)模招募2000名人工編輯,黨員優(yōu)先,正式開啟人工+算法的審核模式。
自媒體人羅振宇在評價今日頭條時所說:“這是一款母愛邏輯產(chǎn)品,你喜歡什么就給你推薦什么。不會教用戶克制、自律。而是全力滿足你自己的內(nèi)容閱讀需求,進而為自己謀得利益。”無論聚合類新聞客戶端是否承認自己是不是媒體,它們都無法否認的一點是,作為占據(jù)了大半個山頭的新聞分發(fā)平臺,必須承擔(dān)一定的社會責(zé)任。低俗化的野蠻生長已經(jīng)為其打下了半壁江山,接下來是時候正視自己的價值觀了。
隨著算法推薦逐漸成為移動互聯(lián)網(wǎng)應(yīng)用的主流邏輯,正視算法的不足,完善推薦技術(shù)與把關(guān)機制應(yīng)及時被提上日程。聚合類新聞客戶端應(yīng)將社會責(zé)任感貫穿于信息分發(fā)過程之中,既能“迎合”用戶又能“教育”用戶,如此才能走得穩(wěn)走得遠。
注釋:
①人民網(wǎng)三評算法推薦:警惕算法走向創(chuàng)新的反面http://opinion.people.com.cn/n1/2017/0920/c1003-29545718.html
②張國良.傳播學(xué)原理[M].上海:復(fù)旦大學(xué)出版社,2011.
③凱斯·R·桑斯坦.《信息烏托邦——眾人如何生產(chǎn)知識》,畢競悅譯,法律出版社,北京,2008.7.
④王茜.打開算法分發(fā)的“黑箱”——基于今日頭條新聞推送的量化研究[J].新聞記者,2017.09.
⑤熊敏.內(nèi)容職能分發(fā)平臺對新聞傳播的價值創(chuàng)新分析——以今日頭條為例[J].編輯學(xué)刊,2017.02.
⑥李建中,劉顯敏.大數(shù)據(jù)的一個重要方面[J].計算機的研究與發(fā)展,2013,50(6).