李閃閃
摘 要 2018年4月,今日頭條因?yàn)槠脚_(tái)涉及低俗、色情等內(nèi)容接連接受整改,這讓我們在感嘆其可以提供“精準(zhǔn)化、個(gè)性化、定制化”內(nèi)容的同時(shí),也不得不去思考個(gè)性化推薦新聞客戶端在大數(shù)據(jù)時(shí)代面臨的困境問題。文章借鑒拉斯維爾的“5W理論”研究思路,對今日頭條平臺(tái)“信息來源——信息把關(guān)、處理——信息推送后的結(jié)果”的傳播過程進(jìn)行線性分析,對其遇到的困境進(jìn)行了5點(diǎn)梳理,以求引發(fā)個(gè)性化推薦新聞客戶端的思考,并不斷做出改進(jìn)。
關(guān)鍵詞 大數(shù)據(jù)時(shí)代;個(gè)性化推薦;新聞客戶端;困境分析;今日頭條
中圖分類號(hào) TP3 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)212-0130-03
1 問題研究背景
1.1 大數(shù)據(jù)時(shí)代背景
1.1.1 大數(shù)據(jù)
關(guān)于大數(shù)據(jù)的定義眾說紛紜,對大數(shù)據(jù)的理解取決于定義者的態(tài)度和學(xué)科背景。有關(guān)大數(shù)據(jù)的特點(diǎn),行業(yè)內(nèi)比較認(rèn)可的有以下4點(diǎn):Volume(規(guī)模性)、Variety(多樣性)、Velocity(高速性)、Value(價(jià)值性)。大數(shù)據(jù)的規(guī)模性、多樣性對應(yīng)于當(dāng)今時(shí)代信息的海量化、多元化。紛繁復(fù)雜的信息時(shí)代,規(guī)模化的數(shù)據(jù)信息可以快速生成、在人與人之間急劇傳播,對這些數(shù)據(jù)進(jìn)行挖掘又可以產(chǎn)生不可估量的價(jià)值,這又恰與大數(shù)據(jù)后兩個(gè)特性不謀而合。
1.1.2 大數(shù)據(jù)催生個(gè)性化新聞推薦
傳統(tǒng)上的新聞客戶端,多是通過人工篩選、編輯信息,基于用戶的共性需求推薦同樣的新聞內(nèi)容,即共性化推送。大數(shù)據(jù)時(shí)代的到來和科技的進(jìn)步使得個(gè)性化新聞推薦成為可能。北京字節(jié)跳動(dòng)科技有限公司就是在這樣的時(shí)代背景下,充分發(fā)揮其敏銳的嗅覺,開發(fā)了今日頭條——一個(gè)基于數(shù)據(jù)挖掘的個(gè)性化信息推薦引擎。從2012年9月開發(fā)第一版推薦系統(tǒng)以來,今日頭條緊跟大數(shù)據(jù)時(shí)代的腳步,成為個(gè)性化推薦系統(tǒng)行業(yè)的先驅(qū)和佼佼者,其新聞聚合、分發(fā)模式很好地解決了大數(shù)據(jù)時(shí)代信息過載的問題。
1.2 今日頭條接連接受整改
2018年4月,今日頭條以極不情愿的姿態(tài)上了頭條。4月4日,國家廣播電視總局約談今日頭條,要求立即整改,全面清查庫存節(jié)目;4月9日,應(yīng)用市場下架今日頭條客戶端,并暫停服務(wù)三周;4月10日,今日頭條永久關(guān)停旗下“內(nèi)涵段子”客戶端及公眾號(hào);4月11日,今日頭條下的抖音App刪除了所有用戶評(píng)論。在此之前,今日頭條也受到過類似的處理。2017年12月29日,北京市網(wǎng)信辦就曾針對今日頭條持續(xù)傳播色情、低俗信息約談企業(yè)負(fù)責(zé)人,責(zé)令企業(yè)立即停止違法行為。大數(shù)據(jù)時(shí)代下,個(gè)性化新聞推薦使得點(diǎn)對點(diǎn)(P2P)的傳播更精準(zhǔn),但也帶來了一些問題,值得我們思考和研究。
2 今日頭條困境分析
拉斯維爾的“5W理論”向我們展示了新聞信息傳播的過程:Who?says?what?in?which?channel? to?whom?with?what?effects,這為本文研究的問題也提供了一個(gè)很好的線性分析思路。從今日頭條聚合新聞信息到推薦到用戶的手機(jī)客戶端界面,經(jīng)歷了一個(gè)“信息來源——信息把關(guān)、處理——信息推送后的結(jié)果”的過程,因此筆者按照這個(gè)流程對今日頭條面臨的困境進(jìn)行了以下五點(diǎn)分析。其中針對“平臺(tái)信息來源”,進(jìn)行了第一點(diǎn)分析,針對“信息把關(guān)、處理”,進(jìn)行了第二、第三點(diǎn)分析,針對“信息推送后的結(jié)果”,進(jìn)行了第四、第五點(diǎn)分析。
2.1 聚合各平臺(tái)信息,引來版權(quán)糾紛
2014年以來,廣州日報(bào)等多家媒體曾聲稱今日頭條侵犯版權(quán),2017年5月2日,《南方日報(bào)》也發(fā)表公告指責(zé)今日頭條竊取自家新聞。針對侵權(quán)問題,今日頭條負(fù)責(zé)人曾以各種理由抗辯,打法律擦邊球,但也有不少業(yè)內(nèi)人士認(rèn)定今日頭條構(gòu)成侵權(quán)。IT法律專家趙占領(lǐng)指出:今日頭條構(gòu)成侵權(quán)主要涉及兩種方式,一是深層鏈接,二是采用轉(zhuǎn)碼“優(yōu)化”的方式進(jìn)行轉(zhuǎn)載。這兩種轉(zhuǎn)載方式都沒有將原有網(wǎng)頁進(jìn)行完全呈現(xiàn),因此涉嫌侵權(quán)[ 1 ]。筆者了解到,今日頭條在對信息進(jìn)行處理時(shí),可能將原有媒體頁面進(jìn)行“優(yōu)化”、更改媒體來源、改變網(wǎng)站原有設(shè)計(jì)、屏蔽廣告,這也給趙占領(lǐng)專家的解釋提供了事實(shí)依據(jù)。
一直以來,新媒體之間,傳統(tǒng)媒體與新媒體之間都不斷存在版權(quán)紛爭。在信息就是財(cái)富的“流量變現(xiàn)時(shí)代”,媒體平臺(tái)要有版權(quán)意識(shí)、法律意識(shí),今日頭條要認(rèn)真處理平臺(tái)信息來源問題,盡量避免再次陷入版權(quán)紛爭。
2.2 機(jī)器代替人工,造成把關(guān)的缺位
今日頭條創(chuàng)始人張一鳴一直堅(jiān)持把大量資金投入到技術(shù)研發(fā)領(lǐng)域,以求用更精密的機(jī)器和更準(zhǔn)確的計(jì)算模型,把用戶的興趣算得更快、更好。重視算法技術(shù)的運(yùn)用,可以提高工作效率,節(jié)省人力資源,但機(jī)器完全代替人工,也會(huì)造成一定的把關(guān)缺位。
2.2.1 把關(guān)缺位,導(dǎo)致大量低質(zhì)內(nèi)容泛濫
作為反映意識(shí)形態(tài)的精神產(chǎn)品的生產(chǎn)者,新聞媒介從屬于上層建筑范疇,可見新聞產(chǎn)品在傳達(dá)意識(shí)形態(tài)、弘揚(yáng)社會(huì)價(jià)值觀上具有重要意義。今日頭條雖然不是信息生產(chǎn)者,但其作為新聞產(chǎn)品的運(yùn)輸者,也理應(yīng)做好把關(guān)作用,確保傳播內(nèi)容的真實(shí)性、積極性、正面性。機(jī)器人進(jìn)行把關(guān),大都是針對新聞信息的自身特性進(jìn)行分發(fā),例如文化類、娛樂類、科技類、生活類等,很難對信息內(nèi)容的優(yōu)劣、價(jià)值觀導(dǎo)向進(jìn)行審核、篩選,因此很可能會(huì)傳播一些色情、低俗的信息。低質(zhì)內(nèi)容的泛濫,會(huì)對用戶產(chǎn)生不良的引導(dǎo),這也正是前不久國家責(zé)令今日頭條整改其平臺(tái)內(nèi)容的原因所在。
2.2.2 算法推薦,導(dǎo)致新聞價(jià)值喪失
國內(nèi)外關(guān)于新聞價(jià)值的討論眾說紛紜,標(biāo)準(zhǔn)不一。一般較為流行的是美國希伯特(《現(xiàn)代大眾傳播工具概論》作者)和麥克道格爾(《闡釋性報(bào)道》作者)提出的新聞價(jià)值五要素:時(shí)效性、接近性、顯著性、重要性、人情味[2]。個(gè)性化信息推薦系統(tǒng)利用數(shù)據(jù)挖掘、算法分析對新聞信息進(jìn)行整合分發(fā),在對新聞價(jià)值的選擇上完全依據(jù)用戶的后臺(tái)使用行為。數(shù)字化的用戶數(shù)據(jù)很難于與新聞價(jià)值的五要素聯(lián)系起來,以此作為評(píng)判新聞價(jià)值的依據(jù),就很難去推送重要及時(shí)、重要有用有趣的信息,一定程度上會(huì)造成新聞價(jià)值的喪失。
2.2.3 機(jī)器把關(guān),媒體難以承擔(dān)社會(huì)責(zé)任
任何新聞媒體都具有與生俱來的公共性,新聞媒體的公共性要求媒體承擔(dān)必要的社會(huì)責(zé)任,以公眾的公共利益為優(yōu)先目標(biāo),或者說公共利益至上是新聞媒體的第一訴求[3]。在今日頭條算法技術(shù)的背后,是機(jī)器所做的枯燥的、冷冰冰的數(shù)學(xué)計(jì)算。只以數(shù)字化的計(jì)算結(jié)果作為后期推薦的依據(jù),媒體自身不對內(nèi)容進(jìn)行把關(guān),則不容易選出公共利益至上的信息。機(jī)器沒有人類情感,沒有社會(huì)歸屬感,自然很難判斷哪些信息對社會(huì)有益,哪些有害,完全用機(jī)器進(jìn)行把關(guān),媒體很難承擔(dān)應(yīng)盡的社會(huì)責(zé)任。
2.3 平臺(tái)信息繁雜,內(nèi)容可能處理不當(dāng)
今日頭條的主要“生產(chǎn)方式”,是廣泛搜索、采集新聞網(wǎng)站、門戶網(wǎng)站、自媒體平臺(tái)或者社區(qū)等的信息,然后通過一定的算法將抓取到的有價(jià)值信息推送給用戶。人工智能時(shí)代,算法的確代表著先進(jìn)的生產(chǎn)力,但算法不是萬能的。因此面對海量的數(shù)據(jù)信息,即便是擁有先進(jìn)技術(shù)的數(shù)據(jù)算法,在內(nèi)容處理上也可能存在問題。
2.3.1 更新頻繁,新聞碎片化閱讀嚴(yán)重
今日頭條根據(jù)用戶使用特征、使用場景進(jìn)行個(gè)性化推薦。使用特征包括用戶瀏覽新聞的時(shí)長、刷新網(wǎng)頁的速率,還有點(diǎn)贊、轉(zhuǎn)發(fā)、評(píng)論等行為,根據(jù)這些個(gè)人特征實(shí)現(xiàn)真正的私人定制。除此之外,基于GPS系統(tǒng),用戶在不同的使用場合也會(huì)收到不同的推薦。用戶的使用行為變化莫測,使用場景不斷變化,這都使得平臺(tái)上的信息更新頻繁。試想一下,如果在不連續(xù)的時(shí)間內(nèi)打開網(wǎng)頁看到的新聞都不一樣,上次閱讀的新聞還沒保存就刷新掉了,就不能實(shí)現(xiàn)連續(xù)性閱讀,新聞碎片化閱讀現(xiàn)象嚴(yán)重,給用戶帶來不便。
2.3.2 標(biāo)題黨新聞泛濫
繁雜的平臺(tái)信息使得內(nèi)容處理成為難題,想要得到更多用戶的關(guān)注,不僅要在內(nèi)容方面著手,在新聞?wù)宫F(xiàn)形式上也要加以改進(jìn),這就催生了大量標(biāo)題黨新聞的產(chǎn)生?;蚴峭ㄟ^聳人聽聞的題目吸引眼球,或是用明星的奇聞軼事來做噱頭,再或是借助“掛羊頭賣狗肉”這樣題文不符的方式來贏得關(guān)注,大數(shù)據(jù)時(shí)代的聚合類新聞平臺(tái)泛濫著太多標(biāo)題黨新聞。這樣只求流量、不講質(zhì)量的方式,難以提高顧客忠誠度,形成極高的用戶黏性,也不利于企業(yè)形象的塑造。
2.3.3 容易重復(fù)推薦相似內(nèi)容,浪費(fèi)用戶注意力
個(gè)性化推薦系統(tǒng)基于“新聞內(nèi)容+數(shù)據(jù)化精確制導(dǎo)”的方式給用戶提供私人定制化信息。一方面,算法技術(shù)通過分析用戶個(gè)人基本信息、興趣特征、使用特點(diǎn)等來給不同用戶提供信息;另一方面,用戶通過不同的標(biāo)簽主動(dòng)選擇自己喜歡的信息內(nèi)容來滿足自身需求。一旦喜歡的內(nèi)容確定下來,機(jī)器在下次就會(huì)完成自動(dòng)推薦。海量信息的不易處理,再加上標(biāo)簽分類的有限性,導(dǎo)致容易重復(fù)推薦相似內(nèi)容,用戶重復(fù)觀看相似的新聞信息,嚴(yán)重浪費(fèi)了注意力。
2.3.4 多為直接轉(zhuǎn)載,內(nèi)容不深刻
今日頭條平臺(tái)上的新聞多為直接轉(zhuǎn)載,沒有對新聞內(nèi)容進(jìn)行二次加工就呈現(xiàn)給用戶。這種運(yùn)作方式對于內(nèi)容相對獨(dú)立的娛樂新聞無可厚非,但對于一些涉及重大事件的政治新聞或是專業(yè)性比較強(qiáng)的經(jīng)濟(jì)新聞,如果不專門進(jìn)行特殊的專題式整合、專題式推送,就不利于用戶全面了解重大新聞事件或新聞話題,內(nèi)容也失去了深刻性。
2.4 個(gè)性化信息推送,形成“信息繭房”
凱斯·R·桑斯坦在2006年著作《信息烏托邦——眾人如何生產(chǎn)知識(shí)》中,提出了“信息繭房”的概念:信息傳播中,因公眾自身的信息需求并非全方位的,公眾只注意自己選擇的東西和使自己愉悅的通訊領(lǐng)域,久而久之,就會(huì)將自身桎梏于像蠶繭一般的“繭房”內(nèi)[4]。今日頭條的個(gè)性化推薦服務(wù)讓每個(gè)人都擁有為自己量身定制一份個(gè)人日報(bào)的可能,但這種行為也導(dǎo)致了“信息繭房”的形成。
2.4.1 信息窄化,阻礙個(gè)人認(rèn)知世界
今日頭條依據(jù)不同的用戶畫像進(jìn)行新聞推送,用戶毫不費(fèi)力就能看到自己感興趣的內(nèi)容。一方面,當(dāng)個(gè)人禁錮在自己所建構(gòu)的信息繭房中,久而久之,個(gè)人生活就會(huì)呈現(xiàn)一種定式化、程序化。另一方面,長期處于過度的主動(dòng)選擇中,沉浸在個(gè)人日報(bào)式的滿足中,個(gè)人信息逐漸窄化,失去了解不同事物的機(jī)會(huì)和能力,也會(huì)阻礙個(gè)人客觀全面地認(rèn)識(shí)世界。
2.4.2 社會(huì)黏性喪失,不利于社會(huì)發(fā)展
在網(wǎng)絡(luò)信息時(shí)代,社會(huì)是一個(gè)個(gè)原子式的用戶的集合體,用戶的行為與社會(huì)發(fā)展息息相關(guān)。算法技術(shù)的應(yīng)用,使得每個(gè)用戶都擁有一個(gè)私人定制式的個(gè)人主頁,達(dá)到了真正的千人千面。精準(zhǔn)化的推送使得每個(gè)人處于自己的信息格子中,如若長期不接收相似的新聞內(nèi)容,在發(fā)生重大公共事件時(shí),就會(huì)妨礙社會(huì)共識(shí)的凝聚和公共議程的設(shè)置,也不利于公共事件的解決和公共政策的出臺(tái)。
2.4.3 助推網(wǎng)絡(luò)群體極化
群體極化這一論點(diǎn)最早是詹姆斯·斯托納在1961年提出的,是指在群體中進(jìn)行決策時(shí),人們往往會(huì)比個(gè)人決策時(shí)更傾向于冒險(xiǎn),向某一個(gè)極端偏斜,從而背離最佳決策。雖然今日頭條的用戶在接收信息上相對獨(dú)立,但是新聞下面的評(píng)論、回復(fù)、分享、關(guān)注等功能在獨(dú)立的用戶之間架起了溝通的橋梁,容易形成一個(gè)個(gè)網(wǎng)絡(luò)群體。原子化的個(gè)人聚集在一起會(huì)產(chǎn)生強(qiáng)大的呼聲,面對公眾事件,群體可能會(huì)做出更冒險(xiǎn)、更極端的行為,再加上網(wǎng)絡(luò)的匿名性,這種群體極化現(xiàn)象會(huì)越來越嚴(yán)重。
2.4.4 個(gè)人接收信息的“回音室效應(yīng)”
桑斯坦曾指出:由于人們只說或只選擇愉悅自己的通訊領(lǐng)域,久而久之,具有相似想法的人都能并且的確把自己歸入他們設(shè)計(jì)的回音室,制造偏激的錯(cuò)誤、過度的自信和沒道理的極端主義[5]。長期接收相似信息的用戶,信息窄化,容易造成思維模式的固化,認(rèn)知世界的積極性、創(chuàng)新性可能也會(huì)隨之減弱;眼光永遠(yuǎn)局限一隅,坐井觀天,以為自己接受的信息都是正確的、自己的觀點(diǎn)都是無誤的,這樣長期的盲目自信從長遠(yuǎn)角度來看對個(gè)人、對社會(huì)都是不利的。
2.5 用戶信息可二次利用,個(gè)人隱私容易泄露
今日頭條的內(nèi)容分發(fā)平臺(tái)是基于移動(dòng)端的,集社交、搜索、場景識(shí)別、個(gè)性化推送、智能化聚合為一體的智能算法平臺(tái),這種算法平臺(tái)的背后是打包儲(chǔ)存的用戶數(shù)據(jù)。在眼球經(jīng)濟(jì)時(shí)代,用戶流量就是金錢,用戶數(shù)據(jù)的價(jià)值已不再單純來自于它的基本用途,而更多來自它的二次利用。一旦打包好的用戶數(shù)據(jù)遭到泄露,會(huì)產(chǎn)生嚴(yán)重的后果。經(jīng)官方統(tǒng)計(jì),截至2016年10月,今日頭條累計(jì)激活用戶達(dá)到7億。如此龐大的數(shù)據(jù)信息一旦遭到泄露,被不法分子利用,對個(gè)人乃至社會(huì)都可能是一場災(zāi)難。
大數(shù)據(jù)時(shí)代,個(gè)人隱私數(shù)據(jù)的保護(hù)成為一個(gè)棘手的問題,面臨著內(nèi)憂外患。內(nèi)憂主要指的是企業(yè)內(nèi)部,可能出現(xiàn)四種不同形式的泄露:信息的收集、誤用、二次使用和未授權(quán)訪問;外患主要指的是外部人為了獲取數(shù)據(jù),通過系統(tǒng)的漏洞對數(shù)據(jù)進(jìn)行竊取。[6]由此可見,大數(shù)據(jù)時(shí)代,個(gè)人隱私變得數(shù)據(jù)化,個(gè)人隱私的泄露方式更隱匿、更多樣。因此今日頭條作為廣大社會(huì)群體認(rèn)識(shí)世界的窗戶,不僅要承擔(dān)提供信息的責(zé)任,還要保護(hù)好用戶的個(gè)人隱私,這樣才能值得用戶信任,進(jìn)而提升媒體的公信力和影響力。?
3 結(jié)論
大數(shù)據(jù)時(shí)代下,個(gè)性化新聞推薦系統(tǒng)通過算法分析、精準(zhǔn)推送很好地解決了信息過載的問題,但純技術(shù)化的信息分發(fā)方式也帶來了“侵犯版權(quán)、把關(guān)缺位、信息處理不當(dāng)、信息繭房、個(gè)人隱私泄露”諸多問題。今日頭條等個(gè)性化推薦新聞客戶端應(yīng)該意識(shí)到自身所處的困境,提出有針對性的解決方案,這樣在競爭激烈的新聞市場,才能永遠(yuǎn)保持領(lǐng)先地位。
參考文獻(xiàn)
[1]趙剛.“今日頭條”:行走于創(chuàng)新和版權(quán)之間[N].光明日報(bào),2014,6(10):10.
[2]郝雨.回歸本意的新聞價(jià)值研究[J].上海大學(xué)學(xué)報(bào)社會(huì)科學(xué)版,2006,13(6):69-74.
[3]李良榮.新聞學(xué)概論[M].上海:復(fù)旦大學(xué)出版社,2015:141.
[4]梁鋒.信息繭房[J].新聞前哨,2013(1):87.
[5]凱斯·R·桑斯坦.信息烏托邦——眾人如何生產(chǎn)知識(shí)[M].北京:法律出版社,2008.
[6]劉雅輝,張鐵贏,靳小龍.大數(shù)據(jù)時(shí)代的個(gè)人隱私保護(hù)[J].計(jì)算機(jī)研究與發(fā)展,2015,52(1):229-247.