作者簡介:涂凌波,男,教授,博士生導(dǎo)師;趙奧博,男,碩士研究生。
摘"要:作為自然語言處理技術(shù)和生成式人工智能的里程碑,Chat GPT技術(shù)和AIGC的興起正在改變新聞傳播活動的面貌,也意味著大數(shù)據(jù)已深度嵌入社會系統(tǒng)之中。文章從新聞傳播學(xué)角度,討論大數(shù)據(jù)的角色和功能及其對新聞傳播活動所產(chǎn)生的影響。在厘清大數(shù)據(jù)的四種基本認(rèn)識基礎(chǔ)上,文章認(rèn)為大數(shù)據(jù)是驅(qū)動數(shù)字新聞傳播活動的基礎(chǔ)資源和關(guān)鍵要素,也是AIGC的語料庫和資源池。然而,應(yīng)當(dāng)對數(shù)據(jù)商品化、人與數(shù)據(jù)深度綁定、數(shù)字勞動等保持批判意識,避免淪為“數(shù)據(jù)中心主義”。在AIGC帶來的新聞傳播業(yè)變化中,應(yīng)找尋人的主體價值,倡導(dǎo)良性的數(shù)字交往。
關(guān)鍵詞:AIGC;ChatGPT;數(shù)字新聞學(xué);大數(shù)據(jù);傳播政治經(jīng)濟(jì)學(xué)
中圖分類號:G20文獻(xiàn)標(biāo)識碼:A文章編號:2096-8418(2023)03-0009-08
基于人工智能技術(shù)驅(qū)動的自然語言處理(NLP,Natural Language Processing)應(yīng)用ChatGPT,已經(jīng)掀起了一場全社會的討論熱潮。作為專門化人工智能領(lǐng)域的里程碑式的產(chǎn)品,ChatGPT僅在發(fā)布五天后就已突破100萬用戶,并在發(fā)布兩個月內(nèi),實現(xiàn)月活躍用戶突破1億,成為史上用戶數(shù)增長最快的消費(fèi)者應(yīng)用。迄今為止,該應(yīng)用已經(jīng)迭代至GPT-5階段,而由GPT技術(shù)引發(fā)的新一輪的內(nèi)容生產(chǎn)和新聞傳播變革正在成為學(xué)界業(yè)界的關(guān)注熱點(diǎn)。
不同于高門檻、長周期的專業(yè)生產(chǎn)內(nèi)容(PGC)和泛參與性的用戶產(chǎn)生內(nèi)容(UGC),學(xué)界和業(yè)界將這種基于大數(shù)據(jù)、互聯(lián)網(wǎng)和人工智能等技術(shù)生成的內(nèi)容稱為AIGC(AI-Generated Content,人工智能生成內(nèi)容)。AIGC是在大模型基礎(chǔ)上、基于自然語言處理技術(shù)的生成式內(nèi)容,其底層邏輯是一個超級規(guī)模的大數(shù)據(jù)結(jié)構(gòu),并以此為基礎(chǔ)的算法學(xué)習(xí)和對話式內(nèi)容生成,其核心在于由超級規(guī)模的數(shù)據(jù)所驅(qū)動,并通過對抗學(xué)習(xí)生成模型且不斷迭代。
可以說,在AIGC帶來的新聞傳播活動變革下,研究和討論本已十分重要的“大數(shù)據(jù)”問題具有理論和實踐的雙重意義。若從更宏觀的背景來看,GPT技術(shù)和AIGC的發(fā)展正是大數(shù)據(jù)技術(shù)已經(jīng)深度嵌入社會系統(tǒng)之中的表現(xiàn)。從經(jīng)濟(jì)社會活動來看,近年來我國實施大數(shù)據(jù)戰(zhàn)略取得顯著成效。從日常生活中的個人移動支付、征信記錄查詢到疫情防控下的健康碼、行程軌跡等數(shù)據(jù)使用,大數(shù)據(jù)塑造著人們的交往行為與觀念,更是成為社會組織、協(xié)調(diào)、動員的重要資源。然而,在現(xiàn)實運(yùn)作中也出現(xiàn)了唯數(shù)據(jù)、制造數(shù)據(jù)、“只看數(shù)據(jù)不看人”等問題,這些都對社會治理帶來了新的挑戰(zhàn)。作為一種重要的生產(chǎn)要素和治理手段,大數(shù)據(jù)同樣是需要被治理的對象。
基于此,本文所討論的核心問題是:在AIGC所引發(fā)的新聞傳播變革背景下,從新聞傳播學(xué)的角度,大數(shù)據(jù)的角色和功能究竟是什么?大數(shù)據(jù)對新聞傳播活動帶來的影響有哪些?我們應(yīng)當(dāng)對當(dāng)前大數(shù)據(jù)的發(fā)展保持怎樣的反思和批判姿態(tài),并推動新聞傳播活動的良性發(fā)展?
一、數(shù)字社會環(huán)境下關(guān)于大數(shù)據(jù)的基本認(rèn)識
正如20世紀(jì)中期以自動化和裝配線為代表的福特主義的出現(xiàn),改變了人們對勞動、工作和社會的理解一樣,大數(shù)據(jù)的誕生也重塑了我們認(rèn)知世界和理解社會的方式。大數(shù)據(jù)(Big Data)作為一個概念,最早由美國科學(xué)家約翰·馬西(John Mashey)于1998年提出,以此描述數(shù)據(jù)量的快速增長帶來的四個挑戰(zhàn),即難理解、難獲取、難處理和難組織。[1]隨著經(jīng)濟(jì)社會和數(shù)字技術(shù)的發(fā)展,尤其是網(wǎng)絡(luò)社會的來臨,大數(shù)據(jù)在社會中扮演的角色愈發(fā)重要,具體可歸納為四種面向。
第一,大數(shù)據(jù)作為一種中性的技術(shù)手段,具有提高經(jīng)濟(jì)社會效率(包括傳播效率)、提升社會治理能力等功能。自科學(xué)主義盛行以來,自然科學(xué)的法則被普遍應(yīng)用在其他領(lǐng)域。而在實證主義研究范式的推動下,數(shù)字在人類社會運(yùn)作過程中的作用越來越大。大數(shù)據(jù)及其技術(shù)的發(fā)展,更是提供了前所未有的廣度、深度和規(guī)模收集和分析數(shù)據(jù)的能力。在國家和社會治理中,大數(shù)據(jù)被視為數(shù)字政府建設(shè)的核心要素,能夠引起“管理革命”,為治理決策提供依據(jù)。數(shù)據(jù)的社會化和社會的數(shù)據(jù)化相結(jié)合,有助于政治、經(jīng)濟(jì)、民生、醫(yī)療等宏觀領(lǐng)域的資源合理配置。
大數(shù)據(jù)還被普遍運(yùn)用于突發(fā)事件預(yù)警和快速響應(yīng)機(jī)制中。新冠肺炎疫情加速了全球社會的數(shù)字化生存,數(shù)據(jù)則以各種形式嵌入了人們的生活。從個體的行程碼、健康碼到社會層面的感染數(shù)據(jù)、傳播軌跡、核酸檢測數(shù)據(jù)、疫苗接種數(shù)據(jù)等,大數(shù)據(jù)連接起個體與社會,疫情傳播規(guī)律和發(fā)展態(tài)勢得以被精準(zhǔn)揭示。從個體的數(shù)據(jù)化生活來看,伴隨著數(shù)據(jù)管理和應(yīng)用的成熟,人們通過記事本、備忘錄、健康A(chǔ)PP等各種數(shù)字媒介工具,實現(xiàn)對個人數(shù)據(jù)或家庭數(shù)據(jù)的自我管理??偟膩砜?,大數(shù)據(jù)是一種物質(zhì)性、工具性的存在,社會功能和意義顯著,這也是人們對于大數(shù)據(jù)的樂觀認(rèn)識。
第二,大數(shù)據(jù)日益成為一種普遍的社會觀念,是現(xiàn)代知識體系中的一類新型知識(知識資源)。2011年的世界經(jīng)濟(jì)論壇提出,數(shù)據(jù)作為21世紀(jì)的一種寶貴資源,是與資本、勞動力相當(dāng)?shù)男滦驮牧稀4撕?,大?shù)據(jù)概念風(fēng)靡開來,甚至被認(rèn)為是信息社會中一種重要的生產(chǎn)力。大數(shù)據(jù)主要指搜索、匯總和交叉引用大型數(shù)據(jù)集的能力。[2]在社會學(xué)視野中,社會事實的客觀性離不開對數(shù)據(jù)收集和分析的系統(tǒng)性方法,數(shù)據(jù)被認(rèn)為可以客觀全面地呈現(xiàn)社會事實,并使得社會科學(xué)工作嚴(yán)謹(jǐn)可靠。大數(shù)據(jù)作為被概念化的社會事實,通過各個學(xué)科的轉(zhuǎn)譯,在社會運(yùn)行中越來越不可或缺。近年來,各個學(xué)科關(guān)于大數(shù)據(jù)的研究反映出社會思想和研究中的計算轉(zhuǎn)向。[3]總之,大數(shù)據(jù)在經(jīng)濟(jì)學(xué)、管理學(xué)、社會學(xué)、傳播學(xué)等各個學(xué)科知識體系中的重要性,揭示了大數(shù)據(jù)本身作為一種知識資源的價值。
第三,從批判的角度反思“數(shù)據(jù)中心”的社會發(fā)展邏輯,重新認(rèn)知大數(shù)據(jù)的價值?,F(xiàn)代經(jīng)濟(jì)社會發(fā)展和社會治理離不開大數(shù)據(jù)的支撐,然而也存在大數(shù)據(jù)的誤用等問題,比如過度追求數(shù)據(jù)化(流量)、將復(fù)雜的社會現(xiàn)實簡化為數(shù)據(jù)等。就新聞傳播業(yè)而言,大數(shù)據(jù)可能影響甚至干擾新聞工作者的判斷,有的時候過分依賴數(shù)據(jù)信息,甚至出現(xiàn)了“無數(shù)據(jù),別說話”(No data, No talk)[4]的新聞傳播觀念。這種“唯數(shù)據(jù)論”的傾向忽視了制作有深度的、受眾所關(guān)切的新聞內(nèi)容所需的時間,也放棄了自身對事實變動準(zhǔn)確報道的能力。正如研究者觀察到的,大數(shù)據(jù)并不具有自我解釋性,更不是所謂的“客觀真理”,而解釋數(shù)據(jù)的方法卻可以引起各種意義的爭論。[5]換言之,我們還是有必要反思作為資源的大數(shù)據(jù)的稀缺性,“大”不一定意味著全面和真實,也可能是冗余和繁雜,因而也有研究者呼吁重思“小數(shù)據(jù)”的價值。
此外,社會不同利益群體和價值的分化,使得大數(shù)據(jù)的管理方面也出現(xiàn)諸多問題。誠然,技術(shù)本無善惡,但技術(shù)作惡卻有一個共同特征,即“既有的社會規(guī)范無力約束新的技術(shù)行為”[6]。如未能秉承技術(shù)節(jié)制原則的“文明碼”的開發(fā)和應(yīng)用,就是技術(shù)治理的數(shù)字化異化和基層治理的簡約化動機(jī)帶來的“滑坡效應(yīng)”[7]。
第四,大數(shù)據(jù)也應(yīng)當(dāng)作為被治理的對象,大數(shù)據(jù)運(yùn)用中的關(guān)鍵是“數(shù)據(jù)善用”,即針對數(shù)據(jù)本身的治理問題。從近年來全球互聯(lián)網(wǎng)治理實踐來看,“治理數(shù)據(jù)”成為各國的共識。就治理的手段來看,包括個人數(shù)據(jù)保護(hù)、數(shù)據(jù)隱私等在內(nèi)的立法和監(jiān)管手段也在跟進(jìn),如歐盟制定的數(shù)據(jù)安全管理法規(guī)《通用數(shù)據(jù)保護(hù)條例》(GDPR)、美國《加利福利亞消費(fèi)者隱私法案》(CCPA)等。我國也出臺《中華人民共和國網(wǎng)絡(luò)安全法》《中華人民共和國數(shù)據(jù)安全法》《中華人民共和國個人信息保護(hù)法》等法律和行政法規(guī),并持續(xù)完善數(shù)據(jù)監(jiān)管的標(biāo)準(zhǔn)和規(guī)范。
平臺(platform)是數(shù)據(jù)收集、處理與保障數(shù)據(jù)安全的信息基礎(chǔ)設(shè)施,也是大數(shù)據(jù)治理的關(guān)鍵對象。作為世界第二大經(jīng)濟(jì)貿(mào)易體,我國擁有多個億級用戶的互聯(lián)網(wǎng)平臺。2020年以來,我國開啟迄今最大一輪的互聯(lián)網(wǎng)反壟斷治理工作。國家通過立法和監(jiān)管等綜合手段,推進(jìn)構(gòu)建大數(shù)據(jù)治理體系和公平競爭的經(jīng)濟(jì)和社會秩序,確保不同主體的數(shù)據(jù)收集、管理和應(yīng)用的透明性,以實現(xiàn)“數(shù)據(jù)善用”“數(shù)據(jù)向善”的核心目標(biāo)。
二、數(shù)字新聞傳播中的基礎(chǔ)資源和關(guān)鍵要素
從新聞傳播學(xué)的視角來看,人類的新聞傳播活動離不開數(shù)據(jù)的支撐,信息的采集、加工、傳播和反饋是新聞業(yè)運(yùn)作的基本環(huán)節(jié),而數(shù)據(jù)則構(gòu)成了信息的基本單元。最早的手抄小報登載的內(nèi)容除了文字簡訊,就是數(shù)據(jù),包括商品內(nèi)容、價格等信息。在數(shù)字新聞業(yè)時代,不管是算法推薦技術(shù)的廣泛使用,還是融合新聞生產(chǎn)、智能新聞生產(chǎn)等新聞傳播新形態(tài)的興起,大數(shù)據(jù)越來越扮演著基礎(chǔ)性功能,構(gòu)成新聞傳播活動的基礎(chǔ)資源和關(guān)鍵要素。
(一)大數(shù)據(jù)作為新聞生產(chǎn)活動的資源
首先,在新聞采集環(huán)節(jié),數(shù)據(jù)是信息的基本單位,一定程度上“表征”了客觀事實。可以說,新聞最開始的地方就是數(shù)據(jù),新聞從業(yè)者們通過采集豐富的數(shù)據(jù),以保證新聞報道的準(zhǔn)確、真實與客觀。早期計算機(jī)技術(shù)引入新聞工作,成為輔助性報道內(nèi)容(computer-assisted reporting,CAR)。而這種通過使用數(shù)據(jù)庫和人工調(diào)查相結(jié)合的方式,為后來的“精準(zhǔn)新聞”提供了方法基礎(chǔ)。但新聞工作者們知道,數(shù)據(jù)本身并不等同于事實,記者們也需要找出“隱藏”在數(shù)據(jù)中的故事或者解釋,這才構(gòu)成通常意義上的新聞。當(dāng)計算機(jī)技術(shù)和社會科學(xué)不斷結(jié)合,諸如數(shù)據(jù)新聞(data journalism)、計算新聞(computational journalism)和機(jī)器人新聞(robot journalism)等基于大數(shù)據(jù)的新聞報道形態(tài)便不斷涌現(xiàn)。
其次,在新聞報道或者“加工”環(huán)節(jié),大數(shù)據(jù)被闡釋為文本,用來描述新聞事實及其變動。大數(shù)據(jù)背后的深層邏輯在于,由量化思維驅(qū)動的實證主義取向認(rèn)識論,使得新聞業(yè)偏向數(shù)據(jù)導(dǎo)向(data-oriented)的報道趨勢,而記者也正在成為一種“確定性的信徒”[8]。正是在這個意義上,數(shù)據(jù)在新聞報道中的使用越來越頻繁。此外,新聞媒體還構(gòu)建了一套數(shù)據(jù)指標(biāo)體系,將數(shù)據(jù)直接當(dāng)作反映社會現(xiàn)實的依據(jù)。以商業(yè)新聞編輯室推出和發(fā)布的國家股市指數(shù)為例,諸如《華爾街日報》的道瓊斯指數(shù)、《金融時報》的富時指數(shù)和《日本經(jīng)濟(jì)新聞》的日經(jīng)指數(shù)等,就被認(rèn)為是經(jīng)濟(jì)社會變動的客觀依據(jù),進(jìn)而在新聞業(yè)發(fā)展過程中成為一種重要的新聞樣態(tài)。
最后,在新聞的傳播和反饋環(huán)節(jié),大數(shù)據(jù)可以揭示新聞報道是否產(chǎn)生了價值,并將原本零散的、瑣碎的新聞報道整合為完整的傳播圖景。在注意力稀缺的時代,數(shù)據(jù)的價值就在于可以成為一種簡化的指標(biāo),便于衡量新聞報道的效果、用戶的關(guān)注度乃至成為“決定什么是新聞”的價值標(biāo)準(zhǔn)。從傳統(tǒng)的電視節(jié)目收視率,到社交媒體時代的新聞閱讀、點(diǎn)贊、轉(zhuǎn)發(fā)和評論量等指標(biāo),數(shù)據(jù)似乎成為傳播資源的代名詞。當(dāng)然,數(shù)據(jù)的過度商業(yè)化不免讓人警惕和擔(dān)憂。
(二)大數(shù)據(jù)作為社會聯(lián)結(jié)的要素
數(shù)字新聞中的數(shù)據(jù)不只是一種抽象的數(shù)字性存在,同樣具有物質(zhì)性的內(nèi)涵。正是在這種物質(zhì)性的流動中,新聞業(yè)得以參與公共世界的建設(shè),并建構(gòu)了自己的存在。[9]在數(shù)字新聞生態(tài)中,數(shù)據(jù)作為一種基礎(chǔ)要素和物質(zhì)資源,構(gòu)建起人與人、人與社會之間廣泛的網(wǎng)絡(luò)關(guān)系。
數(shù)據(jù)聯(lián)結(jié)起各主體之間信息流通。在記者的日常工作中,最重要的任務(wù)之一就是從采訪對象那里獲取信息和數(shù)據(jù),并建立記者和信源之間的聯(lián)結(jié)。而為了達(dá)成社會信任,無論是政府,還是商業(yè)機(jī)構(gòu),都會主動給新聞機(jī)構(gòu)提供數(shù)據(jù),保持與公眾之間的聯(lián)結(jié),數(shù)據(jù)也意味著公開透明。數(shù)字時代,記者不僅需要借助數(shù)據(jù)完成日常性的新聞內(nèi)容生產(chǎn),還要基于大數(shù)據(jù)維護(hù)新聞關(guān)系、開展輿情管理。此外,為了追求新聞的透明性原則,關(guān)于數(shù)據(jù)的來源和生產(chǎn)過程也會盡量公之于眾。在一些情況下,新聞機(jī)構(gòu)還會使用用戶生產(chǎn)貢獻(xiàn)的數(shù)據(jù)素材,如新華社的“全民拍”、澎湃新聞的“湃客”等。
大數(shù)據(jù)本身還是一種交往的方式。在傳統(tǒng)的新聞生產(chǎn)中,記者往往依賴于組織機(jī)構(gòu)和精英群體組成的新聞消息網(wǎng),而大數(shù)據(jù)則帶來了擺脫這種關(guān)系束縛的可能。記者可以成為數(shù)據(jù)的“管理者”和“解釋者”。通過數(shù)字基礎(chǔ)設(shè)施和各種傳播分析工具,記者得以更好地收集、組織和分析網(wǎng)絡(luò)中不同的信息流,預(yù)測、傳播社會事件的過程及其發(fā)展趨勢。
(三)大數(shù)據(jù)作為數(shù)字新聞業(yè)中的行動者
數(shù)字時代的新聞生態(tài)呈現(xiàn)出一種更為混雜(hybrid)的狀態(tài):技術(shù)思維和平臺邏輯深刻嵌入新聞業(yè)的運(yùn)作之中,人類行動者和非人行動者(算法、文本等)的行為相互交織,帶來了新聞傳播活動的巨大變化。如果說在傳統(tǒng)新聞業(yè)時代,數(shù)據(jù)只是作為一種工具性的應(yīng)用存在,那么在數(shù)字新聞業(yè)時代,數(shù)據(jù)則是一個具有一定的自主性的行動者(actor),在新聞生產(chǎn)環(huán)節(jié)中發(fā)揮十分重要的作用。這不僅是行動者網(wǎng)絡(luò)理論(ANT)帶來的啟發(fā),而且是在數(shù)字新聞生態(tài)下人們對大數(shù)據(jù)的新認(rèn)識。
大數(shù)據(jù)及其系統(tǒng)能夠?qū)崟r、全時地對社會事實的變動進(jìn)行監(jiān)測和預(yù)警,進(jìn)而深刻影響新聞生產(chǎn)。作為一種稀缺資源和動態(tài)工作安排,時間制約并塑造了新聞生產(chǎn)。在數(shù)字環(huán)境中,新聞時間除了受新聞工作者和媒體機(jī)構(gòu)影響外,還受制于基于大數(shù)據(jù)運(yùn)作的新聞節(jié)奏。[10]在大數(shù)據(jù)構(gòu)建的新聞節(jié)奏下,任何新聞機(jī)構(gòu)都不能、也不愿意脫離大數(shù)據(jù)使用的效率和便捷,個體的新聞工作者更無法在平臺、用戶和算法之外單方面改變這種數(shù)字新聞生產(chǎn)的節(jié)奏。
基于互聯(lián)網(wǎng)和數(shù)字平臺的傳播實踐,數(shù)據(jù)邏輯成功地嵌入數(shù)字新聞生產(chǎn)的全流程中。當(dāng)前,我們討論的數(shù)字新聞學(xué)(digital journalism)并不僅僅局限于數(shù)據(jù)新聞這一狹義的范疇,而是從選題策劃、編輯流程到呈現(xiàn)樣態(tài)、反饋機(jī)制、傳播網(wǎng)絡(luò)等方面,新聞工作者都需要符合數(shù)字新聞業(yè)的規(guī)則、慣例、時間節(jié)奏等生態(tài)原則,要學(xué)會“與數(shù)字共生”“與數(shù)據(jù)一起工作”。在這個意義上,大數(shù)據(jù)作為一個非人的行動者,為新聞工作者帶來了新的角色定位、工作內(nèi)容和交往關(guān)系,也塑造了數(shù)字新聞業(yè)的運(yùn)作邏輯。
(四)大數(shù)據(jù)作為AIGC的語料庫和資源池
ChatGPT技術(shù)的發(fā)展和AIGC的興起,使得大數(shù)據(jù)的重要性愈發(fā)凸顯。根據(jù)Open AI 2020年發(fā)布的論文,其訓(xùn)練使用了4990億TokenToken:最小語義單位,單詞的信息。即單詞內(nèi)部表示的數(shù)據(jù)結(jié)構(gòu)形式。的數(shù)據(jù)。這些訓(xùn)練語料中,60%的內(nèi)容來自過濾后的Common CrawlCommon Crawl是一套數(shù)據(jù)集。其從2018年開始搜集數(shù)據(jù),來源包含了博客、網(wǎng)站、維基百科、各國網(wǎng)絡(luò)社區(qū)、政府和大學(xué)官網(wǎng)等。,22% 來自 WebText2WebText:文本數(shù)據(jù)庫,來源于谷歌、電子圖書館、新聞網(wǎng)站、代碼網(wǎng)站等。WebText為GPT-2所使用的數(shù)據(jù)庫,ChatGPT在此基礎(chǔ)上做了擴(kuò)展成為WebText2但并未公布其來源。,16% 來自各類書籍,3%來自維基百科。[11]而基于大量的數(shù)據(jù)集和多模態(tài)模型CLIP(contrastive language-image pre-training)[12],AIGC得以區(qū)別于傳統(tǒng)UGC和PGC,實現(xiàn)跨模態(tài)融合(即通過分別提取文本特征和圖片特征進(jìn)行相似度對比,經(jīng)由特征相似度計算匹配關(guān)系)的內(nèi)容生產(chǎn)。
在AIGC所帶來的影響下,數(shù)字新聞業(yè)能夠基于更大維度的數(shù)據(jù)進(jìn)行新聞內(nèi)容生產(chǎn)、分發(fā)與流通。具體而言,全自動鏈條的內(nèi)容創(chuàng)作與到分發(fā)程,使媒體的生產(chǎn)更迅速和高效,并能夠簡化媒體專業(yè)人員的復(fù)雜任務(wù)。[13]而基于自動分析用戶行為及其接觸體驗,媒體能夠提供更多個性化的新聞內(nèi)容[14]。最后,通過大數(shù)據(jù)集的用戶行為分析,幫助內(nèi)容創(chuàng)造者和市場營銷人員能夠更好地識別定位用戶及其消費(fèi)模式,從而改進(jìn)的最佳方式。[15]
與此同時,AIGC也將從多方面對既有的新聞生產(chǎn)模式、分發(fā)反饋機(jī)制形成全面沖擊。在數(shù)字時代尤其是AIGC變革下,大數(shù)據(jù)作為新聞傳播活動的基礎(chǔ)資源和關(guān)鍵要素,也將成為各方爭奪的場域,這就需要我們從傳播政治經(jīng)濟(jì)學(xué)的視角展開進(jìn)一步分析和批判。
三、傳播政治經(jīng)濟(jì)學(xué)視角下的大數(shù)據(jù)及其批判
歷史地看,人類社會在不同的階段,隨著生產(chǎn)力的發(fā)展帶來了新的資源配置形式。在農(nóng)業(yè)社會,土地和勞動力是核心的生產(chǎn)要素。在工業(yè)社會,資本、石油鋼鐵等工業(yè)原材料、機(jī)器則是不可替代的生產(chǎn)資源。當(dāng)人類社會進(jìn)入數(shù)字時代,在以ChatGPT技術(shù)為代表的新一代人工智能發(fā)展背景下,大數(shù)據(jù)日益成為社會經(jīng)濟(jì)活動的重要資源,影響著社會生產(chǎn)、分配、交換和消費(fèi)的各個環(huán)節(jié)。
(一)資本的壟斷:被“商品化”的大數(shù)據(jù)
就互聯(lián)網(wǎng)企業(yè)而言,數(shù)據(jù)資源不僅是實現(xiàn)價值創(chuàng)造的核心,更是“權(quán)力躍升”的關(guān)鍵。但是,數(shù)據(jù)的收集、管理、存儲、分析和應(yīng)用的過程卻一直是一個“黑箱”。2019年,學(xué)者肖莎娜·祖波夫(Shoshana Zuboff)通過觀察美國互聯(lián)網(wǎng)商業(yè)巨頭經(jīng)濟(jì)模式,創(chuàng)造性地提出監(jiān)視資本主義(Surveillance Capitalism)的概念。[16]有學(xué)者批判道,在數(shù)據(jù)經(jīng)濟(jì)的運(yùn)作中,用戶的個人數(shù)據(jù)及隱私被資本所“掌握”,活生生的人被用作公司企業(yè)的斂財工具與生產(chǎn)資料。[17]具體來說,通過將個體行為數(shù)據(jù)信息作為免費(fèi)“原料”(raw material),互聯(lián)網(wǎng)平臺公司或出售給第三方公司直接盈利,或通過算法進(jìn)行產(chǎn)品預(yù)測和生產(chǎn),最終轉(zhuǎn)化為市場中的“期貨商品”。由此完成將數(shù)據(jù)的“使用價值轉(zhuǎn)化為交換價值”這一商品化過程。
傳播政治經(jīng)濟(jì)學(xué)一般認(rèn)為,使用價值在資本主義體系中變得貨幣化,這使得商品能夠在市場上出售。[18]雖然單一數(shù)據(jù)的使用價值有限,但大數(shù)據(jù)卻讓足量異質(zhì)化的數(shù)據(jù)集產(chǎn)生較高的交換價值?;ヂ?lián)網(wǎng)平臺通過挖掘數(shù)據(jù)之間的關(guān)系,將再次提升數(shù)據(jù)的商業(yè)能力。為了實現(xiàn)資本的快速積累與增值,數(shù)據(jù)的自由流動則會受到一定的限制。平臺之間會設(shè)置壁壘防止用戶的流動,比如用戶面臨二選一服務(wù),不同平臺之間支付跳轉(zhuǎn)和外鏈打開受限等。平臺通過實施保護(hù)主義,實現(xiàn)資源的封閉和占有,控制了數(shù)據(jù)資源的商品化能力。
總而言之,在數(shù)據(jù)的商品化過程中,平臺或互聯(lián)網(wǎng)企業(yè)通過收集、分析和買賣個人數(shù)據(jù)來牟取超額的利潤,將受眾商品和數(shù)據(jù)商品合二為一,在一定程度上壟斷了大數(shù)據(jù)資源。這就使得我們一定要注意AIGC背后的超級規(guī)模數(shù)據(jù)集的商品壟斷問題。
(二)數(shù)據(jù)的非扁平化:人與大數(shù)據(jù)的深度綁定
作為一種傳播資源,數(shù)據(jù)看似是無差別的、扁平的,但其背后卻是現(xiàn)實的社會階層和社會關(guān)系。在平臺與用戶之間,這種關(guān)系是非扁平化的,平臺擁有為用戶進(jìn)行精準(zhǔn)畫像的能力,并進(jìn)一步通過提供差異化服務(wù)固化了這種社會關(guān)系,在將人們與數(shù)據(jù)深度綁定的同時,實現(xiàn)層級化的數(shù)據(jù)關(guān)系。
平臺的發(fā)展過程經(jīng)歷了從技術(shù)服務(wù)者到數(shù)據(jù)控制者的角色轉(zhuǎn)換。在法律規(guī)定范圍內(nèi),為了擴(kuò)大自己的功能和效益,平臺以“地推”和“讓利”的形式吸引大量的用戶群體注冊和使用。每個用戶將擁有一個認(rèn)證賬戶,個體信息被納入平臺數(shù)據(jù)庫中。用戶之間的互動行為和數(shù)據(jù)將被永久儲存。而當(dāng)用戶加入平臺之后,需要接受一定條件的服務(wù)條款限制,而平臺這一脫離物質(zhì)實體的空間產(chǎn)物則成了一種自治屬性的“領(lǐng)地”。誠然,用戶在平臺之間具有跳轉(zhuǎn)和流動的機(jī)會,但過往儲存的數(shù)據(jù)卻很難流動。平臺也會使用各種手段來增強(qiáng)用戶黏性,比如通過價格戰(zhàn)、補(bǔ)貼戰(zhàn)等手段拉攏用戶和商家,通過滿單獎勵拉攏外賣騎手等勞動者等,由此形成一種臨時性的結(jié)盟。這種利益共謀的身份,深度綁定了每一個平臺使用者。
在此意義上,大數(shù)據(jù)的興起與互聯(lián)網(wǎng)空間中的層級化或者圈層化過程密切相關(guān)?;诖髷?shù)據(jù),平臺通過算法等技術(shù)手段,將用戶身份進(jìn)行標(biāo)簽化、層級化處理,由此大數(shù)據(jù)再次呈現(xiàn)出現(xiàn)實社會中的社會分層圖景,具有一定的“象征權(quán)力”。 同時,現(xiàn)實中的社會結(jié)構(gòu)和社會關(guān)系也決定了個體對數(shù)據(jù)的控制、占有和分配狀況,這反映了不同社會階層在數(shù)據(jù)的使用和自我保護(hù)等方面是有所差異的。
(三)勞動“異化”:從受眾商品到數(shù)字勞工
在大數(shù)據(jù)的生成過程中,個人數(shù)據(jù)變成了一種抽象的勞動商品。不同于傳統(tǒng)的生產(chǎn)勞動,互聯(lián)網(wǎng)的數(shù)據(jù)勞動大多是用戶自發(fā)的行為,互聯(lián)網(wǎng)用戶不是被動的受眾,而是數(shù)據(jù)生產(chǎn)的主體。在加拿大傳播政治經(jīng)濟(jì)學(xué)學(xué)者達(dá)拉斯·斯邁思(Dallas Smythe)看來,媒體受眾在消費(fèi)媒體內(nèi)容時觀看廣告,實際上是在他們所謂的免費(fèi)休閑時間,通過觀看媒體——尤其是廣告——為廣告商服務(wù)。[19]簡言之,受眾收看廣告行為是一種商品化勞動。當(dāng)然,受眾商品論并非僅指用戶收看廣告的行為,而是受眾的注意力這一稀缺資源,其本身就是一種排他性的商品。進(jìn)入互聯(lián)網(wǎng)時代,平臺、廣告商與用戶之間的關(guān)系發(fā)生了新的變化,用戶數(shù)據(jù)成為三者關(guān)系的重要紐帶。
早在2011年,針對谷歌企業(yè)受眾商品的一項研究證明,沒有用戶的集體勞動,搜索引擎中的廣告剩余價值就不復(fù)存在,用戶的每一次點(diǎn)擊和搜索行為都會被定位,進(jìn)而提升其交換價值和廣告投放。[20]如果說傳統(tǒng)意義上“受眾商品”的交換價值取決于“人口統(tǒng)計學(xué)數(shù)據(jù)”,那么數(shù)字時代則指的是點(diǎn)擊、評論等交互行為所產(chǎn)生的數(shù)據(jù)。用戶在互聯(lián)網(wǎng)使用過程中,無論是工作時間,還是休閑時間,無論是通過平臺開展工作,還是社交活動,都在源源不斷地為平臺生產(chǎn)數(shù)據(jù),而這些數(shù)據(jù)則進(jìn)一步成為具有交換價值的勞動商品。在大多數(shù)時刻,用戶沉迷于互聯(lián)網(wǎng)中,并未意識到這是一種數(shù)字勞動,無形中為平臺創(chuàng)造了巨大的經(jīng)濟(jì)價值。
由于數(shù)字技術(shù)的快速發(fā)展,用戶現(xiàn)在可以享受到多種多樣的信息和便捷的服務(wù),然而數(shù)字勞動的形式以及相關(guān)的量化技術(shù)和計數(shù)指標(biāo)卻更加復(fù)雜,日益打造了一套數(shù)據(jù)的“牢籠”。數(shù)據(jù)成為平臺激勵政策的變現(xiàn)手段,還通過隱形貨幣化(如打榜、投票等)測量用戶的數(shù)字勞動,并在平臺內(nèi)流通和兌換。在這一過程中,互聯(lián)網(wǎng)平臺通過各種形態(tài)的數(shù)字勞動,完成了數(shù)據(jù)資本的積累和再生產(chǎn),“為了數(shù)據(jù)而數(shù)據(jù)”就是另一種典型的異化勞動現(xiàn)象。
可以看到,大數(shù)據(jù)的產(chǎn)生和應(yīng)用全方位地滲入用戶日常行為之中,從隱私信息、在線操作到內(nèi)容生產(chǎn),“數(shù)字勞工”持續(xù)不斷地為數(shù)字資本的累積與增值提供數(shù)據(jù),由此資本和平臺的控制權(quán)力得以鞏固。因此,我們應(yīng)當(dāng)對數(shù)據(jù)商品化、非扁平化和數(shù)字勞動等問題保持警惕和批判意識,通過加強(qiáng)法律法規(guī)、健全平臺自律、提高個人數(shù)據(jù)素養(yǎng)等方面,以避免大數(shù)據(jù)所帶來的極端化狀況。近年來,“治理數(shù)據(jù)”“數(shù)據(jù)向善”等理念受到了更多的關(guān)注,“人—數(shù)據(jù)—平臺—社會”之間的關(guān)系亟需重構(gòu),我們需要邁向“數(shù)字交往”的新維度。
(四)摒棄“數(shù)據(jù)至上”:AIGC發(fā)展中的主體性問題
在AI技術(shù)的演進(jìn)中,AIGC內(nèi)容共經(jīng)歷了三個階段:基于實體孿生階段、基于學(xué)習(xí)創(chuàng)作階段和基于實時自主生成階段[21]。但當(dāng)Chat GPT介入知識生產(chǎn)時,其模糊了知識生產(chǎn)中“人類要素”與“非人類要素”的界限,形成了大量“雜合知識”,人類的生存境遇也將隨著知識生產(chǎn)的此種變化而改變。[22]
在AI技術(shù)的作用下,一種全新的數(shù)字人正在產(chǎn)生,而“虛擬化、智能化、外腦化”便是其發(fā)展方向。這種意識復(fù)雜化的人,以及被數(shù)字技術(shù)“交往化”的人,既是技術(shù)的演化,也是新人的初生。[23]但正如前文提到的,大數(shù)據(jù)的價值在于提供了感知、預(yù)測和治理社會世界的新思路和新模式,其核心就在于通過數(shù)據(jù)驅(qū)動的決策替代經(jīng)驗性決策。然而,當(dāng)越來越多決策角色被技術(shù)和算法所取代,個體難免呈現(xiàn)出客體化的趨勢,即人的主體性的喪失,其為生活賦予意義的能動性被剝奪,可能淪為被平臺和信息支配的個體。[24]這就是數(shù)據(jù)至上的觀念和實踐所帶來的極端狀況。
對大數(shù)據(jù)的追捧也讓人們忽視了小數(shù)據(jù)的價值,有時還違背了數(shù)據(jù)選擇、收集和使用的道德倫理原則。實際上,在新聞傳播活動中,以數(shù)據(jù)為驅(qū)動的智能媒體實踐已迭代多年,從最早的機(jī)器人寫作、智能剪輯、算法推薦到近年來爆火的AI主播,數(shù)據(jù)聚合和信息可視化作為新聞生產(chǎn)的一種重要方式。在此過程中,大數(shù)據(jù)常常被視為中立、客觀的工具,然而卻忽視了將新聞作為一種交往的追求。以Chat GPT為例,在“信息論(概率)”和“控制論(反饋)”的影響下,其所生產(chǎn)的信息內(nèi)容是缺乏反思性的邏輯關(guān)系對既有知識的概率聯(lián)結(jié)和組合[25],而這種拼湊式內(nèi)容創(chuàng)作也對現(xiàn)有“原創(chuàng)作者”觀念和制度帶來了挑戰(zhàn)。當(dāng)新聞的選擇、決策和判斷交由數(shù)據(jù)、平臺和算法,而非憑借記者的主觀能動性時,人在新聞傳播中的主體性地位將遭受沖擊。數(shù)據(jù)并不能代替新聞傳播主體的理性行為,更無法揭示新聞傳播活動中復(fù)雜的情緒、社會心態(tài)和社會互動。
四、結(jié)語:從基礎(chǔ)資源到數(shù)字交往
AIGC為人類社會的文化與藝術(shù)信息的表達(dá)、存儲和傳播提供了一種新的形態(tài),也將引發(fā)教育、傳媒、影視、電商等社會諸多領(lǐng)域的變革,影響數(shù)字時代人們生活的方方面面。本文認(rèn)為,在以Chat GPT為代表的AIGC技術(shù)變革中,大數(shù)據(jù)是數(shù)字新聞傳播活動中的基礎(chǔ)資源和關(guān)鍵要素,一定意義上還是能夠自我再生產(chǎn)的“行動者”和“新新數(shù)據(jù)”。當(dāng)然,就其本質(zhì)而言,大數(shù)據(jù)并不是自然產(chǎn)生的,而是一種歷史建構(gòu)的產(chǎn)物,并影響著人類社會發(fā)展的現(xiàn)實走向和邏輯路徑。
在大數(shù)據(jù)廣泛運(yùn)用尤其是AIGC日益發(fā)展的語境下,數(shù)字新聞業(yè)愈發(fā)離不開大數(shù)據(jù)的采集、整合與應(yīng)用,但更應(yīng)明確的是:新聞傳播主體之間的關(guān)系核心仍然是人的交往關(guān)系,新聞業(yè)不能陷入數(shù)據(jù)中心主義的泥沼,而是要堅持以人為本的傳播理念與實踐形態(tài),即從單純的信息傳播到更高維度的溝通對話以及關(guān)系的維系。[26]
質(zhì)言之,在數(shù)字生活世界,個體既是一種生命實體,也是一種符號化和抽象化的存在,不同主體間通過數(shù)字傳播技術(shù),建立交往網(wǎng)絡(luò)與社會互動。在被數(shù)字技術(shù)全面中介化的當(dāng)下,數(shù)據(jù)成為人與人之間建立關(guān)系的重要連接點(diǎn),但這種連接最終是要靠人來實現(xiàn)的,而非數(shù)據(jù)本身。人們開發(fā)和使用大數(shù)據(jù)及其技術(shù),根本目的是建立復(fù)雜、有序且有意義的人際聯(lián)系?!皵?shù)據(jù)拜物教”只是一種物質(zhì)交往形態(tài),而基于大數(shù)據(jù)展開更深層次的“數(shù)字交往”,突出精神交往的維度,則是一個更高的境界。對于新聞傳播活動而言,數(shù)字交往意味著在大數(shù)據(jù)應(yīng)用中找回人的主體性,將大數(shù)據(jù)作為連接人與世界的中介角色。
參考文獻(xiàn):
[1]譚建榮大數(shù)據(jù)思維與新基建發(fā)展[EB/OL] 中國信息化周報,2021-10-11
[2]Boyd, Damp; Crawford, K (2012) Critical questions for big data: Provocations for a cultural, technological, and scholarly phenomenonInformation, Communication amp; Society,15(5):662-679
[3]Burkholder, L (2019) Philosophy and the computer New York: Routledge
[4]Kitchin, R (2014) Big data, new epistemologies and paradigm shiftsBig Data amp; Society,1(1):1-12
[5]Bollier, D amp; Firestone, C M (2010)The promise and peril of big data Washington, DC: Aspen Institute, Communications and Society Program
[6]邱澤奇技術(shù)化社會治理的異步困境[J]社會發(fā)展研究,2018(4):2-26+242
[7]郭春鎮(zhèn)對“數(shù)據(jù)治理”的治理——從“文明碼”治理現(xiàn)象談起[J]法律科學(xué)(西北政法大學(xué)學(xué)報),2021(1):58-70
[8]Anderson, C W (2019) Between certainty and uncertainty: The historical, political, and normative contexts of inferential journalism claimsJournalism amp; Communication Monographs,21(4):358-361
[9]Anderson,CWamp;De Maeyer, J (2015) Objects of journalism and the newsJournalism,16(1):3-9
[10]Ananny, Mamp; Finn, M(2020)Anticipatory news infrastructures: Seeing journalism’s expectations of future publics in its sociotechnical systemsNew Media amp; Society,22(9):1600-1618
[11]Brown,T,Mann, B,Ryder,N, Subbiah, M, Kaplan, J D,Dhariwal,Pamp;Amodei, D (2020) Language models are few-shot learnersAdvances in Neural Information Processing Systems,33:1877-1901
[12]Radford, A, Kim, J W, Hallacy, C et al (2021) Learning transferable visual models from natural language supervision Paper presented at the Proceedings of the 38th International Conference on Machine Learning, Proceedings of Machine Learning Research Retrieved May 2, 2023, from https://proceedingsmlrpress/v139/radford21ahtml
[13]Thurzo,A,Strunga, M,Urban, R, Surovková, J amp; Afrashtehfar, K I (2023) Impact of artificial intelligence on dental education: A review and guide for curriculum updateEducation Sciences,13(2):150-152
[14] Rathore, B (2023) Integration of artificial intelligence amp; it’s practices in apparel industryInternational Journal of New Media Studies (IJNMS),10(1):25-37
[15] Pavlik, J V (2023) Collaborating With ChatGPT: Considering the implications of generative artificial intelligence for journalism and media educationJournalism amp; Mass Communication Educator, 10776958221149577
[16]Zuboff, S (2019) The age of surveillance capitalism: The fight for a human future at the new frontier of power New York: Public Affairs
[17]符豪21世紀(jì)美國左翼學(xué)者對監(jiān)視資本主義的批判研究[J]馬克思主義與現(xiàn)實,2020(5):135-140
[18][加]文森特·莫斯可傳播政治經(jīng)濟(jì)學(xué)[M]胡春陽,等譯上海:上海譯文出版社, 2013:168-170
[19]Smythe, DW (1981) On the audience commodity and its workIn Durham, Mamp; Kellner, DM (eds) Media and cultural studies: Keyworks Hong Kong: Blackwell Publishing, 230-256
[20]Kang, Hamp; McAllister,MP(2011)Selling you and your clicks: Examining the audience commodification of GoogleTriple C: Communication, Capitalism amp; CritiqueOpen Access Journal for a Global Sustainable Information Society,9(2):141-153
[21]李白楊,白云,詹希旎,等人工智能生成內(nèi)容(AIGC)的技術(shù)特征與形態(tài)演進(jìn)[J]圖書情報知識,2023(1):66-74
[22]姜華從辛棄疾到GPT:人工智能對人類知識生產(chǎn)格局的重塑及其效應(yīng)[J]南京社會科學(xué),2023(4):135-145
[23]杜駿飛何以為人?——AI興起與數(shù)字化人類[J]南京社會科學(xué),2023(3):76-85
[24]"孫國東“算法理性”的政治哲學(xué)檢視[J]廈門大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2021(2):23-33
[25]鄧建國概率與反饋:ChatGPT的智能原理與人機(jī)內(nèi)容共創(chuàng)[J]南京社會科學(xué),2023(3):86-94+142
[26] 涂凌波,虞鑫“新聞價值”學(xué)術(shù)對談:數(shù)字新聞?wù)Z境下的變革及其未來[J]青年記者,2022(9):12-17
[責(zé)任編輯:高辛凡]