□文│劉 冰
抽樣調(diào)查是傳統(tǒng)調(diào)查方法的經(jīng)典代表,抽樣調(diào)查也是輿論的表達(dá)方式,“抽樣調(diào)查的普及有助于政治領(lǐng)袖更有效率地監(jiān)視整個(gè)人口的情緒,同時(shí)也給予公民一種社會(huì)比較機(jī)制”,[1]但這種調(diào)查方法目前正在受到挑戰(zhàn)。人類(lèi)現(xiàn)在已經(jīng)步入ABC時(shí)代,A即人工智能(Artificial Intelligence),B即大數(shù)據(jù)(Big data),C即云計(jì)算(Cloud computing)。新技術(shù)對(duì)傳統(tǒng)調(diào)查方法產(chǎn)生了沖擊和挑戰(zhàn),同時(shí)也為調(diào)查方法的發(fā)展帶來(lái)了機(jī)遇。我們應(yīng)該全面客觀(guān)地看待傳統(tǒng)調(diào)查方法與大數(shù)據(jù)方法的發(fā)展關(guān)系,需要看到問(wèn)卷設(shè)計(jì)、抽樣技術(shù)等傳統(tǒng)調(diào)查方法依然具有頑強(qiáng)的生命力,同時(shí)也需要對(duì)大數(shù)據(jù)進(jìn)行反思。我們應(yīng)該高度關(guān)注大數(shù)據(jù)技術(shù)的發(fā)展,思考和理解大數(shù)據(jù)調(diào)查方法的原理,在條件具備的前提下積極利用大數(shù)據(jù)方法。另外,生物傳感技術(shù)、人工智能技術(shù)等高新科技也都對(duì)社會(huì)調(diào)查產(chǎn)生著影響,在社會(huì)調(diào)查領(lǐng)域也有不同程度的應(yīng)用,值得我們關(guān)注。
對(duì)于從事社會(huì)科學(xué)研究和工作的人來(lái)講,調(diào)查方法通常都是需要掌握的工具。從某種意義上講,方法甚至比知識(shí)還重要。方法是創(chuàng)造知識(shí)的工具,所以當(dāng)我們具備了一定的知識(shí)后,有必要學(xué)習(xí)并掌握創(chuàng)造知識(shí)的方法。社會(huì)科學(xué)領(lǐng)域使用的調(diào)查研究方法是行之有效的創(chuàng)造知識(shí)的工具,社會(huì)科學(xué)研究其實(shí)也可以看成是一個(gè)運(yùn)用調(diào)查方法獲取知識(shí)的過(guò)程,從中不難看出方法的重要性。
調(diào)查方法是指社會(huì)科學(xué)領(lǐng)域的信息數(shù)據(jù)收集、整理、分析的方法,它在不同的書(shū)籍或?qū)I(yè)里還有多種多樣的稱(chēng)謂,如社會(huì)科學(xué)研究方法、社會(huì)調(diào)查方法、傳播研究方法、市場(chǎng)調(diào)查、媒介調(diào)查與分析、營(yíng)銷(xiāo)調(diào)研等。
不過(guò)究其實(shí)質(zhì),稱(chēng)謂雖然不同,但它們針對(duì)的內(nèi)容對(duì)象卻并無(wú)截然的不同,它們所論述和傳授的方法并無(wú)二致,都是為了使所要研究的社會(huì)現(xiàn)實(shí)狀況明朗化,都是獲取社會(huì)信息數(shù)據(jù)的手段或操作過(guò)程。甚至還有一些名稱(chēng)看似相去甚遠(yuǎn),但其論述的內(nèi)容仍然是調(diào)查方法或曰研究方法。比如,菲利普·邁耶是一位精確新聞學(xué)家,他所著的《精確新聞報(bào)道》副標(biāo)題卻是“記者應(yīng)掌握的社會(huì)科學(xué)研究方法”,論述的主要內(nèi)容也還是抽樣、調(diào)查、統(tǒng)計(jì)分析等,是將社會(huì)調(diào)查研究方法尤其是量化研究方法運(yùn)用到新聞報(bào)道中去罷了。
廣義的社會(huì)調(diào)查方法包括抽樣調(diào)查研究、實(shí)地研究、文獻(xiàn)研究、實(shí)驗(yàn)研究等方法類(lèi)別。狹義的社會(huì)調(diào)查方法僅指抽樣調(diào)查研究方法,“指的是一種采用自填式問(wèn)卷或結(jié)構(gòu)式訪(fǎng)問(wèn)的方法,通過(guò)直接的詢(xún)問(wèn),從一個(gè)取自總體的樣本那里收集系統(tǒng)的、量化的資料,并通過(guò)對(duì)這些資料的統(tǒng)計(jì)分析來(lái)認(rèn)識(shí)社會(huì)現(xiàn)象及其規(guī)律的社會(huì)研究方式”。[2]抽樣問(wèn)卷調(diào)查是社會(huì)調(diào)查研究方法中的重點(diǎn)和主線(xiàn)。大家其實(shí)很容易重視這種量化調(diào)查方法,因?yàn)樗跉v史發(fā)展過(guò)程中逐步完善,具有科學(xué)性,能帶給我們啟迪,并且真正有效、可行。
我們也需要注意到,大數(shù)據(jù)其實(shí)已經(jīng)對(duì)傳統(tǒng)調(diào)查方法產(chǎn)生了沖擊。我們應(yīng)該關(guān)注和思索這個(gè)問(wèn)題。不過(guò),大數(shù)據(jù)通常掌握在騰訊、百度、阿里等大公司手里,個(gè)人大多并不掌握大數(shù)據(jù)的管道,并不容易獲取大數(shù)據(jù)。如果你不能獲取大數(shù)據(jù),那么你就去找小數(shù)據(jù),做抽樣問(wèn)卷調(diào)查,獲得結(jié)構(gòu)化數(shù)據(jù)。目前,大數(shù)據(jù)方法和傳統(tǒng)調(diào)查方法處于并用階段。當(dāng)前以及今后一段很長(zhǎng)的時(shí)間里,抽樣問(wèn)卷調(diào)查依然是一種很常用的調(diào)查研究方法。
質(zhì)化研究方法也要給予足夠重視。有的人過(guò)分迷信量化研究,而忽視質(zhì)化研究,這是不足取的。比如文獻(xiàn)研究方法其實(shí)至今仍然是一種很重要的質(zhì)化研究方法,不管科技如何發(fā)達(dá),我們總不能放棄文獻(xiàn)閱讀。沒(méi)有閱讀,其實(shí)也就沒(méi)有研究和寫(xiě)作。另外,質(zhì)化研究方法取得的成果或許具有更長(zhǎng)的壽命,這一點(diǎn)也是需要注意的。
在互聯(lián)網(wǎng)科技迅猛發(fā)展的今天,我們應(yīng)該秉持開(kāi)放的心態(tài)對(duì)待調(diào)查方法。要深入學(xué)習(xí)并掌握抽樣問(wèn)卷調(diào)查技術(shù),同時(shí)不要忽略質(zhì)化研究方法。要關(guān)注大數(shù)據(jù),充分利用網(wǎng)絡(luò)平臺(tái)開(kāi)展調(diào)查。
提問(wèn)題是一種非常重要的能力,問(wèn)卷設(shè)計(jì)的核心就是提問(wèn)題?;ヂ?lián)網(wǎng)科技迅猛發(fā)展,人類(lèi)進(jìn)入智媒時(shí)代,融媒體傳播成為人類(lèi)傳播圖景,其實(shí)質(zhì)也是泛化的智慧傳播,[3]大數(shù)據(jù)、人工智能、生物傳感技術(shù)等給傳統(tǒng)調(diào)查方法帶來(lái)了巨大沖擊和挑戰(zhàn),但即便是在這樣的新時(shí)代,提出好的問(wèn)題仍然是沒(méi)有過(guò)時(shí)的重要技能,學(xué)會(huì)提問(wèn)題仍然具有顯著的價(jià)值。
提出好的問(wèn)題并設(shè)計(jì)成問(wèn)卷,甚至可以與人工智能技術(shù)結(jié)合,用于中醫(yī)診斷。百度公司前副總裁梁冬目前轉(zhuǎn)行從事中醫(yī)診所事業(yè),但他一直覺(jué)得中醫(yī)不可能規(guī)模化、復(fù)制化。有一天,他碰到了一位從事人工智能研究的朋友,這位朋友將人工智能技術(shù)應(yīng)用到中醫(yī)研究上,改變了梁冬的看法。
這位人工智能專(zhuān)家找到高水平中醫(yī),反復(fù)詢(xún)問(wèn)大夫看病時(shí)會(huì)問(wèn)什么問(wèn)題。研究發(fā)現(xiàn),大夫問(wèn)的問(wèn)題其實(shí)通常不會(huì)超過(guò)三四十個(gè)。人工智能專(zhuān)家擬合大夫看病的思維和方法,把大夫看病時(shí)望聞問(wèn)切的過(guò)程擬合為一系列提問(wèn),形成一份問(wèn)卷,居然開(kāi)發(fā)出一套看病的軟件系統(tǒng)。
一個(gè)患者來(lái)了,大夫給患者診斷后,開(kāi)出一個(gè)藥方。同樣的這個(gè)患者,人工智能專(zhuān)家讓一個(gè)操作人員來(lái)問(wèn)問(wèn)卷上的問(wèn)題,打完勾,把數(shù)據(jù)輸入系統(tǒng),也開(kāi)出來(lái)一個(gè)藥方。結(jié)果發(fā)現(xiàn),機(jī)器開(kāi)出來(lái)的藥方與大夫的藥方非常接近,甚至讓那位大夫覺(jué)得機(jī)器開(kāi)的藥方比自己開(kāi)的藥方還要好。梁冬說(shuō)他對(duì)自己的體質(zhì)很了解,他讓機(jī)器測(cè)了一下,機(jī)器問(wèn)了他40個(gè)問(wèn)題,給他開(kāi)出了一個(gè)溫膽湯的藥方,診斷結(jié)果和開(kāi)出的藥方令他非常震驚。
大數(shù)據(jù)、算法對(duì)抽樣技術(shù)是有沖擊的,大數(shù)據(jù)時(shí)代抽樣調(diào)查還有存在的必要嗎?這個(gè)問(wèn)題的確值得我們思考。隨機(jī)抽樣的產(chǎn)生歷經(jīng)了一個(gè)歷史過(guò)程,抽樣技術(shù)具有科學(xué)性,是人類(lèi)智慧的結(jié)晶。即便是在當(dāng)前大數(shù)據(jù)時(shí)代,抽樣技術(shù)仍然有存在的價(jià)值。甚至即便是在算法見(jiàn)長(zhǎng)的公司內(nèi)部,抽樣技術(shù)仍然具有頑強(qiáng)的生命力。
以算法和機(jī)器抓取見(jiàn)長(zhǎng)的今日頭條如今在大量增加內(nèi)容審核編輯崗位人員。今日頭條內(nèi)容審核編輯團(tuán)隊(duì)已經(jīng)超過(guò)4000人,這次又要招聘2000人,團(tuán)隊(duì)還會(huì)繼續(xù)擴(kuò)大,預(yù)計(jì)很快要突破10000人。[4]
據(jù)今日頭條總編輯張輔評(píng)介紹,頭條號(hào)平臺(tái)自媒體作者超過(guò)90萬(wàn),每天都在生產(chǎn)大量的內(nèi)容,針對(duì)用戶(hù)可能生產(chǎn)傳播色情低俗內(nèi)容、違規(guī)內(nèi)容的問(wèn)題,今日頭條還曾專(zhuān)門(mén)從用戶(hù)中抽樣建立了1000人規(guī)模的專(zhuān)業(yè)評(píng)估團(tuán),每天反饋千余份對(duì)于機(jī)器推薦效果滿(mǎn)意度的問(wèn)卷。[5]從這里我們也可以看出,即便是像今日頭條這樣的以算法見(jiàn)長(zhǎng)的公司,也依然使用了抽樣問(wèn)卷調(diào)查方法來(lái)助益業(yè)務(wù)的運(yùn)轉(zhuǎn)。擴(kuò)展內(nèi)容審核編輯團(tuán)隊(duì),其實(shí)也可以看成是傳統(tǒng)調(diào)查技術(shù)的擴(kuò)展應(yīng)用——不能完全依賴(lài)計(jì)算機(jī)技術(shù),還需要人工把關(guān)。內(nèi)容審核編輯相當(dāng)于特殊的調(diào)查員,閱聽(tīng)完內(nèi)容之后,從兩個(gè)選項(xiàng)“通過(guò)”和“不通過(guò)”中選擇一項(xiàng)。
大數(shù)據(jù)、算法等計(jì)算機(jī)技術(shù)是人類(lèi)取得的先進(jìn)技術(shù),我們當(dāng)然需要正視和積極利用這些先進(jìn)技術(shù),但同時(shí)我們也仍然需要看到抽樣技術(shù)的價(jià)值。至少到目前為止,抽樣問(wèn)卷調(diào)查仍然沒(méi)有被廢棄,我們要善于學(xué)習(xí)和掌握抽樣技術(shù)。
大數(shù)據(jù)容量巨大,具有更加復(fù)雜的多樣性,生成速度更快,價(jià)值密度低。大數(shù)據(jù)的一個(gè)特點(diǎn)是大,數(shù)據(jù)大到用常規(guī)手段無(wú)法收集和統(tǒng)計(jì),那才叫大。小學(xué)生統(tǒng)計(jì)蘇軾詩(shī)詞,區(qū)區(qū)幾十萬(wàn)字,卻妄稱(chēng)是“大數(shù)據(jù)”,這是對(duì)“大數(shù)據(jù)”的曲解和濫用。
對(duì)于網(wǎng)絡(luò)調(diào)查來(lái)講,更能體現(xiàn)互聯(lián)網(wǎng)技術(shù)優(yōu)勢(shì)特征的調(diào)查方法是大數(shù)據(jù)方法,這種調(diào)查融合運(yùn)用了網(wǎng)絡(luò)爬蟲(chóng)技術(shù)和大數(shù)據(jù)技術(shù),通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)對(duì)各大門(mén)戶(hù)網(wǎng)站、博客、微博、論壇、貼吧等網(wǎng)絡(luò)信息源進(jìn)行數(shù)據(jù)抓取,對(duì)抓取到的網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行挖掘和分析,獲取調(diào)查數(shù)據(jù)依靠軟件程序自動(dòng)進(jìn)行,方便快捷。
毫無(wú)疑問(wèn),采用大數(shù)據(jù)方法獲取網(wǎng)絡(luò)數(shù)據(jù)是一種先進(jìn)的方法,我們需要密切關(guān)注、高度重視和積極利用大數(shù)據(jù)技術(shù)。網(wǎng)絡(luò)數(shù)據(jù)的抓取與傳統(tǒng)社會(huì)調(diào)查方法區(qū)別很大,這種區(qū)別表現(xiàn)在樣本獲取、數(shù)據(jù)規(guī)模以及操作程序等諸多方面。傳統(tǒng)調(diào)查方法遵循的是抽樣理念,用樣本來(lái)表征或推斷總體,以小博大,樣本規(guī)模、數(shù)據(jù)規(guī)模與大數(shù)據(jù)方法相比均要小得多,操作程序主要包括抽樣、調(diào)查和統(tǒng)計(jì)分析,人工操作是核心。
網(wǎng)絡(luò)數(shù)據(jù)抓取采用大數(shù)據(jù)理念,強(qiáng)調(diào)獲取網(wǎng)絡(luò)大數(shù)據(jù),用整體來(lái)表征整體,而不是用部分來(lái)代表整體,它采取的是普查方式,調(diào)查對(duì)象的規(guī)模、抓取到的數(shù)據(jù)規(guī)模均要比傳統(tǒng)抽樣調(diào)查方法大得多,大數(shù)據(jù)方法的主要工作由計(jì)算機(jī)程序自動(dòng)完成。大數(shù)據(jù)給社會(huì)調(diào)查帶來(lái)的一個(gè)重大影響表現(xiàn)為對(duì)抽樣方法的沖擊,“在大數(shù)據(jù)時(shí)代,我們可以分析更多的數(shù)據(jù),有時(shí)候甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴(lài)于隨機(jī)抽樣”。[6]
我們對(duì)大數(shù)據(jù)方法的認(rèn)識(shí)卻還需要做深入思考,我們需要辨析網(wǎng)絡(luò)世界輿情與現(xiàn)實(shí)世界輿情的關(guān)系,需要思考采用大數(shù)據(jù)方法抓取到的網(wǎng)絡(luò)數(shù)據(jù)對(duì)全體公民意見(jiàn)的代表程度。
真正的大數(shù)據(jù)是全面數(shù)據(jù),全面數(shù)據(jù)的采集成本和采集難度會(huì)變大。大數(shù)據(jù)到底大到什么程度,只有掌握大數(shù)據(jù)的機(jī)構(gòu)最清楚。大數(shù)據(jù)變化快,流動(dòng)性強(qiáng),這意味著大數(shù)據(jù)的采集需要頻繁進(jìn)行,而頻繁采集同時(shí)又必然面臨隱私問(wèn)題,每次采集都需要獲得用戶(hù)的同意。如果用戶(hù)不同意,數(shù)據(jù)采集質(zhì)量就會(huì)受損,強(qiáng)行采集則面臨倫理困境。大數(shù)據(jù)是混亂的材料,大數(shù)據(jù)中真正有價(jià)值的還是經(jīng)過(guò)提取之后的數(shù)據(jù)。
大數(shù)據(jù)跟我們每個(gè)人相關(guān),但我們絕大多數(shù)人其實(shí)并不掌握大數(shù)據(jù),當(dāng)然也不能從中直接獲益。大數(shù)據(jù)掌握在極少數(shù)的機(jī)構(gòu)手里,掌握在騰訊、阿里、百度等大公司手里。我們每個(gè)身處互聯(lián)網(wǎng)的人其實(shí)不過(guò)扮演了大數(shù)據(jù)采集節(jié)點(diǎn)供應(yīng)器的角色,讓自己的數(shù)據(jù)匯入大數(shù)據(jù)的洪流之中,但我們鬧得再歡騰,卻也不過(guò)僅僅如此而已。我們絕大多數(shù)的個(gè)體并不是大數(shù)據(jù)宴會(huì)的真正擁有者,我們只是大數(shù)據(jù)的貢獻(xiàn)者甚至是犧牲者。
大數(shù)據(jù)方法依賴(lài)網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)的設(shè)計(jì),網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)需要遵循全面、準(zhǔn)確、及時(shí)、穩(wěn)定的原則。
全面原則是指網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)對(duì)網(wǎng)絡(luò)信息數(shù)據(jù)的抓取要盡量全覆蓋,全面監(jiān)測(cè)門(mén)戶(hù)網(wǎng)站、博客、論壇、微博等網(wǎng)絡(luò)載體,不遺漏重要的輿情數(shù)據(jù)。準(zhǔn)確原則是指網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)能夠?qū)嬰s的數(shù)據(jù)進(jìn)行精確分析,將最有價(jià)值的輿情數(shù)據(jù)篩選出來(lái),進(jìn)行分類(lèi)展示,凸顯關(guān)鍵輿情信息。及時(shí)原則是指網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)能夠第一時(shí)間抓取到網(wǎng)絡(luò)數(shù)據(jù),第一時(shí)間對(duì)數(shù)據(jù)進(jìn)行分析,第一時(shí)間呈現(xiàn)給用戶(hù),及時(shí)發(fā)出預(yù)警信號(hào)。穩(wěn)定原則是指網(wǎng)絡(luò)監(jiān)測(cè)系統(tǒng)要采用先進(jìn)算法,模塊組合合理有效,程序運(yùn)行順暢,系統(tǒng)易于擴(kuò)展,數(shù)據(jù)處理平穩(wěn)可靠。
網(wǎng)頁(yè)蜘蛛技術(shù)。網(wǎng)頁(yè)蜘蛛又稱(chēng)網(wǎng)絡(luò)爬蟲(chóng),這是一種形象的說(shuō)法,其實(shí)質(zhì)是按照某種規(guī)則自動(dòng)抓取網(wǎng)絡(luò)信息的計(jì)算機(jī)程序,它像蜘蛛一樣在網(wǎng)絡(luò)空間里爬行,搜尋信息數(shù)據(jù)。搜索引擎的首要工作原理就是利用網(wǎng)頁(yè)蜘蛛去自動(dòng)搜尋網(wǎng)絡(luò)信息。網(wǎng)頁(yè)蜘蛛通常會(huì)選擇鏈出鏈接較多的重要網(wǎng)站URL當(dāng)作種子集合,開(kāi)始數(shù)據(jù)抓取,并通過(guò)頁(yè)面鏈接路徑爬到新的頁(yè)面抓取數(shù)據(jù)。網(wǎng)頁(yè)蜘蛛通常采用先廣搜索算法采集頁(yè)面,下載相應(yīng)的網(wǎng)頁(yè)進(jìn)行解析,反復(fù)操作直到爬取整個(gè)網(wǎng)絡(luò)才停下來(lái)?!皩V度優(yōu)先搜索與網(wǎng)頁(yè)過(guò)濾技術(shù)結(jié)合使用,先用廣度優(yōu)先策略抓取網(wǎng)頁(yè),網(wǎng)絡(luò)爬蟲(chóng)采用多線(xiàn)程,某個(gè)線(xiàn)程下載完頁(yè)面后提交至解析的緩沖區(qū)線(xiàn)程池,線(xiàn)程池調(diào)用解析器解析網(wǎng)頁(yè)提取URL,并把解析到的URL加入到URL記錄中。然后過(guò)濾掉其中無(wú)關(guān)的網(wǎng)頁(yè)”。[7]
云計(jì)算技術(shù)。云計(jì)算是切實(shí)可行的分布式計(jì)算方式,分布式存儲(chǔ),并行計(jì)算。計(jì)算不是在本地計(jì)算機(jī)或單一的遠(yuǎn)程服務(wù)器上開(kāi)展,而是分布在大量的分布式計(jì)算機(jī)上,有效解決了海量數(shù)據(jù)挖掘難題。參與云計(jì)算的服務(wù)器有幾十萬(wàn)臺(tái)甚至上百萬(wàn)臺(tái),規(guī)模龐大,計(jì)算能力前所未有。云計(jì)算采用了計(jì)算節(jié)點(diǎn)同構(gòu)可互換、數(shù)據(jù)多副本容錯(cuò)等技術(shù),其運(yùn)算的可靠性也比本地計(jì)算機(jī)更強(qiáng)。云計(jì)算可以按需購(gòu)買(mǎi)服務(wù),數(shù)據(jù)管理成本可以大幅度降低,經(jīng)濟(jì)效益非常明顯。
網(wǎng)絡(luò)處理技術(shù)。網(wǎng)絡(luò)處理技術(shù)主要包括話(huà)題發(fā)現(xiàn)與追蹤技術(shù)、網(wǎng)絡(luò)分析技術(shù)等技術(shù)類(lèi)別。話(huà)題發(fā)現(xiàn)與追蹤技術(shù)是指輿情監(jiān)測(cè)系統(tǒng)能夠從網(wǎng)絡(luò)世界中尋找到熱點(diǎn)話(huà)題,根據(jù)發(fā)言頻率、信息源權(quán)威度等指標(biāo),準(zhǔn)確識(shí)別熱點(diǎn)話(huà)題、敏感話(huà)題,并對(duì)相關(guān)話(huà)題的發(fā)展變化加以追蹤,及時(shí)捕捉相關(guān)信息,抓取輿情數(shù)據(jù)。網(wǎng)絡(luò)分析技術(shù)對(duì)抓取到的數(shù)據(jù)進(jìn)行智能化分析,具體包括自動(dòng)分類(lèi)、相似性排重、自動(dòng)生成熱點(diǎn)、負(fù)面輿情研判、轉(zhuǎn)載計(jì)算、統(tǒng)計(jì)圖表自動(dòng)生成、自動(dòng)抽取關(guān)鍵詞、自動(dòng)摘要等。
A/B測(cè)試是指為網(wǎng)絡(luò)頁(yè)面制作兩個(gè)版本,在同一時(shí)間內(nèi)進(jìn)行測(cè)驗(yàn),讓訪(fǎng)客群組隨機(jī)訪(fǎng)問(wèn)不同的版本,收集各群組的用戶(hù)數(shù)據(jù),加以比較和評(píng)估,最后選擇出效果最好的那個(gè)版本。
赫芬頓郵報(bào)采用A/B測(cè)試,確立網(wǎng)站頭條新聞標(biāo)題的寫(xiě)法。讀者的請(qǐng)求達(dá)到服務(wù)器后,服務(wù)器會(huì)通過(guò)自動(dòng)分流技術(shù),為不同的用戶(hù)分配不同的版本。同一新聞內(nèi)容的報(bào)道,讀者會(huì)被隨機(jī)分配到不同的標(biāo)題版本,服務(wù)器會(huì)記錄和收集讀者的閱讀行為數(shù)據(jù),閱讀行為數(shù)據(jù)優(yōu)異的標(biāo)題將成為這條新聞的最終標(biāo)題?!斑M(jìn)行A/B測(cè)試時(shí),測(cè)試用戶(hù)的選取是十分關(guān)鍵的環(huán)節(jié),為保證試驗(yàn)結(jié)果的準(zhǔn)確性,一是要保證一定的樣本數(shù)量,二是要考慮用戶(hù)細(xì)分”。[8]
對(duì)于網(wǎng)絡(luò)媒體用戶(hù)研究來(lái)講,實(shí)時(shí)監(jiān)測(cè)用戶(hù)的行為數(shù)據(jù)是十分便捷的事情,用戶(hù)的行為數(shù)據(jù)最能說(shuō)明他們的喜好和態(tài)度。算法在頁(yè)面上的跟蹤以及對(duì)用戶(hù)行為數(shù)據(jù)的抓取,突破了傳統(tǒng)媒體受眾調(diào)查方法的局限。新聞標(biāo)題、圖片、文字段落、音頻、視頻、文章推薦等的設(shè)置,均可進(jìn)行類(lèi)似測(cè)試,實(shí)時(shí)掌握用戶(hù)行為數(shù)據(jù)并據(jù)此作出調(diào)整和改變,最大程度上讓用戶(hù)滿(mǎn)意,優(yōu)化傳播效果。
網(wǎng)絡(luò)時(shí)代科技發(fā)展日新月異,讀心成為可能,生物傳感技術(shù)、情感交互技術(shù)、人工智能技術(shù)等在網(wǎng)絡(luò)時(shí)代社會(huì)調(diào)查領(lǐng)域的應(yīng)用尤其值得關(guān)注。采用這些高科技,省去了提問(wèn)的環(huán)節(jié),受測(cè)試者不說(shuō)話(huà),機(jī)器也可以直接讀出受測(cè)試者的心理活動(dòng)變化數(shù)據(jù),不可謂不神奇。
新華網(wǎng)Star生物傳感智能機(jī)器人就掌握這種讀心術(shù),可以直接收集受測(cè)試者的情感變化數(shù)據(jù)并生成報(bào)告。2018年3月5日,李克強(qiáng)總理在人民大會(huì)堂作《政府工作報(bào)告》。新華網(wǎng)影視傳感評(píng)測(cè)實(shí)驗(yàn)室邀請(qǐng)30位社會(huì)各界人士同步觀(guān)看總理報(bào)告,接受Star生物傳感智能機(jī)器人的讀心測(cè)驗(yàn)。
現(xiàn)場(chǎng)觀(guān)眾的情緒生理變化被傳感器捕捉下來(lái),通過(guò)人機(jī)交互等技術(shù)轉(zhuǎn)化為數(shù)值,傳遞到后臺(tái)計(jì)算機(jī),以數(shù)字形態(tài)描繪出每個(gè)人的情緒曲線(xiàn)。從情緒曲線(xiàn)上可以非常直觀(guān)地看出,觀(guān)眾的興奮值、情緒波峰、情緒波谷及情緒變化趨勢(shì)。觀(guān)眾情緒喚起強(qiáng)度明顯升高,則表明他們這個(gè)時(shí)候注意力非常集中,對(duì)相關(guān)內(nèi)容很關(guān)注。新華網(wǎng)Star生物傳感智能機(jī)器人可以精準(zhǔn)捕捉被測(cè)試者“同頻共振”瞬間、“心潮澎湃”瞬間,同時(shí)還能出具測(cè)試報(bào)告、生產(chǎn)生理傳感新聞報(bào)道。[9]