文|李京波
一直以來,新聞報道始終是傳統(tǒng)專業(yè)媒體的優(yōu)勢所在。雖然網(wǎng)絡(luò)社交媒體出現(xiàn)以后,情況發(fā)生了變化,傳統(tǒng)媒體還是能夠通過種種手段保持住自己在報道領(lǐng)域特別是深度報道方面的優(yōu)勢。但是,大數(shù)據(jù)技術(shù)的出現(xiàn),就像在傳統(tǒng)媒體的頭頂上高懸了一把重錘,隨時都可能把傳統(tǒng)媒體的專屬領(lǐng)地進一步壓扁。
也許給出這樣的論斷為時尚早,但大數(shù)據(jù)將在新聞領(lǐng)域引起的震蕩是不容忽視的,因此我們有必要對大數(shù)據(jù)有所了解。
大數(shù)據(jù)是在計算機及存儲技術(shù)高度發(fā)達、互聯(lián)網(wǎng)的普及和廣泛應(yīng)用的前提下產(chǎn)生的概念,它既是資源,也是工具。作為資源,大數(shù)據(jù)有著普遍認同的四個特征:數(shù)據(jù)量巨大(Volume)、數(shù)據(jù)類型繁多(Variety)、價值密度低(Value)和處理速度快(Velocity)。美國加州大學圣地亞哥分校提供的數(shù)據(jù)顯示:2008年全球數(shù)據(jù)總量為9.57z,更加令人震憾的是當今世界所有信息中只有不到2%是非數(shù)字化的,而數(shù)字數(shù)據(jù)量每三年就可以翻一番。
作為工具,人們利用大數(shù)據(jù)進行數(shù)據(jù)分析,趨勢判斷。正是由于數(shù)據(jù)量大、數(shù)據(jù)品種繁多的特點,大數(shù)據(jù)的價值體現(xiàn)比率較低。要從浩如煙海的龐雜數(shù)據(jù)中獲得富有價值的信息,就要借助于相應(yīng)技術(shù),對數(shù)據(jù)歸類整理和聚類分析。
奧運會稱得上是目前世界上規(guī)模最大的活動。奧運會期間產(chǎn)生的數(shù)據(jù)是任何一個單項活動所不能比擬的。因此,我們不妨通過奧運會這個窗口對大數(shù)據(jù)及媒體發(fā)展趨勢做進一步的觀察。
2012年倫敦奧運會的總體數(shù)據(jù)量可以透過英國電信網(wǎng)的統(tǒng)計得到,包括奧運會“體制內(nèi)數(shù)據(jù)”和部分“體制外數(shù)據(jù)”。據(jù)估算,倫敦奧運會期間每秒鐘有60GB的數(shù)據(jù)量流經(jīng)英國電信局網(wǎng)絡(luò),倫敦奧運會的現(xiàn)場直播節(jié)目超過2000小時。奧運期間,世界上有85億臺個人電腦、智能手機與互聯(lián)網(wǎng)相連。
社交媒體方面,奧運會期間,僅推特用戶平均每秒推出13000條信息;8億人每天通過facebook了解奧運會新聞,而facebook每天承載的數(shù)據(jù)量達到15T(15兆兆字節(jié))。在奧運會上,當博爾特完成了100米沖刺后,推特用戶以每分鐘8萬條信息的數(shù)據(jù)量推送與此相關(guān)的信息。如果這個數(shù)字還不夠震撼的話,奧運會開幕式時966萬推特用戶同時發(fā)出的信息,相當于2008年北京奧運會期間推特用戶推送信息的總和。
與奧運會相關(guān)的信息數(shù)據(jù)中有一部分是在奧運會場館中產(chǎn)生的,包括主新聞中心、技術(shù)中心等管理服務(wù)類場館和各比賽場館,我們將這些數(shù)據(jù)稱為“奧運會數(shù)據(jù)服務(wù)”O(jiān)DF(即前面提到的“體制內(nèi)數(shù)據(jù)”)。ODF服務(wù)是國際奧委會為包括21600名注冊媒體在內(nèi)的奧林匹克大家庭成員提供的專項數(shù)據(jù)信息服務(wù),內(nèi)容龐大、繁雜且詳細,其中既包含實時數(shù)據(jù)、歷史數(shù)據(jù),也有運行數(shù)據(jù);包括人員、比賽、天氣、媒體、交通等等各項奧運會相關(guān)信息。倫敦奧運會期間,近4,000名專業(yè)技術(shù)人員每天24小時保證著900臺服務(wù)器、1,000套網(wǎng)絡(luò)和安全設(shè)備,以及超過1萬部PC設(shè)備的運行。這些設(shè)備產(chǎn)生和管理的數(shù)據(jù)隨時通過奧運會信息系統(tǒng)匯集、存儲,同時提供給以文字攝影媒體和轉(zhuǎn)播商為主的奧運會注冊用戶。
大約20年前,在國際奧委會新聞委員的協(xié)調(diào)下,世界上一些著名通訊社和報紙聯(lián)合建立起一個名為WNPA的組織(世界新聞通訊社組織),它的主要功能就是研究并實現(xiàn)將奧運會產(chǎn)生的各種數(shù)據(jù)(ODF的雛形),并將其轉(zhuǎn)換成媒體能夠接收和解析的格式,供媒體使用。無論過去還是現(xiàn)在,奧運會期間產(chǎn)生的ODF數(shù)據(jù)都算得上是海量信息。它包含的數(shù)據(jù)量巨大,各種數(shù)據(jù)混合在一起傳輸,因此媒體要從中獲取對自己有用的信息,就要從技術(shù)上解決制定數(shù)據(jù)標準、過濾和篩選等問題。
美聯(lián)社的下屬公司STATS,有100多年從事體育數(shù)據(jù)統(tǒng)計和分析的歷史,它的數(shù)據(jù)統(tǒng)計范圍覆蓋目前世界上300多項體育賽事,詳細到重要賽事的每個場地、每場比賽、每個人的數(shù)據(jù)。以奧運會籃球項目的技術(shù)統(tǒng)計為例:
STATS通過奧運會數(shù)據(jù)專線連接到ODF數(shù)據(jù)服務(wù),通過專門設(shè)計的應(yīng)用程序?qū)?shù)據(jù)進行過濾、解析、整理、分類,得出有關(guān)籃球的數(shù)據(jù),按照事先確定的不同用途,經(jīng)過設(shè)計人員的加工和包裝,以不同形式呈現(xiàn)給用戶。經(jīng)過處理的籃球項目的相關(guān)技術(shù)統(tǒng)計以及運動員和教練的背景信息、比賽感想等內(nèi)容,為體育記者撰寫新聞提供了豐富的素材。同時,STATS公司還將這些數(shù)據(jù)資源向公眾付費開放,這樣就使凡有興趣了解體育賽事詳細信息的受眾很方便地得到相關(guān)數(shù)據(jù)。借助于此項服務(wù),網(wǎng)絡(luò)媒體等非傳統(tǒng)專業(yè)新聞媒體不用通過專門的采訪,就可以寫出有深度的稿子;體育研究部門拿到這些數(shù)據(jù),就可以有針對性地進行研究,提出運動趨勢的預(yù)測,為運動員和運動隊提供訓(xùn)練建議等。
隨著各種數(shù)據(jù)的增多,各個行業(yè)的數(shù)據(jù),必然會越來越多地向公眾開放。通過大數(shù)據(jù)工具,就能解決篩選有用信息的問題,使新聞素材的獲取變得更加容易。它將進一步縮小新興媒體和傳統(tǒng)專業(yè)媒體之間獲取深度新聞數(shù)據(jù)能力上的差距,因此會給傳統(tǒng)媒體帶來更大的競爭壓力。
隨著大數(shù)據(jù)技術(shù)的普遍應(yīng)用,一些過去由人工完成的新聞采寫工作開始由計算機代替。例如,奧運會獎牌榜的制作和更新:
奧運會數(shù)據(jù)服務(wù)ODF實時提供奧運會每個比賽項目獲獎運動員及所屬國家的信息數(shù)據(jù)及其背景信息,通過大數(shù)據(jù)手段將有關(guān)數(shù)據(jù)篩選出來,按照所屬國家和金銀銅牌分類,即可形成一個奧運會多媒體獎牌榜產(chǎn)品的雛形,經(jīng)過適當編排,就可以在平面媒體上發(fā)布。再經(jīng)過聲光電多媒體手段的設(shè)計包裝,就可以在網(wǎng)絡(luò)和電視等媒體上向觀眾呈現(xiàn)。如果需要,可以增加和變換分類,使獎牌榜內(nèi)容更加豐富多彩。奧運獎牌榜的模板設(shè)計好以后,剩下的工作就是將實時更新的數(shù)據(jù)按照分類填入具體區(qū)域,全部工作均由計算機自動完成。上述整個過程基本概括了計算機進行體育新聞采寫的原理。
目前,計算機采寫新聞還局限在體育和金融領(lǐng)域。但隨著新聞模板的積累及豐富,計算機采寫新聞的領(lǐng)域?qū)⒉粩鄶U大,由此也將給新聞行業(yè)帶來新的挑戰(zhàn)和思考。
對媒體界產(chǎn)生重要影響的兩大技術(shù)變革,新媒體和大數(shù)據(jù)接踵而來。新技術(shù)的出現(xiàn)和發(fā)展是不可避免的,而傳統(tǒng)行業(yè)總是受新技術(shù)影響和沖擊的最大著力點。傳統(tǒng)行業(yè)要立于不敗之地,就要不斷變革,接受新技術(shù),融入新技術(shù)。幾年前舉行的世界媒體峰會上,新華社社長李從軍就有如下論述:“新興媒體的產(chǎn)生是時代的進步,是媒體適應(yīng)當前經(jīng)濟、科技進步發(fā)展的一種變革。新興媒體的出現(xiàn)勢必會對傳統(tǒng)媒體帶來影響。媒體之間要通過融合與合作,才能推動自身往前發(fā)展?!敝两褡x起來仍讓人感覺其力道未減。