徐常亮
一個個監(jiān)控攝像頭將成為記者的眼睛,擴大大家觸達新聞熱點的能力。在今年兩會報道時,由新華社和阿里巴巴成立的新華智云科技有限公司通過對輿情熱點的發(fā)現(xiàn),把相關(guān)的輿情熱點報道視頻化,整個過程機器自動制作,使之在很短時間內(nèi)就能迅速產(chǎn)生,這正是新華智云目前正在力推的一個理念叫MGC。隨著智能時代的到來,萬物皆媒時代,MGC會成為主流。
MGC指的是機器生產(chǎn)內(nèi)容,這方面對傳統(tǒng)主流媒體機構(gòu)而言有獨特優(yōu)勢,傳統(tǒng)主流媒體更有優(yōu)勢接觸到這些數(shù)據(jù),只要在人工智能大數(shù)據(jù)的相關(guān)技術(shù)上予以跟進,就可以將內(nèi)容生產(chǎn)自動化、流水線化,大大提高新聞線索的發(fā)現(xiàn)和生產(chǎn)。
不管是國內(nèi),還是海外媒體,都對新華社這樣的舉措非??隙?。新華智云今天所做的事情也不僅僅服務(wù)于新華社,新華社希望讓新華智云這家公司,在探索過程中沉淀下技術(shù)、經(jīng)驗,和全國的媒體機構(gòu)進行分享。
媒體大腦由新華智云獨立研發(fā),致力于用業(yè)界領(lǐng)先的大數(shù)據(jù)及人工智能技術(shù),同媒體機構(gòu)和從業(yè)者一起,重新定義智能時代內(nèi)容生產(chǎn)者的核心競爭力。去年12月,新華智云正式發(fā)布媒體大腦時,介紹了媒體大腦的各項功能,集齊了報道線索、發(fā)現(xiàn)態(tài)勢到整個新聞制造流程,最后到分發(fā)覆蓋,但當(dāng)時我們更多是以工具或是單獨插進的能力來做,我們稱之為媒體大腦1.0階段。
媒體大腦的理念是:憑計算之力,求數(shù)據(jù)洞察,賦萬物為媒,迎智能時代。其中包含了四個要素:計算、數(shù)據(jù)、萬物和智能。計算連接數(shù)據(jù),智能賦予萬物,在萬物皆媒的時代,萬物要成為媒體,都需要大數(shù)據(jù)和人工智能技術(shù),這方面我們會一直深入探索。
▲媒體大腦1.0階段
▲媒體大腦2.0—— MAGIC智能生產(chǎn)平臺
今年6月,俄羅斯世界杯開賽當(dāng)天,新華智云正式發(fā)布了媒體大腦2.0,我們將上文提到的所有功能進行整合,放到一個大平臺中,在這個平臺里,整個內(nèi)容的采集、制造、分發(fā),成為一個整體。我們在把這套平臺作為新華社智能化編輯部探索的基礎(chǔ),同時也在和一些省級媒體合作,探索如何把這套平臺輸出到省級媒體,今后也可以成為區(qū)縣級融媒體中心發(fā)展的平臺基礎(chǔ)。
媒體大腦的重點仍在生產(chǎn)這條線,盡管它會覆蓋分發(fā),但其側(cè)重點仍是生產(chǎn)。在內(nèi)容生產(chǎn)領(lǐng)域,我們將理念提升為一條內(nèi)容生產(chǎn)的流水線,希望通過大數(shù)據(jù)和人工智能整體在線化地提供內(nèi)容生產(chǎn),讓大家今后的工作更智能化、輕量化。
隨著UGC等各類自媒體的出現(xiàn),主流媒體的聲音越來越弱,或者說比例越來越小,這樣智能化平臺的推出,可以給大家?guī)砀嗟南胂罂臻g,把主流聲音加強。媒體大腦平臺不僅可以提高效率、批量生產(chǎn)、秒級生成,更重要的是希望受眾喜歡。
媒體大腦2.0—— MAGIC智能生產(chǎn)平臺,MAGIC剛好是MGC(機器生產(chǎn)內(nèi)容)加上AI(人工智能),MAGIC平臺集中應(yīng)用了媒體大腦1.0的所有功能,由一條內(nèi)容生產(chǎn)流水線、四大智能基礎(chǔ)設(shè)施、五十余個智能系統(tǒng)構(gòu)成。MAGIC平臺能夠幫助內(nèi)容生產(chǎn)者更好地獲取和處理新聞資源,更快地發(fā)現(xiàn)新聞角度,生成的視頻滿足批量生產(chǎn)、秒級生成、受眾喜歡的要求。
媒體機構(gòu)發(fā)展至今,其本身積累的數(shù)據(jù)有很多價值,只是我們把這些數(shù)據(jù)進行細分,比如世界杯每場比賽對觀眾而言可能就是一場90分鐘左右的比賽,但我們會把它切成兩秒、五秒或十秒一個片段,整場比賽會被切成500到1000個片段,進行標(biāo)注,每個片段就是一個非常重要的數(shù)據(jù)。如何標(biāo)注就需要智能數(shù)據(jù)工坊。世界杯只是一個例子,每一篇文章都是非常重要的數(shù)據(jù),我們會把這篇文章里的時間、人物、地點,或它關(guān)系到的各方面,包括誰寫的、哪個機構(gòu)來發(fā)布的,都是一篇文章相關(guān)聯(lián)的重要數(shù)據(jù),通過視頻圖文等采集把它先聚攏起來,然后再進行處理。我們會做到甚至說金融級數(shù)據(jù)的處理要求,把數(shù)據(jù)質(zhì)量提高到最純最有用,希望這些數(shù)據(jù)能成為今后再創(chuàng)造再生產(chǎn)的源泉,同時也會對原始的素材進行打標(biāo),一方面通過智能的能力,另一方面也會結(jié)合人工。我們需要結(jié)合人和機器的能力,一起把數(shù)據(jù)加工到極致。
在基本的數(shù)據(jù)加工處理以后,我們會用智能媒資系統(tǒng)做一次精加工,其中使用到內(nèi)容理解、內(nèi)容萃取、各類人工智能技術(shù)來使媒資的內(nèi)容得到深入解釋。仍以世界杯為例,我們除了取它的畫面鏡頭,也會取它的比分鏡頭,取它的字模,把它的解說轉(zhuǎn)成文字記錄下來,今后可以做各類搜索。當(dāng)有了基本的數(shù)據(jù)處理和媒資整體的加工以后,整個批量生產(chǎn)構(gòu)造依賴于智能生產(chǎn)引擎。尤其對于二次創(chuàng)作的視頻,我們提出了一個想法就是先把原始視頻去化整為零,然后在化整為零的基礎(chǔ)上再化零為整,做成一個新的片子,這依賴背后整個智能生產(chǎn)引擎對內(nèi)容模板的組建管理,對實時數(shù)據(jù)介入和最后的素材灌入整個流程進行串通。俄羅斯世界杯期間,MAGIC平臺第一次將生產(chǎn)流水線引入內(nèi)容生產(chǎn)領(lǐng)域,31天內(nèi),機器生產(chǎn)的世界杯短視頻新聞達到37581條,其中最快一條耗時僅6秒。全國關(guān)于世界杯的短視頻產(chǎn)量大概也就6萬多條,我們占了將近60%的生產(chǎn)內(nèi)容提供量,背后源于這套系統(tǒng),對于一個3分鐘以內(nèi)的視頻要求在10秒之內(nèi)就能生產(chǎn)出來,有賴于一個非常強大的生產(chǎn)引擎來支撐整體的產(chǎn)量。
MAGIC平臺是人機協(xié)作的重要突破點,整個流程從選題開始,就會通過AI大數(shù)據(jù)分析以往的熱點,讓人的經(jīng)驗作為一個補充,世界杯期間每場球開始前我們都會有預(yù)定的目標(biāo),比如今天會有一個進球集錦、紅牌集錦、黃牌集錦,這些主題在賽前都可以規(guī)劃好,當(dāng)賽事發(fā)生,全部由機器發(fā)現(xiàn)其中的進球鏡頭,把這些鏡頭自動剪輯后再形成新的集錦,整個流程速度很快。傳統(tǒng)媒體可以利用自身優(yōu)勢,預(yù)先設(shè)定好模板,只要拿到數(shù)據(jù)源后,人就可以很少參與或介入,讓機器直接生成內(nèi)容。最后的內(nèi)容產(chǎn)品生成以后,像本次世界杯期間,我們還有人工干預(yù)階段,比如標(biāo)題怎么取,機器取標(biāo)題還是非常程式化。比如,C羅進球的集錦,機器取的標(biāo)題就是“C羅進球集錦”,但編輯人員會發(fā)現(xiàn)今天C羅進了4個球,有左腳進球、右腳進球、頭球,可以改一下標(biāo)題——“讓大家領(lǐng)略一下C羅的全能風(fēng)采,看看他的左腳右腳和頭球”。機器本身可以幫助編輯發(fā)現(xiàn)相關(guān)新聞點,它雖然取不出精彩的標(biāo)題,但它可以告訴編輯今天進球集錦里包含了左腳、右腳、頭球進球集錦,怎么取名字讓編輯發(fā)揮一下,成為一個閉環(huán)。
本次世界杯期間,這套平臺和騰訊系、阿里系、頭條系等平臺資源打通,視頻一生產(chǎn)出來的1分鐘或半分鐘內(nèi)就一下子分發(fā)出去,我們和今日頭條聯(lián)合做了一次進球推送,在進球后的2分鐘之內(nèi)就完成了這次進球的全網(wǎng)推送。
比如,C羅剛出來的那個鏡頭,從物理場去抽出數(shù)據(jù)場,對鏡頭里的人物,通過人臉識別、姿態(tài)識別,包括動作識別去發(fā)現(xiàn)他到底是誰,也會借助球衣號碼或解說等,通過視覺、聽覺等一切可用信息去分析這個人到底是誰,然后和各網(wǎng)的媒資做關(guān)聯(lián)。這個其實和最開始通過交通攝像頭發(fā)現(xiàn)道路上的爆炸是一樣的,先期要準備相當(dāng)多類似的視頻進行訓(xùn)練和學(xué)習(xí)。在足球領(lǐng)域?qū)σ恍╆P(guān)鍵的信息,如進球、定位球、紅黃牌,進行區(qū)分,今后在各垂直領(lǐng)域,可以去找到這樣的新聞點或進球事件,用機器就可以做這個事情,讓整個生產(chǎn)流程提速。
這套系統(tǒng)背后利用了物聯(lián)網(wǎng)、人工智能、大數(shù)據(jù)等技術(shù)。除了本身這套生產(chǎn)平臺以外,接下去我們也會發(fā)布區(qū)塊鏈的版權(quán),希望從這個平臺生產(chǎn)出來的內(nèi)容都能受到版權(quán)保護。整個內(nèi)容傳播鏈路和分發(fā)平臺有配合的話,我們也可以完成用戶畫像,整個鏈路很完整,當(dāng)然我們的側(cè)重點在生產(chǎn)這一側(cè)。
在媒體融合發(fā)展方面,我們希望引領(lǐng)新聞熱點報告這個新形勢。前段時間的一個熱點新聞,江蘇昆山一個路口的砍人事件,這個事情從報道的角度可以分兩方面來看,一方面是有技術(shù)能力的時候可以做報道,另一方面其實可以往前一步,當(dāng)有一輛車長時間停在路口,對交通本身是阻礙,如果再能識別出一些動作,其實可以更快地派警力到相關(guān)地方,避免發(fā)生這樣的慘案,把攝像頭新聞做到極致。攝像頭新聞這個理念最開始是我在做城市大腦的過程中提取出來的。攝像頭可以成為線索發(fā)現(xiàn)、第一時間報道的重要渠道。
另外,可以打造一些品牌欄目智能生產(chǎn)。2015年,當(dāng)時我還在阿里云,我們和湖南衛(wèi)視《我是歌手》做了一期節(jié)目,用AI預(yù)測誰是歌王。這方面可以進行一些嘗試,一方面可以把人工智能強力植入到欄目本身,另外一方面可以在背后用人工智能支持品牌欄目的制作,在這方面一定會有很好的合作模式等待探索。
最后,今天媒體融合發(fā)展中很重要一環(huán)還是如何把我們的基礎(chǔ)數(shù)據(jù)利用起來,例如在改革開放40周年的一系列報道活動中,如果能把歷史照片、歷史視頻,先通過人工智能的手段做標(biāo)注,記錄好某個片段有誰的出現(xiàn),或在某個場合誰說了某句話,或者可以把一些地方性的建筑抽取出來看40年間的變化。
這背后有大數(shù)據(jù)或者說算法的能力讓我們把已有的歷史資料庫挖掘出新意,就算沒有挖掘出新意至少把歷史文檔做了很好的標(biāo)注。最早在發(fā)布媒體大腦時,我們希望通過媒體大腦來幫助大家在記錄歷史的時候,更好地定位歷史,標(biāo)注歷史,今后更好地回顧歷史。