一、機(jī)器寫作會出錯嗎?騰訊的機(jī)器寫作兩年沒有出過一起事故。機(jī)器怎么做到零事故呢?機(jī)器寫作基于數(shù)據(jù),只要數(shù)據(jù)沒錯機(jī)器就不會有錯。如何保證數(shù)據(jù)不出錯?我們有嚴(yán)格的審核,比如說邏輯審核、計算審核,我們還單獨(dú)有一套開發(fā)的內(nèi)部審核系統(tǒng)平臺??傊覀円还灿?個環(huán)節(jié)來審核,確保數(shù)據(jù)安全無誤,這樣就保證我們在最終的環(huán)節(jié)不會出現(xiàn)問題。
二、機(jī)器是如何寫作的?我講個跳水的例子大家可能容易理解機(jī)器是怎么生成文章的。跳水是一個評分制的比賽,它的每一個比分應(yīng)該對應(yīng)著一個工作環(huán)節(jié),以及評委對他的評價。在我們的數(shù)據(jù)庫里每一個數(shù)字都代表著一個動作或描述,我們會從機(jī)器的角度把這些數(shù)據(jù)重新組合,還原成動作本身和評委的評判,然后再通過擬人的口語化的表述做一個詞組和段落之間的聯(lián)系,包括連詞、語氣詞,這樣就可以由不同的比賽、不同的分?jǐn)?shù)形成不同的表述。
三、機(jī)器在媒體生產(chǎn)和分發(fā)的環(huán)節(jié)中有哪些優(yōu)勢?其實(shí)很簡單,就6個字:多、快、好、省、準(zhǔn)、久。去年8月舉行的奧運(yùn)會,由于里約奧運(yùn)會的時差跟我們大概有十幾個小時,都是夜里三四點(diǎn),可能傳統(tǒng)的媒體記者都選擇加班,我們的系統(tǒng)只有3個人在維護(hù),不用加班,我們3600篇的稿子全是機(jī)器自動生成的。
四、機(jī)器有哪些可以提高和改善的地方?第一個是數(shù)據(jù)源的問題,騰訊的AI基礎(chǔ)是基于數(shù)據(jù),我們一定要找到豐富的數(shù)據(jù)場景來還原它。有的人會問我,你們在寫足球、籃球的稿件里面,會有這樣的表述,說某某人射門高出橫梁。按道理機(jī)器不會知道,它也不會知道球員的表現(xiàn),但事實(shí)上這些都可以在數(shù)據(jù)庫中體現(xiàn),因為現(xiàn)在的數(shù)據(jù)采集技術(shù)已經(jīng)非常好了。
第二個是深度學(xué)習(xí)和個性化,就是說,現(xiàn)在機(jī)器寫不只是批量,也不只是速度快,我們爭取未來為不同的人群寫,甚至為每一個不同的個體寫。每個人都有唯一的畫像,因為每個人都是唯一的,我們希望針對這些不一樣的地方給每一個不同的人寫不同的文章。
第三個是弱AI到強(qiáng)AI,我們現(xiàn)在只能說是弱AI時代,但我們一步步的往強(qiáng)AI時代邁進(jìn),因為終有一天機(jī)器會介入創(chuàng)作領(lǐng)域。
五、AI具體帶來哪幾個變化呢?我有一個特別推崇的詞,就是人機(jī)協(xié)同。未來記者、編輯很有可能每天都要跟機(jī)器打交道,一些復(fù)雜的收集、簡單的稿件,可能就由機(jī)器寫了,你只負(fù)責(zé)評判。
人機(jī)協(xié)作的改變,可能就在三五年內(nèi),我們會慢慢的適應(yīng)如何和機(jī)器打交道,如何通過機(jī)器、通過技術(shù)讓自己更強(qiáng)大。
針對騰訊新聞這樣的機(jī)構(gòu)來講,我們第一是希望做一些服務(wù),比如說各個地區(qū)的黨媒有豐富的資訊信息,我們希望把這些信息進(jìn)一步的整合,或者說做一個加工,幫助這些咨訊更有效的到達(dá)客戶,這是我們努力的方向。第二是想使資訊本身更有價值。媒體人將來重要的工作是什么呢?我覺得以前我們可能把更多的精力放在了加工、分發(fā)流通的環(huán)節(jié),未來將集中于信息的采集。另外,我們可以在單條資訊里面完成整個商業(yè)變現(xiàn)的閉環(huán),包括流量變現(xiàn)、用戶畫像的確認(rèn)等,未來的科技可以提供個人定制。第三個想發(fā)掘的是真正個性化的商業(yè)潛力,為每一個個體寫,這是我們未來特別希望做到的。
未來我們希望AI成為什么樣子的呢?它應(yīng)該是一個生活與資訊服務(wù)的平臺,你可以把它當(dāng)做秘書,讓它做很多特別辛苦、特別枯燥,但是同時又能幫助你提高生產(chǎn)質(zhì)量和生產(chǎn)效率的事情,這是我們未來一兩年都可以觸達(dá)的領(lǐng)域。
編輯:本刊編輯部