“Xiaomingbot”背后,寫稿機(jī)器人的技術(shù)探尋——專訪北京大學(xué)計(jì)算機(jī)科學(xué)技術(shù)研究所萬小軍博士
萬小軍博士
《中國(guó)傳媒科技》:頭條寫稿機(jī)器人的主要技術(shù)特色是什么?
萬小軍:寫稿機(jī)器人的主要技術(shù)特色在于對(duì)包括自然語言生成、文檔自動(dòng)摘要、機(jī)器學(xué)習(xí)等在內(nèi)的多種技術(shù)的綜合利用,并且針對(duì)不同類型的稿件采用不同的技術(shù)途徑去生成,因此能夠?yàn)轶w育賽事同時(shí)生成短短幾句話的簡(jiǎn)訊與長(zhǎng)達(dá)上千字的詳細(xì)報(bào)道。
《中國(guó)傳媒科技》:網(wǎng)易等媒體報(bào)道頭條寫稿機(jī)器人主要有速度快、發(fā)稿樣式多、語言情感自適應(yīng)、自動(dòng)配圖等業(yè)務(wù)特色,哪些關(guān)鍵技術(shù)實(shí)現(xiàn)了突破,對(duì)應(yīng)哪些關(guān)鍵技術(shù)創(chuàng)新?
萬小軍:該寫稿機(jī)器人在基于文字直播的新聞自動(dòng)生成以及語言情感自適應(yīng)等技術(shù)上實(shí)現(xiàn)了突破。“Xiaomingbot”是業(yè)界首個(gè)基于文字直播數(shù)據(jù)進(jìn)行新聞生成的系統(tǒng)。基于先進(jìn)的機(jī)器學(xué)習(xí)算法,該系統(tǒng)能夠?qū)崟r(shí)地從文字直播數(shù)據(jù)中進(jìn)行語句篩選與融合,從而在體育比賽的任一時(shí)刻生成高質(zhì)量賽事報(bào)道。
在語言情感自適應(yīng)方面,我們?cè)O(shè)計(jì)了比賽邏輯判斷單元,使得“Xiaomingbot”在判斷出比賽的激烈程度后,可以使用不同的詞語形容賽事中運(yùn)動(dòng)員獲勝的難易程度,如“力克”“艱難晉級(jí)”“完勝”等詞語。另外,“Xiaomingbot”會(huì)不斷學(xué)習(xí)網(wǎng)絡(luò)直播員使用的語言,應(yīng)用在長(zhǎng)篇資訊報(bào)道中。
《中國(guó)傳媒科技》:有媒體報(bào)道頭條機(jī)器人的推出標(biāo)志寫稿機(jī)器人進(jìn)入第二代,您怎么看待這個(gè)評(píng)價(jià),您認(rèn)為人工智能技術(shù)合理的斷代依據(jù)是什么?
萬小軍:按照專業(yè)人士觀點(diǎn),人工智能發(fā)展順序是從弱人工智能開始,到與人類智能相當(dāng)?shù)?“強(qiáng)人工智能”,再到全面超過人類智能的“超人工智能”。目前人工智能在少數(shù)領(lǐng)域確實(shí)進(jìn)入了2.0時(shí)代,也即“強(qiáng)人工智能”,例如語音識(shí)別、棋類對(duì)弈等,但在很多領(lǐng)域還處于弱人工智能,這其中就包括自然語言生成。再回過來說寫稿機(jī)器人,我個(gè)人的看法是這個(gè)第二代寫稿機(jī)器人的說法并不能和人工智能2.0對(duì)應(yīng),而只是與第一代基于模板填充的寫稿機(jī)器人進(jìn)行區(qū)分。由于寫作是極富創(chuàng)造力的事情,因此寫稿機(jī)器人具有“強(qiáng)人工智能”,仍有很長(zhǎng)的路要走。
《中國(guó)傳媒科技》:頭條機(jī)器人對(duì)“基于會(huì)話分析的摘要生成技術(shù)”的應(yīng)用效果不俗,需要多大規(guī)模的語料庫(kù)和持續(xù)訓(xùn)練時(shí)間?
萬小軍: 由于時(shí)間和精力的原因,目前我們只人工整理了一百多項(xiàng)比賽對(duì)應(yīng)的文字直播數(shù)據(jù)與人工撰寫的賽事新聞作為訓(xùn)練語料,采用的機(jī)器學(xué)習(xí)算法能夠在數(shù)小時(shí)內(nèi)訓(xùn)練完畢。 如果有更多的訓(xùn)練語料,效果肯定會(huì)進(jìn)一步得到提升。
《中國(guó)傳媒科技》:寫稿機(jī)器人研發(fā)過程中,在今年的ACL會(huì)議上發(fā)表了哪些論文,取得了多大范圍的影響?
萬小軍:我們針對(duì)“基于文字直播數(shù)據(jù)的新聞自動(dòng)生成技術(shù)”已發(fā)表ACL2016長(zhǎng)文一篇(Jianmin Zhang, Jin-ge Yao and Xiaojun Wan. Toward Constructing Sports News from Live Text Commentary. In ACL 2016.),該論文在ACL會(huì)議期間受到眾多國(guó)內(nèi)外同行關(guān)注。此外,我們還在ACL2016上發(fā)表了3篇論文,此前,我們依據(jù)研發(fā)的成果已經(jīng)在國(guó)際頂級(jí)會(huì)議與期刊上發(fā)表數(shù)十篇學(xué)術(shù)論文。
《中國(guó)傳媒科技》:頭條寫稿機(jī)器人的圖文自動(dòng)關(guān)聯(lián)發(fā)稿是如何實(shí)現(xiàn)的,今后是否有可能做到基于視頻信息摘要生成技術(shù)的自動(dòng)發(fā)稿?
萬小軍:圖文自動(dòng)關(guān)聯(lián)實(shí)現(xiàn)方法主要是基于圖片和文本做語義匹配,這是多媒體信息處理領(lǐng)域的熱門課題?;诖罅康膱D文數(shù)據(jù)庫(kù),采用先進(jìn)的機(jī)器學(xué)習(xí)算法能夠?qū)W習(xí)圖文語義匹配模型,基于該模型可以為文本挑選合適圖片。
基于視頻信息進(jìn)行自動(dòng)發(fā)稿是一個(gè)遠(yuǎn)期目標(biāo),需要視頻理解技術(shù)達(dá)到一定的高度才可行。然而對(duì)于帶有音頻解說的體育視頻,我們可以先采用語音識(shí)別技術(shù)將音頻解說轉(zhuǎn)換為文字直播數(shù)據(jù),然后采用基于文字直播的新聞生成方法自動(dòng)寫稿。
《中國(guó)傳媒科技》:這次奧運(yùn)賽事報(bào)道期間,如何實(shí)現(xiàn)研究機(jī)構(gòu)和產(chǎn)業(yè)機(jī)構(gòu)聯(lián)合運(yùn)維的?
萬小軍:在這次合作中, 北大方面主要負(fù)責(zé)提供算法模塊。由于該系統(tǒng)的模塊劃分較容易,接口定義也很清晰,因此雙方責(zé)任很明確,同時(shí)雙方技術(shù)人員保持密切溝通,所以整個(gè)系統(tǒng)的上線和優(yōu)化效率較高。
《中國(guó)傳媒科技》:寫稿機(jī)器人是否能寫深度報(bào)道,需要哪些關(guān)鍵技術(shù)支持,未來是否會(huì)代替記者和編輯?
萬小軍:機(jī)器人寫深度報(bào)道是一個(gè)長(zhǎng)期目標(biāo),如果機(jī)器人能夠?qū)崿F(xiàn)這個(gè)目標(biāo),那么在該領(lǐng)域就真正實(shí)現(xiàn)人工智能2.0了。這個(gè)需要語義理解、觀點(diǎn)分析等多種技術(shù)支撐,需要計(jì)算機(jī)掌握歸納和推理能力。
即使寫稿機(jī)器人獲得大規(guī)模應(yīng)用,也不會(huì)讓記者丟飯碗,而是分工合作、各司其職:寫稿機(jī)器人負(fù)責(zé)生產(chǎn)陳述基本事實(shí)的稿件,記者負(fù)責(zé)生成對(duì)事件的深度分析報(bào)道。研發(fā)寫稿機(jī)器人的目的是要解放記者和編輯,讓他們做更有創(chuàng)造性的事。
《中國(guó)傳媒科技》:有人質(zhì)疑學(xué)校科研成果落地的效果,這次成功的產(chǎn)學(xué)研合作是如何實(shí)現(xiàn)的?
萬小軍:我們雙方負(fù)責(zé)人(我和李磊)都是一線從事技術(shù)工作的,能夠比較準(zhǔn)確地判斷一項(xiàng)技術(shù)的應(yīng)用價(jià)值和成熟度,而且我們雙方的判斷一致,溝通順利,這為合作打下了基礎(chǔ)。我們從開始談合作到系統(tǒng)上線只用了不到兩周,這得益于前期的基本模塊開發(fā)和原型系統(tǒng)。
學(xué)術(shù)研究目標(biāo)主要不是為了產(chǎn)學(xué)研合作,畢竟大部分科研成果并不具備實(shí)用價(jià)值,但是我們需要準(zhǔn)確地判斷哪些成果具有實(shí)用價(jià)值,并據(jù)此研發(fā)相關(guān)原型系統(tǒng)。
《中國(guó)傳媒科技》:人工智能不僅是傳媒的熱點(diǎn),而且是未來的轉(zhuǎn)型升級(jí)方向,您認(rèn)為傳媒領(lǐng)域下一個(gè)人工智能熱點(diǎn)是什么技術(shù)或產(chǎn)品?
萬小軍:我不太擅長(zhǎng)預(yù)測(cè),預(yù)測(cè)變化日新月異的人工智能領(lǐng)域尤其感到力不從心。我個(gè)人比較看好人機(jī)交互技術(shù),通過人機(jī)對(duì)話與各種智能設(shè)備進(jìn)行多通道交互,獲取多媒體信息。例如,用戶可以基于語音對(duì)話實(shí)現(xiàn)新聞的個(gè)性化閱讀,能夠回溯、暫?;蚩爝M(jìn)一篇新聞播報(bào),同時(shí)系統(tǒng)能夠主動(dòng)對(duì)用戶提問,詢問用戶對(duì)新聞事件的看法等,可能成為未來的新聞形態(tài)。