任敏
訴別離,它說,“離別恨難分,琵琶不忍聞。斷腸空有淚,明月已無魂?!痹伌喝?,它說,“三月初春雪未消,東風吹送柳絲飄。綠楊枝上鶯聲急,紅杏梢頭蝶夢遙?!?/p>
它是誰?它是“熟讀”詩歌90萬首,通曉平仄、押韻、對仗等“潛規(guī)則”,只需輸入關鍵詞句,即可在數(shù)秒之內(nèi)出口成詩的人工智能機器人,名曰“九歌”。這位古詩界的“最強大腦”,誕生于清華大學自然語言處理與社會人文計算實驗室,其主要研發(fā)者矣曉沅,是清華園里一位輪椅上的博士。九歌,寄托了他的志向,也帶領他抵達詩意的遠方。
6歲起,矣曉沅身體就被類風濕性關節(jié)炎糾纏。無法自由行走的曉沅,多了思考的時間,他是中學里名副其實的學霸。2012年高考,曉沅以云南省理科第16名的成績考入清華計算機系。2016年8月,成績優(yōu)異的曉沅開始讀研究生。
近年來,隨著深度學習的興起,人工智能與文學藝術碰撞出炫目的火花。那在人類語言高度凝練的詩歌領域,AI表現(xiàn)如何?曉沅與他的導師孫茂松教授二人一拍即合,何不做一個自動作詩機器人?他們鄭重地為機器人取名“九歌”。曉沅解釋,《九歌》既是自己名字的來源,也是《楚辭》名篇,這一命名意在致敬屈原,同時寄托了“九歌”的起點,即源于中國數(shù)千年的詩詞文化之中;另外,“九”作為虛數(shù)意味“多”,“歌”作為“詩歌”的泛稱,是大家對系統(tǒng)未來的期許,希望“九歌”能“創(chuàng)作”出更多優(yōu)秀的詩作。
當時,人工智能作詩,是比較小眾的研究領域?!熬鸥琛毖邪l(fā)團隊白手起家,他們借鑒詩歌寫作、語言學、心理學等方面的理論,設計出專門的模型結構。
古詩文是篇章結構,講究上下文一致,前后呼應。這是他們要解決的頭號難題?!耙灰箵P州月,凄涼萬里心。故鄉(xiāng)無限意,惆悵暮云陰。”這首機器生成的五言絕句,看似文從字順,首尾卻露出馬腳,第一句“月”字點明時間為夜晚,第四句卻變成“暮云”,前后矛盾。嘗試不少思路之后,他們設計出了顯著性線索機制模型。在此模型主導下,上文的詩有了改進:“憶昔揚州月,于今又一秋。故人何處是,落葉滿汀洲?!?/p>
第二關,扣題。對于自動作詩系統(tǒng),主題一般以用戶輸入的一個或多個關鍵詞來確定,如“春風”“寒月”“相思”等?,F(xiàn)有的系統(tǒng)要么漏詞,要么將用戶給定的關鍵詞直接生搬硬套地嵌入生成的詩歌中。他們從心理語言學角度切入,提出了基于工作記憶模型的詩歌生成方法。該方法使用不同的記憶模塊存儲用戶輸入的不同關鍵詞和生成的詩文內(nèi)容。模型不斷動態(tài)讀取和更新“自我”記憶,以此來提升扣題的緊密度和靈活性。
攻下一個又一個難關后,2017年年底,“九歌”1.0版正式上線,系統(tǒng)內(nèi)錄入了從唐代到清代數(shù)千名詩人的30多萬首詩,能自動創(chuàng)作出集句詩、絕句和藏頭詩。
一年半之后,“九歌”2.0版上線。曉沅說,通過改進算法,“九歌”2.0版既能作律詩,又能生成蕭瑟凄涼、憶舊感喟、孤寂惆悵、思鄉(xiāng)憂老、渺遠孤逸五種風格的絕句。2.0版的系統(tǒng)中,增加了交互功能,如果用戶對生成的詩歌不滿意,可以自定義修改。經(jīng)自動檢索之后,“九歌”還可推薦相似意境的經(jīng)典詩歌。
疾病困住了雙腳,卻無法束縛思想,“九歌”的誕生,讓曉沅迎來更加廣闊的舞臺。
2017年年底,“九歌”1.0版誕生之后,坐著輪椅的曉沅就登上了央視舞臺。曉沅帶著自己的作品迎戰(zhàn)青年詩人,他的“九歌”會用“機智過人”四個字作一首藏頭詩,也能以“心有靈犀一點通”打頭作集句詩,且速度遠超人類,他還喊出那句著名的口號,“古有曹植七步成詩,今有‘九歌七秒成詩?!被凇熬鸥琛?,曉沅連續(xù)兩年獲得中國計算語言學大會的“最佳系統(tǒng)展示獎”。
如今,“九歌”系統(tǒng)的訪問量已超過1000萬人次?!熬鸥琛?.0新版本正在緊鑼密鼓地開發(fā)。曉沅透露,目前系統(tǒng)已錄入從魏晉南北朝到近現(xiàn)代所能找到的90萬首詩歌,未來,他們還計劃讓這個“腹有詩書”的機器人學會看圖作詩、觀視頻作詩,也將嘗試作現(xiàn)代詩。
(摘自《北京日報》)