文/成 怡
大數(shù)據(jù)時代,人們利用電子計算機(jī)的超級數(shù)據(jù)處理功能,從海量數(shù)據(jù)中尋找規(guī)律、獲得結(jié)論,從而為現(xiàn)今的工作提供有益的參考以及創(chuàng)新的動力。人們生產(chǎn)數(shù)據(jù)、分享數(shù)據(jù)、再從數(shù)據(jù)中獲利,生產(chǎn)量越大,分享面越寬,獲利者就相應(yīng)越多,獲利越豐厚,這就是數(shù)據(jù)紅利。產(chǎn)生數(shù)據(jù)紅利的基本條件有三:一是客觀上要有人類各個領(lǐng)域積累的云數(shù)據(jù)的存在;二是需要電子計算機(jī)的處理;三是要建立信息整理、信息服務(wù)的平臺。滿足以上基本條件,數(shù)據(jù)紅利作為推手可以衍生出無數(shù)創(chuàng)新產(chǎn)品。在數(shù)據(jù)紅利時代,各種建立在海量數(shù)據(jù)基礎(chǔ)上的智能操作,可以快速精確計算,大量節(jié)省甚至代替人力。
智能寫作可以說是數(shù)據(jù)紅利時代的一個鮮明個例。智能寫作,也稱為機(jī)器人寫作、自動寫作,是通過數(shù)據(jù)統(tǒng)計及深度學(xué)習(xí)等原理及方法進(jìn)行文字整理及創(chuàng)作工作,一定程度上可被視為通過智能服務(wù)介入人類的文字交流與互動。與人工寫作不同的是,智能寫作不具備也不需要人腦天馬行空的想象力,其借助和利用大數(shù)據(jù)來彌補(bǔ)自身想象力的缺陷。只要數(shù)據(jù)存在,其于數(shù)據(jù)中整理、提煉的速度和準(zhǔn)確率大大超出人們的想象。
隨著人工智能技術(shù)的發(fā)展,智能寫作在很短的時間里呈現(xiàn)了快速而穩(wěn)健的成長。其發(fā)展歷史雖短卻迅猛。2009年,由美國西北大學(xué)智能信息實驗室的學(xué)生和研究人員創(chuàng)建的寫作軟件“StatsMonkey”寫作了一篇體育報道,這篇報道被認(rèn)為是機(jī)器人新聞寫作的開山之作。2010年,西北大學(xué)的技術(shù)團(tuán)隊成立了自動寫作技術(shù)公司Narrative Science,并推出了更為強(qiáng)大的人工智能引擎“鵝毛筆”(Quill)。2 0 1 4年6月,美聯(lián)社開始利用Automated Insights公司的軟件自動生成稿件。2016年3月14日,韓國的一名人工智能記者在一家金融新聞編輯部正式上崗,僅用0.3秒就完成了一篇股市行情的新聞報道。2016年3月末,人工智能寫出的小說在日本入圍大獎賽。
在我國,2015年9月,騰訊財經(jīng)頻道率先推出智能新聞寫作機(jī)器人“Dreamwriter”,發(fā)表簡單的財經(jīng)新聞;同年11月,新華社的寫稿機(jī)器人“快筆小新”面世,撰寫關(guān)于體育賽事的中英文稿件和財經(jīng)信息稿件。2017年12月,在中央電視臺電視節(jié)目《機(jī)智過人》中,清華大學(xué)自然語言處理與社會人文計算實驗室出品的會寫詩的機(jī)器人“九歌”戰(zhàn)勝了陳更等3人詩歌團(tuán)隊。
以比特介質(zhì)完成的智能寫作與以人腦介質(zhì)完成的人工寫作相比較呈現(xiàn)了三個主要特征:強(qiáng)大的數(shù)據(jù)處理能力、強(qiáng)大的深度學(xué)習(xí)能力和強(qiáng)大的智能語言處理能力。
從截至目前出品的這些智能寫作產(chǎn)品來看,智能寫作涉獵的成熟的新聞產(chǎn)品以體育類、財經(jīng)類為主。在這些類別的新聞寫作中,需要從大量的數(shù)據(jù)素材中提取并整理信息。體育賽事在有限的賽季中在不斷更新、比較和整理賽事數(shù)據(jù),賽事結(jié)果都在數(shù)據(jù)中體現(xiàn),賽事過程體現(xiàn)為數(shù)據(jù)的變化過程。而財經(jīng)類報道對數(shù)據(jù)的依賴上也和體育賽事報道呈現(xiàn)出同樣的特征。這體現(xiàn)了智能寫作的最主要的特征:強(qiáng)大的數(shù)據(jù)處理能力。
而智能寫作起初最不被看好的一面則隨其對文學(xué)創(chuàng)作的參與而被重新審視。智能寫作內(nèi)容的“非人格化”“機(jī)械化”“表達(dá)局限”等曾被認(rèn)為是其主要短板。然而當(dāng)機(jī)器人“九歌”通過“圖靈測試”,所做的詩歌無懈可擊地騙過了詩詞專家的雙眼,打敗了國內(nèi)詩歌高手的時候,人們發(fā)現(xiàn)智能寫作并非不能涉獵情感類、個性化主題。而最近關(guān)于晉江文學(xué)網(wǎng)站發(fā)現(xiàn)有作者使用自動寫稿軟件發(fā)表文學(xué)作品的作弊事件也證明了智能寫作進(jìn)行文學(xué)創(chuàng)作幾乎可以以假亂真。可見智能寫作的發(fā)展完全可以突破人類對它的刻板化印象——這又恰恰體現(xiàn)了智能寫作的另外一個重要特征:強(qiáng)大的深度學(xué)習(xí)能力。
人工智能的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力在“阿爾法狗”的運(yùn)行原理中可窺一斑。2017年5月,在中國烏鎮(zhèn)圍棋峰會上,由谷歌(Google)旗下DeepMind公司戴密斯·哈薩比斯領(lǐng)銜的團(tuán)隊開發(fā)的人工智能“阿爾法狗”(AlphaGo)與排名世界第一的圍棋冠軍柯潔對戰(zhàn),以3∶0的總比分獲勝。阿爾法狗的工作原理主要就是“數(shù)據(jù)統(tǒng)計+深度學(xué)習(xí)”。第一代“阿爾法狗”的學(xué)習(xí)方法是通過數(shù)據(jù)統(tǒng)計的方法在結(jié)合了數(shù)百萬人類圍棋專家的棋譜基礎(chǔ)上,加之強(qiáng)化學(xué)習(xí)和監(jiān)督學(xué)習(xí)而來。而“阿爾法狗”的升級版AlphaGoZero的學(xué)習(xí)方法則摒棄了人類數(shù)據(jù),它從一開始就沒有接觸過人類棋譜,研發(fā)團(tuán)隊只是讓它自由隨意地在棋盤上下棋,然后進(jìn)行自我博弈。無論是在短時間掌握所有大數(shù)據(jù),還是發(fā)揮計算機(jī)本身超級計算的特長,人類的大腦都無法在這些方面與人工智能相匹敵。
智能寫作的數(shù)據(jù)處理能力和深度學(xué)習(xí)能力還融合在以NLP(Natural Language Processing,自然語言處理)為代表的系統(tǒng)算法上,更發(fā)揮了智能寫作與其他人工智能在語言溝通領(lǐng)域的優(yōu)勢。這可以成為智能寫作的第三個特征:強(qiáng)大的智能語言處理能力。NLP,它研究能實現(xiàn)人與計算機(jī)之間用自然語言進(jìn)行有效通信的各種理論和方法,是計算機(jī)科學(xué)、人工智能、語言學(xué)和人類(自然)語言之間相互作用的領(lǐng)域。NLP的發(fā)展經(jīng)歷了從理性主義到經(jīng)驗主義的過渡,越來越多地通過機(jī)器學(xué)習(xí)來獲取知識,越來越重視統(tǒng)計方法,出現(xiàn)了強(qiáng)烈的“詞匯主義”傾向。隨著NLP及其他智能語言處理技術(shù)的逐漸升級與進(jìn)步,智能寫作以及其他形式的人機(jī)溝通將越來越趨向于完美,更接近于人類思維。
從目前的發(fā)展來看,智能寫作產(chǎn)品種類從記者到詩人再到小說家,雖然都是同樣以文字處理為主業(yè),然則它們被社會認(rèn)可的程度卻大為不同。智能寫作種類可以分為:已經(jīng)合法執(zhí)業(yè)的智能記者;尚不能合法寫作的智能文學(xué)作者;尚有發(fā)展空間的其他形式智能文字處理體系,如智能公文處理體系、網(wǎng)站智能客服等。
智能記者與智能文學(xué)作者雖然都以碼字為生,但它們的境遇卻截然相反。智能記者的寫作可以代替人工新聞寫作中程式化及數(shù)據(jù)整合的部分為其最大的優(yōu)勢。和文學(xué)寫作不同的是,智能新聞寫作一開始就并無多少爭議地合法化了。而智能文學(xué)寫作面臨的問題就復(fù)雜得多。
首先,二者在時效性上的不同以及歸屬的不同,決定了如版權(quán)、剽竊等一系列后續(xù)問題的不同。智能記者一般是由新聞單位使用,是納入在一個組織管理系統(tǒng)中,用于為某新聞組織通過合法方式撰寫新聞稿件。而新聞稿件的時效性要求很高,新聞稿件必須第一時間刊發(fā)才有新聞價值,也正因為新聞稿件的時效性,其失去新聞吸引力并不斷被新的新聞更替的速度也很快。另外,因為目前各大新聞機(jī)構(gòu)還未大批量地使用人工智能進(jìn)行新聞寫作,針對同一新聞事件進(jìn)行寫作的雷同率也不高,出現(xiàn)知識產(chǎn)權(quán)爭議問題的幾率尚低。
文學(xué)寫作的私人化特點(diǎn)就比較強(qiáng)調(diào)沒有組織的管理,也沒有時效性的限制。人工智能通過學(xué)習(xí)人類的文學(xué)創(chuàng)作進(jìn)行新的創(chuàng)作時,會使用到人類作品中的創(chuàng)意、構(gòu)思,甚或一個句子、一個詞,乃至是原創(chuàng)中的姓名等信息。這種情況和新聞寫作中大量地使用事件信息中的數(shù)據(jù)是不同的。如果大量地學(xué)習(xí)或模仿他人的創(chuàng)意并將其構(gòu)思在一個文學(xué)創(chuàng)作中則會受到剽竊的質(zhì)疑。
其次,二者寫作目的的不同,決定了智能寫作在兩個領(lǐng)域中的價值不同。新聞寫作的目的是第一時間傳播信息。智能新聞寫作可以非??焖俚卣蠑?shù)據(jù)信息,且在數(shù)據(jù)處理的正確率上占有絕對優(yōu)勢,這個優(yōu)勢對于新聞業(yè)來說是極具吸引力的。而文學(xué)創(chuàng)作的目的則主要是為了滿足人們情感的需要。單純辭藻的堆砌或許并沒有“那年那時那地”更能勾起人類的情感記憶。除非是為了某種特定的利益,否則寫出自己對世界獨(dú)特的認(rèn)知和情感才是作家的創(chuàng)作目的。機(jī)器進(jìn)行文學(xué)創(chuàng)作,目前除了嘩眾取寵地引起驚嘆(如寫詩機(jī)器人“九歌”),就是幫助他人漁利(如充斥于網(wǎng)絡(luò)的自動寫作軟件)。
除了高大上的智能記者、智能詩人,其實智能寫作早已在民間網(wǎng)絡(luò)經(jīng)濟(jì)發(fā)展中悄然開始。出于實際需要的網(wǎng)站智能客服目前仍主要以文本服務(wù)為主,同時兼容語音服務(wù)以及超鏈接服務(wù)的發(fā)展。網(wǎng)站語音客服也仍然以文本為基礎(chǔ)。這種文本的創(chuàng)作雖然仍處于固定預(yù)設(shè)的初級文本創(chuàng)作階段,但已經(jīng)萌發(fā)智能化查詢和智能解答的創(chuàng)作。這種創(chuàng)作操作簡單,不像智能記者和智能詩人或是智能棋手那樣因為技術(shù)尖端而顯得高深莫測,其開發(fā)成本也相對較低而能得到行業(yè)普及。由于實際經(jīng)濟(jì)發(fā)展的需求,以低廉成本代替繁忙的人工網(wǎng)站客服將使其前景可觀。
智能公文寫作如果建立在現(xiàn)有的電子公文管理體系基礎(chǔ)之上,也是有其極為明朗的發(fā)展前景的。公文寫作的程式化特點(diǎn),使其具有非常大的智能化操作空間。電子公文業(yè)已發(fā)展為成熟體系,并已被使用在各行各業(yè)的實際公文管理體系。但電子公文只是使用了電子介質(zhì)用于公文保存和傳遞,只有將自動寫作系統(tǒng)納入公文寫作才能被視作智能公文寫作或智能公文管理。目前的電子公文生成系統(tǒng)只是參與了公文寫作的格式部分,尚未代替人腦對公文內(nèi)容的撰制。但其有望升級為由人工智能參與到文本內(nèi)容寫作以及格式,甚至還包括外圍的公文保存、傳遞及查閱等一系列完整體系中去。
智能公文寫作在未來將會有更大的、暢通無阻的發(fā)展空間。而曾經(jīng)以文字處理為主的網(wǎng)站智能客服在未來則有望擺脫智能寫作的單一局限,而發(fā)展為全方位的人機(jī)溝通智能小秘書。
在版權(quán)、抄襲等敏感問題得到解決之前,智能寫作應(yīng)該首先活躍于那些程式化的、枯燥的、會消耗大量人工精力的寫作領(lǐng)域。準(zhǔn)確、快速的智能寫作將成為幫助人類從枯燥無趣卻又耗時費(fèi)力的寫作中解脫出來的好助手。優(yōu)秀創(chuàng)意的誕生仍將依賴人腦,并非機(jī)器就不可能產(chǎn)生創(chuàng)意,只因創(chuàng)意的鑒定最終還是依賴人類的標(biāo)準(zhǔn)和人腦的選擇。機(jī)器可以從浩瀚的文字中組合出有趣的創(chuàng)意,但能否被肯定并使用仍然由人腦來決定。說回版權(quán)問題,如果有朝一日人工智能的創(chuàng)作出于效益的考慮大部分代替了人類的創(chuàng)作,而與人類的欣賞并無違和,則版權(quán)就不再有存在的意義。如若取消版權(quán),則機(jī)器替代人類進(jìn)行創(chuàng)作的動力又將何在?文學(xué)和藝術(shù)的創(chuàng)作需要滿足雙重的興趣需求,一個在讀者那里,一個在作者那里。作為讀者,人類會去欣賞來自機(jī)器的創(chuàng)作。但作為作者,人類不會由于機(jī)器可以創(chuàng)作就不再產(chǎn)生創(chuàng)作的欲望。