王羽佳
(電子工業(yè)出版社,北京,100036)
人工智能(AI)研究浪潮席卷全球,出版領(lǐng)域也迎來智能化轉(zhuǎn)型的機遇,“AI+出版”議題成為行業(yè)熱點。在應用層面,許多出版企業(yè)在出版生產(chǎn)中引入了人工智能技術(shù),諸如增強現(xiàn)實(AR)、虛擬現(xiàn)實(VR)等,借由這些技術(shù)應用,將傳統(tǒng)的紙質(zhì)出版物變換成更適應讀者個性化閱讀體驗的形式,重塑了出版物的傳播介質(zhì),并改變了出版物的傳播途徑和傳播模式,促進出版行業(yè)向智能化方向發(fā)展。
基于人工智能神經(jīng)網(wǎng)絡深度學習性能,AI技術(shù)在出版生產(chǎn)中有諸多形式的應用,比如基于信息處理技術(shù)的AI編輯、AI審稿和AI校對等。當前,許多出版企業(yè)應用了較為前沿的AI技術(shù),能夠輔助編輯完成圖片識別、格式轉(zhuǎn)換、語音文字交互等任務,有效提升了編輯的審核效率,替代了一部分重復勞動,也使編輯對信息的利用更加充分,提升了選題策劃與內(nèi)容生產(chǎn)效率,縮短了出版周期。但是,隨著AI在圖書選題策劃與內(nèi)容生產(chǎn)中的運用越來越普遍,也浮現(xiàn)出諸多問題。本文基于“AI技術(shù)并不完善,但其與出版融合的趨勢不可逆”這一基本前提,從AI對傳統(tǒng)出版工作中圖書選題策劃與內(nèi)容生產(chǎn)的影響和賦能角度,嘗試提出“AI+出版”的圖書選題策劃與內(nèi)容生產(chǎn)優(yōu)化路徑。本文中的圖書選題策劃與內(nèi)容生產(chǎn)主體是出版單位和編輯,涉及圖書著作類型包括原創(chuàng)著作、譯著、論文集、編著圖書等。
2017年5月,北京聯(lián)合出版有限公司出版了AI詩人小冰創(chuàng)作的詩集《陽光失了玻璃窗》。這是小冰學習了19世紀20年代以來519位中國現(xiàn)代詩人的上千首詩、經(jīng)過萬次迭代后“創(chuàng)作”的139首詩的結(jié)集。該詩集的出版顯示,AI技術(shù)的發(fā)展和應用,實現(xiàn)了圖書選題策劃與內(nèi)容生產(chǎn)的自動化、智能化,開啟了機器創(chuàng)作(Machine Generated Content,MGC)的新時代,賦予圖書選題策劃與內(nèi)容生產(chǎn)新的優(yōu)勢。
傳統(tǒng)圖書的選題策劃與內(nèi)容生產(chǎn)高度依賴編輯和作者,而“AI+”圖書選題策劃與內(nèi)容生產(chǎn)模式中,AI算法可以替代編輯進行智能化數(shù)據(jù)篩選、信息識別、歸納整理等工作,AI內(nèi)容生產(chǎn)輔助功能可以實現(xiàn)內(nèi)容的多樣化呈現(xiàn),從而使圖書選題策劃與內(nèi)容生產(chǎn)降低對人力的依賴,實現(xiàn)人與AI的智能協(xié)作。
2018年4月,電子工業(yè)出版社出版了網(wǎng)易有道推出的譯著《極簡區(qū)塊鏈》。該書以全方位的視角,結(jié)合通俗有趣的案例及150張插圖深入淺出地講解區(qū)塊鏈的核心理論和最新發(fā)展。全書20萬字,由AI翻譯技術(shù)翻譯、人工參與審校,從原文錄入到翻譯完成,用時不足半分鐘。龍源數(shù)字傳媒集團旗下的AI平臺“知識樹”,能夠在數(shù)千萬篇文章中尋找已獲取授權(quán)的內(nèi)容,然后基于編輯定義的主題和創(chuàng)作的部分內(nèi)容,自動組織和生成剩余內(nèi)容?!爸R樹”利用龍源集團旗下數(shù)千萬篇授權(quán)文章的積累,讓舊的內(nèi)容煥發(fā)出新的活力。如果沒有AI協(xié)同,在數(shù)據(jù)庫中查找相同主題的內(nèi)容都需要幾天甚至更長的時間,更不用說把這些內(nèi)容編成一本書。內(nèi)容生產(chǎn)完成后,“知識樹”會對接亞馬遜、當當、京東等電商平臺,將內(nèi)容輸出到各種數(shù)字出版分發(fā)渠道,快速完成一系列出版發(fā)行工作。在“知識樹”的幫助下,一本書的編寫只需要一個半小時,發(fā)行只需要一天,并且內(nèi)容可以分發(fā)到所有渠道,實現(xiàn)“流量在哪里,內(nèi)容就可以被輸出到哪里”。
現(xiàn)在的AI水平仍處于弱人工智能階段,內(nèi)容生產(chǎn)過程中,人與AI協(xié)同工作是最佳方式,AI能夠有效提升內(nèi)容生產(chǎn)的效率。在選題策劃和內(nèi)容生產(chǎn)過程中,人利用AI,更易獲得選題靈感,更易把握市場需求,從而使圖書內(nèi)容生產(chǎn)更符合市場期待。
AI賦能圖書選題策劃與內(nèi)容生產(chǎn),不僅能夠?qū)崿F(xiàn)傳統(tǒng)出版規(guī)范化知識生產(chǎn)和傳播的功能,而且能夠借助AI技術(shù)實現(xiàn)內(nèi)容的融合出版,增強內(nèi)容與讀者的互動。AI參與圖書選題策劃與內(nèi)容生產(chǎn),使圖書不僅可以是“實體紙質(zhì)圖書+電子書+音視頻”等簡單的融合出版物形態(tài),而且可以是集文字、圖像、語音、視頻、VR/AR等于一體的復雜的融合出版物形態(tài),但無論是哪種,都大大提高了內(nèi)容與讀者的交互性能。如美國作家詹姆斯·帕特森(James Patterson)在2018年發(fā)表的AI對話式小說《大廚》(The Chef),讀者可以通過與書中人物進行線上互動推動情節(jié)發(fā)展,從而提高作品的表現(xiàn)力與市場吸引力。
隨著AI技術(shù)在選題策劃與內(nèi)容生產(chǎn)中的深入應用,傳統(tǒng)的圖書選題策劃與內(nèi)容生產(chǎn)模式將被打破,出版服務將不再局限于向讀者單向輸出內(nèi)容,出版社、編輯、作者與讀者之間將真正實現(xiàn)自由“對話”,交互式學習、沉浸式閱讀將日漸普及,讀者將真正成為“主角”。
2019年3月施普林格·自然(Springer Nature)出版的《鋰離子電池:機器生成的前沿研究摘要》(Lithium-lon Batteries:A Machine-Generated Summary of Current Research),是基于對530000篇論文的學習、通過Beta編寫器(Beta Writer)算法,由AI創(chuàng)作出來的第一本學術(shù)圖書,聚焦于鋰離子電池的前沿研究,是巨量研究論文的精華合集。2021年,施普林格·自然又采用混合人機交互方式出版了第二本AI創(chuàng)作的學術(shù)圖書—《氣候、行星和進化科學:計算機生成的文獻綜述》(Climate,Planetary and Evolutionary Sciences:A Machine-Generated Literature Overview),這是一本將人工撰寫的文本和計算機生成的文獻融合綜述而成的圖書。2022年7月,該社推出第3本由AI整合生命科學專業(yè)領(lǐng)域的文獻而集成的學術(shù)圖書—《CRISPR:計算機生成的文獻綜述》(CRISPR-A Machine-Generated Literature Overview),這也是首次有中國學者參與的AI創(chuàng)作圖書。這些書的出版,顯示了AI對于信息極強的整合能力,這種能力,毫無疑問會推動圖書選題策劃與內(nèi)容生產(chǎn)邁上新臺階。
AI技術(shù)在圖書選題策劃與內(nèi)容生產(chǎn)中嶄露頭角,應用領(lǐng)域從篇幅較小的詩集、小說等,已逐步拓展到學術(shù)著作等大部頭圖書,成為傳統(tǒng)出版業(yè)轉(zhuǎn)型發(fā)展的重要趨勢之一。但AI技術(shù)本身并不成熟,在出版領(lǐng)域更是遠未達到普及的程度,這就使得AI應用于圖書選題策劃與內(nèi)容生產(chǎn)存在質(zhì)量與法律管理方面的瓶頸問題。
AI主導的圖書選題策劃與內(nèi)容生產(chǎn)很難呈現(xiàn)真正意義上的“原創(chuàng)”,而是在已有資料、數(shù)據(jù)的基礎上進行的“二次創(chuàng)作”。嚴格來說,AI并不是其自主創(chuàng)作的圖書的“著者”,而應該稱為“編者”或“譯者”。從原創(chuàng)性、文學性或?qū)W術(shù)性來說,AI創(chuàng)作的圖書內(nèi)容距離文學名著、社會科學和自然科學的創(chuàng)新性著作相去甚遠。由于AI圖書是基于既有數(shù)據(jù)庫的總結(jié)、歸納和模仿,因而創(chuàng)作深度不夠,提供給讀者的價值有限。
對于AI技術(shù)應用于圖書選題策劃與內(nèi)容生產(chǎn),出版業(yè)內(nèi)外都存在較大的質(zhì)疑,這些質(zhì)疑主要表現(xiàn)在兩個方面。一種質(zhì)疑指責AI主導的圖書選題策劃與內(nèi)容生產(chǎn)過于屈服于市場,過度應用流量導向,導致內(nèi)容同質(zhì)化現(xiàn)象愈發(fā)嚴重,且拉低了出版內(nèi)容的精神文化屬性,使其流于文本形式,而喪失了文字的內(nèi)涵深度與個性化色彩。例如,在傳統(tǒng)出版選題策劃中,內(nèi)容寫作角度、寫作方法、寫作素材都會融入編輯、作者的個體價值,具有較強的個體性特征。但在AI出版中,AI提供的基于數(shù)據(jù)分析的、可能更受市場歡迎的寫作方案,盡管寫作素材或?qū)懽鹘嵌瓤赡懿煌耆痪庉?、作者認同,但出于市場考慮,他們可能會產(chǎn)生一定的妥協(xié),從而使圖書的個性化程度降低。另一種質(zhì)疑指責AI技術(shù)過度干預選題策劃,造成選題策劃中的“劣幣驅(qū)除良幣”現(xiàn)象。由算法和流量主導的內(nèi)容生產(chǎn)可能導致大量人工創(chuàng)作的優(yōu)質(zhì)內(nèi)容無法得到有效的展示,基于算法和流量推薦,真正有內(nèi)涵的作品可能無法被出版方發(fā)現(xiàn),繼而導致出版行業(yè)在精神文化價值方向上的迷失,導致出版的作品“缺少靈魂”。例如《陽光失了玻璃窗》中,字里行間不難找到冰心、徐志摩、汪靜之、李金發(fā)等一批著名詩人的影子和名句。正是這種明顯的直接“挪用”暴露了AI內(nèi)容生產(chǎn)的本質(zhì)—通過一定的算法和程序?qū)A康臄?shù)據(jù)進行篩選和整合,通過改造和重組別人的作品進行“創(chuàng)作”。該詩集中的詩歌,詩句基本是各種修辭堆砌的華麗語句,看不出立意的深度和事件的細節(jié)和場景,部分詩句語句不連貫、情感表達混亂、思維邏輯跳躍。《人民日報》這樣評價這本詩集:“詩歌語言向來模糊、多義,文體自由度和讀者的理解包容度都比較大,微軟小冰的詩集《陽光失了玻璃窗》能夠‘以假亂真’被讀者接受,多多少少得益于這種自由度和包容度?!钡拇_,該詩集的出版在一定程度上得益于作者是AI詩人為讀者獵奇心理所帶來的市場。
與人類情感充沛的文字表達相比,AI的文字表達顯得相對冰冷—計算機算法的世界里,所有信息被歸化為“0”和“1”。AI創(chuàng)作的作品中,情感表達只是對大量作者既有的情緒和思維的機械整合,文字往往止步于字面意思,因此,存在情感缺乏和人文關(guān)懷缺位現(xiàn)象。同時,由于目前AI技術(shù)不成熟,很多AI作品中存在句子不連貫、表意不清晰甚至亂碼的情況,這進一步制約了AI創(chuàng)作的情感表達力。人類使用文字已經(jīng)有幾千年歷史,基于情感的表達方式、理解思維已形成完備體系,顯然,短時期內(nèi)AI還難以達到人類的文字表達水平。
AI的學習算法決定了內(nèi)容的寫作角度與寫作水平。盡管AI技術(shù)已經(jīng)迭代多次,但相對傳統(tǒng)出版行業(yè)仍顯得稚嫩,復雜的算法還無法準確地表達所有的寫作實踐,這是因為圖書不僅具有商品屬性,更具有精神文化屬性。通過算法迭代,AI技術(shù)可以實現(xiàn)對圖書商品屬性的最大挖掘,可以盡可能深入地模仿數(shù)據(jù)庫中內(nèi)容的寫作模式,但缺乏人類真實情感的轉(zhuǎn)化,很難比肩人類書寫。因此,在圖書選題策劃與內(nèi)容生產(chǎn)過程中,仍然需要人工因素與AI技術(shù)的協(xié)同。
AI技術(shù)應用于圖書選題策劃與內(nèi)容生產(chǎn)時,會遇到諸多具體法律問題。例如在選題策劃階段,AI大數(shù)據(jù)技術(shù)智能搜索依托于海量的數(shù)據(jù)庫,通過對來源于虛擬網(wǎng)絡世界中的瀏覽數(shù)據(jù)的高效分析獲得關(guān)鍵數(shù)據(jù),提取并進行大量的樣本統(tǒng)計歸納后,將可能受市場歡迎的選題方向提供給編輯。這一過程如果沒有得到用戶授權(quán),那么就存在侵犯用戶著作權(quán)的問題。在內(nèi)容生產(chǎn)階段,AI的“二次創(chuàng)作”可能會侵犯其學習數(shù)據(jù)庫中相關(guān)作品的著作權(quán)。AI選題策劃與內(nèi)容生產(chǎn)使著作權(quán)的歸屬變得復雜,由此產(chǎn)生了諸多關(guān)于AI出版著作權(quán)問題的討論。
但是,目前我國與AI內(nèi)容生產(chǎn)相關(guān)的法律體系不完備,針對性核心法條缺位。AI介入內(nèi)容生產(chǎn)屬于新生事物,因而我國尚未出臺相關(guān)法律,而現(xiàn)有的著作權(quán)法、出版管理法律法規(guī)等缺乏明確的關(guān)聯(lián)條款,這使得對AI參與選題策劃和內(nèi)容生產(chǎn)的法律監(jiān)管在具體實施時面臨許多困難,存在明顯的執(zhí)行性和可操作性不強的問題。
出版行業(yè)正站在產(chǎn)業(yè)變革的十字路口,為了促進知識與文化的最大價值化發(fā)展,滿足人們對圖書的多樣化需求,出版業(yè)和人工智能的深入融合是必然選擇。就AI技術(shù)在圖書選題策劃與內(nèi)容生產(chǎn)中的應用而言,筆者認為,可以選擇編輯、AI、法律“三位一體”的優(yōu)化路徑,見圖1,以編輯主導選題策劃與內(nèi)容生產(chǎn)的價值導向,同時聚焦AI技術(shù)的突破和法律法規(guī)的保障。
圖1 “三位一體”的AI圖書選題策劃與內(nèi)容生產(chǎn)
選題策劃是重要的出版環(huán)節(jié),在某種程度上來說,選題決定了圖書的受歡迎程度。傳統(tǒng)出版行業(yè),選題策劃要經(jīng)過編輯的前期調(diào)研和判斷,提煉出選題構(gòu)思,再經(jīng)過團體決策尋找出價值點后形成選題。這一過程通常需要花費較長的時間來進行信息篩選、沉淀和整合,而且對信息利用的程度并不能充分保證。但如果將AI技術(shù)應用于選題策劃,則能夠有效地提升信息檢索、篩選和整合的效率,使信息得到更全面、充分的利用。AI能在選題關(guān)鍵詞的引導下,高效地搜索出大量與選題相關(guān)的數(shù)據(jù),并能在數(shù)據(jù)分析模型之下有效地篩選出關(guān)鍵信息、隱蔽性信息和相關(guān)性強的信息,為圖書選題提供精準的信息支撐。
雖然AI對選題策劃的助益良多,但只能作為協(xié)同圖書選題決策的一種有力手段,選題策劃的決策者應該仍然是“人”—編輯和作者。具體來說,圖書的主題、形式等應該由“人”而不是“機器”來決定,即使是AI創(chuàng)作的作品,也有必要經(jīng)過人—編輯和作者的再次整理和編纂,對AI創(chuàng)作的內(nèi)容“取其精華,去其糟粕”,錘煉內(nèi)容,決策成書。有“靈魂”的作品,才能成為雋永的“好書”。因此,“編輯決策+AI協(xié)同”模式,應成為AI賦能圖書選題策劃與內(nèi)容生產(chǎn)的主流模式。
在這一模式下,既要充分發(fā)揮AI在學習廣度和深度上的優(yōu)勢,為選題策劃與內(nèi)容生產(chǎn)提供精準的參考選項,更要合理規(guī)劃編輯主體、作者與AI在選題策劃與內(nèi)容生產(chǎn)體系中的話語權(quán),必須堅持以“人”為本。要做到不過度依賴AI算法,不完全以流量和市場商業(yè)價值為導向,必須始終堅持選題策劃與內(nèi)容生產(chǎn)的價值導向,堅持出版內(nèi)容的精神文化屬性。
AI應用于圖書選題策劃與內(nèi)容生產(chǎn)的核心技術(shù)是基于數(shù)據(jù)庫的深度學習和算法創(chuàng)作,因此,在技術(shù)層面,AI賦能選題策劃與內(nèi)容生產(chǎn)的重點是做好選題策劃與內(nèi)容生產(chǎn)數(shù)據(jù)庫建設。
選題策劃與內(nèi)容生產(chǎn)的整個流程涉及很多數(shù)據(jù),如圖書信息、作者信息、銷量信息、內(nèi)容評價信息、讀者信息,以及用戶偏好和購買行為信息等,這些數(shù)據(jù)是圖書選題決策的基礎和依據(jù)。如果能將這些數(shù)據(jù)匯總到數(shù)據(jù)庫,就可以通過AI大數(shù)據(jù)技術(shù)幫助編輯進行分析判斷。比如,可以借助AI分析社會事件的熱度以發(fā)現(xiàn)選題方向,優(yōu)化選題構(gòu)思;可以通過AI對銷售數(shù)據(jù)、閱讀數(shù)據(jù)、評論數(shù)據(jù)、傳播數(shù)據(jù)、同類圖書影響力數(shù)據(jù)等的分析,幫助編輯定位目標市場和分銷渠道。AI還可以重塑內(nèi)容分發(fā)機制,基于AI大數(shù)據(jù)的智能分發(fā)和個性化推薦,可以做到千人千面,或者每個人都可以獨享自己關(guān)注的內(nèi)容。因此,AI的應用,還可以在發(fā)行和精準營銷上起到很好的支撐作用。
要提升AI賦能內(nèi)容生產(chǎn)的質(zhì)量,出版社必須建立更大、更全面的數(shù)據(jù)庫。出版企業(yè)應該積極構(gòu)建和擴充版權(quán)數(shù)據(jù)庫、作者數(shù)據(jù)庫、選題數(shù)據(jù)庫、讀者數(shù)據(jù)庫、銷售數(shù)據(jù)庫等各類數(shù)據(jù)庫,加強數(shù)字化建設和基礎設施建設,也可以嘗試與AI技術(shù)企業(yè)達成數(shù)據(jù)庫共享合作機制,構(gòu)建規(guī)模更大、容納類型更多樣、來源更廣泛的數(shù)據(jù)庫。小型出版機構(gòu)可以采用聯(lián)盟機制,共建數(shù)據(jù)庫。
有了強大的數(shù)據(jù)支持,結(jié)合讀者和市場導向思維—社交思維和對話理念,AI賦能圖書選題策劃與內(nèi)容生產(chǎn)就能更加高效和可行,就能從算法機制上實現(xiàn)選題策劃和內(nèi)容生產(chǎn)與讀者個性化需求之間的精準適配,為讀者提供個性化的出版服務,構(gòu)建穩(wěn)定的讀者社群,優(yōu)化出版企業(yè)的選題策劃與內(nèi)容生產(chǎn)生態(tài)鏈,最終實現(xiàn)智能化出版。
《人工智能指數(shù)2022》報告顯示,自2014年以來,關(guān)于AI法律研究的出版物數(shù)量增長了5倍,學術(shù)界對人工智能的版權(quán)法律規(guī)則的討論十分熱烈。不過,目前有關(guān)AI法律層面的諸多問題仍處于討論階段,并未達成共識。本文想指出的是,出版行業(yè)在推動AI出版相關(guān)法律建設的過程中,要追求技術(shù)變革與法律規(guī)則的協(xié)調(diào)發(fā)展,既要保障AI技術(shù)價值的發(fā)揮,也要在法律層面約束其可能產(chǎn)生的不利影響,確保AI技術(shù)真正促進出版產(chǎn)業(yè)的繁榮發(fā)展。
具體而言,建立和完善AI出版相關(guān)法律體系,首先應補充和完善《中華人民共和國著作權(quán)法》和《出版管理條例》中有關(guān)AI內(nèi)容生產(chǎn)的相關(guān)內(nèi)容和實施細則。科學技術(shù)飛速發(fā)展并與出版行業(yè)的緊密結(jié)合,凸顯了出版相關(guān)法律法規(guī)調(diào)整的急迫性。對AI內(nèi)容出版的相關(guān)流程和實施細則均應設置詳盡的操作規(guī)范,確保有法可依。其次應修改和廢止原有不合理的法律和行政法規(guī),以推進AI技術(shù)的應用以及出版行業(yè)的革新和升級。第三,在新法律法規(guī)出臺或?qū)υ蟹ㄒ?guī)進行修訂后,適時出臺有關(guān)司法解釋,對涉及概念、術(shù)語及其含義等進行清晰解釋,幫助出版企業(yè)及相關(guān)主體深入理解這些法律法規(guī),從而提高法律法規(guī)執(zhí)行的有效性,保障執(zhí)法權(quán)威。
在當下的工作實踐中,為了避免AI內(nèi)容生產(chǎn)侵權(quán)的相關(guān)法律風險,出版企業(yè)可以在每本圖書的出版合同中加入取得本作品內(nèi)容后續(xù)可能被用于AI內(nèi)容生產(chǎn)素材的相關(guān)權(quán)利,如發(fā)表權(quán)、署名權(quán)、修改權(quán)、保護作品完整權(quán)、復制權(quán)、發(fā)行權(quán)、信息網(wǎng)絡傳播權(quán)、改編權(quán)、翻譯權(quán)、匯編權(quán)等。可以根據(jù)作品具體內(nèi)容,與著作權(quán)人商議采取有償或者無償?shù)姆绞饺〉眠@些權(quán)益,在充分保障著作權(quán)人合法權(quán)益的基礎上,為建設內(nèi)容數(shù)據(jù)庫和后續(xù)的AI內(nèi)容生產(chǎn)做好充分的法律授權(quán)準備。
AI引入出版行業(yè),改變了傳統(tǒng)圖書選題策劃與內(nèi)容生產(chǎn)模式,但并沒有改變出版行業(yè)對優(yōu)質(zhì)內(nèi)容的極度渴望。AI或許能改變出版物內(nèi)容這種圖書的呈現(xiàn)形態(tài)、傳播渠道,但不可能改變出版物內(nèi)容這種人類精神文化的表現(xiàn)方式。從長遠看,AI+出版融合發(fā)展趨勢下的圖書選題策劃與內(nèi)容生產(chǎn)必然要堅守的仍然是文化價值和文化自信,而非對技術(shù)的無止境追求。