文| 顧捷昕
AI 將承擔大部分煩瑣的日常工作,充分釋放人類的創(chuàng)造力,并倚重人類的判斷力。
生成式人工智能到底將給出版業(yè)帶來什么樣的變化?這些變化不僅前所未見,而且令人震撼:行業(yè)內(nèi)的工作流程、經(jīng)營模式以及讀者獲得的最終產(chǎn)品可能都會發(fā)生實質(zhì)性的變化。然而,這項技術(shù)仍處于萌芽階段,通往未來的道路仍在建設(shè)之中。作為親歷出版業(yè)技術(shù)巨變的一線出版人,肯·布魯克斯(Ken Brooks)在美國書業(yè)媒體Publishers Weekly雜志上發(fā)表文章稱,對生成式人工智能的前景持有堅定的信心:它的應(yīng)用范圍廣泛而多樣,同時具備顛覆整個行業(yè)的巨大潛力。
肯·布魯克斯是咨詢公司Treadwell Media Group的創(chuàng)始人,也是Publishing Technology Partners 的創(chuàng)始合伙人。他曾擔任Wiley 出版集團的首席內(nèi)容官和Macmillan Learning 公司的首席運營官。他說,日常工作中,自己目睹了生成式人工智能多項用途的開發(fā)過程。它不是一個局限于紙上談兵的理論工具,而是一種目前正在發(fā)揮作用的操作工具。生成式人工智能具有什么樣的廣闊前景?其運用過程中又存在哪些誤區(qū)?肯·布魯克斯借此提出問題并闡釋他個人看法,希望幫助同人更深入地了解這項強大的技術(shù)及其徹底改變出版業(yè)的潛力。
肯·布魯克斯表示:“生成式人工智能工具大大提高了我的工作效率,以前耗費大量時間和精力的任務(wù),如今可以輕松搞定。一朝神器在手,營銷文案不僅手到擒來,而且目標明確,讀起來引人入勝;利用它爭取到的寶貴時間,我能夠手動定制信息并實現(xiàn)迭代傳遞——若是沒有人工智能的幫助,這幾乎是不可能完成的任務(wù)。此外,實踐證明,人工智能非常擅長生成圖書元數(shù)據(jù),簡化了一個煩瑣但對圖書發(fā)現(xiàn)和銷售至關(guān)重要的過程?!?/p>
他還嘗試運用人工智能應(yīng)用完成如下任務(wù):處理客戶服務(wù)電子郵件,破譯長篇累牘的討論部分;對內(nèi)容和供應(yīng)商合同進行初步分析,提取合同中的權(quán)利授予和版稅條款;整理提取的文本以創(chuàng)建電子書;找到競爭性圖書,以及識別手稿中潛在的問題。他認為,運用過程中,大多數(shù)情況下,人工智能全面碾壓真人操作:迅速、精確地完成多項任務(wù),不僅節(jié)約時間,而且避免人為錯誤。
就上述用途而言,人工智能展示出巨大潛力,但是在運用過程中,還存在某些問題。事實證明,要想在出版業(yè)充分利用人工智能的力量,并不像即插即用那么簡單。作為AI 技術(shù)的使用者,我們需要謹慎思考、努力鉆研,并深刻理解人工智能技術(shù)、其運用方式以及出版業(yè)自身的特殊性質(zhì)。實際操作中,用來執(zhí)行任務(wù)的提示詞通常需要大量的迭代,其結(jié)果也需要真人仔細地檢查和編輯。
在運用人工智能提取合同條款的過程中,布魯克斯感嘆又一次深切感受到這項技術(shù)的強大力量。生成式人工智能具有高超的模式識別技巧,可以對密集的法律術(shù)語進行篩選,有效識別和提取關(guān)鍵術(shù)語,其精確度令人驚嘆。在審查版稅協(xié)議、期限和授予的權(quán)利類型時,每個元素通常都隱藏在一堆法律術(shù)語中,解讀起來可能很耗時。生成式人工智能接受訓練之后,可以用來識別這些特定條款,從而大大減少在合同審查上花費的時間。
產(chǎn)品編輯往往需要從PDF 等格式的文檔中提取文本,甚至還得從打印頁面的掃描件中提取文本——這也是編輯日常工作必須面對的常見困難。提取出的文本往往有百般疏漏:字符編碼錯誤,換行符錯位,成段文字缺失。按照業(yè)內(nèi)標準流程,往往需要第三方服務(wù)商采取額外的步驟整理文本,確保適合進一步使用。布魯克斯透露:“我使用了生成式人工智能來取代這整個過程。應(yīng)用程序甚至可以突出顯示已更正的元素,以便快速查看?!?/p>
AI 技術(shù)在出版業(yè)的運用不僅限于提高操作環(huán)節(jié)的效率,在數(shù)據(jù)分析方面,它同樣具有強大效力。采用OpenAI 發(fā)布的Code Inspector(代碼解釋器),出版業(yè)內(nèi)日常操作生成的市場和物流數(shù)據(jù)成為可以任意取用的寶貴資源。比如,在教育出版領(lǐng)域,對交貨時間的分析至關(guān)重要——在銷售旺季,更是必須關(guān)注其中細節(jié)。將物流數(shù)據(jù)輸入AI 模型,用來分析趨勢,找到影響交貨時間的關(guān)鍵限制性因素。AI 模型熟練地處理大型數(shù)據(jù)庫,迅速找到問題癥結(jié)所在;這項工作如果靠人力來完成,則要耗費數(shù)天或是數(shù)周時間。運用過程中,我們必須有明確的考察目標,并且創(chuàng)建合適的可視化圖表,確保AI 模型能夠清晰地展示分析過程和結(jié)果,但是它只需數(shù)分鐘就能完成海量基礎(chǔ)數(shù)據(jù)運算。AI 工具會嘗試不同途徑,如果此路不通,會迅速轉(zhuǎn)換方法,直至得出恰當結(jié)果。
生成式人工智能技術(shù)在出版業(yè)到底會起到什么樣的作用?如下各個實例中反映出問題的實質(zhì):AI 具有強大功效,但是絕非準確無誤。AI 工具確實有卓越的技術(shù)性能,但是我們必須謹慎解讀它輸出的結(jié)果。
以發(fā)現(xiàn)競爭性圖書為例。表面看來,使用生成式人工智能,我們不費吹灰之力就能得到結(jié)果;但實際上,為合理運用AI 工具,我們必須對出版行業(yè)及其數(shù)據(jù)有深刻的了解??稀げ剪斂怂拐f,與他共事多年的薩德·麥克羅伊在電子郵件往來過程中曾指出:“人們聲稱,AI是用來發(fā)現(xiàn)競爭性圖書的強大工具;但是我認為,說這話的人并不理解這句話到底意味著什么。我們到底出于什么樣的目的,才要去找尋競爭性圖書?這涉及數(shù)據(jù)處理中的推薦引擎系統(tǒng)。我們想要找到與我們計劃出版的書稿在風格/內(nèi)容等方面最具相似性的圖書。這是一項棘手的工作……我們也得以避開那一道幾乎無解的難題:將仍受知識產(chǎn)權(quán)保護的圖書納入競爭性圖書數(shù)據(jù)庫?!?/p>
只要輸入一個或兩個詞組,AI 就能夠生成一系列可能的競爭性圖書標題。布魯克斯說,在他實際操作的案例中,當使用AI 查找競爭性圖書時,它生成了一個每個書名聽起來都很合情合理的競爭性圖書書單,但實際上這些圖書并不存在!實際上,AI 背后的開發(fā)商,推出ChatGPT 的OpenAI公司也承認AI 確實會“無中生有”。他們還就AI 輸出結(jié)果發(fā)出警告:生成的書名體現(xiàn)出用戶的搜索需求,但是列表中的圖書未必真實存在,其結(jié)果沒有權(quán)威性。
即使AI 具備分析數(shù)據(jù)的能力,能夠生成權(quán)威的揭示問題實質(zhì)的輸出結(jié)果,用戶依然得滿足以下要求:有的放矢地提出問題,知道自己想要什么樣的答案。這意味著在AI 應(yīng)用過程中,真人參與始終都是重要環(huán)節(jié)。AI提供工具,作為用戶,必須明確重點,并負責解讀結(jié)果。
乍一看,這貌似是AI 系統(tǒng)的不足之處,其實它可能恰恰又是優(yōu)點。這表明AI 確實只是賦能用戶的工具,而非人類活動的替代者。AI 有助于提高我們的工作效率,為我們提供更多信息,讓我們具備處理更多任務(wù)的能力——無論從規(guī)模還是速度角度看,若是沒有AI,我們不可能具備如此驚人的能力。但是,AI 并未降低行業(yè)知識和人類判斷力本身的價值;實際上,為了實現(xiàn)AI 的全部潛力,這些要素反而顯得更加重要。
布魯克斯認為,真正具有擴展性的企業(yè)應(yīng)用程序必須具有可預測性、一致性和精確性——你肯定不想公司的財務(wù)系統(tǒng)編造公司運營數(shù)據(jù)。生成式AI 尚不具備這樣的精確性,開發(fā)商一直努力做出改進,試圖消除AI生成結(jié)果的不確定性,確保AI 提供的答案無論從格式還是內(nèi)容上,都具有一定的精確性。他們的目標是,AI將承擔大部分煩瑣的日常工作,充分釋放人類的創(chuàng)造力,并倚重人類的判斷力。
OpenAI 公司持續(xù)推出新的功能產(chǎn)品,為實現(xiàn)上述目標提供輔助。比如,它的開發(fā)人員最近發(fā)布一項新的產(chǎn)品功能,使得智能自動語音呼叫更加系統(tǒng)化,并具有可預測性。但是,AI 技術(shù)仍有很長的路要走。
在法蘭克福書展公司于9 月5 日舉辦的法蘭克福版權(quán)會議上,美國企鵝蘭登出版集團前首席執(zhí)行官瑪?shù)铝铡溄鹜惺簿吞岢觯珹I 是有效工具,但出版人仍然應(yīng)該關(guān)注自身,而非糾結(jié)于軟件。
首先,她提到在企鵝蘭登出版的一本書《明天,明 天, 明 天》(Tomorrow,and Tomorrow,and Tomorrow)中,作者加布瑞艾拉·澤文(Gabrielle Zevin)寫出了十分吸引人的開頭。麥金托什以這段金句中的一個詞語作為提示詞,輸入AI 虛構(gòu)寫作工具“Sudowrite”中,但是得到的文本讓她有不忍卒讀的感覺,與澤文的精妙原句相比,完全是天差地別:“我根本不愿意在此轉(zhuǎn)錄生成結(jié)果,因為它如此枯燥,讓我只想跳過開頭。總之,生成的內(nèi)容讀來令人昏昏欲睡?!?/p>
“所以,我再次重申許多創(chuàng)作者對AI 技術(shù)的評價,”麥金托什說,“若是用它從事創(chuàng)造性寫作,其結(jié)果流于平庸”。由此看來,把AI 技術(shù)妖魔化為“圖書創(chuàng)作機器”,并且由此產(chǎn)生恐懼心理,未免言過其實。
麥金托什指出,由于缺乏溝通,作者不知道出版商有什么看法,出版商則擔心作者會因立場不同,對AI 抱有不同的態(tài)度;而許多業(yè)內(nèi)人士在談起AI 技術(shù)對出版業(yè)的影響時,態(tài)度又過于輕率,仿佛這個問題根本不值得嚴肅討論?!俺霭嫒瞬槐叵嗷シ婪?,以秘密小圈子的方式,私下討論AI 在出版業(yè)內(nèi)的運用情況,我真心希望,全行業(yè)應(yīng)該聚在一起,分享觀點,分擔焦慮,并探討可能的AI 運用領(lǐng)域?!?/p>
談起對AI 的相關(guān)疑問,以及它對內(nèi)容的調(diào)用,麥金托什說:“如果說,與AI 相關(guān)的風險正在蠶食我們的部分業(yè)務(wù)領(lǐng)域,最好的應(yīng)對方式就是,嘗試利用技術(shù)實現(xiàn)行業(yè)的整體增長。不要認為,AI 會替代小說家,其實,AI 只是復制人類作者作品的機器人?!?/p>
她認為,AI 真正的才能,在于其發(fā)現(xiàn)能力?!叭魏螐氖麓蟊妶D書出版的業(yè)內(nèi)人員都清楚?!丙溄鹜惺舱f,“內(nèi)容生成根本不是我們的最大難題。早在很久以前,這就不再是出版商心中的頭號問題。實際上,我們的第一要務(wù)是,在浩如煙海的海量內(nèi)容中,如何發(fā)現(xiàn)某一本書,或是一系列書,無論它以圖書、流媒體電影,或是其他形式出現(xiàn)。”
“我不知道到底哪一家開發(fā)商會解決這一問題,但是我認為,我們應(yīng)該有信心:總會有創(chuàng)業(yè)者解決這一難題,我們將采用這樣的AI 利器,加速出版流程,提高出版效率,因為我們能夠找到最有可能和我們出版的最新流行小說產(chǎn)生共鳴的消費者。有了AI 工具,發(fā)現(xiàn)之路將更加暢通?!?/p>
托馬斯·考克斯(Thomas Cox)是位于牛津附近的Arq Works 公司的總經(jīng)理兼董事,一直對AI 系統(tǒng)在出版業(yè)內(nèi)的運用有獨到的見解。
在法蘭克福版權(quán)會議上,考克斯介紹了出版業(yè)內(nèi)重要的AI 應(yīng)用程序開發(fā)項目,以及ChatGPT-4 之外正處于開發(fā)過程中的(二級)開源項目。這些開源項目獲得了微軟,以及谷歌各類產(chǎn)品的支持??伎怂惯€詳細介紹了Llama 2(由Meta 公司于7 月中旬推出)的開發(fā)情況:“它是開源大模型,所以用戶不僅可以訪問,還能自主運行和加以調(diào)整,由于整個開源社區(qū)都參與開發(fā),所以模型會高速發(fā)展?!?/p>
考克斯又談到Anthropic,這是一家“由前OpenAI員工創(chuàng)建的”AI 系統(tǒng)開發(fā)公司。Anthropic 的用戶能夠輸入整本書,然后向AI 提出相關(guān)問題,比如這本書的主要情節(jié)是什么,有哪些人物,而AI 那里擁有所有信息,能夠做出分析。考克斯又談到自己的公司:“我們開始發(fā)現(xiàn),大批基于AI 技術(shù)的應(yīng)用程序面市。許多程序供應(yīng)商都聲稱,他們的AI 是自主開發(fā)的,但實際上,他們使用的依然是ChatGPT,或是谷歌等其他主要的AI 系統(tǒng)供應(yīng)商提供的AI 系統(tǒng)?!?/p>
多年來,考克斯與法蘭克福版權(quán)在線交易項目合作,在版權(quán)交易方面積累了豐富的經(jīng)驗。他說,“版權(quán)業(yè)務(wù)是私人業(yè)務(wù):人情味、人際關(guān)系,以及溝通談判依然是業(yè)務(wù)核心。書展是開展版權(quán)業(yè)務(wù)的關(guān)鍵時間節(jié)點,目前情況并未改變。所以我認為,版權(quán)交易程序的核心也依然如故”。
“但是,這并不意味著這種局面以后也不會改變。如今業(yè)內(nèi)已經(jīng)出現(xiàn)了AI 輔助創(chuàng)作——有些人會坦率承認自己在寫作過程中使用AI 作為輔助工具,有些人不會,但事實是AI 創(chuàng)作輔助工具正在發(fā)揮作用?!?/p>
“業(yè)內(nèi)還有由AI 配音的有聲書,如今這類書籍也越來越常見。谷歌和蘋果年初都推出了AI 配音服務(wù),還有很多地方也能生成有聲書。AI 輔助翻譯已經(jīng)屢見不鮮,而且其效果越來越好。圍繞上述所有服務(wù),都存在與版權(quán)和合同相關(guān)的擔憂,這些還會影響流媒體版權(quán)。畢竟,我們將使用的AI 工具會發(fā)生日新月異的變化,出版業(yè)的變革也同樣迅速。”
如今看來,由AI 生成的文學內(nèi)容依然是個遙不可及的概念,但考克斯認為:“這并不意味著就在數(shù)十年間不會出現(xiàn)針對某一特定時期,抑或是特定體裁而開發(fā)的新模型,這些模型會有自己的人格,就是所謂虛擬作者?!?/p>
他說,到那時,人們會逐漸接受由AI 生成的長篇內(nèi)容。
目前,技術(shù)開發(fā)商們正在緊鑼密鼓地開發(fā)多個出版業(yè)專用的生成式AI 應(yīng)用程序,其前景值得期待。比如,PanOpen Education 將AI 技術(shù)合成至課件平臺之中。AI 起到輔導老師的作用,提供各類輔助,幫助學生改正錯誤理解,節(jié)約出的課堂時間則用來開展深層次的討論。PanOpen 總裁布萊恩·雅各布說:“長久以來,打破教育的工廠量產(chǎn)模式,實現(xiàn)以個人為中心的學習一直是我們的夢想,如今有生成式AI 來相助,夢想正在變?yōu)楝F(xiàn)實。從這一點看,我們認為,AI 工具為教育者與學習者賦能,與之前的應(yīng)用程序相比,其神奇效果遠超人們的想象。這類工具絕非教育者創(chuàng)造力的替代品,而是以新的形式,強力激發(fā)這種創(chuàng)造力。”
同樣,Gutenberg Technology 公司也運用AI 技術(shù)增加其創(chuàng)作工具產(chǎn)出內(nèi)容的可訪問性。公司利用AI 解決如下問題:可訪問性補救措施(適用于所有出版商的服務(wù)方案),合規(guī)性,試題生成(教育出版商專用程序)。公司總裁Gjergj Demiraj 說:“我們引進AI 技術(shù),旨在提高精確度和一致性,給作者和出版商帶來真正的福音。有了AI 的幫助,我們能夠確保出版商提供的內(nèi)容符合標準,能夠被所有用戶訪問,而且不會限制創(chuàng)作者的創(chuàng)造性觀點?!?/p>
上述實例表明,生成式AI 具備技術(shù)優(yōu)勢,而人類的創(chuàng)造力和判斷力無可取代,開發(fā)商努力實現(xiàn)強強聯(lián)合,打造出更高效、精確的創(chuàng)新性平臺,而且他們進步神速。他們還可能針對出版行業(yè)推出其他AI 應(yīng)用程序,比如圖書內(nèi)容開發(fā)、銷售、營銷以及運營和會計部門專用程序。
出版業(yè)已經(jīng)踏上革新旅程,作為親歷者,必須與時俱進,掌握前沿知識。生成式AI 創(chuàng)造機遇,出版人不應(yīng)棄之不顧,而是應(yīng)該盡快掌握相關(guān)應(yīng)用技能。出版人可以嘗試使用AI 工具,在新項目中納入這一元素,并探索其用法;參與相關(guān)討論,思考如何以符合道德規(guī)范的方式,運用AI 技術(shù),辨析該技術(shù)的局限和前景。更重要的是,出版人應(yīng)思考,如何塑造這一技術(shù),為出版行業(yè)所用,為讀者所用,以創(chuàng)造我們共同的未來。AI 是否會在出版業(yè)內(nèi)占據(jù)一席之地,這已經(jīng)不是問題。問題是,在什么時候,AI 會以什么樣的方式,在出版業(yè)內(nèi)發(fā)揮作用。如何保證這些“方式”符合出版人最遠大的抱負,最純粹的初心?!?/p>