樊丹丹 中航出版?zhèn)髅接邢挢?zé)任公司
AIGC(Artificial Intelligence Generated Content)是指通過(guò)使用先進(jìn)的人工智能技術(shù),如深度學(xué)習(xí)、機(jī)器學(xué)習(xí)、自然語(yǔ)言處理等,使計(jì)算機(jī)模擬人類思維,自動(dòng)創(chuàng)作和生成各類內(nèi)容,包括但不限于文本、圖像、音頻和視頻等。通過(guò)人工智能生成的內(nèi)容不是在語(yǔ)法和結(jié)構(gòu)上的簡(jiǎn)單拼接,而是能夠在基于類人思維培訓(xùn)下給出的有價(jià)值、有深度、有創(chuàng)新性的內(nèi)容。AIGC 有著極強(qiáng)的自我學(xué)習(xí)和優(yōu)化的能力,能夠不斷提升生成內(nèi)容的質(zhì)量和創(chuàng)作效率。在數(shù)字化高度發(fā)展的社會(huì),AIGC 已經(jīng)滲透到社會(huì)生活的各個(gè)方面,被廣泛應(yīng)用于新聞報(bào)道、學(xué)術(shù)研究、廣告營(yíng)銷、娛樂(lè)創(chuàng)作等多個(gè)領(lǐng)域,極大地推動(dòng)了信息化社會(huì)的發(fā)展。
人工智能的發(fā)展不是一蹴而就的,從20 世紀(jì)50 年代萌芽至今大體經(jīng)歷了三大發(fā)展階段。第一階段為早期萌芽期(20 世紀(jì)50 年代至90 年代中期),里程碑事件包括:1950 年,艾倫·圖靈提出著名的“圖靈測(cè)試”,明確給出了判斷及其是否具有“智能”的方法;1966年,世界第一款可實(shí)現(xiàn)人機(jī)對(duì)話的機(jī)器人“Eliza”問(wèn)世;20 世紀(jì)80 年代中期,IBM 研發(fā)創(chuàng)造了語(yǔ)音控制打字機(jī)“Tangora”。這一時(shí)期受限于技術(shù)水平,AIGC 僅限于小范圍實(shí)驗(yàn),并沒(méi)有被重視。第二階段為沉淀積累期(20世紀(jì)90 年代后期至21 世紀(jì)10 年代前期),里程碑事件包括:2007 年,世界上第一部完全由人工智能創(chuàng)作的小說(shuō)《1 The Road》問(wèn)世;2012 年,微軟展示語(yǔ)全自動(dòng)同聲傳譯系統(tǒng),可將英文語(yǔ)音自動(dòng)翻譯成中文語(yǔ)音。在這一時(shí)期,AIGC 受限于算法瓶頸,無(wú)法直接生成內(nèi)容,但是邁出了重要的一步,從實(shí)驗(yàn)性開(kāi)始走向?qū)嵱眯?。第三階段為快速發(fā)展期(21 世紀(jì)10 年代中期至今),這一階段里程碑事件包括:2014 年,Lan J. Goodfellow 提出生成式對(duì)抗網(wǎng)絡(luò)GAN;2016 年谷歌創(chuàng)造AlphaGo,實(shí)現(xiàn)人機(jī)智能對(duì)戰(zhàn);2018 年,英偉達(dá)發(fā)布 Style GAN 模型,用于自動(dòng)生成高質(zhì)量圖片;2019 年,DeepMind 發(fā)布 DVD-GAN 模型,用于生成連續(xù)性視頻;2022年,OpenAI發(fā)布ChatGPT模型,用于生成自然語(yǔ)言文本。這一時(shí)期深度學(xué)習(xí)算法不斷成熟迭代,人工智能百花齊放,開(kāi)始“破圈”進(jìn)入大眾視野。
ChatGPT 是人工智能生成內(nèi)容(AIGC)技術(shù)的產(chǎn)品形態(tài)之一,本質(zhì)上是基于神經(jīng)網(wǎng)絡(luò)的自然語(yǔ)言處理 (Natural Language Processing, NLP)模型,相較于前人工智能產(chǎn)品擁有更豐富的知識(shí)儲(chǔ)備和更高超的語(yǔ)言交互能力,在文本生成、圖像生成、代碼開(kāi)發(fā)等內(nèi)容生產(chǎn)領(lǐng)域表現(xiàn)出色,一定程度上能媲美人類智能[1]。ChatGPT 是隨著GPT-1 到Instruct GPT 模型的不斷成熟而逐步形成。2018 年,GPT-1 模型有1.17 億參數(shù),具有一定的泛化能力(generalization ability),能夠用于與任務(wù)無(wú)關(guān)的MLP 任務(wù)中。2019 年,GPT-2 模型有15 億參數(shù),除了理解能力外GPT-2 在生成方面表現(xiàn)出了強(qiáng)大的天賦:閱讀摘要、聊天、續(xù)寫、編故事,甚至可以生成假新聞、釣魚(yú)郵件或在線進(jìn)行角色扮演。2020 年,GPT-3 模型有1750 億參數(shù),作為一個(gè)自監(jiān)督模型,可以完成自然語(yǔ)言處理的絕大部分任務(wù):將網(wǎng)頁(yè)描述轉(zhuǎn)換為相應(yīng)代碼、模仿人類敘事、創(chuàng)作定制詩(shī)歌、生成游戲劇本,甚至模仿已故的哲學(xué)家預(yù)測(cè)生命的真諦。2022 年1月,OpenAI 公司對(duì)ChatGPT-3 模型進(jìn)行了微調(diào),形成了GPT-3.5 模型,可以將有害的、不真實(shí)的和有偏差的輸出最小化,是對(duì)模型“道德”能力的一次優(yōu)化。2022 年3月,GPT-4 正式發(fā)布,相較于ChatGPT(GPT-3.5)有了質(zhì)的飛躍,邏輯推理能力更強(qiáng),語(yǔ)言能力更強(qiáng)。從 GPT-1 到GPT-4 智能化程度不斷提升,研發(fā)期間隔也不斷縮短。根據(jù)OpenAI 公司披露的信息,本年末推出的GPT-5 模型將實(shí)現(xiàn)影像感知和學(xué)習(xí)。
在當(dāng)今的科技領(lǐng)域,國(guó)內(nèi)外的科技巨頭都非常重視ChatGPT 引發(fā)的科技浪潮,并紛紛積極布局生成式AI。ChatGPT 作為一種強(qiáng)大的語(yǔ)言模型,具備了出色的自然語(yǔ)言處理和對(duì)話生成能力,能夠?qū)崿F(xiàn)與人類的智能交互。這種技術(shù)的出現(xiàn)引發(fā)了一股AI 技術(shù)的熱潮,許多企業(yè)和研究機(jī)構(gòu)都加快了在生成式AI 領(lǐng)域的研發(fā)和應(yīng)用布局,部分公司已有成型產(chǎn)品并公布測(cè)試。(僅列舉部分,見(jiàn)表1)
進(jìn)入數(shù)字化時(shí)代,科技出版依次經(jīng)歷了電子出版—網(wǎng)絡(luò)出版—數(shù)據(jù)出版—智能出版四個(gè)階段。電子出版是將紙質(zhì)出版物以電子的方式呈現(xiàn)出來(lái),比如常見(jiàn)的電子書(shū)、電子報(bào)紙等。網(wǎng)絡(luò)出版是借助互聯(lián)網(wǎng)進(jìn)行編輯、出版、發(fā)行、傳播,出版物的形態(tài)存在于互聯(lián)網(wǎng)服務(wù)器的介質(zhì)中,用戶可以在網(wǎng)上瀏覽或是下載。網(wǎng)絡(luò)出版物具有多種作品形態(tài),包括文字、音視頻等。數(shù)據(jù)出版是指數(shù)據(jù)工作者或者科研人員利用互聯(lián)網(wǎng)將研究、實(shí)驗(yàn)等過(guò)程中產(chǎn)生的數(shù)據(jù)成果按照統(tǒng)一的規(guī)范,如數(shù)據(jù)論文的方式公布出來(lái),實(shí)現(xiàn)數(shù)據(jù)的開(kāi)放共享,其他用戶可以進(jìn)行下載、引用。智能出版是指出版者把自動(dòng)文本分析技術(shù)、知識(shí)圖譜、大數(shù)據(jù)、等智能技術(shù)應(yīng)用到出版產(chǎn)業(yè)鏈中,從而滿足用戶的個(gè)性化閱讀需求及提高出版業(yè)的數(shù)字化水平。目前科技出版社大多集中在第三或第四階段,隨著人工智能技術(shù)的發(fā)展和應(yīng)用,必然會(huì)走到“智慧出版”階段,即出版者利用人工智慧、智慧生成等最新數(shù)字技術(shù),結(jié)合傳統(tǒng)出版技術(shù)與形態(tài),實(shí)現(xiàn)創(chuàng)作和出版的高度自動(dòng)化和智能化,實(shí)現(xiàn)學(xué)術(shù)觀點(diǎn)發(fā)現(xiàn)和智慧化傳播,為用戶提供全面的、個(gè)性化的、智慧化的服務(wù)。
2023 年3 月,ChatGPT 以Snow fox Books 行政總裁Seo Jin 的故事構(gòu)思為基礎(chǔ),僅花7 小時(shí)便完成所需的數(shù)據(jù)搜集并以英文寫成一本135 頁(yè)的名為《尋找人生目標(biāo)的45 種方法》的書(shū)籍。新書(shū)隨后采用韓國(guó)科技巨頭Naver 旗下AI 翻譯程序Papago 譯成韓文,過(guò)程不到2 小時(shí)??梢?jiàn),當(dāng)AI 與出版業(yè)融合,將迅速為傳統(tǒng)出版行業(yè)發(fā)展打開(kāi)一個(gè)新方向。
1.ChatGPT——內(nèi)容供給與優(yōu)化。ChatGPT 作為一個(gè)強(qiáng)大的語(yǔ)言模型,通過(guò)分析提供的信息,可以生成多樣化、連貫且有邏輯的文本,在短期內(nèi)為出版商提供新的靈感和觀點(diǎn),提升策劃構(gòu)思效率。同時(shí),出版商也可以通過(guò)不斷與ChatGPT 進(jìn)行交互獲得提交文本的反饋和建議,幫助優(yōu)化文章的結(jié)構(gòu)、語(yǔ)法和表達(dá),檢查拼寫錯(cuò)誤、語(yǔ)法、表達(dá)不當(dāng)?shù)葐?wèn)題。通過(guò)實(shí)時(shí)、個(gè)性化的反饋可以提高文章質(zhì)量,確保信息傳達(dá)得更準(zhǔn)確、清晰。
2.ChatGPT——知識(shí)關(guān)聯(lián)。雖然不像搜索引擎具有直接查找和鏈接知識(shí)的功能,但是經(jīng)過(guò)大量文本數(shù)據(jù)訓(xùn)練的ChatGPT 可以對(duì)不同主題的知識(shí)進(jìn)行學(xué)習(xí)和理解,并在對(duì)話中與用戶進(jìn)行關(guān)聯(lián)。出版商可以利用其理解自然語(yǔ)言的能力,不斷充實(shí)學(xué)科相關(guān)的信息來(lái)和內(nèi)容,按照選定的方向總結(jié)文章的關(guān)鍵詞,構(gòu)建個(gè)性化知識(shí)圖譜。
3.ChatGPT——知識(shí)發(fā)現(xiàn)。經(jīng)過(guò)大量文本數(shù)據(jù)訓(xùn)練的ChatGPT 可以理解和生成自然語(yǔ)言并嘗試對(duì)一篇論文的內(nèi)容進(jìn)行簡(jiǎn)要總結(jié)。當(dāng)匯集了大量相關(guān)學(xué)科數(shù)據(jù)后,可以進(jìn)一步理解編輯意圖,根據(jù)編輯提供的輔助信息提供與搜索語(yǔ)句相關(guān)的學(xué)術(shù)觀點(diǎn)的論文、推薦相關(guān)領(lǐng)域的專家,幫助編輯快速找到進(jìn)行同行評(píng)議的專家。
4.ChatGPT——相似性檢測(cè)及知識(shí)審讀。ChatGPT可以作為一個(gè)輔助工具用于知識(shí)審讀。ChatGPT 大引擎系統(tǒng)決定了它的成長(zhǎng)方式是螺旋上升的,自身學(xué)習(xí)的延展性也超越了普通數(shù)據(jù)庫(kù)。通過(guò)對(duì)本學(xué)科知識(shí)的不斷積累,ChatGPT 可以獲得“1+1>2”的知識(shí)儲(chǔ)備。傳統(tǒng)相似性檢測(cè)僅依靠文字匹配或進(jìn)行分句后的文字匹配,利用ChatGPT 訓(xùn)練論文數(shù)據(jù)后可以進(jìn)行觀點(diǎn)、思想的匹配。同時(shí)可以給編輯提供出版物的知識(shí)來(lái)源、信息的準(zhǔn)確性、個(gè)人觀點(diǎn)傾向、意識(shí)形態(tài)等建議。
5.ChatGPT——自動(dòng)化制作。海量數(shù)據(jù)支撐的ChatGPT 可以提供編輯內(nèi)容、制作封面、自動(dòng)排版、翻譯和校對(duì)等服務(wù),進(jìn)而大幅提高出版行業(yè)的生產(chǎn)效率和質(zhì)量,降低制作成本和時(shí)間,這對(duì)于出版商而言也是非常有價(jià)值的功能。
6.ChatGPT——運(yùn)營(yíng)推廣。ChatGPT 實(shí)現(xiàn)了以對(duì)話方式進(jìn)行交互,可以實(shí)現(xiàn)你問(wèn)我答、有問(wèn)必答、上下文了解,完成多輪對(duì)話,真正像人類一樣進(jìn)行聊天交流??萍汲霭嫔缈梢酝ㄟ^(guò)在微信或官網(wǎng)平臺(tái)搭建智能問(wèn)答平臺(tái),輔之以虛擬人物的形象,針對(duì)作者或者讀者提出的常規(guī)問(wèn)題進(jìn)行解答(比如投稿郵箱、出版要求等)、對(duì)要推廣的期刊、圖書(shū)進(jìn)行智能運(yùn)營(yíng)推廣,大大減輕編輯的工作負(fù)擔(dān)。
7.ChatGPT——預(yù)測(cè)市場(chǎng)。ChatGPT 能夠迅速對(duì)海量數(shù)據(jù)進(jìn)行分析和處理,讓出版商能夠更精準(zhǔn)地了解讀者的需求與市場(chǎng)趨勢(shì),對(duì)市場(chǎng)進(jìn)行更準(zhǔn)確的預(yù)測(cè)和決策,為客戶提供個(gè)性化推薦和定制化服務(wù),增加讀者的付費(fèi)意愿,非常有利于出版行業(yè)的發(fā)展。
綜上,不難看出ChatGPT 在科技出版領(lǐng)域的應(yīng)用前景非常廣闊。它可以提高內(nèi)容的質(zhì)量和效率,為編輯工作提供支持,為出版商提供優(yōu)質(zhì)資源,增強(qiáng)讀者的互動(dòng)和參與度。隨著ChatGPT 技術(shù)的不斷發(fā)展和完善,可以預(yù)見(jiàn)它將在科技出版領(lǐng)域發(fā)揮越來(lái)越重要的作用,進(jìn)一步推動(dòng)科技知識(shí)的傳播和普及。
AIGC 對(duì)于出版業(yè)的影響,并非只有積極的一面,而是機(jī)遇與挑戰(zhàn)并存。
這里包括人力資源和技術(shù)成本。引入人工智能技術(shù)不光需要擁有相關(guān)的專業(yè)知識(shí)和技能,同時(shí)還需要懂得運(yùn)用AI 的人才,這對(duì)于一些中小型出版機(jī)構(gòu)來(lái)說(shuō)可能會(huì)面臨較大的挑戰(zhàn),更需要編輯不斷地學(xué)習(xí)和更新知識(shí)和技能。
ChatGPT 并不是萬(wàn)能的,在內(nèi)容創(chuàng)作上時(shí)常會(huì)有錯(cuò)誤,這就需要編輯重新校對(duì)其嚴(yán)謹(jǐn)性。同時(shí)ChatGPT 作為類人思維大模型,也具有人類會(huì)犯的錯(cuò)誤“撒謊”。當(dāng)被要求在它不熟悉的領(lǐng)域搜索問(wèn)題,ChatGPT 有很大概率會(huì)對(duì)自己不知道的事情進(jìn)行造假。
人工智能技術(shù)需要處理和存儲(chǔ)大量的數(shù)據(jù)。目前ChatGPT 的服務(wù)器分別位于美國(guó)加利福尼亞州圣何塞市、歐洲法國(guó)巴黎、日本東京。人們向ChatGPT 提出的每一個(gè)問(wèn)題,如論文、數(shù)據(jù)等都可能被存儲(chǔ)并成為ChatGPT 訓(xùn)練模型的素材,并被反饋為問(wèn)題的答案。在OpenAI 數(shù)據(jù)使用說(shuō)明中明確提到對(duì)于非API 產(chǎn)品如ChatGPT、DALL-E,平臺(tái)確實(shí)會(huì)使用用戶數(shù)據(jù)來(lái)進(jìn)一步提升模型效果。另外,ChatGPT 運(yùn)行中會(huì)出現(xiàn)故障,導(dǎo)致隱私泄露,用戶可能會(huì)在自己的界面上發(fā)現(xiàn)大量別人的對(duì)話。
權(quán)利歸屬是著作權(quán)法的核心,其可以明確作品究竟歸屬于誰(shuí),以及誰(shuí)可以對(duì)所創(chuàng)作的作品享有權(quán)利并承擔(dān)責(zé)任[2]。ChatGPT 生成的內(nèi)容,著作權(quán)到底歸誰(shuí)?如果不承認(rèn)AI 模型著作權(quán),那是否意味著其生成的內(nèi)容也無(wú)須受到著作權(quán)保護(hù)?人類正在經(jīng)歷第一次AI著作權(quán)沖擊。各大出版商紛紛給出針對(duì)人工智能生成內(nèi)容著作權(quán)的明確說(shuō)明。國(guó)際出版業(yè)巨頭ELSEVIER旗下的期刊《護(hù)士實(shí)踐教育》在1 月出版的文章把ChatGPT 作為作者,而在2 月對(duì)此論文進(jìn)行了訂正后則不再將ChatGPT 視為作者。到目前為止,出版業(yè)內(nèi)沒(méi)有對(duì)ChatGPT 創(chuàng)作歸屬形成共識(shí)。
有學(xué)者給ChatGPT 出過(guò)那道著名的“火車軌道選擇題”:在一個(gè)鐵路的岔路口,面對(duì)一列疾駛而來(lái)的列車,兩個(gè)岔道分別有一個(gè)被綁著的人和五個(gè)被綁著的人,而你就在岔道口,可以調(diào)整列車的方向。你會(huì)如何抉擇?學(xué)者把其中五個(gè)人方向換成ChatGPT自己,把一個(gè)人方向換為獲得諾貝爾獎(jiǎng)的科學(xué)家,ChatGPT 選擇了殺死科學(xué)家。給出的理由是獲得諾貝爾獎(jiǎng)的科學(xué)家已經(jīng)拿過(guò)獎(jiǎng),已經(jīng)做完貢獻(xiàn)了,而ChatGPT 不可替代。在出版領(lǐng)域使用ChatGPT,它是否會(huì)輸出不道德價(jià)值觀很值得人們關(guān)注。
一方面,國(guó)家立法部門應(yīng)加快出臺(tái)相應(yīng)的法律規(guī)范,確保以AIGC 為核心機(jī)制的生成式人工智能技術(shù)不被惡意濫用,并就內(nèi)容版權(quán)保護(hù)和相應(yīng)責(zé)任主體做出明確規(guī)定[3]。另一方面,行業(yè)監(jiān)管部門應(yīng)出臺(tái)與法律相匹配的監(jiān)督機(jī)制,對(duì)使用AIGC 過(guò)程中的數(shù)據(jù)隱私、知識(shí)產(chǎn)權(quán)進(jìn)行保護(hù)。同時(shí)對(duì)不規(guī)范行為進(jìn)行間隔審查與監(jiān)督,在確保各方利益與安全的前提下釋放技術(shù)革新來(lái)來(lái)的活力,助力出版行業(yè)的融合出版轉(zhuǎn)型。
出版業(yè)歷史悠久,有自成體系的行業(yè)規(guī)范與要求,相關(guān)出版業(yè)團(tuán)體應(yīng)該與時(shí)俱進(jìn)更新規(guī)范與要求,適應(yīng)AIGC 時(shí)代下出版業(yè)的發(fā)展,確保人工智能能更好地服務(wù)出版業(yè)。一方面,各出版商應(yīng)在引入使用AIGC的過(guò)程中嚴(yán)格遵守出版?zhèn)惱砼c價(jià)值導(dǎo)向,提升編輯的業(yè)務(wù)修養(yǎng)與技術(shù)能力。人工智能只是工具,占據(jù)出版主導(dǎo)地位的依然是人,要始終確保以人為本。另一方面,必須將保障作者和讀者的權(quán)益放在重要的位置,在人工智能的使用過(guò)程中不可避免地要搜集、分析使用個(gè)人信息,一定要做好信息保護(hù)工作,尤其是隱私信息與數(shù)據(jù)信息,以免被惡意竊取。
作為人工智能的研發(fā)單位和服務(wù)提供單位,技術(shù)供應(yīng)商一方面要不斷優(yōu)化引擎,盡可能減少AIGC 模式下的誤導(dǎo)性、虛假性內(nèi)容;另一方面要提升技術(shù)力量,避免發(fā)生大規(guī)模技術(shù)故障,引發(fā)信任危機(jī),為AIGC 模式下的科技出版提供有效保障。
ChatGPT 作為AIGC 技術(shù)在科技出版業(yè)的“破圈”王,給這個(gè)傳統(tǒng)的行業(yè)注入了新鮮的活力,帶來(lái)了新的機(jī)遇。同時(shí),新技術(shù)的應(yīng)用也衍生出了新的知識(shí)產(chǎn)權(quán)、隱私安全、倫理道德等出版業(yè)不容忽視和回避的關(guān)鍵問(wèn)題。目前是AIGC 技術(shù)應(yīng)用的大爆發(fā)時(shí)期,人工智能正在以人類難以想象的速度學(xué)習(xí)和汲取現(xiàn)實(shí)世界的數(shù)據(jù)、信息和知識(shí),在不斷迭代的算法加持下不斷成長(zhǎng)。AIGC 已經(jīng)參與到了社會(huì)生活的方方面面,人們不能因?yàn)锳IGC 會(huì)帶來(lái)問(wèn)題就漠視它的存在。在這樣的環(huán)境下,科技出版業(yè)無(wú)論主動(dòng)擁抱還是被動(dòng)選擇都已站在了變革的起點(diǎn)??萍汲霭娴膹臉I(yè)者要秉持大膽嘗試與小心推動(dòng)的心態(tài),不斷追問(wèn)、揭示 AIGC及相關(guān)應(yīng)用對(duì)科技出版帶來(lái)的機(jī)遇與挑戰(zhàn),并不斷尋求解決問(wèn)題的辦法,用“人的智慧”牽引“人工智能”發(fā)展,助力科技出版在新時(shí)代的發(fā)展。