摘 要:現(xiàn)階段,人工智能已成為出版機構(gòu)向用戶提供知識服務(wù)的重要驅(qū)動力量。將知識服務(wù)內(nèi)容生產(chǎn)、呈現(xiàn)、傳播等與人工智能進行深度融合已成為出版機構(gòu)提升競爭力水平的題中之義?;趯Τ霭鏅C構(gòu)人工智能應(yīng)用現(xiàn)狀及發(fā)展趨勢的綜合把握,可作出如下研判:在知識內(nèi)容生產(chǎn)方面,創(chuàng)新趨勢主要在于建立高準確率的內(nèi)容核查機制、應(yīng)用深化文本內(nèi)容理解的編輯與校對技術(shù);在知識內(nèi)容呈現(xiàn)方面,創(chuàng)新趨勢主要在于優(yōu)化用戶交互體驗的智能語音與多模態(tài)內(nèi)容生成;在知識內(nèi)容傳播方面,創(chuàng)新趨勢主要在于使用高度智能和開放式算法的個性化推薦系統(tǒng)、實施智能化的版權(quán)監(jiān)控。
關(guān)鍵詞:人工智能;出版機構(gòu);知識服務(wù);數(shù)字出版
DOI: 10.3969/j.issn.2097-1869.2024.03.015 文獻標識碼:A
著錄格式:沈海濤,陳哲.人工智能驅(qū)動下出版業(yè)知識服務(wù)創(chuàng)新趨勢研究[J].數(shù)字出版研究,2024,3(3):133-140.
人工智能是一種研究、開發(fā)用于模擬延伸和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的技術(shù)科學。作為計算機科學的一個分支,其主要研究內(nèi)容包括機器人、語言識別、圖像識別、自然語言處理(Natural Language Processing,NLP)和專家系統(tǒng)[1]。近年來,我國高度重視人工智能的發(fā)展。2022年7月,《關(guān)于加快場景創(chuàng)新以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展的指導(dǎo)意見》發(fā)布,提出要探索人工智能發(fā)展的新模式、新路徑,以人工智能高水平應(yīng)用促進經(jīng)濟高質(zhì)量發(fā)展。可見,伴隨技術(shù)的飛速發(fā)展及國家戰(zhàn)略部署的推進,人工智能將與各行各業(yè)達成發(fā)展創(chuàng)新與深度融合。
在出版業(yè)知識服務(wù)領(lǐng)域,人工智能的應(yīng)用在生產(chǎn)流程、場景、模式及產(chǎn)品形態(tài)等方面引發(fā)顯著變革。然而,技術(shù)的更迭演進并不會停止在某一時刻,人工智能作為當前顛覆性的技術(shù)之一,將不斷賦能出版業(yè)知識服務(wù),繼續(xù)衍生出創(chuàng)新性、革命性的產(chǎn)用模式。把握人工智能驅(qū)動下出版業(yè)知識服務(wù)的創(chuàng)新趨勢,是出版機構(gòu)在下一輪技術(shù)革命浪潮中立于不敗之地的基石,并且對推動出版業(yè)的健康發(fā)展、提高其服務(wù)質(zhì)量與競爭力,以及更好地服務(wù)于社會主義現(xiàn)代化建設(shè)具有深遠意義。
1 人工智能驅(qū)動下出版業(yè)知識服務(wù)達成路線
探討出版業(yè)知識服務(wù)在各階段的達成路線(見圖1),可以為出版機構(gòu)提供具體的操作指南,其中包含如何整合現(xiàn)有資源、選擇適合的技術(shù)工具、設(shè)計實施步驟等。技術(shù)引入有助于出版機構(gòu)識別人工智能等技術(shù)演進的關(guān)鍵節(jié)點和潛在的新興技術(shù),比如,了解NLP、深度學習、大數(shù)據(jù)分析等技術(shù)在出版業(yè)的應(yīng)用趨勢,可以幫助出版機構(gòu)在趨勢研判的基礎(chǔ)上盡早謀篇布局,促成穩(wěn)固發(fā)展。
1.1 知識采集
出版機構(gòu)不僅有傳統(tǒng)的紙質(zhì)書籍,還有電子書、有聲書、視頻課程、在線數(shù)據(jù)庫等多源異構(gòu)的數(shù)據(jù)資源。經(jīng)過多年建設(shè),這些數(shù)據(jù)已成為出版機構(gòu)內(nèi)部重要的資源。向用戶提供知識服務(wù)的前提在于系統(tǒng)地搜集并有效整合所需的知識資源。為此,需要針對不同模態(tài)和形式的數(shù)據(jù)資源進行內(nèi)容提取,例如可使用光學字符識別(Optical Character Recognition,OCR)技術(shù)從電子書和掃描文檔中提取文本;利用語音識別技術(shù)將有聲書中的語音轉(zhuǎn)換為文本;利用視頻內(nèi)容分析技術(shù)提取視頻課程的關(guān)鍵幀、字幕和語音內(nèi)容。為了便于后續(xù)處理,還需要將不同格式的數(shù)據(jù)轉(zhuǎn)換成統(tǒng)一格式,并從各類資源中提取元數(shù)據(jù),用于分類和索引。
1.2 知識抽取與清洗
知識抽取是從各種數(shù)據(jù)源中提取知識并構(gòu)建知識圖譜的過程。為了識別采集到的數(shù)據(jù)資源中的關(guān)鍵信息,將其轉(zhuǎn)化為可用的知識形式,需要采用文本挖掘、實體識別、關(guān)系抽取等技術(shù)從原始數(shù)據(jù)中提取結(jié)構(gòu)化、半結(jié)構(gòu)化或非結(jié)構(gòu)化的數(shù)據(jù)資源。該階段需要運用機器學習、NLP等技術(shù)[2]。知識數(shù)據(jù)在存儲前必須經(jīng)過預(yù)處理,使用NLP、數(shù)據(jù)清洗技術(shù)去除噪聲,如在知識源生產(chǎn)過程中出現(xiàn)的重復(fù)數(shù)據(jù)、錯誤信息,須經(jīng)過標準化處理才能保證數(shù)據(jù)質(zhì)量。
1.3 知識組織與存儲
知識組織是指將清洗后的知識進行結(jié)構(gòu)化處理。在這一階段,利用NLP技術(shù)和機器學習模型,人工智能可自動分類數(shù)據(jù)內(nèi)容,將其歸納至正確的主題類別,并自動生成關(guān)鍵詞標簽,提高知識資源的可發(fā)現(xiàn)性。
知識存儲以構(gòu)建知識圖譜為途徑,將知識以節(jié)點和邊的形式進行組織,以供查詢和推理。除了自有平臺數(shù)據(jù)和用戶數(shù)據(jù)外,出版機構(gòu)內(nèi)部也擁有大量行業(yè)數(shù)據(jù)。構(gòu)建專業(yè)知識圖譜,可以更好地服務(wù)用戶的知識需求,而用戶畫像知識圖譜的搭建,則能夠滿足用戶個性化、定制化、精準化需求。為了使知識計算得以有效展開,需要將知識圖譜關(guān)聯(lián)多種異構(gòu)知識庫,對各類顯性和隱性知識進行表示、組織和融合。
1.4 知識表示與推理
知識表示是將出版機構(gòu)所保有的非結(jié)構(gòu)化知識信息轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。通過知識表示,可以構(gòu)建索引和元數(shù)據(jù),使得內(nèi)容資源能夠被快速定位和檢索,也會更加有序且易于被機器理解和處理。知識服務(wù)的關(guān)鍵在于要求出版機構(gòu)由內(nèi)容思維轉(zhuǎn)變?yōu)橛脩羲季S,這離不開對用戶需求的探知。因此,出版機構(gòu)若要實現(xiàn)更為個性化和精準的內(nèi)容推薦,就需要基于已有的知識圖譜和邏輯規(guī)則進行推理。
知識推理是一套嚴密、復(fù)雜的邏輯推理過程,推理結(jié)果可賦權(quán)人工智能系統(tǒng)理解用戶查詢的潛在意圖,從龐大的知識數(shù)據(jù)庫中提取準確答案或提供決策支持。此外,知識推理還支持知識圖譜的動態(tài)更新和優(yōu)化,發(fā)現(xiàn)知識間的潛在關(guān)聯(lián),補全缺漏信息和修正錯誤鏈接,為用戶提供更深層次的交互體驗。
1.5 知識管理與融合
知識管理需要出版機構(gòu)通過大數(shù)據(jù)分析、NLP、機器學習等手段,獲取、整理、存儲和分享企業(yè)內(nèi)外部的信息。對海量數(shù)據(jù)資源進行自動提取、歸納和分類,幫助用戶更為高效和便捷地獲取知識,并根據(jù)用戶需求和偏好,及時推薦相關(guān)知識內(nèi)容,提供個性化的知識服務(wù)。為了提升知識內(nèi)容的準確性和時效性,人工智能技術(shù)可運用于實時監(jiān)控和知識變化分析,從而及時更新和修正知識庫。除此之外,知識管理也是人工智能技術(shù)在出版機構(gòu)內(nèi)部應(yīng)用的重點場景之一,在知識管理方面的先行探索將為企業(yè)知識服務(wù)平臺大模型建設(shè)筑牢根基。
知識融合涉及將不同格式和結(jié)構(gòu)的知識整合在一起,解決知識重復(fù)和沖突,提高知識的一致性和完整性。藉由對現(xiàn)有資源進行深度挖掘和關(guān)聯(lián),還可以創(chuàng)造出更具價值的知識產(chǎn)品。在人工智能領(lǐng)域,知識融合的意義重大,因為它可以幫助機器學習系統(tǒng)更好地理解和解決復(fù)雜問題。此外,知識融合有助于構(gòu)建統(tǒng)一的知識管理體系,通過實體鏈接、語義標注等技術(shù),提升知識的組織性和可檢索性。
1.6 知識應(yīng)用與服務(wù)
知識創(chuàng)新應(yīng)用需要在對知識圖譜進行查找、學習、推理等知識計算的基礎(chǔ)上,為用戶提供智能化、智慧化的知識服務(wù)[3]。對此,可以根據(jù)用戶需求設(shè)計服務(wù)接口(Application Programming Interface,API)明確服務(wù)功能、數(shù)據(jù)的輸入和輸出格式、訪問協(xié)議等。然后,將語義搜索、知識推理、智能推薦算法等集成到現(xiàn)有的IT架構(gòu)中,確保服務(wù)的穩(wěn)定性和可拓展性。在服務(wù)前端,可通過網(wǎng)頁、移動應(yīng)用平臺、聊天機器人等方式提供用戶友好型界面或API;在服務(wù)過程中,需要提升監(jiān)控服務(wù)性能,優(yōu)化用戶體驗。同時,還需建立反饋機制,根據(jù)用戶交互數(shù)據(jù)和效果評估,持續(xù)優(yōu)化知識庫和服務(wù)算法,繼而引入在線學習機制,使系統(tǒng)能按照新產(chǎn)生的數(shù)據(jù)進行自我更新,提升知識服務(wù)效能。國際領(lǐng)先的教育出版公司圣智開發(fā)的MindTap在線學習平臺通過提供在線測試與及時反饋,幫助用戶在課后自主檢測對相關(guān)知識點的掌握情況,并可以根據(jù)用戶錯誤情況、薄弱點等提出個性化解決方案。
2 知識內(nèi)容生產(chǎn)創(chuàng)新
2.1 內(nèi)容本體:提升事實核查準確率
生成式人工智能是人工智能領(lǐng)域的一個分支,通過自然語言指令創(chuàng)造視頻、音頻、圖片、文本等新內(nèi)容。傳統(tǒng)人工智能的重點是預(yù)測模型以執(zhí)行特定任務(wù),例如估計數(shù)字、分類數(shù)據(jù)或在一組選項之間進行選擇。相比之下,生成式人工智能的重點是創(chuàng)造原創(chuàng)內(nèi)容,而不是基于模型決策邊界的正確答案[4]。三個主要因素促成了生成模型的進步:互聯(lián)網(wǎng)上可用的訓(xùn)練數(shù)據(jù)的爆炸式增長、訓(xùn)練算法的改進、用于訓(xùn)練模型的可用計算能力的增加。例如,GPT-3的訓(xùn)練使用了大約45TB的文本數(shù)據(jù)(大約100萬英尺的書架空間),將文本分解成標記的單詞片段,并創(chuàng)建1.75億個參數(shù),通過統(tǒng)計識別標記序列中最可能的下一個標記來生成新文本。而新版本GPT-4是一個多模態(tài)大語言模型,對文本和視頻圖像都有響應(yīng)。
當前,生成式人工智能技術(shù)正在被出版機構(gòu)廣泛接納并采用,因為它有潛力改變內(nèi)容創(chuàng)造、編輯和分發(fā)的形式。美國科技公司Veristage開發(fā)出一款名叫Insight的大語言模型平臺,將一部十幾萬字的中文小說文稿上傳至該平臺,幾分鐘后便能形成包括英語、德語等在內(nèi)的多語言評估報告。報告還能詳細剖析這部作品的目標受眾、潛在賣點、宣傳文案、新媒體營銷方案和版權(quán)相關(guān)建議等。
但在專業(yè)領(lǐng)域,已有學者發(fā)現(xiàn)ChatGPT等生成式人工智能模型可能并不可靠,如產(chǎn)生事實與推理錯誤,并大規(guī)模傳播。Monteith等研究發(fā)現(xiàn)一般公眾很容易從生成式人工智能中獲得錯誤信息,他們可能會因為毫無防備地接受這些錯誤信息而加速其傳播。然而與個人護理和公共衛(wèi)生有關(guān)的醫(yī)療錯誤信息可能產(chǎn)生嚴重的負面后果[5]。Sivasankari等證實由于ChatGPT假新聞的泛濫和錯誤信息的傳播,人工智能在謠言傳播中得到大面積使用[6]。2023年,律師Steven A Schwartz在與美國地區(qū)法官P.Kevin Castel就一起因航空公司雇員受傷而提起的訴訟進行辯論時發(fā)現(xiàn),他使用OpenAI尋找的案例至少有6起不存在,在2023年5月提交的一份文件中,法官Castel指出,Schwartz提交的卷宗包含虛假的姓名和案卷編號,以及虛假的內(nèi)部引文。而Schwartz本人也承認他“沒有意識到其內(nèi)容可能是虛假的”[7]。由此可見,現(xiàn)階段在技術(shù)局限、數(shù)據(jù)質(zhì)量、算法偏差及人為操縱等因素的作用下,人工智能生成內(nèi)容的準確率仍有待提升。而將內(nèi)容質(zhì)量作為立身之本的出版業(yè),也應(yīng)重視所提供知識服務(wù)的嚴謹性和準確性?;诖?,嚴密施行事實核查機制將成為未來出版業(yè)開展知識服務(wù)時無法回避的一道程序。為了提升供給內(nèi)容的準確率,出版機構(gòu)在向用戶提供知識服務(wù)時可以從以下幾個階段著手。
在數(shù)據(jù)預(yù)處理階段,對原始數(shù)據(jù)進行清洗、去噪、標注和轉(zhuǎn)換,可以確保訓(xùn)練數(shù)據(jù)的質(zhì)量,以便更好地適應(yīng)模型訓(xùn)練的要求。在模型選擇階段,需要選擇適合目標任務(wù)的模型架構(gòu),如BERT1、生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)等,從而提升生成內(nèi)容的準確性。Wang等[8]經(jīng)過實證研究發(fā)現(xiàn),BERT和微調(diào)RoBERTa模型2在性能方面優(yōu)于其他模型。值得注意的是,BERT模型的準確率超過87%,而改進的RoBERTa模型的準確率為98%。在數(shù)據(jù)優(yōu)化階段,可以采用文本糾錯和語義理解技術(shù),對生成內(nèi)容進一步優(yōu)化和修正。此外,還可通過增加訓(xùn)練數(shù)據(jù)量、優(yōu)化訓(xùn)練策略和引入外部知識庫等策略來提升生成內(nèi)容的準確性。而從用戶角度出發(fā),平臺應(yīng)提醒用戶在使用時盡量提供詳細的背景闡述和需求描述,以便平臺系統(tǒng)能夠更準確地理解用戶需求。
2.2 內(nèi)容編輯與校對:深化文本內(nèi)容理解
編輯與校對是出版物公開發(fā)行之前必不可少的流程。編輯的主要目的是識別并糾正語法、語氣風格、事實核查、句法和語義元素等問題;校對作為隨之而來的后一階段,主要目的是審查編輯的工作,解決潛在的錯誤,并改進頁眉、頁腳和格式等頁面元素[9]。現(xiàn)階段,人工智能技術(shù)可以輔助進行文本糾錯、拼寫檢查與語法檢查等,提高稿件的質(zhì)量和準確性。在出版機構(gòu)內(nèi)部,編輯人員可以借助人工智能工具快速、高效地完成稿件審查和修改工作,減輕工作負擔。這類技術(shù)的應(yīng)用已在業(yè)內(nèi)達成廣泛共識。國外編校人員常用Grammarly、ChatGPT和PerfectIt等軟件進行編輯校對輔助。然而,?z?eli?k[10]研究發(fā)現(xiàn),ChatGPT在檢測拼寫、標點錯誤及節(jié)省時間方面可能是一個有用的工具,但其仍然存在偏見和不準確問題,比如其似乎更“偏愛”美式英語而非英式英語,該工具在理解文本的上下文語境或文化方面的能力也有限。要解決人工智能在編校過程中所產(chǎn)生的技術(shù)偏誤,需要依托深度學習和NLP技術(shù)的進步。
首先是對上下文的深度理解。未來,人工智能驅(qū)動的編輯器能夠通過深度學習模型,深入理解文本的語義和上下文關(guān)系,在此基礎(chǔ)上生成的修改建議更能遵循原文邏輯,避免斷章取義情況的發(fā)生。
其次是跨文化適應(yīng)性。在全球化背景下,內(nèi)容創(chuàng)作與傳播跨越國界漸成常態(tài),智能化編輯工具通過訓(xùn)練大規(guī)模多語言數(shù)據(jù)集,能夠理解和轉(zhuǎn)化不同文化語境下的表達習慣、俗語、俚語及特定文化應(yīng)用,從而在編輯和翻譯過程中保留原文的文化特色。
再次是個性化風格模擬。人工智能編輯器可以根據(jù)特定作者的寫作風格、行業(yè)術(shù)語使用習慣或目標受眾偏好,調(diào)整編輯建議或自動生成內(nèi)容。
最后是敏感內(nèi)容識別與處理。在尊重多樣性和避免冒犯性表達方面,智能化編輯技術(shù)能夠幫助識別并提示潛在的敏感內(nèi)容,包括但不限于關(guān)于種族、性別、宗教信仰等問題的不當表述。這不僅有助于保證出版內(nèi)容的安全合規(guī)性,也體現(xiàn)出對于不同文化價值觀的理解和尊重。
3 知識內(nèi)容呈現(xiàn)創(chuàng)新
3.1 智能語音:優(yōu)化用戶交互體驗
在NLP和語音識別技術(shù)的加持下,用戶不但可實現(xiàn)“聽書”的功能,而且能在界面前端進行問答互動,獲得即時的知識解答和內(nèi)容解析,進而增強其在獲取知識內(nèi)容過程中的交互感和參與感。
智能語音技術(shù)的發(fā)展表明,在人類的主導(dǎo)下,技術(shù)思想已經(jīng)開始探尋人類更深層次的需求。一方面,出版機構(gòu)知識服務(wù)平臺可以借助智能語音提供多場景服務(wù),特別是當用戶處于移動場景中,可以通過語音指令獲取知識內(nèi)容,體現(xiàn)出技術(shù)的場景適配性。另一方面,智能語音能夠滿足泛群體的需求。正如美國傳播學家伊萊休·卡茲(Elihu Katz)所言:人是有著特定需求的個體,他們基于特定的需求或動機來使自己的體驗得到滿足[11]。據(jù)統(tǒng)計,截至2022年,中國的視障群體超過1 700萬,其中超過800萬完全失明[12]。提供智能語音功能以滿足視障用戶的知識服務(wù)需求,能夠使得以視障人士為代表的特殊群體的需求被“看見”,這在大幅提升知識內(nèi)容到達率的同時,也表現(xiàn)了技術(shù)可供性所衍生出的人文關(guān)懷??梢姡悄苷Z音技術(shù)不僅有潛力優(yōu)化出版領(lǐng)域傳統(tǒng)的業(yè)務(wù)流程,更預(yù)示著其將開創(chuàng)一種嶄新的用戶體驗維度與服務(wù)模式,未來或?qū)⒊砷L為出版業(yè)知識服務(wù)向智慧化方向轉(zhuǎn)型的關(guān)鍵性力量之一。
3.2 內(nèi)容形式:實現(xiàn)多模態(tài)內(nèi)容生成
在人工智能科學的疆域里,“模態(tài)”一詞特指信息的不同表達維度或感知途徑,涵蓋了文字、圖像和音視頻等內(nèi)容的廣泛范疇。通過模仿人類認知的深度與廣度,人工智能技術(shù)正經(jīng)歷著從依賴單一信息渠道到多維度融合的轉(zhuǎn)變,這一進程深刻反映了人工智能從單模態(tài)到多模態(tài)的飛躍。多模態(tài)人工智能的核心機制圍繞三大支柱構(gòu)建:傳感輸入、信息融合及響應(yīng)輸出。這些模塊構(gòu)成了一個多級協(xié)作系統(tǒng),每個模塊都承擔著獨特而關(guān)鍵的任務(wù),確保系統(tǒng)能夠跨越數(shù)據(jù)類型的界限,實現(xiàn)綜合性洞察與解析。傳感輸入模塊捕獲來自不同源頭的信息流;信息融合模塊則如同大腦的整合中樞,將這些異構(gòu)數(shù)據(jù)統(tǒng)一協(xié)調(diào),挖掘它們之間的內(nèi)在聯(lián)系與互補價值;響應(yīng)輸出模塊則基于深度理解生成行動或反饋,與用戶或環(huán)境互動。
相較單一模態(tài)的傳統(tǒng)知識服務(wù)形式,多模態(tài)內(nèi)容服務(wù)平臺利用不同數(shù)據(jù)模態(tài)間的互補優(yōu)勢,在實現(xiàn)更為準確的預(yù)測和決策支持的基礎(chǔ)上,為用戶定制化、個性化需求的滿足賦予更多的想象空間。現(xiàn)階段,生成式人工智能大模型從單模態(tài)向多模態(tài)發(fā)展已成為行業(yè)共識。繼谷歌在2022年9月推出可以直接通過輸入文本生成3D模型的應(yīng)用DreamFusion之后[13],英偉達發(fā)布了分辨率更高、速度更快的Magic3D[14]。在文本端應(yīng)用ChatGPT(2022年11月面世)和圖像生成應(yīng)用Midjourney V5(2023年3月面世)影響下,文本端和圖像生成應(yīng)用在2023年呈爆發(fā)式增長。2024年2月,OpenAI發(fā)布其首款視頻生成模型Sora,使視頻生成領(lǐng)域成為新一輪行業(yè)熱點。面對用戶需求場景在內(nèi)容模態(tài)方面的延伸,多模態(tài)內(nèi)容生成模式將會廣泛應(yīng)用在出版機構(gòu)所提供的知識服務(wù)平臺中。
4 知識內(nèi)容傳播創(chuàng)新
4.1 個性化推薦系統(tǒng):高度智能和開放式算法
個性化推薦的概念自20世紀90年代首次提出以來,迅速成為學術(shù)界、工業(yè)界等領(lǐng)域的熱門話題。其核心是機器學習用戶興趣,通過對海量數(shù)據(jù)的挖掘,幫助網(wǎng)站為客戶提供完全個性化的決策支持和信息服務(wù)[15],本質(zhì)上就是取代用戶對從未見過的產(chǎn)品進行評價,自動完成選擇的過程。
個性化推薦技術(shù)依賴用戶偏好模型,這些模型來源于瀏覽、搜索、喜歡、收藏、評論和其他歷史行為,再使用邏輯回歸進行離線訓(xùn)練,并通過映射約簡進行計算[16]。根據(jù)項目的建模方式,個性化推薦系統(tǒng)有兩種主要方法:協(xié)同過濾和基于內(nèi)容的推薦。推薦系統(tǒng)也可以根據(jù)系統(tǒng)所基于的源數(shù)據(jù)類型進行區(qū)分——顯性或隱性用戶反饋。由于不同的推薦方法都有其自身局限性,Burke提出了一種混合推薦系統(tǒng),該系統(tǒng)不僅使用了內(nèi)隱反饋的觀察結(jié)果,還利用了各種上下文信息[17],伴隨算法模型的更新還出現(xiàn)了基于知識的過濾和進化計算技術(shù)[18]。當下,互聯(lián)網(wǎng)正由Web2.0時代向Web3.0時代過渡,普通網(wǎng)民達成從消費者到產(chǎn)消者的身份轉(zhuǎn)化。但與此同時,現(xiàn)代社會的一個典型病癥也得以濫觴——網(wǎng)民自身知識素養(yǎng)不足或內(nèi)容缺乏把關(guān)可能導(dǎo)致內(nèi)容質(zhì)量良莠不齊或內(nèi)容過載,用戶需求端無法及時接收有效信息。因此,為了有效甄別并提取信息,滿足用戶的個性化和精準化需求,出版業(yè)知識服務(wù)平臺個性化推薦的發(fā)展將集中在開發(fā)高度智能和交互式算法方向[19]。為此,出版機構(gòu)可利用Transformer、BERT等深度學習模型和最近鄰算法,深入理解文本內(nèi)容及上下文語境信息,挖掘用戶顯性和隱性需求,同時集成知識圖譜以增強推薦系統(tǒng)的語義理解和關(guān)聯(lián)推理,通過分析用戶訪問的時間、地點、設(shè)備、情緒狀態(tài)等隱私,結(jié)合情境感知技術(shù),實時調(diào)整推薦策略。隨著用戶在多個設(shè)備和平臺上消費內(nèi)容,推薦系統(tǒng)將會實現(xiàn)跨平臺的個性化追蹤和服務(wù),確保用戶在不同場景下都能享受連貫的知識服務(wù)體系,并通過用戶反饋、偏好設(shè)置、問答等形式收集實時反饋,不斷優(yōu)化推薦模型。英國的Shimmr.ai公司使用NLP技術(shù),從類型、情節(jié)、主角、反派、主體、情感等方面分析作者的敘事技巧和故事的情感走向,由此向不同讀者推薦感興趣的圖書。從分析到推薦分為三步:第一步是基于結(jié)構(gòu)和價值、興趣、情感三要素提取圖書“DNA”;第二步是生成營銷文案,并自動生成符合消費者需求的、多媒介形態(tài)的標簽和關(guān)鍵詞;第三步是推送給需要的消費者。
4.2 版權(quán)維護:智能化版權(quán)監(jiān)控
版權(quán)是一種鼓勵創(chuàng)新和創(chuàng)意表達的重要機制。當前,行業(yè)競爭日益加劇,對于版權(quán)的保護顯得尤為重要。而在版權(quán)保護的過程中,識別侵權(quán)行為非常關(guān)鍵。為此,國外眾多大型互聯(lián)網(wǎng)企業(yè)都開始利用人工智能進行相應(yīng)探索。Facebook開發(fā)了一套名為Rights Manager的系統(tǒng),利用人工智能技術(shù)對用戶上傳的視頻進行內(nèi)容識別,以防止未經(jīng)授權(quán)的內(nèi)容在平臺上傳播。
目前,利用深度學習和圖像識別技術(shù),人工智能技術(shù)可以快速識別和對比網(wǎng)絡(luò)上流傳的文本、圖像和音視頻內(nèi)容,通過與版權(quán)數(shù)據(jù)庫內(nèi)的正版作品進行對比,及時發(fā)現(xiàn)潛在的侵權(quán)行為。但是,出版機構(gòu)利用人工智能技術(shù)在應(yīng)對知識服務(wù)過程中的版權(quán)問題時,還面臨以下困難。
一是對于原創(chuàng)性的判斷存在誤區(qū)?,F(xiàn)有人工智能水平仍處在“弱人工智能”的階段,涉及對文化、藝術(shù)及科學貢獻等主觀評價時,難以完全理解人類的創(chuàng)造力和作品的深層含義。
二是技術(shù)誤報與漏報。盡管人工智能檢測技術(shù)能夠高效篩查大量內(nèi)容,但可能存在將合法使用誤判為侵權(quán)和未能識別真正的侵權(quán)行為等問題,影響版權(quán)保護的正確性和公正性。
三是隱私與數(shù)據(jù)安全問題。在實施版權(quán)保護時,人工智能工具需處理大量用戶數(shù)據(jù),如何在版權(quán)保護和用戶隱私維護之間找到一個平衡點依舊是一項艱巨的挑戰(zhàn)。
未來,通過大數(shù)據(jù)與模式識別,人工智能將能夠識別各種文本模式。可以構(gòu)建基于語義的指紋或摘要技術(shù),而非簡單的字符匹配以識別內(nèi)容的核心思想,以此來降低原創(chuàng)性誤判等問題。而伴隨算法的進步,人工智能將能更準確地識別和處理復(fù)雜的版權(quán)問題,自動化處理版權(quán)登記、檢測、授權(quán)及侵權(quán)訴訟,提升效率和準確性。在用戶隱私保護層面,人工智能將會減少通過API接收或生成的數(shù)據(jù)來訓(xùn)練未來的模型,并在使用完請求所需的必要時間內(nèi)刪除數(shù)據(jù)。
5 結(jié)語
人工智能正逐步重塑出版業(yè)的知識服務(wù)生態(tài),革新知識采集、處理、推理到應(yīng)用的全鏈條,展現(xiàn)了以人工智能為代表的數(shù)智技術(shù)應(yīng)用在提升出版服務(wù)質(zhì)量方面的巨大潛能。伴隨人工智能從感知智能向認知智能的邁進,出版業(yè)知識服務(wù)的重點和難點將轉(zhuǎn)變?yōu)槿绾我允鼙娦枨鬄轵?qū)動力,基于知識資源提供專業(yè)問題的解決方案[20]。在對出版業(yè)人工智能應(yīng)用現(xiàn)狀進行梳理,并結(jié)合人工智能技術(shù)發(fā)展走向的基礎(chǔ)上,可作出如下研判:在知識內(nèi)容生產(chǎn)創(chuàng)新層面,面對生成式人工智能帶來的內(nèi)容創(chuàng)造與傳播變革,須警惕其可能帶來的錯誤信息傳播風險。在此背景下,建立高準確率的事實核查機制,保障知識內(nèi)容的真實性和可靠性,成為不容忽視的議題。智能化編輯與校對技術(shù)的發(fā)展將會極大提高出版物的質(zhì)量控制水平,同時保持內(nèi)容的文化多樣性和風格獨特性。在知識內(nèi)容呈現(xiàn)創(chuàng)新層面,智能語音技術(shù)能夠滿足多場景和泛群體的需求,讓人工智能的發(fā)展在展示技術(shù)特性的同時,也體現(xiàn)對于人文主義關(guān)懷的考量。多模態(tài)內(nèi)容生成使得知識服務(wù)平臺向高級別的交互智能邁進,開創(chuàng)一個能夠無縫溝通多元信息、精準服務(wù)個性化需求的新場域。在知識內(nèi)容傳播層面,深度智能化的個性化推薦系統(tǒng)讓內(nèi)容推送更加貼合用戶定制化需求,促進知識服務(wù)體驗的質(zhì)變。而版權(quán)維護雖面臨諸多難題,但人工智能的介入無疑為版權(quán)保護提供了新的可能,通過智能化監(jiān)控鋪設(shè)一張更加嚴密的版權(quán)防護網(wǎng)。出版業(yè)知識服務(wù)創(chuàng)新在人工智能的賦能下正處于蓬勃發(fā)展的階段,并且有著廣闊的發(fā)展前景。但是在適配技術(shù)應(yīng)用、探索技術(shù)前沿的同時,出版行業(yè)還需持續(xù)關(guān)注技術(shù)倫理、用戶隱私保護及內(nèi)容質(zhì)量把控,以期在人工智能的助力下,構(gòu)筑更為開放、高效、精準且負責的知識服務(wù)體系。
作者簡介
沈海濤,男,天津人民出版社副社長,副編審。研究方向:編輯出版。
陳哲,男,北京印刷學院新聞傳播學院碩士研究生。研究方向:數(shù)字出版。
參考文獻
YANG F. Optimization of personalized recommendation strategy for ecommerce platform based on artificial intelligence[J]. Informatica,2023,47(2):235-242.
柳益君,李仁璞,羅燁,等.人工智能+圖書館知識服務(wù)的實現(xiàn)路徑和創(chuàng)新模式[J].圖書館學研究,2018(10):42,61-65.
董彥.人工智能背景下圖書館知識服務(wù)創(chuàng)新研究[J].圖書館學刊,2019(7):78-81.
GOLDSTEIN J A, SASTRY G, MUSSER M, et al. Generative language models and automated influence operations: Emerging threats and potential mitigations[EB/OL].(2023-01-10)[2024-07-08].https://arxiv.org/pdf/2301.04246.
MONTEITH S, GLENN T, GEDDES J R, et al. Artificial intelligence and increasing misinformation[J].British Journal of Psychiatry,2023,224(2):33-35.
SIVASANKARI S, VADIVU G. Tracing the fake news propagation path using social network analysis[J].Soft Computing,2022,26(23):1-9.
計算機世界. 9次著名的統(tǒng)計分析和人工智能災(zāi)難[EB/OL].(2023-10-25)[2024-07-17]. https://new.qq.com/rain/a/20231025A01WHU00.
WANG Z, CHENG J, CUI C, et al. Implementing BERT and fine-tuned RobertA to detect AI generated news by ChatGPT[EB/OL].(2023-06-09)[2024-07-08].https://arxiv.org/pdf/2306.07401.
CALONIA J. Copy editing vs. Proofreading: What’s the difference?[EB/OL].(2022-09-02)[2024-07-08].https://www.grammarly.com/blog/whats-the-difference-between-copy-editing-and-proofreading.
?Z?ELI?K N P. A comparative analysis of proofreading capabilities: Language experts vs. ChatGPT[M].BüLENT P. International studies in educational sciences. Ankara: Serüven Publishing,2023:147-61.
伊萊休·卡茨, 保羅·F·拉扎斯菲爾德.人際影響:個人在大眾傳播中的作用[M].張寧,譯.北京:中國人民大學出版社,2016:15.
湖南日報.青年說丨殘障不是阻礙,人生同樣精彩[EB/OL].(2022-02-22)[2024-07-17]. https://baijiahao.baidu.com/s?id=1725465873008038100amp;wfr=spideramp;for=pc.
POOLE B, JAIN A, JONATHAN T, et al. Dream fusion: Text-to-3d using 2d diffusion[EB/OL].(2023-09-01)[2024-07-08]. https://arxiv.org/pdf/2209.14988.
LIN C, GAO J, TANG L, et al. Magic3d: High-resolution text-to-3d content creation[C]. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver: Institute of Electrical and Electronic Engineers, 2023:300-309.
LI H, ZHANG S, SHI J, et al. Research and design of intelligent learning system based on recommendation technology[J]. Mechatronic Systems and Control,2019,47(1):43-49.
XU K, ZHOU H, ZHENG H, et al. Intelligent classification and personalized recommendation of ecommerce products based on machine learning[EB/OL].(2023-03-28)[2024-07-08].https://arxiv.org/pdf/2403.19345.
LEE S, MOORE R, REN G, et al. Making personalized recommendation through conversation: Architecture design and recommendation methods[C].California: The Thirty-Second AAAI Conference on Artificial Intelligence, 2018:727-730.
VERMA P, SHARMA S. Artificial intelligence based recommendation system[C]. 2020 2nd International Conference on Advances in Computing, Communication Control and Networking (ICACCCN). IEEE, 2020:669-673.
HSU C H, ALAVI A H, DONG M. Interactive personalized recommendation systems for human health[J]. Journal of Ambient Intelligence and Humanized Computing,2021(12):3209-3212.
代楊.價值創(chuàng)造視角下面向受眾需求的出版知識服務(wù)研究[J].編輯之友,2023(12):92-99.
Research on Innovation Trend of Knowledge Service in Publishing Industry Driven by Artificial Intelligence
SHEN Haitao1, CHEN Zhe2
1. Tianjin People’s Publishing House, 300051, Tianjin, China; 2. School of Journalism and Communication, Beijing Institute of Graphic Communication, 102600, Beijing, China
Abstract: Artificial intelligence has become an important driving force for publishing institutions to provide knowledge services to users. Deep integration of knowledge service content production, presentation and dissemination with artificial intelligence (AI) has become a key issue for publishing institutions to enhance their competitiveness. Based on comprehensive understanding of current status and development trend of AI application in publishing institutions, the following conclusions can be made. In terms of knowledge content production, innovation trend mainly lies in content verification mechanism with high accuracy, and editing and proofreading technology to deepen text content understanding; in terms of knowledge content presentation, innovation trend mainly lies in intelligent speech and multimodal content generation to optimize user interaction experience; in terms of knowledge content dissemination, innovation trend mainly lies in personalized recommendation systems with highly intelligent and open algorithms and intelligent copyright monitoring.
Keywords: Artificial intelligence; Publishing agency; Knowledge service; Digital publishing