林美蓉
(海南科技職業(yè)大學(xué),海南 ???570203)
在全球化的背景下,不同語言之間的溝通成了日常生活和國(guó)際業(yè)務(wù)的重要組成部分。傳統(tǒng)翻譯服務(wù)受限于人力資源和時(shí)間成本,難以滿足即時(shí)、大量的翻譯需求。智能翻譯技術(shù)的興起,利用人工智能的強(qiáng)大計(jì)算能力和大數(shù)據(jù)分析的深度挖掘能力,為解決這一難題提供了可能[1]?;诖笳Z音模型的翻譯AI智能體通過大模型學(xué)習(xí)大量的文本數(shù)據(jù),理解詞匯、句法和語義,針對(duì)特定任務(wù)進(jìn)行訓(xùn)練,可以進(jìn)行語音識(shí)別、機(jī)器翻譯和情感分析等。項(xiàng)目組在本文中基于大語言模型構(gòu)建了翻譯AI智能體,可以實(shí)現(xiàn)對(duì)用戶輸入的識(shí)別、多語言翻譯和情感分析。
大語言模型(Large Language Model,LLM)是通過訓(xùn)練具有龐大參數(shù)空間的深度學(xué)習(xí)模型來理解和生成人類語言的方法。這些模型通?;谧儞Q器(Transformer)架構(gòu),利用自監(jiān)督學(xué)習(xí)在大規(guī)模未標(biāo)注文本數(shù)據(jù)上預(yù)訓(xùn)練,以捕捉語言的內(nèi)在規(guī)律和語義信息。預(yù)訓(xùn)練完成后,模型可以通過指定的任務(wù)、特定的數(shù)據(jù)進(jìn)行微調(diào),以適應(yīng)各種自然語言處理任務(wù),如文本分類、命名實(shí)體識(shí)別、情感分析、機(jī)器翻譯、問答系統(tǒng)和文本摘要等[2]。大語言模型的應(yīng)用已經(jīng)滲透到多個(gè)領(lǐng)域,包括客戶服務(wù)自動(dòng)化、智能搜索引擎、個(gè)性化推薦系統(tǒng)以及輔助編程等。它們的發(fā)展推動(dòng)了人工智能與人類交流的界限,使得機(jī)器能夠更加流暢和自然地理解和生成語言。
AI智能體,即人工智能智能體(Artificial Intelligence Agent),是指能夠在某一特定環(huán)境中自主感知、決策并采取行動(dòng),以實(shí)現(xiàn)特定目標(biāo)的實(shí)體或軟件系統(tǒng)。這些智能體可以通過算法和模型模擬人類的學(xué)習(xí)、推理、規(guī)劃等智能行為,在多種場(chǎng)景中應(yīng)用,如智能家居、自動(dòng)駕駛汽車、虛擬助手等,是當(dāng)前大模型落地業(yè)務(wù)場(chǎng)景的主流形式之一。大語言模型是AI智能體的核心大腦,實(shí)現(xiàn)將復(fù)雜任務(wù)拆解成可以實(shí)現(xiàn)的子任務(wù),構(gòu)成具備自主思考決策和執(zhí)行任務(wù)的智能體。
在人工智能和自然語言處理中,提示詞(Prompt)是引導(dǎo)模型理解和執(zhí)行特定任務(wù)的文本片段。它們?cè)谂c模型的輸入交互中扮演關(guān)鍵角色,能夠顯著影響模型的行為和輸出結(jié)果。精心設(shè)計(jì)的提示詞可以激發(fā)模型潛在的知識(shí)和能力,提高其對(duì)復(fù)雜任務(wù)的處理效率和準(zhǔn)確性。專業(yè)的提示詞工程不僅涉及單個(gè)詞匯的選擇,而且包括整個(gè)短語、句子結(jié)構(gòu)乃至上下文環(huán)境的構(gòu)建。高效的提示詞設(shè)計(jì)可以幫助模型更好地理解用戶意圖,提升用戶體驗(yàn),在數(shù)據(jù)生成、文本分類、問答系統(tǒng)及機(jī)器翻譯等領(lǐng)域發(fā)揮至關(guān)重要的作用。
為了對(duì)AI智能體進(jìn)行更加深入的研究和分析,筆者基于ZeLinAI平臺(tái)進(jìn)行了智能體的創(chuàng)建和應(yīng)用。ZeLinAI是一款定位于零代碼構(gòu)建企業(yè)AI應(yīng)用的平臺(tái),幫助用戶快捷、安全、高效地接入大模型。該平臺(tái)使用不同智能體,通過調(diào)試提示詞和各個(gè)智能體參數(shù),訓(xùn)練自定義的訓(xùn)練集,達(dá)到穩(wěn)定輸出的效果,助力打通大模型落地的最后一公里。項(xiàng)目組在詳細(xì)需求分析的基礎(chǔ)上明確本項(xiàng)目需要完成的主要功能,確保為用戶提供智能翻譯服務(wù)。本研究主要依托ZeLinAI平臺(tái)進(jìn)行開發(fā),可以根據(jù)需求對(duì)自建的數(shù)據(jù)集進(jìn)行訓(xùn)練,將訓(xùn)練后的數(shù)據(jù)集與創(chuàng)建的智能體關(guān)聯(lián),提高智能體數(shù)據(jù)的準(zhǔn)確性。將翻譯AI智能體部署到H5應(yīng)用,分享智能體,用戶可通過手機(jī)端和電腦端使用該AI智能體,反饋使用過程中的問題和建議。項(xiàng)目組根據(jù)反饋持續(xù)優(yōu)化翻譯AI智能體。整個(gè)項(xiàng)目流程如圖1所示。
圖1 項(xiàng)目流程
2.2.1 智能體創(chuàng)建
首先注冊(cè)并登錄ZeLinAI平臺(tái)。以創(chuàng)建“翻譯小助手”智能體項(xiàng)目為例,進(jìn)入ZeLinAI平臺(tái)后,選擇平臺(tái)左側(cè)列表的“智能體”。進(jìn)入智能體界面后,點(diǎn)選“創(chuàng)建智能體”按鈕即可進(jìn)行智能體的定制和創(chuàng)建?!皠?chuàng)建智能體”界面的參數(shù)有很多。定制最基礎(chǔ)的智能體可以不關(guān)注其他參數(shù),只需要配置“智能體名稱”“模型型號(hào)”和“角色定位”,其他參數(shù)默認(rèn)即可。
智能體名稱配置。用戶自定義智能體的名稱,例如“翻譯小助手”,也可以使用簡(jiǎn)潔且寓意深刻的命令和朗朗上口的名稱,如“智譯靈”“譯通天下”“譯智軒”等。
模型型號(hào)配置。模型型號(hào)是從下拉菜單中選擇。目前,ZeLinAI平臺(tái)支持的模型包括微軟-3.5、微軟-4、文心一言、訊飛星火、MJ畫圖、SD畫圖、DALLE3等大語言模型。不同的大語言模型由于算法的不同對(duì)智能體返回的結(jié)果會(huì)產(chǎn)生不同的效果。用戶測(cè)試時(shí),可對(duì)不同大語言模型的選擇進(jìn)行調(diào)試,如智能體返回的結(jié)果不理想可以通過更換模型來優(yōu)化。
角色定位配置。角色定位定義了智能體的角色(提示詞),即項(xiàng)目組需要寫的 Prompt。Prompt是智能體的重中之重,務(wù)必準(zhǔn)確定義,才能有符合項(xiàng)目組需求的輸出。項(xiàng)目組在“翻譯小助手”中定義的Prompt如圖2所示。通常,這個(gè)步驟需要反復(fù)迭代。如果智能體返回的結(jié)果不理想,那么可以通過不斷反復(fù)迭代優(yōu)化定義的Prompt來實(shí)現(xiàn)更符合需求的輸出。
圖2 翻譯小助手定義的提示詞
智能體測(cè)試。完成“智能體名稱”“模型型號(hào)”和“角色定位”的配置后,點(diǎn)擊“確認(rèn)”,完成“翻譯小助手”智能體的創(chuàng)建。在窗體右下側(cè)輸入欄輸入需要翻譯的內(nèi)容,智能體可以按照輸入內(nèi)容進(jìn)行翻譯和情感分析,如圖3所示。
圖3 翻譯小助手智能體測(cè)試
2.2.2 優(yōu)化提示詞
項(xiàng)目組對(duì)翻譯AI智能體的提示詞進(jìn)行了結(jié)構(gòu)化的優(yōu)化。結(jié)構(gòu)化的提示詞有各種各樣的模板。項(xiàng)目組選擇了知名的 CRISPE 框架。CRISPE框架強(qiáng)調(diào)了迭代的過程,每個(gè)步驟都為下一步驟打下基礎(chǔ),有助于系統(tǒng)地探索和利用模型的潛在能力。優(yōu)化后的翻譯AI智能體從角色的主要工作任務(wù)、角色的工作背景、角色在互動(dòng)中必須遵循的限制條件、角色的主要目標(biāo)、角色的主要技能、角色的語氣風(fēng)格、符合角色身份的價(jià)值觀、角色的工作流程結(jié)構(gòu)化等多個(gè)方面進(jìn)行遞歸定義[3],如圖4所示。
圖4 優(yōu)化后的提示詞
2.2.3 引入訓(xùn)練集
為了使智能體更加匹配項(xiàng)目組自身的業(yè)務(wù),本研究還需要引入訓(xùn)練集,通過精準(zhǔn)的投喂訓(xùn)練集,將智能體和訓(xùn)練集關(guān)聯(lián)起來,提升翻譯AI智能體的準(zhǔn)確性和流暢性。目前,ZeLinAI平臺(tái)的訓(xùn)練集支持文本、圖片、視頻、多媒體庫等多種形式。
創(chuàng)建訓(xùn)練集。選擇平臺(tái)左側(cè)列表的“訓(xùn)練”,進(jìn)入訓(xùn)練窗口??梢詣?chuàng)建智能訓(xùn)練集和普通訓(xùn)練集兩種訓(xùn)練集。智能訓(xùn)練集支持錄入內(nèi)容的收斂和發(fā)散兩種訓(xùn)練方式,而普通訓(xùn)練集則是Q&A的問答形式。文本訓(xùn)練直接輸入訓(xùn)練的內(nèi)容。文檔訓(xùn)練采用拖拽的形式將需要訓(xùn)練的文檔加入訓(xùn)練集。目前,平臺(tái)支持.txt、.docx、.pdf3種格式的文檔。添加訓(xùn)練集后,點(diǎn)擊“完成”即可。
創(chuàng)建智能體并關(guān)聯(lián)訓(xùn)練集。創(chuàng)建智能體的步驟與之前創(chuàng)建基礎(chǔ)智能體完全一致。本研究需要關(guān)注的是新建智能體與訓(xùn)練集的關(guān)聯(lián)。點(diǎn)擊添加訓(xùn)練集按鈕,在新彈出的窗口中勾選新建的訓(xùn)練集名稱,完成后,點(diǎn)擊確定,返回新建智能體的狀態(tài)。點(diǎn)擊訓(xùn)練集,此時(shí)在“角色定位”框中自動(dòng)添加訓(xùn)練集,完成了自建訓(xùn)練集與智能體的關(guān)聯(lián)。引入自建訓(xùn)練集的智能體創(chuàng)建完成后,在窗體右下側(cè)輸入欄輸入需要了解的培訓(xùn)相關(guān)的內(nèi)容,智能體可以按照輸入內(nèi)容進(jìn)行問題解答。解答的下方標(biāo)注引用訓(xùn)練集的段落。
智能體創(chuàng)建之后,項(xiàng)目組希望把它分享出來給更多的用戶使用,需要把創(chuàng)建的智能體打包為AI應(yīng)用。目前,平臺(tái)支持創(chuàng)建3種方式的應(yīng)用:H5應(yīng)用、API應(yīng)用、BOT應(yīng)用。在本次項(xiàng)目中,項(xiàng)目組采用了H5應(yīng)用的方式。H5應(yīng)用可以在電腦以及手機(jī)端打開直接使用。
創(chuàng)建應(yīng)用。選擇平臺(tái)左側(cè)列表的“應(yīng)用”,進(jìn)入應(yīng)用窗口后,選擇“創(chuàng)建H5應(yīng)用”,進(jìn)入H5應(yīng)用窗口。在此窗口輸入應(yīng)用名稱、應(yīng)用圖標(biāo)、應(yīng)用介紹和選擇智能體4個(gè)必填項(xiàng),完成應(yīng)用創(chuàng)建。在內(nèi)容設(shè)置欄,選擇需要分享的智能體——翻譯小助手,實(shí)現(xiàn)應(yīng)用與智能體的關(guān)聯(lián)后,點(diǎn)擊“完成并分享”進(jìn)入分享應(yīng)用的窗口。
分享應(yīng)用。分享應(yīng)用窗口有鏈接分享、二維碼分享和海報(bào)分享3種分享方式。手機(jī)端掃描海報(bào)或二維碼可以登錄并使用智能體。
通過智能體項(xiàng)目的創(chuàng)建和應(yīng)用,項(xiàng)目組深切感受到智能體項(xiàng)目的關(guān)鍵核心在于提示詞。良好的提示詞可以讓模型正確地理解用戶需求并給出符合預(yù)期的結(jié)果,提示詞的質(zhì)量決定了智能體輸出的質(zhì)量。下一步,項(xiàng)目組一是持續(xù)優(yōu)化提示詞,通過多學(xué)習(xí)、多實(shí)踐,盡可能地編寫語義明確、邏輯清晰、結(jié)果合理的提示詞,引導(dǎo)大模型的高質(zhì)量回應(yīng);二是引入更多自定義訓(xùn)練集,根據(jù)用戶的偏好和歷史數(shù)據(jù)來調(diào)整翻譯風(fēng)格和詞匯選擇。翻譯AI智能體將更加注重個(gè)性化服務(wù),同時(shí)將具備更強(qiáng)的適應(yīng)性,能夠在不斷變化的語言環(huán)境中持續(xù)學(xué)習(xí)和進(jìn)化。