□姚永嘉
對形形色色的車模、船模、航模,同學(xué)們再熟悉不過,那你是否聽說過“大語言模型”?難道語言也能變成什么模型?沒錯(cuò),那可是人工智能擅長的“絕活兒”!確切地說,這是一種人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,一種聊天機(jī)器人程序。哈哈,說到聊天機(jī)器人,你大概就能想起某些客服電話或?qū)υ捒蛑袘?yīng)對自如的語言、文字了吧,那些親切的“叔叔”“阿姨”,沒準(zhǔn)兒就是大語言模型的杰作哦。
2022 年底,美國人工智能研究實(shí)驗(yàn)室OpenAI公司推出了ChatGPT 系列產(chǎn)品,這種大語言模型能做到與真正人類幾乎無異的交流。這個(gè)原本科幻電影里才有的技術(shù)立即引爆了世界對大語言模型的關(guān)注,掀起了一場前所未有的技術(shù)變革。如今,使用大語言模型不再是一種高深莫測的技術(shù)術(shù)語,說不定你也能用它開啟屬于自己的無限可能。
大語言模型不是生來“萬事通”,只有對你的語言、思維,對書籍、圖片、互聯(lián)網(wǎng)內(nèi)容等進(jìn)行“預(yù)訓(xùn)練”,就像對人類小孩那樣,通過不斷反饋指導(dǎo),甚至給它獎(jiǎng)勵(lì)或懲罰,大語言模型才會(huì)變得越來越“聰明”,“聰明”到能對你輸入的任何問題或指令都迅速給出答案,幫你構(gòu)思,幫你發(fā)揮創(chuàng)意,甚至幫你處理好所有相關(guān)細(xì)節(jié)。
想象一下,就算是你心愛的寵物生病了,只要你告訴大語言模型小寶貝的具體情況,它也許就能像一名經(jīng)驗(yàn)豐富、醫(yī)術(shù)高超的寵物醫(yī)生那樣告訴你治療方案。大語言模型是那么“博學(xué)”,無論你對歷史、科學(xué)、文化還是任何其他領(lǐng)域感興趣,只要向它提出問題,它都能瞬間啟動(dòng)隨時(shí)更新的龐大知識(shí)庫,施展超高效率的自我學(xué)習(xí)技能,盡力給你一個(gè)準(zhǔn)確、詳細(xì)的答案。大語言模型還是“語言專家”,無論你是在學(xué)習(xí)外語、在國外旅行還是需要與來自不同文化背景的人交流,它都能為你提供準(zhǔn)確的翻譯服務(wù)。對同學(xué)們來說,大語言模型最吸引人的能力之一大概是生成文本,無論你是在列提綱、寫作文,還是僅僅需要一些創(chuàng)意靈感,“機(jī)智”的大語言模型隨時(shí)都能幫你延伸思維的觸角,簡直就是一個(gè)靈感無限的寫作小助手。
這一切的“超能力”都源于大語言模型背后高速發(fā)展的人工智能,它很樂意為人類效勞,對于各種問題持續(xù)幫助我們提供更好的答案?;叵胍幌拢覀冊诳苹秒娪爸锌偸悄苈牭侥硞€(gè)聰明的人工智能語音,回答主人公這樣那樣的問題,幫他(她)做出關(guān)鍵的判斷。未來,這樣的現(xiàn)實(shí)也許會(huì)通過大語言模型體現(xiàn)在我們每個(gè)人身上,人際關(guān)系、社會(huì)治理、智能制造……各種你想得到或想不到的應(yīng)用場景都會(huì)有大語言模型的存在,更受信任的人工智能甚至有可能改變未來整個(gè)人類社會(huì)生態(tài)。
過去的客服聊天機(jī)器人,通常只能根據(jù)用戶提問,發(fā)送預(yù)先準(zhǔn)備好的回答。應(yīng)用大語言模型后,同樣的問題問兩遍,它的回答可能會(huì)完全不同,甚至?xí)鱿胂罅Φ倪吔?。這有可能為人類開啟新的創(chuàng)造,也有可能是“一本正經(jīng)的胡說八道”,看上去非常真實(shí)和有道理,但卻會(huì)讓人踏入誤區(qū)。有一個(gè)真相頗令人意外,大語言模型雖然已經(jīng)開始廣泛應(yīng)用,但其實(shí)際運(yùn)行機(jī)制人類卻還不是很清楚。
人類對機(jī)器的完全信任也許還要走很長的路,你得意識(shí)到,大語言模型的回答可能是錯(cuò)的!那是因?yàn)榇笳Z言模型只是對已有的文本信息進(jìn)行模擬和預(yù)測,目前還無法真正深入理解文本背后的含義和情感。所以,別以為有了大語言模型我們就可以“躺平”啦,學(xué)習(xí)、寫作業(yè)還得靠自己獨(dú)立完成哦。
2023 年11 月8 日,知識(shí)增強(qiáng)大語言模型關(guān)鍵技術(shù)在浙江烏鎮(zhèn)發(fā)布。
早晨的露珠,晶瑩,閃亮,我想采集起來,寫純真的童話。
廣西合浦縣廉州鎮(zhèn)第八小學(xué) 吳中婉
說了這么多,我估計(jì)同學(xué)們已經(jīng)迫不及待地想要嘗試大語言模型了。雖說大語言模型很厲害,實(shí)際對于普通用戶來說,上手極其簡單。最常見的大語言模型的界面,都有一個(gè)輸入框,類似微信或者QQ 的聊天窗口。
我們想得到一個(gè)更優(yōu)質(zhì)的內(nèi)容,離不開優(yōu)質(zhì)的提問,專業(yè)說法是“提示詞”。提示詞可以是一個(gè)問題、一個(gè)任務(wù)或者一段話的描述,是你給大語言模型的線索或者啟發(fā),它會(huì)根據(jù)這個(gè)提示詞的信息和上下文理解,生成相應(yīng)的回答。
你可以提問“貓是一種什么動(dòng)物?”或者“我想寫一篇關(guān)于中國高鐵的科普文章,請給我一個(gè)提綱?!币部梢試L試提一些發(fā)散性的問題,比如“去火星要做哪些準(zhǔn)備工作?”當(dāng)提示詞輸入完畢以后,點(diǎn)擊“發(fā)送”按鈕,稍等片刻就可以看到完整回答啦。不過,要是你提出了包括但不限于暴力、歧視、犯罪等不懷好意的問題和請求,大語言模型就會(huì)按照預(yù)先設(shè)計(jì)的道德準(zhǔn)則說“不”,拒絕提供有效答案。
很久以前,人類對人工智能的探索就已經(jīng)開始了。在20 世紀(jì)50 年代,英國數(shù)學(xué)家阿蘭·圖靈提出了一個(gè)問題:“機(jī)器能思考嗎?”從此以后,這個(gè)問題引發(fā)了長期的爭論,人類也開始不斷探索機(jī)器智能。隨著科技的進(jìn)步,新的思想和技術(shù)逐漸嶄露頭角。研究人員們開始利用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)來訓(xùn)練語言模型,使計(jì)算機(jī)能夠從大量的數(shù)據(jù)中學(xué)習(xí)語言的規(guī)律和特征,通過自我理解來生成文本。
雖然大語言模型誕生在西方國家,但咱們中國人也能用它來為國家富強(qiáng)和人們生活更美好服務(wù)??墒窃谥形闹?,詞與詞之間并沒有明顯的分隔符號(hào),不像英文單詞之間是由空格分隔,這就給機(jī)器理解中文帶來了一定的困難。中國科學(xué)家就發(fā)明了中文分詞的方法,就像是給中文句子打上合理的斷點(diǎn),把一串連續(xù)的文字分割成一個(gè)個(gè)有意義的詞語。這樣,機(jī)器就可以更好地理解中文句子的含義和結(jié)構(gòu),機(jī)器翻譯、文本分類、情感分析等任務(wù)都不在話下。
早在大語言模型成熟之前,中文分詞就已經(jīng)在中文搜索引擎等應(yīng)用領(lǐng)域中產(chǎn)生了重要影響。大語言模型的訓(xùn)練,離不開自然語言的處理。正是中文世界對分詞的迫切需要,促進(jìn)了自然語言處理的成熟,為大語言模型的進(jìn)步貢獻(xiàn)了自己的力量。
咱們中國當(dāng)然也得擁有自己的大語言模型,那可是一個(gè)不能被外國“卡脖子”的關(guān)鍵技術(shù)。目前,我國已把大語言模型建設(shè)列為國家科技基建的重要內(nèi)容,把它作為產(chǎn)業(yè)數(shù)字化的重要推動(dòng)者和參與者,不斷提升相關(guān)技術(shù)水平,拓展應(yīng)用場景。中國的科技公司也在奮起直追,全球首個(gè)大語言模型ChatGPT 發(fā)布后不到一年的時(shí)間,阿里巴巴“通義千問”,華為“盤古”,訊飛“星火認(rèn)知”,百度“文心一言”,騰訊“混元”以及各科研機(jī)構(gòu)的大語言模型紛紛發(fā)布。就像計(jì)算機(jī)誕生后迅速取代了人類大量繁重勞動(dòng),大語言模型的問世加上中國人的智慧,也許會(huì)為未來人類的創(chuàng)造開拓難以想象的空間。
(本文在創(chuàng)作過程中得到技術(shù)專家朱峰老師的幫助,在此表示感謝。)
夜晚的沙漠一片漆黑,如此靜謐。此時(shí),我仿佛身處太空,周圍是漫天繁星。我閉上眼,用心聆聽,仿佛可以聽見幾千年來在這片沙漠上發(fā)生的無數(shù)滄桑故事與歷史變遷。
浙江余姚市第一實(shí)驗(yàn)小學(xué) 符振南