自O(shè)penAI于2022年11月30日發(fā)布ChatGPT大語(yǔ)言模型以來,國(guó)內(nèi)外各種各樣的大模型快速發(fā)展。由于大模型具有大數(shù)據(jù)、大算力、強(qiáng)算法的特點(diǎn),目前機(jī)構(gòu)或個(gè)體一般以預(yù)訓(xùn)練的通用大模型為基座,通過提示詞工程、檢索增強(qiáng)生成、微調(diào)或預(yù)訓(xùn)練進(jìn)行二次知識(shí)創(chuàng)造,最終形成行業(yè)大模型或者解決具體任務(wù)的自訓(xùn)練模型。
例如,2024年中秋前夕,廣聯(lián)達(dá)發(fā)布了建筑行業(yè)的AI大模型白皮書,預(yù)示著中國(guó)建筑軟件行業(yè)第一個(gè)大模型出現(xiàn)。這個(gè)行業(yè)大模型是針對(duì)行業(yè)特定數(shù)據(jù)和任務(wù)(如建筑規(guī)劃、設(shè)計(jì)、交易、成本、施工、運(yùn)維及綜合管理等)進(jìn)行定制化訓(xùn)練和優(yōu)化形成的,具有行業(yè)專業(yè)知識(shí)和技能。
又如,針對(duì)沖壓時(shí)產(chǎn)生的廢料偶發(fā)性卡塞影響生產(chǎn)效率,并存在打壞模具風(fēng)險(xiǎn)的問題,上汽大眾儀征工廠進(jìn)行了視覺自動(dòng)化監(jiān)測(cè)廢料通暢的嘗試。項(xiàng)目組首先通過相機(jī)捕捉廢料槽實(shí)時(shí)畫面,之后使用圖像增強(qiáng)和形態(tài)學(xué)處理等方法,利用幀差法實(shí)現(xiàn)廢料的識(shí)別,進(jìn)而建立不同模具的廢料數(shù)學(xué)模型,并基于VI+AI技術(shù)開發(fā)模具廢料實(shí)時(shí)監(jiān)測(cè)系統(tǒng),實(shí)現(xiàn)了對(duì)沖壓廢料的實(shí)時(shí)智能監(jiān)控,從而能夠及時(shí)發(fā)現(xiàn)卡廢,減少清理難度,減少停機(jī)時(shí)間。
與傳統(tǒng)以人為主體的知識(shí)創(chuàng)造相比,基于大模型的知識(shí)創(chuàng)造的規(guī)律有何不同?機(jī)構(gòu)或個(gè)體如何應(yīng)用通用大模型進(jìn)行知識(shí)創(chuàng)造?在知識(shí)創(chuàng)造過程中,人和AI的合作方式和角色分配是怎樣的?人類智慧和人工智能在知識(shí)創(chuàng)造中如何形成互補(bǔ)?本文就這些問題展開分析和討論。
基于大模型的知識(shí)創(chuàng)造有兩個(gè)主體:人(個(gè)體和團(tuán)隊(duì))和AI(具備深度學(xué)習(xí)能力的大模型)。以下就人的工作特點(diǎn)和通用大模型的特點(diǎn)展開分析,并歸納出基于大模型的知識(shí)共創(chuàng)模式、過程及其特點(diǎn)。
個(gè)體和團(tuán)隊(duì)的工作特點(diǎn)
作為知識(shí)創(chuàng)造者,人類的知識(shí)獲取和整合能力、認(rèn)知能力、偏好和價(jià)值觀等影響著知識(shí)創(chuàng)造過程。野中郁次郎認(rèn)為人類知識(shí)創(chuàng)造主體包括個(gè)體和團(tuán)隊(duì),有四種知識(shí)創(chuàng)造形式:社會(huì)化(Socialization)、外顯化(Externalization)、組合化(Combination)和內(nèi)隱化(Internalization)。
社會(huì)化是指?jìng)€(gè)體間的隱性知識(shí)轉(zhuǎn)化,那些難以言傳的心智模式、經(jīng)驗(yàn)與直覺通過觀察、模仿和親身實(shí)踐傳遞給其他個(gè)體。這種知識(shí)的傳遞是隱性的,依賴于個(gè)體間的直接互動(dòng)和非正式學(xué)習(xí)。外顯化是指?jìng)€(gè)體將隱性知識(shí)轉(zhuǎn)化為可以共享和交流的顯性知識(shí),通常通過語(yǔ)言、文字、圖表等媒介讓原本深藏于個(gè)人心中的知識(shí)明晰化,為團(tuán)隊(duì)所共享。組合化是指團(tuán)隊(duì)將顯性知識(shí)進(jìn)一步整合和系統(tǒng)化,形成組織層面的顯性知識(shí)庫(kù)。這一過程涉及知識(shí)的收集、分類、存儲(chǔ)和分析,以便于更廣泛的應(yīng)用和傳播。內(nèi)隱化是指組織層面的顯性知識(shí)被個(gè)體吸收和內(nèi)化,轉(zhuǎn)化為新的隱性知識(shí)。個(gè)體通過學(xué)習(xí)、實(shí)踐和反思,將這些知識(shí)融入自己的知識(shí)體系中,為新一輪的社會(huì)化做好準(zhǔn)備。
團(tuán)隊(duì)是組織知識(shí)創(chuàng)造的主體,團(tuán)隊(duì)目標(biāo)的設(shè)置和分解、團(tuán)隊(duì)成員的選擇和分工、團(tuán)隊(duì)成員之間的溝通和協(xié)作,均對(duì)團(tuán)隊(duì)的知識(shí)創(chuàng)造效果有重要影響。理查德·哈克曼和露絲·瓦格曼指出,構(gòu)建高績(jī)效團(tuán)隊(duì)需要滿足三個(gè)必要條件:首先,團(tuán)隊(duì)必須擁有既具有挑戰(zhàn)性又清晰明確的目標(biāo),并且這些目標(biāo)對(duì)組織具有重大意義;其次,團(tuán)隊(duì)成員需要具備相應(yīng)的勝任力,團(tuán)隊(duì)成員之間的技能和專長(zhǎng)要互為補(bǔ)充;最后,團(tuán)隊(duì)?wèi)?yīng)保持一定的穩(wěn)定性,團(tuán)隊(duì)的邊界要既清晰又具有一定的擴(kuò)展性,成員之間相互依賴。
通過比較研究,我們發(fā)現(xiàn)普通團(tuán)隊(duì)和極限團(tuán)隊(duì)存在以下差異。第一,工作態(tài)度上,普通團(tuán)隊(duì)只是以專業(yè)精神完成工作,極限團(tuán)隊(duì)則是把工作當(dāng)成一種使命并沉浸其中。第二,在團(tuán)隊(duì)協(xié)調(diào)上,普通團(tuán)隊(duì)注重團(tuán)隊(duì)成員個(gè)人的經(jīng)驗(yàn)和能力,極限團(tuán)隊(duì)看重團(tuán)隊(duì)成員之間的適配性和任務(wù)完成的協(xié)作性。第三,在任務(wù)目標(biāo)設(shè)置方面,普通團(tuán)隊(duì)設(shè)置很多優(yōu)先事項(xiàng),認(rèn)為目標(biāo)越多越好,極限團(tuán)隊(duì)則是注重有限的重要目標(biāo),堅(jiān)持“少即是多”的原則。第四,在團(tuán)隊(duì)文化方面,普通團(tuán)隊(duì)努力營(yíng)造一種高效且一成不變的文化,極限團(tuán)隊(duì)竭力打造一種既溫情又嚴(yán)苛的文化。第五,在對(duì)待團(tuán)隊(duì)沖突方面,普通團(tuán)隊(duì)傾向于維護(hù)團(tuán)隊(duì)成員之間的和諧,避免沖突和不安,極限團(tuán)隊(duì)將沖突視為一種積極的動(dòng)力,認(rèn)為適度的不安可以激發(fā)團(tuán)隊(duì)的創(chuàng)新和進(jìn)步。極限團(tuán)隊(duì)因其明確的目標(biāo)、互補(bǔ)的技能、清晰的邊界、協(xié)作的文化和對(duì)沖突的積極態(tài)度,在追求卓越和創(chuàng)新方面展現(xiàn)出更為明顯的優(yōu)勢(shì)。
以O(shè)penAI最近推出的o1大模型為例,這個(gè)大模型是由18位在各自專業(yè)領(lǐng)域表現(xiàn)出色的年輕科學(xué)家組成的極限團(tuán)隊(duì)精心打造的。首先,從團(tuán)隊(duì)目標(biāo)來看,該團(tuán)隊(duì)的工作目標(biāo)極具挑戰(zhàn)性,對(duì)推動(dòng)AI大模型的發(fā)展具有極其重要的意義。為了在這個(gè)模型中融合思維鏈技術(shù)(ChainofThought,簡(jiǎn)稱CoT)和系統(tǒng)二思維模式,團(tuán)隊(duì)每個(gè)成員都孜孜不倦地工作并樂此不疲。第二,從團(tuán)隊(duì)成員構(gòu)成和分工來看,團(tuán)隊(duì)成員大多擁有國(guó)際頂尖大學(xué)的教育背景和博士學(xué)位,并在AI領(lǐng)域積累了豐富的工作經(jīng)驗(yàn)。他們?cè)诖竽P偷拈_發(fā)過程中有不同的角色和職責(zé),但都做出了突出的貢獻(xiàn)。例如,JieqiYu獲得復(fù)旦大學(xué)本科學(xué)位、普林斯頓大學(xué)博士學(xué)位,曾在臉書(Facebook)工作了12年,目前擔(dān)任OpenAI的工程經(jīng)理,負(fù)責(zé)模型的安全性和穩(wěn)定性。艾哈邁德·埃爾-基什基(AhmedEl-Kishky)和詹森·韋(JasonWei)在模型設(shè)計(jì)和實(shí)現(xiàn)過程中發(fā)揮了關(guān)鍵作用,前者擁有豐富的行業(yè)經(jīng)驗(yàn),參與推理研究,后者因提出思維鏈概念而廣為人知。LilianWeng獲得北京大學(xué)本科學(xué)位、印第安納大學(xué)布魯明頓分校博士學(xué)位,是OpenAI的安全系統(tǒng)負(fù)責(zé)人,為大模型注入了很多安全保障理念。第三,從團(tuán)隊(duì)文化來看,該團(tuán)隊(duì)的氛圍非常和諧,同事們經(jīng)常一起用餐、一起外出活動(dòng)。第四,團(tuán)隊(duì)成員擁抱不同意見,理性對(duì)待觀念上的沖突。團(tuán)隊(duì)成員都非常聰明且才華橫溢,在專業(yè)問題上都有自己的見解,并充滿熱情地推動(dòng)自己的想法,但是他們并不固執(zhí)己見,如果遇到客觀證據(jù)反駁自己的觀點(diǎn),也會(huì)愿意改變想法。
通用大模型的特點(diǎn)
通用大模型是一種可以處理多種任務(wù)的人工智能模型,通常是基于深度學(xué)習(xí)和自然語(yǔ)言處理技術(shù)開發(fā)的。通用大模型可細(xì)分為單模態(tài)大模型和多模態(tài)大模型。
單模態(tài)大模型指僅處理和理解一種類型數(shù)據(jù)的人工智能模型,即只專注于一種數(shù)據(jù)模態(tài)(文本、圖像、音頻、視頻等)。這類模型通常是針對(duì)特定任務(wù)或領(lǐng)域進(jìn)行優(yōu)化和訓(xùn)練的,具有很強(qiáng)的專門性和深入的理解能力。例如,自然語(yǔ)言處理(NLP)模型專注于文本數(shù)據(jù),圖像識(shí)別模型專注于圖像數(shù)據(jù)。由于只處理一種類型的數(shù)據(jù),單模態(tài)大模型可以針對(duì)數(shù)據(jù)進(jìn)行深度優(yōu)化,從而在特定任務(wù)上表現(xiàn)出色。單模態(tài)大模型通常被應(yīng)用于特定領(lǐng)域或任務(wù),如機(jī)器翻譯、圖像分類、語(yǔ)音識(shí)別等。自然語(yǔ)言處理領(lǐng)域的單模態(tài)大模型有OpenAI開發(fā)的ChatGPT4o、谷歌開發(fā)的Gemini、Meta開發(fā)的LLaMA、百度開發(fā)的文心一言、阿里巴巴開發(fā)的通義千問和華為開發(fā)的盤古大模型等;計(jì)算機(jī)視覺(CV)領(lǐng)域的單模態(tài)大模型有微軟開發(fā)的ResNet、谷歌開發(fā)的EfficientNet、JosephRedmon開發(fā)的YOLOv10等;語(yǔ)音處理領(lǐng)域的單模態(tài)大模型有Mozilla開發(fā)的DeepSpeech和DeepMind開發(fā)的WaveNet等。單模態(tài)大模型的應(yīng)用場(chǎng)景有自然語(yǔ)言處理、計(jì)算機(jī)視覺和語(yǔ)音處理。
多模態(tài)大模型是一種能夠同時(shí)處理和理解多種類型數(shù)據(jù)的人工智能模型。這類模型的主要特點(diǎn)是能夠融合和綜合多種模態(tài)的數(shù)據(jù),從而在理解和生成復(fù)雜信息時(shí)展現(xiàn)出更強(qiáng)的能力。多模態(tài)大模型能夠理解和關(guān)聯(lián)不同模態(tài)之間的關(guān)系,如理解一段文字并找到與之匹配的圖像,或是生成與圖像內(nèi)容相關(guān)的文字。多模態(tài)大模型具備處理多種任務(wù)的能力,如圖像分類、文本生成、情感分析等,能夠在一個(gè)統(tǒng)一的模型框架內(nèi)進(jìn)行多種任務(wù)的處理。比較知名的多模態(tài)大模型包括OpenAI公司開發(fā)的CLIP、DALL-E、微軟開發(fā)的Florence、阿里巴巴達(dá)摩院開發(fā)的天元(Tianyuan)、中國(guó)科學(xué)院自動(dòng)化研究所開發(fā)的紫東太初(ZidongTaichu)、小鵬汽車開發(fā)的小鵬(Xpeng)AI、廣聯(lián)達(dá)開發(fā)的AecGPT-V等。多模態(tài)大模型在許多場(chǎng)景中具有廣泛應(yīng)用,如自動(dòng)駕駛、醫(yī)療診斷、智能客服等。
人+AI的知識(shí)共創(chuàng)模式
知識(shí)共創(chuàng)的主體之一人可細(xì)分為個(gè)體和團(tuán)隊(duì),另一主體AI可以根據(jù)其處理信息的模態(tài)劃分為單模態(tài)大模型和多模態(tài)大模型。由此可以形成四種知識(shí)共創(chuàng)模式:個(gè)體—單模態(tài)知識(shí)創(chuàng)造、個(gè)體—多模態(tài)知識(shí)創(chuàng)造、團(tuán)隊(duì)—單模態(tài)知識(shí)創(chuàng)造和團(tuán)隊(duì)—多模態(tài)知識(shí)創(chuàng)造(見表1)。每一種模式代表了人類智慧與人工智能在不同層面和維度上的協(xié)作與融合。
在個(gè)體—單模態(tài)知識(shí)創(chuàng)造模式中,個(gè)體利用專注于單一數(shù)據(jù)類型的AI模型來增強(qiáng)自己的創(chuàng)造力和問題解決能力。例如,作家使用專門分析文本的AI模型來提升內(nèi)容深度和專業(yè)性。
在個(gè)體—多模態(tài)知識(shí)創(chuàng)造模式中,個(gè)體與能夠處理多種數(shù)據(jù)類型的AI模型合作,以實(shí)現(xiàn)更為全面和創(chuàng)新的知識(shí)創(chuàng)造。例如,研究人員與一個(gè)能夠同時(shí)分析文本、圖像和聲音的AI模型合作,以探索跨學(xué)科的研究問題。
在團(tuán)隊(duì)—單模態(tài)知識(shí)創(chuàng)造模式中,團(tuán)隊(duì)成員共同利用單模態(tài)AI模型來協(xié)作和共創(chuàng)知識(shí)。這種模式適用于需要團(tuán)隊(duì)智慧和AI在特定領(lǐng)域內(nèi)深入分析的情況,如市場(chǎng)分析團(tuán)隊(duì)使用文本分析AI來解讀消費(fèi)者反饋。
在團(tuán)隊(duì)—多模態(tài)知識(shí)創(chuàng)造模式中,當(dāng)團(tuán)隊(duì)與多模態(tài)AI模型合作時(shí),能夠?qū)崿F(xiàn)跨領(lǐng)域的知識(shí)整合和創(chuàng)新。這種模式特別適合需要綜合多種數(shù)據(jù)源和視角來解決復(fù)雜問題的場(chǎng)景,如產(chǎn)品開發(fā)團(tuán)隊(duì)利用AI模型來分析用戶行為、市場(chǎng)趨勢(shì)和設(shè)計(jì)元素,共同創(chuàng)造出新的產(chǎn)品概念。
這四種知識(shí)共創(chuàng)模式不僅展示了人與AI在知識(shí)創(chuàng)造過程中的多樣化合作方式,也揭示了不同規(guī)模和模態(tài)的人工智能如何被應(yīng)用于支持和增強(qiáng)人類的認(rèn)知能力。
人+AI雙環(huán)螺旋上升的知識(shí)共創(chuàng)過程
人和AI知識(shí)共創(chuàng)存在著兩個(gè)互補(bǔ)且相互促進(jìn)的循環(huán)系統(tǒng):一個(gè)以人為中心,另一個(gè)以AI(大模型)為中心。這兩個(gè)循環(huán)在各自領(lǐng)域內(nèi)不斷演進(jìn),還通過交互作用共同推動(dòng)知識(shí)的深化與擴(kuò)展。
以人為中心的知識(shí)創(chuàng)造循環(huán)是一個(gè)動(dòng)態(tài)迭代的過程,包括社會(huì)化、外顯化、組合化和內(nèi)隱化四個(gè)階段。這個(gè)循環(huán)在個(gè)體和團(tuán)隊(duì)的學(xué)習(xí)中不斷螺旋上升,每一次迭代都深化了對(duì)知識(shí)的理解和應(yīng)用(見圖1)。
以AI為中心的知識(shí)創(chuàng)造循環(huán)遵循機(jī)器學(xué)習(xí)和深度學(xué)習(xí)的路徑,包括數(shù)據(jù)收集和預(yù)處理、模型訓(xùn)練、模型優(yōu)化和內(nèi)容生成幾個(gè)階段。AI系統(tǒng)通過各種渠道收集大量數(shù)據(jù),并對(duì)其進(jìn)行清洗、標(biāo)注和格式化,為模型訓(xùn)練做準(zhǔn)備。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,AI模型通過算法學(xué)習(xí)數(shù)據(jù)中的模式和關(guān)聯(lián),逐步構(gòu)建知識(shí)基礎(chǔ)。在訓(xùn)練的基礎(chǔ)上,AI模型不斷調(diào)整和優(yōu)化參數(shù)和結(jié)構(gòu),以提高預(yù)測(cè)和生成的準(zhǔn)確性。經(jīng)過訓(xùn)練和優(yōu)化的AI模型能夠生成新的內(nèi)容、模式和解決方案,這些成果可以用于各種應(yīng)用場(chǎng)景。以AI為中心的知識(shí)創(chuàng)造循環(huán)在機(jī)器深度學(xué)習(xí)的過程中也不斷螺旋式上升,每一次迭代都增強(qiáng)了AI的智能水平和應(yīng)用能力(見圖2)。
以人為中心的知識(shí)創(chuàng)造循環(huán)和以AI為中心的知識(shí)創(chuàng)造循環(huán)并不是孤立的,它們相互交織、相互促進(jìn)。人類的直覺、創(chuàng)造力和批判性思維可以指導(dǎo)AI的訓(xùn)練和優(yōu)化,AI的強(qiáng)大計(jì)算能力和模式識(shí)別能力又可以擴(kuò)展人類的認(rèn)知邊界和處理復(fù)雜問題的能力。這種雙向互動(dòng)形成了一個(gè)雙環(huán)螺旋上升的結(jié)構(gòu),共同推動(dòng)知識(shí)創(chuàng)造和知識(shí)應(yīng)用(見圖3)。
上海巡智科技有限公司(下文簡(jiǎn)稱“巡智科技”)是一家為城市地下資產(chǎn)提供現(xiàn)場(chǎng)智慧管理解決方案的高新技術(shù)企業(yè)和專精特新企業(yè),主要產(chǎn)品有AR智能管網(wǎng)管理系統(tǒng)、AI智能審核系統(tǒng)、小區(qū)泵房三維可視化、小區(qū)AR建設(shè)(地下管線+立體管線)等。其中,AR智能管網(wǎng)管理系統(tǒng)運(yùn)用AR、AI、云計(jì)算等技術(shù),以智能手機(jī)、平板、AR眼鏡等為載體,實(shí)現(xiàn)了管網(wǎng)及其附屬設(shè)備閥門、水表、消火栓等的智能化、可視化、便利化管理。
下面以巡智科技智能工單審核系統(tǒng)在二次供水水箱清洗中的應(yīng)用為例,分析其以團(tuán)隊(duì)為單位應(yīng)用單模態(tài)大模型進(jìn)行知識(shí)共創(chuàng)的過程。
某市的水務(wù)公司將七萬多只水箱池的清潔工作外包給第三方專業(yè)公司。水務(wù)公司采用一個(gè)水箱一張工單的作業(yè)質(zhì)量監(jiān)管制度,第三方專業(yè)公司的作業(yè)人員需要用手機(jī)拍攝清洗過程上傳系統(tǒng),由水務(wù)公司員工進(jìn)行人工審核銷單。由于上傳的照片多達(dá)百萬張,人工審核效率低,成本高。為此,水務(wù)公司委托巡智科技開發(fā)水箱清潔智能工單審核系統(tǒng),以降低成本,提高工作效率。
巡智科技派出由1名產(chǎn)品工程師、1名測(cè)試工程師和3名開發(fā)工程師組成的5人團(tuán)隊(duì)負(fù)責(zé)這個(gè)智能工單審核系統(tǒng)的開發(fā)。整個(gè)開發(fā)過程包括了解工作流程和落實(shí)審核指標(biāo),收集和準(zhǔn)備數(shù)據(jù)集,選擇大模型并定義、訓(xùn)練模型,評(píng)估模型性能,將模型應(yīng)用于審核實(shí)踐。
了解工作流程和落實(shí)審核指標(biāo)。項(xiàng)目組的工程師擅長(zhǎng)AI技術(shù)但是不懂客戶的工作流程和工單審核標(biāo)準(zhǔn),所以要花很多時(shí)間去熟悉、學(xué)習(xí)、挖掘和規(guī)范相關(guān)的工作流程和標(biāo)準(zhǔn)。例如,客戶的工作流程可能不是很完備,缺了某些環(huán)節(jié)或者不符合智能審核系統(tǒng)的要求,巡智的開發(fā)團(tuán)隊(duì)就需要制定一個(gè)工作流程給清洗水箱池的工人,讓工人按照這個(gè)流程進(jìn)行作業(yè)并拍照上傳圖片。又如,在落實(shí)審核指標(biāo)時(shí),項(xiàng)目組通過與客戶溝通發(fā)現(xiàn)有一個(gè)叫“水質(zhì)”的指標(biāo),即衡量水的含氧量、總氯等是否合格,于是,項(xiàng)目組就要求提交的照片中包括能夠體現(xiàn)“水質(zhì)”的相應(yīng)信息。
收集和準(zhǔn)備數(shù)據(jù)集。智能審核系統(tǒng)根據(jù)工單上提供的照片收集和準(zhǔn)備數(shù)據(jù)集。如果提供的照片不符合要求,就難以收集數(shù)據(jù),需要作業(yè)人員更新符合標(biāo)準(zhǔn)的照片。由于照片數(shù)量龐大,項(xiàng)目組在收集和準(zhǔn)備數(shù)據(jù)庫(kù)這個(gè)環(huán)節(jié)花的時(shí)間是最多的。數(shù)據(jù)集的數(shù)據(jù)質(zhì)量和數(shù)量決定著模型訓(xùn)練效果。
選擇、定義和訓(xùn)練模型。項(xiàng)目組選擇YoloV8模型作為預(yù)訓(xùn)練大模型,這個(gè)模型采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)實(shí)現(xiàn)對(duì)圖像的分類和查重。工程師將數(shù)據(jù)集中99%的數(shù)據(jù)拿來做模型訓(xùn)練,留下1%的數(shù)據(jù)用于測(cè)試。在模型訓(xùn)練過程中,工程師要根據(jù)經(jīng)驗(yàn)判斷模型什么時(shí)候會(huì)收斂,模型輸出的結(jié)果是好還是不好??紤]到模型訓(xùn)練的時(shí)間,工程師輸入模型的數(shù)據(jù)是逐漸增加的,在訓(xùn)練過程中要移出數(shù)據(jù)集中的臟數(shù)據(jù)。通過不斷增加數(shù)據(jù)集,在每一輪訓(xùn)練后調(diào)整YoloV8中的超參數(shù)(包括學(xué)習(xí)率、網(wǎng)絡(luò)層數(shù)、激活函數(shù)、批處理大小、卷積核大小等),模型會(huì)不斷優(yōu)化,最終適配項(xiàng)目的任務(wù)要求。這是一個(gè)人和AI頻繁溝通、不斷互動(dòng)、共同促進(jìn)知識(shí)更新和知識(shí)生成的過程。
評(píng)估模型性能和應(yīng)用于實(shí)踐。項(xiàng)目組拿預(yù)留的測(cè)試數(shù)據(jù)來測(cè)試模型的有效性,當(dāng)預(yù)測(cè)準(zhǔn)確率達(dá)到95%時(shí),就可以停止訓(xùn)練模型,將模型交付給客戶使用了。在交付的時(shí)候,會(huì)將智能審核結(jié)果與人工審核結(jié)果進(jìn)行比較,看哪一個(gè)準(zhǔn)確率更高。當(dāng)智能審核結(jié)果的準(zhǔn)確率高于人工審核時(shí),就可以由智能工單審核系統(tǒng)取代人工審核。
巡智科技以阿米巴的形式來管理項(xiàng)目組。組長(zhǎng)由選舉產(chǎn)生,且均為年輕人。每個(gè)項(xiàng)目組需要全流程閉環(huán)完成承擔(dān)的任務(wù),權(quán)利和責(zé)任前置,自我管理,有充分的自主權(quán)。項(xiàng)目組與客戶溝通需求后會(huì)在組內(nèi)進(jìn)行頭腦風(fēng)暴,大家從各個(gè)角度思考可能的解決方案和難點(diǎn)。在頭腦風(fēng)暴的過程中,項(xiàng)目組成員也會(huì)通過詢問chatGPT等大模型獲取所需的信息并形成問題解決思路(這里有個(gè)體—單模態(tài)知識(shí)創(chuàng)造、個(gè)體—多模態(tài)知識(shí)創(chuàng)造)。在頭腦風(fēng)暴后,項(xiàng)目組制定一個(gè)工作流程,然后按照這個(gè)流程推進(jìn)工作。頭腦風(fēng)暴是一個(gè)知識(shí)社會(huì)化、外顯化、組合化和內(nèi)隱化的過程。
智能工單審核系統(tǒng)在某市水務(wù)公司二次供水水箱清洗中應(yīng)用3年后,共審核43萬多份工單,處理了超過700萬圖片,其中超過110萬張圖片需查重,審核合格率從67.15%增至93.36%,重復(fù)率降至0.53%,有效達(dá)到了提升效率、降低成本的目標(biāo)。
基于大模型的人+AI知識(shí)共創(chuàng)大概有三種互動(dòng)模式,每種模式都體現(xiàn)了人與AI之間不同的合作方式和角色分配。這三種互動(dòng)模式分別是嵌入模式(EmbeddingMode)、副駕駛模式(CopilotMode)和智能體模式(AgentMode)。
在嵌入模式下,人類專家定義整個(gè)任務(wù)的框架和目標(biāo),負(fù)責(zé)任務(wù)的主要部分,在特定環(huán)節(jié)會(huì)調(diào)用AI模型獲取建議或輔助決策。AI在這一過程中扮演輔助角色,提供必要的信息和選項(xiàng),最終的決策權(quán)和任務(wù)的完成掌握在人類手中。這種模式強(qiáng)調(diào)人在任務(wù)執(zhí)行中的中心地位,AI只是一個(gè)增強(qiáng)人類能力的工具。
副駕駛模式下,人和AI是一種更為協(xié)作的伙伴關(guān)系。人類設(shè)定任務(wù)目標(biāo),與AI模型共同參與任務(wù)的執(zhí)行。人類利用大模型的輸出,還通過訓(xùn)練小型模型來優(yōu)化和定制AI的輔助功能,使其更貼合特定任務(wù)的需求。在這種模式下,人與AI的關(guān)系更加平等,雙方共同推動(dòng)任務(wù)向前發(fā)展,相互之間的協(xié)作和溝通更加頻繁。
智能體模式代表了一種高度自動(dòng)化的合作方式。人類僅僅需要定義任務(wù)的最終目標(biāo)和提供必要的資源,如數(shù)據(jù)集或計(jì)算資源,之后,AI模型將獨(dú)立負(fù)責(zé)任務(wù)的規(guī)劃、分解和執(zhí)行。AI不僅執(zhí)行任務(wù),還自行判斷任務(wù)的完成情況和結(jié)束時(shí)機(jī)。這種模式下,AI擁有更大的自主權(quán),人類轉(zhuǎn)變?yōu)楸O(jiān)督者和策略提供者,負(fù)責(zé)監(jiān)督AI的績(jī)效并確保任務(wù)目標(biāo)的實(shí)現(xiàn)。
前述智能工單審核系統(tǒng)的開發(fā),采用了“嵌入”和“副駕駛”混合的模式。首先,項(xiàng)目組在項(xiàng)目開發(fā)的不同階段通過ChatGPT等大模型來獲取建議或輔助決策,采取的是嵌入模式。其次,項(xiàng)目組在開發(fā)計(jì)算機(jī)程序時(shí)使用Copilot輔助編碼,包括生成代碼、生成注釋、解釋代碼和優(yōu)化代碼。最后,在智能工單審核系統(tǒng)開發(fā)完成并交付使用后,部分環(huán)節(jié)實(shí)現(xiàn)了智能化。例如,系統(tǒng)每天凌晨自動(dòng)拉取前一天工單數(shù)據(jù),使用多階段策略獲取數(shù)據(jù),并存儲(chǔ)“已完成”工單信息,確保數(shù)據(jù)安全。又如,系統(tǒng)自動(dòng)更新和對(duì)比描述信息,分段下載文件,確??煽啃?。下載后,系統(tǒng)驗(yàn)證、解包并保存數(shù)據(jù),為后續(xù)處理提供基礎(chǔ)。審核結(jié)果加密發(fā)送至客戶服務(wù)器校驗(yàn)。但是,目標(biāo)設(shè)置、模型優(yōu)化和確定工單審核任務(wù)是否應(yīng)該結(jié)束等工作還是由人工來完成。因此,在智能工單審核這項(xiàng)任務(wù)上,采用的是副駕駛模式。
總的來講,人和AI在知識(shí)共創(chuàng)中是雙向哺育的:人推動(dòng)AI演變,AI增進(jìn)人類智慧。人類智慧推動(dòng)人工智能持續(xù)進(jìn)化,人工智能的發(fā)展又反過來激發(fā)和促進(jìn)人類智慧提升,智慧生命與智能機(jī)器之間相互促進(jìn)、共同成長(zhǎng)。
人和AI在知識(shí)創(chuàng)造過程中各有優(yōu)勢(shì)和劣勢(shì)。相比人類,AI具有強(qiáng)大的學(xué)習(xí)能力和數(shù)據(jù)處理能力。例如,阿爾法圍棋(AlphaGo)大模型能夠打敗世界頂級(jí)的圍棋大師,一方面是因?yàn)閷W(xué)習(xí)了大量人類棋譜,包括頂級(jí)圍棋大師的對(duì)弈記錄,它還通過與自己對(duì)弈不斷改進(jìn)和優(yōu)化下棋策略。另一方面,阿爾法圍棋擁有強(qiáng)大的計(jì)算資源,包括高性能的GPU和TPU集群,這使它能夠在短時(shí)間內(nèi)進(jìn)行大量的模擬和計(jì)算,快速評(píng)估和選擇最佳走法。AI在知識(shí)創(chuàng)造中的主要劣勢(shì)是創(chuàng)造力不足,在生成新穎和原創(chuàng)想法方面存在局限,通常依賴于已有的數(shù)據(jù)和算法。
人類擁有豐富的想象力和創(chuàng)造力,能夠提出新穎的想法和解決方案,這是基于算法的AI難以比擬的。人類在知識(shí)創(chuàng)造過程中常常會(huì)經(jīng)歷“頓悟”的瞬間,OpenAI的o1團(tuán)隊(duì)成員將這種靈光一現(xiàn)的時(shí)刻稱為“啊哈”時(shí)刻。頓悟是一種在特定時(shí)刻發(fā)生的意外突破,那一刻,所有的迷霧似乎都一掃而空,一切都變得清晰明了,仿佛一道靈感的閃電劃破夜空。o1的團(tuán)隊(duì)成員分享了他們靈感閃現(xiàn)的“啊哈”時(shí)刻。其中一個(gè)例子是,當(dāng)一位成員觀察到通過強(qiáng)化學(xué)習(xí)訓(xùn)練模型生成和優(yōu)化思維鏈技術(shù)(CoT)后,其效果竟然超越了人類編寫的CoT,他非常振奮,此時(shí)他意識(shí)到了強(qiáng)化學(xué)習(xí)時(shí)間(訓(xùn)練時(shí)計(jì)算量)和推理時(shí)間(測(cè)試時(shí)計(jì)算量)對(duì)提高模型效率的重要性(新認(rèn)知和新知識(shí)的產(chǎn)生)。另一位團(tuán)隊(duì)成員驚訝地發(fā)現(xiàn)模型在數(shù)學(xué)測(cè)試中的得分突然有了顯著提高,進(jìn)一步觀察后發(fā)現(xiàn)這是由于模型開始自我反思、質(zhì)疑自己的答案了。他強(qiáng)烈地感受到團(tuán)隊(duì)終于創(chuàng)造出了與眾不同的東西,那一瞬間,仿佛所有東西都匯聚到了一起,大模型驅(qū)動(dòng)的知識(shí)組合化和知識(shí)內(nèi)隱化在這個(gè)團(tuán)隊(duì)成員的身上猛烈發(fā)生。這些“啊哈”時(shí)刻不僅是團(tuán)隊(duì)成員個(gè)人學(xué)習(xí)成長(zhǎng)的標(biāo)志,也是整個(gè)o1項(xiàng)目向前邁進(jìn)的重要里程碑。
總的來講,人類與AI在知識(shí)創(chuàng)造中的優(yōu)勢(shì)和劣勢(shì),可以讓我們更好地理解兩者在知識(shí)創(chuàng)造中的互補(bǔ)性,從而能夠有效地結(jié)合人類的智慧與AI的能力來促進(jìn)知識(shí)共創(chuàng)。