引言
當(dāng)前,企業(yè)對于本地化人工智能部署表現(xiàn)出極大的熱忱,特別是“本地部署滿血DeepSeek大模型”已成為眾多企業(yè)在數(shù)字化轉(zhuǎn)型進(jìn)程中的一個標(biāo)志性事件。這一現(xiàn)象背后,反映了企業(yè)對于提升工作效率、優(yōu)化決策過程等多方面需求的期待。
在行業(yè)數(shù)字化轉(zhuǎn)型浪潮中,部分企業(yè)存在戰(zhàn)略研判不足的跟風(fēng)現(xiàn)象,這種非理性決策可能引發(fā)多重資源損耗。具體而言,大模型應(yīng)用須構(gòu)建包含高性能服務(wù)器、分布式算力集群及高速通信設(shè)施的技術(shù)矩陣,若缺失系統(tǒng)性架構(gòu)設(shè)計與運(yùn)維方案,極易造成設(shè)備利用率低下。隨著人工智能團(tuán)隊(duì)的組建與持續(xù)運(yùn)維形成顯著人力成本,當(dāng)企業(yè)業(yè)務(wù)流程與模型技術(shù)特性存在適配偏差時,將衍生專業(yè)技術(shù)人才的結(jié)構(gòu)性閑置。尤其值得關(guān)注的是,在未構(gòu)建清晰業(yè)務(wù)圖譜的情況下,盲目采用無監(jiān)督訓(xùn)練范式不僅難以達(dá)成預(yù)期效果,更會形成技術(shù)投入與產(chǎn)出的剪刀差[-3]。
1.大模型技術(shù)與企業(yè)適配困境
1.1大模型的技術(shù)特性
高參數(shù)量的生成式、推理模型和多模態(tài)模型能夠展現(xiàn)出強(qiáng)大的跨領(lǐng)域認(rèn)知能力,源于其底層代碼構(gòu)建的邏輯與后期訓(xùn)練投喂的參數(shù)量,常見四種大模型異同比較如表1所示。相比傳統(tǒng)決策模型,這三類模型能夠接受更廣泛意義上的參數(shù),其認(rèn)知特征表現(xiàn)為三個維度。
知識表征的泛化性:模型通過海量語料庫訓(xùn)練形成分布式表征空間,有效捕捉跨領(lǐng)域知識的潛在關(guān)聯(lián)模式。這種特性使其在處理非結(jié)構(gòu)化數(shù)據(jù)(如文本、圖像)時,展現(xiàn)出與人類專家經(jīng)驗(yàn)相似的問題解構(gòu)能力。
推理機(jī)制的層次性:模型采用注意力機(jī)制構(gòu)建動態(tài)推理路徑,可模擬多學(xué)科研究的認(rèn)知決策過程。在復(fù)雜問題求解中,其層級化特征提取能力支持從數(shù)據(jù)驅(qū)動到知識驅(qū)動的范式轉(zhuǎn)換。
語言交互的適應(yīng)性:基于Transformer架構(gòu)的序列建模能力,模型不僅實(shí)現(xiàn)語義空間的精準(zhǔn)映射,還可通過參數(shù)微調(diào)適配特定領(lǐng)域術(shù)語體系。這種動態(tài)調(diào)整機(jī)制使其在工業(yè)場景中具備從通識能力向?qū)I(yè)能力轉(zhuǎn)化的技術(shù)基礎(chǔ)。
研究表明,通過引入行業(yè)知識圖譜與專家經(jīng)驗(yàn)融合機(jī)制,可有效提升模型在垂直領(lǐng)域的應(yīng)用效能,但須平衡參數(shù)規(guī)模與計算成本的關(guān)系。
1.2企業(yè)中具體復(fù)雜問題的適配難題
在企業(yè)的具體業(yè)務(wù)場景中,大模型面臨經(jīng)驗(yàn)真空問題,主要表現(xiàn)為三個維度的適配性挑戰(zhàn),以鋼鐵制造企業(yè)為例。
第一,責(zé)任主體界定困境。生產(chǎn)決策涉及質(zhì)量安全、環(huán)境合規(guī)等法律要件,生成式模型輸出的結(jié)果不具備可解釋性,預(yù)設(shè)不足時推理模型生成的錯誤結(jié)論更難以落實(shí)責(zé)任。當(dāng)企業(yè)在部署決策模型時難以保證系統(tǒng)中具備足夠的參考信息,特別是在自動化質(zhì)量檢測等關(guān)鍵環(huán)節(jié)更建議保留人工復(fù)核機(jī)制。
第二,關(guān)鍵要素識別偏差。由于生產(chǎn)流程涉及采購、工藝、檢驗(yàn)、物流、設(shè)備損耗、成本、能源調(diào)度等多環(huán)節(jié)的復(fù)雜耦合系統(tǒng),孤立的大模型即便具備并行數(shù)據(jù)處理能力,當(dāng)使用者預(yù)設(shè)立場不同時,如從成本或質(zhì)量角度出發(fā),也很難在多重要素間把握好重心,最終可能做出偏激的決策。
第三,隱性知識轉(zhuǎn)化障礙。生產(chǎn)體系中存在大量未編碼的專家經(jīng)驗(yàn),如極限規(guī)格工藝參數(shù)微調(diào)、設(shè)備異常診斷等,這類知識通常通過師徒制傳承或?qū)嵺`積累形成。大模型受限于訓(xùn)練數(shù)據(jù)的結(jié)構(gòu)化特征,難以捕捉操作場景中的上下文關(guān)聯(lián)信息,在設(shè)備故障預(yù)警等任務(wù)中易出現(xiàn)模式誤判。
因此,本文將從“獲取模型一部署模型一實(shí)現(xiàn)人與模型的迭代”三個角度構(gòu)建企業(yè)人工智能適配體系。
2.垂直領(lǐng)域知識圖譜構(gòu)建
2.1結(jié)構(gòu)化監(jiān)督學(xué)習(xí)框架的構(gòu)建
當(dāng)前主流模型訓(xùn)練主要采用無監(jiān)督學(xué)習(xí),雖然在通用知識獲取方面展現(xiàn)出顯著優(yōu)勢,但在垂直領(lǐng)域應(yīng)用中又存在明顯的功能局限性。無監(jiān)督學(xué)習(xí)機(jī)制賦予模型廣泛的知識探索能力,但其自主發(fā)現(xiàn)模式難以適應(yīng)專業(yè)化領(lǐng)域的精準(zhǔn)需求。垂直領(lǐng)域通常包含高度結(jié)構(gòu)化的知識體系和特定領(lǐng)域規(guī)則,這使得通用模型常常面臨語義理解偏差與知識應(yīng)用失準(zhǔn)的雙重挑戰(zhàn)。
為此,構(gòu)建結(jié)構(gòu)化監(jiān)督學(xué)習(xí)框架具有必要性。前期通過微調(diào)或定向蒸餾獲取具備一定專業(yè)性的基礎(chǔ)模型[5。通過對業(yè)務(wù)的流程解構(gòu)與邏輯分析,提取核心特征參數(shù)。以宣傳部門為例,通過針對性學(xué)習(xí)優(yōu)秀稿件與低質(zhì)量稿件,人工智能可以提取出該部門的風(fēng)格特色、價值取向等,進(jìn)而提高生成稿件或稿件審閱的有效性。
標(biāo)注體系設(shè)計應(yīng)遵循多維度語義表征原則,不僅涵蓋基礎(chǔ)數(shù)據(jù)分類標(biāo)簽,還須嵌人領(lǐng)域知識圖譜與操作規(guī)范約束條件。結(jié)合上下文語義標(biāo)注與領(lǐng)域規(guī)則注入的監(jiān)督學(xué)習(xí)方法,可使模型在專業(yè)場景中的任務(wù)適應(yīng)能力顯著提升。這種結(jié)構(gòu)化訓(xùn)練機(jī)制有效解決了傳統(tǒng)方法中領(lǐng)域知識表征不足的問題,為垂直場景應(yīng)用提供了可靠的技術(shù)路徑。
2.2訓(xùn)練材料優(yōu)先級評估模型
基于“知識密度-數(shù)據(jù)可得性”雙維度評估矩陣的材料篩選方法,可以實(shí)現(xiàn)訓(xùn)練資源的更優(yōu)配置。該模型將訓(xùn)練樣本劃分為四個特征象限,如圖1所示,其中高頻高價值具有最高訓(xùn)練優(yōu)先級。
高頻高價值的優(yōu)先處理策略源于其雙重價值屬性:高頻特性反映業(yè)務(wù)場景覆蓋率,直接影響智能體基礎(chǔ)能力構(gòu)建;高價值特性體現(xiàn)對企業(yè)核心指標(biāo)的貢獻(xiàn)度。以客戶服務(wù)場景為例,高頻咨詢問題處理模塊的訓(xùn)練可使智能體響應(yīng)準(zhǔn)確率顯著提升,同時降低人工干預(yù)需求。這種策略不僅實(shí)現(xiàn)資源投人產(chǎn)出最大化,更為低頻復(fù)雜場景處理提供了可遷移的知識框架。
3.漸進(jìn)式部署策略實(shí)施
3.1輕量模型試練階段
在企業(yè)本地化人工智能適配體系構(gòu)建的初期階段,選擇大量部署10b(billion)量級的小參數(shù)模型是極為明智的策略。此階段類似于讓人工智能部門進(jìn)行基礎(chǔ)訓(xùn)練。小參數(shù)模型易于部署、訓(xùn)練,對設(shè)備性能要求不高,在構(gòu)建基本智能體與簡易工作流中可以積累大量經(jīng)驗(yàn),同時也可以作為對抗摩爾定律的手段,防止軟硬件快速迭代導(dǎo)致沉沒成本。
通過在多崗位部署小模型也可以逐漸形成崗位對各類數(shù)據(jù)調(diào)用的熱力圖,這張熱力圖可以為雙維度評估矩陣提供進(jìn)一步的參考,清晰地展示出哪些數(shù)據(jù)在哪些崗位上被頻繁調(diào)用,哪些數(shù)據(jù)鮮少被觸及,為后續(xù)模型在垂直場景的強(qiáng)化提供了寶貴的參考依據(jù),為智能體的進(jìn)一步成長打下堅實(shí)基礎(chǔ)。
3.2中等模型迭代階段
在企業(yè)積累了相當(dāng)多的數(shù)據(jù)和經(jīng)驗(yàn)之后,中期引入100b量級模型成為推動智能體成長的關(guān)鍵步驟。該模型具備更強(qiáng)大的計算能力和更豐富的知識儲備,能夠有效應(yīng)對復(fù)雜的垂直場景任務(wù)。
此外,構(gòu)建多種工作流也是此階段的關(guān)鍵措施。工作流可以拆解任務(wù)下發(fā)給不同智能體,多種智能體之間相互協(xié)作、相互補(bǔ)充,形成一個有機(jī)的整體,顯著提升了企業(yè)在垂直場景下的業(yè)務(wù)處理能力和效率,為企業(yè)的發(fā)展注入新的活力。
3.3“多模態(tài)+ 工作流升華”階段
目前為止,全參模型的意義僅限于更廣闊的知識面,對于專業(yè)性較強(qiáng)的企業(yè)意義并不明確。處理復(fù)雜問題時,通過綜合性較強(qiáng)的模型進(jìn)行拆解,再下發(fā)給多模態(tài)工作流,能更有條理地完成任務(wù)。在此階段更重要的是建立可靠的容災(zāi)機(jī)制與實(shí)現(xiàn)資源最優(yōu)調(diào)度。
4.人機(jī)協(xié)作范式重塑
4.1人機(jī)協(xié)作預(yù)適應(yīng)訓(xùn)練機(jī)制
在人機(jī)協(xié)作范式轉(zhuǎn)換前 3~6 個月建議對首輪參與轉(zhuǎn)換的崗位啟動系統(tǒng)性工作流分析,該過程構(gòu)成智能體組織適配的認(rèn)知基礎(chǔ)。通過專家評估選定一些崗位或工作流進(jìn)行解構(gòu):從任務(wù)觸發(fā)機(jī)制、執(zhí)行路徑到成果評估體系,建立全要素流程拓?fù)鋱D譜,揭示其核心特征參數(shù)與阻滯點(diǎn)。
基于流程拓?fù)涞哪K化拆解,采用DMAIC模型評估各子任務(wù)屬性:對于高創(chuàng)造性指數(shù)、高情感交互需求的任務(wù),保留人工決策權(quán);而具有強(qiáng)規(guī)律性、高重復(fù)頻次的任務(wù),則配置智能體代理。此決策框架有效實(shí)現(xiàn)人機(jī)比較優(yōu)勢的最優(yōu)配置。
4.2智能體質(zhì)量三元控制體系
設(shè)立具備雙重職能的智能體監(jiān)管崗位:其一對智能體行為與輸出結(jié)果進(jìn)行合規(guī)性審查,確保操作邊界有效約束;其二構(gòu)建異常響應(yīng)機(jī)制,模型決策異常時能夠及時修正錯誤或挽回?fù)p失。
質(zhì)量保障體系包含三級控制機(jī)制:
(1)實(shí)時監(jiān)控與動態(tài)修正系統(tǒng)?;诳刂茍D理論建立過程能力指數(shù)(Cpk)預(yù)警模型,當(dāng)智能體輸出偏離 ±3σ 控制限時觸發(fā)實(shí)時校正協(xié)議。
(2)案例深度解析與知識沉淀。運(yùn)用扎根理論對異常案例進(jìn)行三級編碼,構(gòu)建包含情境要素、行為模式、結(jié)果向量的SAR案例模型庫。
(3)多模態(tài)驗(yàn)證機(jī)制。針對關(guān)鍵決策節(jié)點(diǎn),構(gòu)建多智能體共識模型,設(shè)置信度閾值作為輸出準(zhǔn)繩。
4.3“智能體師徒制”
選拔具備卓越學(xué)習(xí)能力和深刻理解力的團(tuán)隊(duì),組建人工智能訓(xùn)練師團(tuán)隊(duì)。眾多業(yè)務(wù)能力卓越、經(jīng)驗(yàn)豐富的骨干,未必能將自身經(jīng)驗(yàn)轉(zhuǎn)化為人工智能可理解的形式,因此需要一個團(tuán)隊(duì)跟蹤考察各崗位的實(shí)際工作,辨析出作業(yè)指導(dǎo)書中未明確闡述的“隱性”工作內(nèi)容,再充當(dāng)人工智能與人類之間的“橋梁”,以便向智能體傳授實(shí)際業(yè)務(wù)知識與技能8
對于那些難以適應(yīng)新工作范式的員工,企業(yè)應(yīng)提供必要的過渡期支持。通過安排參與特定培訓(xùn)課程,協(xié)助他們逐步適應(yīng)人機(jī)協(xié)作的新工作模式,或者根據(jù)個人能力調(diào)整崗位,以從事更適合的工作,從而減少因不適應(yīng)而產(chǎn)生的工作壓力和焦慮情緒[9-11]。
在指導(dǎo)智能體的過程中,人工智能(AI)訓(xùn)練師會產(chǎn)生大量與智能體的交互記錄。通過整理和歸納這些記錄,可以形成高質(zhì)量的交互案例庫。該案例庫可以為智能體后續(xù)的學(xué)習(xí)和優(yōu)化提供豐富的素材,使其更有效地與人類協(xié)作,共同促進(jìn)企業(yè)業(yè)務(wù)的發(fā)展。
結(jié)語
目前,通用大模型在產(chǎn)業(yè)落地中面臨“經(jīng)驗(yàn)真空”困境,本文通過垂直領(lǐng)域知識圖譜的定向優(yōu)化、人機(jī)協(xié)作范式的制度重構(gòu),簡要論證了一種從技術(shù)能力到商業(yè)價值的轉(zhuǎn)化路徑。在未來的研究中,須重點(diǎn)關(guān)注多智能體工作流搭建在具體場景的落地與集團(tuán)或行業(yè)間的算力資源適配優(yōu)化。隨著服務(wù)于人工智能的新型算力架構(gòu)快速發(fā)展,如何將諸多高垂度專家模型與solidworks、deform、Altair等專業(yè)工具結(jié)合起來,以及在多智能體協(xié)同的效率與安全性中取得平衡,將成為企業(yè)人工智能應(yīng)用的下一個攻堅方向。
參考文獻(xiàn):
[1]臨江.人工智能賦能新型工業(yè)化痛點(diǎn)在哪里?[N].人民郵電,2024-11-21(4).
[2]孫小童,郭蘇敏.人工智能嵌入新型工業(yè)化進(jìn)程中的數(shù)據(jù)治理困局與因應(yīng)[].信息通信技術(shù)與政策,2024,50(12):7-12.
[3]黃鋅.人工智能大模型訓(xùn)練數(shù)據(jù)的風(fēng)險類型與法律規(guī)制[J].政法論叢,2025(1):23-37.
[4]李藝春,劉澤嬌,洪藝天,等.基于多 智能體強(qiáng)化學(xué)習(xí)的博弈綜述[].自動化學(xué) 報,2025(03):540-558.
[5]智振,李森.以工業(yè)大模型促進(jìn)制造業(yè)數(shù)實(shí)融合[].服務(wù)外包,2024,(12):60-66.
[6]惠寧,楊金璇,許瀟丹.論人工 智能對制造業(yè)新質(zhì)生產(chǎn)力影響的邏 輯機(jī)理[EB/OL].(2025-01-15)[2025- 03-04].https://kns.cnki.net/kcms2/article/ abstract?v=uQzRnDzoTXFJa1w1hMrw-sOlZF WYdjFX5lT4gRAqI6vmZOOanna1VZ5tHuZ 9hQW-teU5PMqh0Jw_zbgVYjqeSSQDO1- FYjCFDUa4ABoqSWuZufsXA6naGEe PudVbR-8JEyIJ2pAuheEnCyQ2HlflK_ w5W1PTsxLifbHksidqNvIWdb07_ z7Dy0iV9Z2B1b_vamp;uniplatform=NZKPTamp;langu age=CHS.
[7]韓哲哲.基于人工智能的高爐煉鐵冶金技術(shù)研究[J].冶金與材料,2024,44(11):62-64.
[8]李健斌,周浩.人工智能、資本-技能互補(bǔ)與企業(yè)全要素生產(chǎn)率[].經(jīng)濟(jì)評論,2025(1):20-36.
[9]陳澍,韓清,張伯超.企業(yè)人工智能技術(shù)水平與勞動力需求結(jié)構(gòu)變化:基于大語言模型的新方法和新發(fā)現(xiàn)[].技術(shù)經(jīng)濟(jì),2025,44(1):1-13.
[10]霍麗,王琦.人工智能驅(qū)動制造業(yè)新質(zhì)生產(chǎn)力價值創(chuàng)造研究[].山西師大學(xué)報(社會科學(xué)版),2025,52(1):34-44.
[11]胡晶晶,程承坪.新一代人工智 能對就業(yè)的影響及應(yīng)對策略[J].人文雜 志,2025(1):40-52.
作者簡介:魏威,本科,助理工程師,huiyehancui@foxmail.com,研究方向:軋鋼工藝、數(shù)字化轉(zhuǎn)型、人工智能。