摘要:文章提出并建立了一套完善的智能識(shí)別系統(tǒng)。此系統(tǒng)能夠根據(jù)海關(guān)查驗(yàn)指令及?;繁O(jiān)管要求,準(zhǔn)確、高效地對(duì)危險(xiǎn)化學(xué)品危險(xiǎn)公示標(biāo)簽的商品標(biāo)識(shí)、象形圖、信號(hào)詞、危險(xiǎn)說(shuō)明、防范說(shuō)明、供應(yīng)商標(biāo)識(shí)等信息進(jìn)行自動(dòng)識(shí)別并基于AI智能模型對(duì)關(guān)鍵信息的準(zhǔn)確性和邏輯性進(jìn)行智能驗(yàn)核,全面助力相關(guān)監(jiān)管工作的順利開(kāi)展,提升整體監(jiān)管效能與準(zhǔn)確性。整體架構(gòu)上,系統(tǒng)分為數(shù)據(jù)層、服務(wù)層、應(yīng)用層以及展示層等多個(gè)層級(jí)。各層級(jí)之間相互協(xié)作、數(shù)據(jù)流轉(zhuǎn)順暢,共同實(shí)現(xiàn)系統(tǒng)功能。該系統(tǒng)采用YOLOv8作為目標(biāo)檢測(cè)模型,與Qwen大語(yǔ)言模型相結(jié)合,根據(jù)結(jié)果設(shè)計(jì)針對(duì)性的識(shí)別程序,能夠更準(zhǔn)確地形成標(biāo)準(zhǔn)結(jié)構(gòu)化輸出結(jié)果。
關(guān)鍵詞:智能識(shí)別;標(biāo)簽檢測(cè);YOLOv8;識(shí)別系統(tǒng)
中圖分類(lèi)號(hào):TP183
文獻(xiàn)標(biāo)志碼:A
0 引言
隨著海關(guān)查驗(yàn)工作以及?;繁O(jiān)管需求的日益提升,化學(xué)品相關(guān)信息的精準(zhǔn)、智能識(shí)別變得愈發(fā)重要。傳統(tǒng)的人工識(shí)別方式效率低且易出錯(cuò),難以滿足當(dāng)下高效、準(zhǔn)確監(jiān)管的要求。在此背景下,本系統(tǒng)應(yīng)運(yùn)而生,旨在利用先進(jìn)的技術(shù)手段,為海關(guān)查驗(yàn)及危化品監(jiān)管提供有力的技術(shù)支持。
1 危險(xiǎn)化學(xué)品標(biāo)簽智能識(shí)別算法描述
1.1 YOLOv8概述
YOLOv8是一種單階段目標(biāo)檢測(cè)算法,廣泛應(yīng)用于工業(yè)發(fā)展的各個(gè)領(lǐng)域,顯著提高了檢測(cè)精度和速度,成為當(dāng)前最先進(jìn)的目標(biāo)檢測(cè)算法之一[1]。YOLOv8采用了精巧的網(wǎng)絡(luò)模塊設(shè)計(jì),優(yōu)化了主干網(wǎng)絡(luò),采用了更高效的卷積操作,結(jié)合了新的C2f特征提取模塊,增強(qiáng)了對(duì)多目標(biāo)和高密度場(chǎng)景的處理能力。YOLOv8在計(jì)算開(kāi)銷(xiāo)和推理速度方面進(jìn)行了優(yōu)化,在保持較高精度的同時(shí)實(shí)現(xiàn)實(shí)時(shí)檢測(cè)。這對(duì)于需要快速響應(yīng)的應(yīng)用場(chǎng)景至關(guān)重要。
1.2 Qwen 大語(yǔ)言模型概述
Qwen是由阿里巴巴集團(tuán)通義千問(wèn)團(tuán)隊(duì)研發(fā)的開(kāi)源大語(yǔ)言模型[2]。Qwen支持超過(guò)29種語(yǔ)言,能夠更精準(zhǔn)地執(zhí)行復(fù)雜命令,生成超過(guò)8K標(biāo)記的長(zhǎng)文本,擅長(zhǎng)處理結(jié)構(gòu)化數(shù)據(jù),如表格和JSON格式內(nèi)容。Qwen具有強(qiáng)大的自然語(yǔ)言處理能力,能夠有效理解和概括文本中的關(guān)鍵信息,適用于處理圖像識(shí)別系統(tǒng)提取的文字信息、象形圖分類(lèi)以及公章文字識(shí)別等任務(wù)。
1.3 本文智能識(shí)別算法
本文的智能識(shí)別算法包含2個(gè)關(guān)鍵模型:危險(xiǎn)公示標(biāo)簽的智能識(shí)別模型和智能審核模型。
危險(xiǎn)公示標(biāo)簽的智能識(shí)別模型的主要任務(wù)是自動(dòng)從危險(xiǎn)公示標(biāo)簽圖像中提取關(guān)鍵信息,如商品標(biāo)識(shí)、信號(hào)詞、象形圖、危險(xiǎn)說(shuō)明等。為此,本文采用深度學(xué)習(xí)技術(shù)構(gòu)建模型,使用YOLOv8目標(biāo)檢測(cè)模型對(duì)表單字段進(jìn)行定位,隨后利用PP-OCR系列模型識(shí)別印刷體文字并進(jìn)行關(guān)鍵信息抽取,利用預(yù)訓(xùn)練的SAM語(yǔ)義分割模型進(jìn)行圖像分割任務(wù)[3],提取公章圖像及相關(guān)細(xì)節(jié)。通過(guò)這3種技術(shù),該智能識(shí)別算法能夠整合識(shí)別結(jié)果,生成結(jié)構(gòu)化的輸出數(shù)據(jù),為后續(xù)的智能審核提供有力支持。
智能審核模型的主要任務(wù)是基于提取的危險(xiǎn)公示標(biāo)簽關(guān)鍵信息進(jìn)行智能審核并給出審核結(jié)果和風(fēng)險(xiǎn)提示。為此,本文選用Qwen大語(yǔ)言模型,該模型具有強(qiáng)大的自然語(yǔ)言處理能力,能夠理解和概括文本中的關(guān)鍵信息,用于處理圖像識(shí)別系統(tǒng)提取的文字信息、象形圖分類(lèi)和公章文字信息。具體而言,首先,根據(jù)海關(guān)業(yè)務(wù)需求和法律法規(guī),構(gòu)建包含各類(lèi)規(guī)則和判斷邏輯的知識(shí)庫(kù)作為模型的基礎(chǔ)。其次,利用監(jiān)督學(xué)習(xí)方法對(duì)規(guī)則進(jìn)行補(bǔ)充和優(yōu)化[4]。再次,將輸入單據(jù)類(lèi)型、概括后的關(guān)鍵信息與知識(shí)庫(kù)中的規(guī)則進(jìn)行匹配,判斷信息是否符合規(guī)則要求。最后,Qwen大語(yǔ)言模型使用自然語(yǔ)言輸出結(jié)果,根據(jù)結(jié)果設(shè)計(jì)針對(duì)性的識(shí)別程序,形成標(biāo)準(zhǔn)結(jié)構(gòu)化輸出結(jié)果,返回業(yè)務(wù)系統(tǒng)。模型結(jié)構(gòu)如圖1所示。
2 危險(xiǎn)化學(xué)品標(biāo)簽智能識(shí)別架構(gòu)設(shè)計(jì)
本項(xiàng)目的整體設(shè)計(jì)方案旨在構(gòu)建一個(gè)高效、智能且安全可靠的危化品信息識(shí)別與管理系統(tǒng),以滿足海關(guān)查驗(yàn)指令及危化品監(jiān)管要求。整體架構(gòu)上,系統(tǒng)將分為數(shù)據(jù)層、服務(wù)層、應(yīng)用層以及展示層等多個(gè)層級(jí)。各層級(jí)之間相互協(xié)作,共同實(shí)現(xiàn)系統(tǒng)功能。
(1)系統(tǒng)底層由服務(wù)器、網(wǎng)絡(luò)、GPU集群及云平臺(tái)相關(guān)操作系統(tǒng)支撐,相關(guān)應(yīng)用部署在該環(huán)境中。
(2)基礎(chǔ)層提供了OCR識(shí)別、NLP自然語(yǔ)言處理、LLM大模型、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等智能識(shí)別和自動(dòng)審核所需的支撐技術(shù)能力組件。
(3)存儲(chǔ)層存儲(chǔ)了業(yè)務(wù)所需的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),同時(shí)存儲(chǔ)了抽取數(shù)據(jù)模型、標(biāo)注數(shù)據(jù)、訓(xùn)練模型數(shù)據(jù)以及系統(tǒng)運(yùn)行的數(shù)據(jù)。數(shù)據(jù)存儲(chǔ)采用關(guān)系型數(shù)據(jù)庫(kù)和分布式文件存儲(chǔ)服務(wù)。
(4)數(shù)據(jù)與圖譜構(gòu)建層將系統(tǒng)中的原態(tài)數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換,根據(jù)知識(shí)模型識(shí)別數(shù)據(jù)類(lèi)別形成主題庫(kù)。通過(guò)知識(shí)識(shí)別、知識(shí)標(biāo)識(shí)、知識(shí)融合、知識(shí)關(guān)聯(lián)、知識(shí)集成技術(shù),從數(shù)據(jù)中提取知識(shí)最終形成知識(shí)圖譜,使用大預(yù)言模型為上層應(yīng)用及服務(wù)層提供數(shù)據(jù)支撐。
(5)應(yīng)用層為業(yè)務(wù)應(yīng)用平臺(tái)提供服務(wù)和中間件支持。建設(shè)各類(lèi)邏輯服務(wù)中間件,如智能識(shí)別、語(yǔ)義搜索、智能推薦、輔助決策、圖譜可視化及配置服務(wù)等。應(yīng)用層是各項(xiàng)功能業(yè)務(wù)應(yīng)用功能正常開(kāi)展的基本單元。
(6)用戶。本系統(tǒng)服務(wù)的用戶為海關(guān)內(nèi)部用戶。用戶使用移動(dòng)App端查驗(yàn)顯示進(jìn)行危險(xiǎn)公示標(biāo)簽的智能識(shí)別和自動(dòng)驗(yàn)核服務(wù),在內(nèi)網(wǎng)管理端進(jìn)行數(shù)據(jù)的管理和查詢(xún)服務(wù)。
3 AI模型算法開(kāi)發(fā)設(shè)計(jì)
3.1 圖像識(shí)別技術(shù)路徑
通過(guò)OCR、目標(biāo)檢測(cè)(YOLOv8)和圖像分割(SAM模型)技術(shù),實(shí)現(xiàn)對(duì)危險(xiǎn)公示標(biāo)簽中的文字、象形圖及其內(nèi)部文字的全面識(shí)別。具體路徑如下。
3.1.1 數(shù)據(jù)準(zhǔn)備與預(yù)處理
數(shù)據(jù)收集:收集各類(lèi)危險(xiǎn)公示標(biāo)簽件,包括進(jìn)出口各類(lèi)企業(yè)的文件。
數(shù)據(jù)標(biāo)注:對(duì)掃描件中的印刷體文字、象形圖及其內(nèi)部文字進(jìn)行標(biāo)注,生成訓(xùn)練所需的數(shù)據(jù)集。
數(shù)據(jù)預(yù)處理:對(duì)掃描件進(jìn)行圖像增強(qiáng)、去噪、二值化等預(yù)處理操作,提高識(shí)別準(zhǔn)確率。
3.1.2 模型選擇與訓(xùn)練
本文選用YOLOv8模型進(jìn)行目標(biāo)檢測(cè),使用標(biāo)注好的象形圖數(shù)據(jù)集訓(xùn)練YOLOv8模型,使其能夠準(zhǔn)確檢測(cè)出圖像中的特定目標(biāo)。使用SAM進(jìn)行語(yǔ)義圖像分割并根據(jù)標(biāo)簽對(duì)分割后的圖像進(jìn)行歸類(lèi),調(diào)用象形圖模型進(jìn)行識(shí)別處理。
3.1.3 結(jié)果整合與輸出
將印刷體文字、象形圖位置及其內(nèi)部文字等識(shí)別結(jié)果進(jìn)行整合,生成結(jié)構(gòu)化的輸出數(shù)據(jù)。輸出數(shù)據(jù)可用于后續(xù)的審核服務(wù)。
3.2 內(nèi)容審核技術(shù)路徑
3.2.1 關(guān)鍵信息概括
Qwen大語(yǔ)言模型具有強(qiáng)大的自然語(yǔ)言處理能力,能夠理解和概括文本中的關(guān)鍵信息。該模型用于處理圖像識(shí)別系統(tǒng)識(shí)別出的文字信息、象形圖分類(lèi)和公章文字信息。
3.2.2 規(guī)則判斷與提示詞
(1)知識(shí)庫(kù)構(gòu)建。
根據(jù)海關(guān)業(yè)務(wù)需求和法律法規(guī),構(gòu)建包含各類(lèi)規(guī)則和判斷邏輯的知識(shí)庫(kù)。規(guī)則邏輯可以用自然語(yǔ)言描述。規(guī)則匹配:將輸入單據(jù)類(lèi)型、概括后的關(guān)鍵信息與知識(shí)庫(kù)中的規(guī)則進(jìn)行匹配,判斷信息是否符合規(guī)則要求。
(2)提示詞。
設(shè)計(jì)相應(yīng)的提示詞,用于指示模型進(jìn)行規(guī)則判斷處理。
3.2.3 結(jié)果輸出
大語(yǔ)言模型使用自然語(yǔ)言輸出結(jié)果。根據(jù)結(jié)果設(shè)計(jì)針對(duì)性的識(shí)別程序,形成標(biāo)準(zhǔn)結(jié)構(gòu)化輸出結(jié)果,返回業(yè)務(wù)系統(tǒng)。
3.3 ?;窐?biāo)簽識(shí)別模型的構(gòu)建
3.3.1 ?;窐?biāo)簽要素識(shí)別分割模型算法訓(xùn)練開(kāi)發(fā)
該模型主要對(duì)?;窐?biāo)簽上的各個(gè)要素進(jìn)行精確識(shí)別和分割,利用深度學(xué)習(xí)中的圖像分割技術(shù),對(duì)標(biāo)簽圖像中的每個(gè)要素進(jìn)行邊界檢測(cè)和區(qū)域劃分。通過(guò)訓(xùn)練算法,模型能夠?qū)W習(xí)到這些要素的特征和分布規(guī)律,從而在測(cè)試階段對(duì)新的標(biāo)簽圖像進(jìn)行自動(dòng)分割和標(biāo)注。
(1)標(biāo)注工作。
依據(jù)?;冯S附單據(jù)樣本數(shù)據(jù),將PDF格式按頁(yè)轉(zhuǎn)換成圖片格式,對(duì)圖片格式的安全公示標(biāo)簽使用labelStudio進(jìn)行標(biāo)注,形成訓(xùn)練數(shù)據(jù)集。
(2)訓(xùn)練安全公示標(biāo)簽圖片分割模型。
使用標(biāo)注數(shù)據(jù),進(jìn)行YOLOv8模型的訓(xùn)練。使用AI算力服務(wù)器訓(xùn)練,Epoch迭代100次,生成訓(xùn)練后模型best.pt、last.pt。
(3)安全公示標(biāo)簽?zāi)P万?yàn)證識(shí)別。
將現(xiàn)場(chǎng)采集的危險(xiǎn)公示標(biāo)簽提交進(jìn)行智能識(shí)別,將產(chǎn)品標(biāo)識(shí)、象形圖[5]、危險(xiǎn)說(shuō)明、防范說(shuō)明、供應(yīng)商標(biāo)識(shí)等不同部分的信息分別在不同區(qū)域以合適的格式(文字、圖片等)呈現(xiàn),方便使用者一目了然地查看各項(xiàng)關(guān)鍵內(nèi)容。
3.3.2 ?;窐?biāo)簽各要素圖片OCR識(shí)別模型算法
該模型的主要功能是對(duì)?;窐?biāo)簽上的文本信息進(jìn)行光學(xué)字符識(shí)別(Optical Character Recognition,OCR)。它利用深度學(xué)習(xí)中的OCR技術(shù),對(duì)分割出的文本圖像進(jìn)行字符識(shí)別和文本提取。通過(guò)訓(xùn)練算法,模型能夠?qū)W習(xí)到文本圖像中字符的布局、大小、字體等特征,從而實(shí)現(xiàn)對(duì)文本信息的準(zhǔn)確識(shí)別[5]。該模型對(duì)于提取標(biāo)簽上的化學(xué)品名稱(chēng)、編號(hào)、警告語(yǔ)等關(guān)鍵文本信息具有重要意義。
4 危險(xiǎn)化學(xué)品標(biāo)簽智能識(shí)別系統(tǒng)業(yè)務(wù)流程
危險(xiǎn)化學(xué)品標(biāo)簽智能識(shí)別系統(tǒng)的業(yè)務(wù)流程涵蓋數(shù)據(jù)采集、預(yù)處理、特征提取、分類(lèi)、品類(lèi)確認(rèn)、智能驗(yàn)核及智慧展示等關(guān)鍵環(huán)節(jié)。該系統(tǒng)通過(guò)集成多種技術(shù)手段,確保?;窐?biāo)簽信息的準(zhǔn)確識(shí)別和高效處理。
4.1 數(shù)據(jù)采集流程
工作人員根據(jù)現(xiàn)場(chǎng)需求選擇合適的移動(dòng)終端設(shè)備的攝像頭或掃描功能,進(jìn)行危險(xiǎn)化學(xué)品標(biāo)簽的拍攝或掃描操作,以獲取標(biāo)簽圖像及其相關(guān)的文字信息。
4.2 數(shù)據(jù)預(yù)處理流程
預(yù)處理模塊首先進(jìn)行數(shù)據(jù)格式的校驗(yàn)和清洗,去除圖像中的噪聲及干擾信息,對(duì)其中的文字信息進(jìn)行編碼轉(zhuǎn)換、錯(cuò)誤糾正等操作,確保數(shù)據(jù)質(zhì)量得到優(yōu)化,根據(jù)預(yù)設(shè)規(guī)則對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
4.3 特征提取流程
系統(tǒng)采用文字識(shí)別模型和圖像識(shí)別模型對(duì)預(yù)處理后的數(shù)據(jù)進(jìn)行深度分析。針對(duì)危化品標(biāo)簽上的關(guān)鍵元素,系統(tǒng)精準(zhǔn)提取出具有決定性影響的文字和圖標(biāo)特征。隨后,系統(tǒng)依據(jù)業(yè)務(wù)邏輯對(duì)這些特征進(jìn)行分類(lèi)并建立嚴(yán)謹(jǐn)?shù)年P(guān)鍵詞對(duì)應(yīng)關(guān)系,形成特征集合。
4.4 特征分類(lèi)流程
系統(tǒng)將依據(jù)提取的特征集合,結(jié)合特征的位置信息及預(yù)設(shè)的內(nèi)容關(guān)鍵詞等多維度因素,自動(dòng)進(jìn)行初步的特征分類(lèi)。分類(lèi)結(jié)果完成后,現(xiàn)場(chǎng)工作人員將進(jìn)行人工確認(rèn)。
4.5 確認(rèn)品類(lèi)流程
系統(tǒng)依據(jù)特征分類(lèi)的結(jié)果提取相應(yīng)的產(chǎn)品標(biāo)識(shí)信息并與業(yè)務(wù)數(shù)據(jù)庫(kù)中的范本信息進(jìn)行比對(duì)。通過(guò)匹配產(chǎn)品名稱(chēng)、CAS號(hào)等關(guān)鍵指標(biāo),系統(tǒng)能夠準(zhǔn)確確認(rèn)?;返钠奉?lèi)。
4.6 智能驗(yàn)核流程
系統(tǒng)從數(shù)據(jù)庫(kù)中提取該品類(lèi)對(duì)應(yīng)的范本信息,將其與前述特征提取和分類(lèi)后的信息進(jìn)行結(jié)合,利用智能算法進(jìn)行智慧識(shí)別和智能判定。系統(tǒng)全面分析?;废嚓P(guān)信息的準(zhǔn)確性和邏輯性,判斷信息是否符合要求并最終得出精準(zhǔn)的識(shí)別結(jié)果。該結(jié)果將被反饋至展示層。
4.7 智慧展示流程
當(dāng)系統(tǒng)通過(guò)智能識(shí)別確認(rèn)品類(lèi)時(shí),展示層將清晰分區(qū)顯示各類(lèi)信息。同時(shí),數(shù)據(jù)庫(kù)支持持續(xù)錄入新的范本信息,工作人員可以根據(jù)實(shí)際情況反饋、調(diào)整和修改系統(tǒng)的匹配標(biāo)準(zhǔn),以不斷完善數(shù)據(jù)庫(kù),確保展示的信息更加貼合實(shí)際應(yīng)用場(chǎng)景。通過(guò)上述流程的緊密銜接和高效協(xié)作,危險(xiǎn)化學(xué)品標(biāo)簽智能識(shí)別系統(tǒng)能夠提供精準(zhǔn)、智能、實(shí)時(shí)的識(shí)別和判斷,支持?;繁O(jiān)管和海關(guān)查驗(yàn)等任務(wù)的高效開(kāi)展。
5 結(jié)語(yǔ)
本研究通過(guò)綜合應(yīng)用YOLOv8目標(biāo)檢測(cè)模型和Qwen大語(yǔ)言模型,實(shí)現(xiàn)了對(duì)危險(xiǎn)化學(xué)品標(biāo)簽的自動(dòng)識(shí)別與核查,極大地提升了?;繁O(jiān)管的效率與準(zhǔn)確性。系統(tǒng)從數(shù)據(jù)采集、預(yù)處理到智能識(shí)別,再到結(jié)果展示,構(gòu)建了一個(gè)多層級(jí)的架構(gòu),確保了數(shù)據(jù)流轉(zhuǎn)的高效性和各環(huán)節(jié)的有序協(xié)作。通過(guò)移動(dòng)終端設(shè)備采集標(biāo)簽信息,系統(tǒng)能夠迅速處理并核對(duì)關(guān)鍵數(shù)據(jù),如商品標(biāo)識(shí)、象形圖、信號(hào)詞等,有效減少了人工干預(yù)與判斷錯(cuò)誤,確保了危險(xiǎn)化學(xué)品的準(zhǔn)確分類(lèi)與合規(guī)性驗(yàn)證。本研究不僅提升了海關(guān)查驗(yàn)與?;繁O(jiān)管的工作效率,還在風(fēng)險(xiǎn)防控和安全監(jiān)管上發(fā)揮了重要作用。
參考文獻(xiàn)
[1]曹斯茹,金可藝,陳惠妹.基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法研究[J].中國(guó)新技術(shù)新產(chǎn)品,2025(1):1-3.
[2]李佳沂,黃瑞章,陳艷平,等.結(jié)合提示學(xué)習(xí)和Qwen大語(yǔ)言模型的裁判文書(shū)摘要方法[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2024(12):2007-2018.
[3]王淼,黃智忠,何暉光,等.分割一切模型SAM的潛力與展望:綜述[J].中國(guó)圖象圖形學(xué)報(bào),2024(6):1479-1509.
[4]王思穎.基于深度強(qiáng)化學(xué)習(xí)的多智能體協(xié)同算法關(guān)鍵技術(shù)研究[D].成都:電子科技大學(xué),2023.
[5]盧健,車(chē)禮東,郭兵,等.危險(xiǎn)化學(xué)品安全標(biāo)簽國(guó)家標(biāo)準(zhǔn)與GHS制度要求的比對(duì)與分析[J].標(biāo)準(zhǔn)科學(xué),2021(5):78-83.
[6]陳麗,任穎.基于OCR識(shí)別的民生檔案數(shù)字化管理研究[J].中國(guó)信息界,2024(3):6-8.
(編輯 王雪芬)
Research on intelligent recognition of hazardous public labeling based on YOLOv8 and large language model
LYU Jian1, LIU Yanghong2,3*, ZHU Jinlian1, ZHANG Yu1
(1.Nanjing Customs of the People’s Republic of China, Nanjing 210001, China;
2.School of Railway Intelligent Engineering, Dalian Jiaotong University, Dalian 116028, China;
3.Dalian Rolling Stock Co., Dalian 116045, China)
Abstract:A perfect intelligent identification system is proposed and established, which can accurately and efficiently automatically identify the commodity identification, pictogram, signal word, hazard description, precautionary description, supplier identification and other information of the hazardous publicity label of hazardous chemicals in accordance with the customs inspection instructions and the regulatory requirements of hazardous chemicals, and intelligently verify the accuracy and logic of the key information based on the AI intelligent model, which comprehensively helps the related regulatory work smoothly and improve the overall efficiency and accuracy. The system will comprehensively help the smooth development of related regulatory work and improve the overall regulatory efficiency and accuracy. On the overall architecture, the system will be divided into data layer, service layer, application layer and display layer, etc., and each layer will collaborate with each other and smooth data flow to realize the system functions together. The system adopts YOLOv8 as the target detection model, combines with Qwen big language model, designs targeted recognition program according to the results, and can form standard structured output results more accurately.
Key words:intelligent recognition; label detection; YOLOv8; recognition system