摘要:文章提出了一種基于智能文檔處理(IDP)技術(shù)的試驗數(shù)據(jù)自動采集與處理方法,涵蓋數(shù)據(jù)采集、圖像預(yù)處理、IDP識別和數(shù)據(jù)校驗等模塊。針對當(dāng)前電力PMS系統(tǒng)試驗數(shù)據(jù)錄入效率低、易出錯的問題,設(shè)計了一套包含數(shù)據(jù)采集、圖像預(yù)處理、IDP識別及數(shù)據(jù)校驗與錄入功能的智能處理系統(tǒng)。該系統(tǒng)采用高分辨率掃描設(shè)備進(jìn)行數(shù)據(jù)采集,通過去噪、二值化等圖像預(yù)處理提升識別質(zhì)量,利用IDP技術(shù)中的光學(xué)字符識別和自然語言處理技術(shù),結(jié)合卷積神經(jīng)網(wǎng)絡(luò)模型提高文字識別準(zhǔn)確率,并通過數(shù)據(jù)校驗確保錄入完整性。實驗結(jié)果表明,該系統(tǒng)可將每份試驗報告的錄入時間從21分鐘縮短至5分鐘,準(zhǔn)確率達(dá)到98%以上,顯著提升數(shù)據(jù)處理效率,同時降低人工成本及錯誤率。研究成果對推動電力企業(yè)數(shù)字化轉(zhuǎn)型具有重要意義。
關(guān)鍵詞:智能文檔處理;手寫識別;電力系統(tǒng);自動化錄入;效率提升
中圖分類號:TP274文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2025)15-0082-05
0引言
電力公司的數(shù)據(jù)管理對于保障系統(tǒng)穩(wěn)定、優(yōu)化資源配置、提升服務(wù)質(zhì)量等方面具有重要意義,但當(dāng)前數(shù)據(jù)管理面臨數(shù)據(jù)質(zhì)量參差不齊、數(shù)據(jù)量大且多樣、實時性要求高等挑戰(zhàn)。在現(xiàn)有電氣試驗工作中,每項試驗完成后,試驗人員需從試驗儀器上判斷數(shù)據(jù)并手動記錄到記錄本;工作結(jié)束后,須在14天內(nèi)將試驗報告及時錄入PMS3.0系統(tǒng)。由于工作環(huán)境和試驗儀器老舊,現(xiàn)階段只能采用人工填寫,但該方式存在以下問題:①試驗數(shù)據(jù)錄入PMS3.0系統(tǒng)效率低下,容易延誤和遺漏;②操作及錄入數(shù)據(jù)的技術(shù)人員水平參差,易出錯;③數(shù)據(jù)共享困難,難以支持快速調(diào)用和分析決策[1]。針對這些問題,國內(nèi)企業(yè)已采用IDP技術(shù),結(jié)合光學(xué)字符識別(OCR)、自然語言處理(NLP)及深度學(xué)習(xí)算法,在多個領(lǐng)域取得應(yīng)用成果[2]。在電力領(lǐng)域,IDP技術(shù)可自動提取設(shè)備型號、參數(shù)、維護(hù)記錄等信息,輔助運維人員快速掌握設(shè)備狀況并制定維護(hù)計劃,提高設(shè)備運維效率。同樣,在電力營銷業(yè)務(wù)、電網(wǎng)規(guī)劃建設(shè)、電力項目審批等場景中,IDP技術(shù)展現(xiàn)出巨大應(yīng)用潛力?;诖耍驹O(shè)計借鑒IDP技術(shù),結(jié)合具體業(yè)務(wù)場景,設(shè)計了一種自動識別與錄入試驗數(shù)據(jù)的方法,以提升數(shù)據(jù)處理效率和準(zhǔn)確性,減少人力資源消耗,推動電力企業(yè)數(shù)字化轉(zhuǎn)型[3-4]。
1系統(tǒng)架構(gòu)
本系統(tǒng)采用模塊化設(shè)計,主要包括以下四個功能模塊:數(shù)據(jù)采集模塊、圖像預(yù)處理模塊、IDP識別模塊、數(shù)據(jù)校驗與錄入模塊。其中,數(shù)據(jù)采集模塊負(fù)責(zé)使用高分辨率掃描設(shè)備對試驗表格進(jìn)行掃描,獲取數(shù)字圖像;圖像預(yù)處理模塊對掃描圖像進(jìn)行去噪、二值化、傾斜校正等處理,以提高后續(xù)識別準(zhǔn)確率;IDP識別模塊采用深度學(xué)習(xí)算法對預(yù)處理圖像進(jìn)行字符識別,提取試驗數(shù)據(jù);數(shù)據(jù)校驗與錄入模塊對識別結(jié)果進(jìn)行智能校驗,自動錄入至PMS3.0系統(tǒng)。
整體系統(tǒng)架構(gòu)如圖1所示。
3軟件設(shè)計
軟件設(shè)計部分借鑒了當(dāng)前IDP和RPA技術(shù)的優(yōu)勢,其中智能文檔處理(IDP)融合了人工智能與機(jī)器學(xué)習(xí)技術(shù),能夠從各類文檔中提取、分類和處理信息,將結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化格式,便于分析[8-10]。機(jī)器人流程自動化(RPA)則通過軟件機(jī)器人模擬人類電腦操作,自動執(zhí)行重復(fù)性任務(wù),提高效率、減少錯誤,釋放人力從事更有價值的工作[11]。
將IDP和RPA技術(shù)結(jié)合,能夠?qū)崿F(xiàn)端到端的自動化,提升數(shù)據(jù)質(zhì)量與工作效率。在試驗數(shù)據(jù)自動采集識別智能錄入系統(tǒng)中,IDP負(fù)責(zé)從試驗報告、原始記錄等文檔中精準(zhǔn)提取數(shù)據(jù),RPA則按照既定規(guī)則,將IDP提取的數(shù)據(jù)自動錄入系統(tǒng)指定位置。二者協(xié)同,優(yōu)化整個數(shù)據(jù)采集與錄入流程。
基于當(dāng)前試驗數(shù)據(jù)類型,需錄入系統(tǒng)的數(shù)據(jù)種類包括:220kV變壓器例行試驗記錄、110kV變壓器例行試驗記錄(兩圈變)、110kV變壓器例行試驗記錄(三圈變)、220kV側(cè)主進(jìn)間隔例行試驗記錄、110kV側(cè)主進(jìn)間隔例行試驗記錄、110kV側(cè)主進(jìn)間隔例行試驗記錄(兩圈)、110kV側(cè)主進(jìn)間隔例行試驗記錄(三圈)、220kVPT間隔例行試驗記錄、110kVPT間隔例行試驗記錄、220kV間隔例行試驗記錄、110kV間隔例行試驗記錄。針對每種數(shù)據(jù)類型,識別完成后,根據(jù)各字段名稱及PMS系統(tǒng)數(shù)據(jù)錄入要求,完成相應(yīng)的軟件設(shè)計開發(fā)。
3.1軟件流程架構(gòu)
整個系統(tǒng)工作流程分為五個階段:初始化階段:啟動試驗數(shù)據(jù)自動錄入系統(tǒng),對硬件設(shè)備進(jìn)行檢測,確保數(shù)據(jù)采集設(shè)備正常連接且通信順暢,加載采集參數(shù)和錄入配置任務(wù);
數(shù)據(jù)采集階段:采集設(shè)備根據(jù)參數(shù)采集數(shù)據(jù)并返回系統(tǒng),采集的數(shù)據(jù)經(jīng)初步校驗進(jìn)入數(shù)據(jù)處理層;
數(shù)據(jù)處理階段:對采集的數(shù)據(jù),尤其是圖像數(shù)據(jù)進(jìn)行降噪、二值化、傾斜校正等處理,然后進(jìn)行精準(zhǔn)OCR字符識別,提取精確試驗數(shù)據(jù)并整理存檔[12-15];
數(shù)據(jù)錄入階段:根據(jù)錄入任務(wù)配置信息,數(shù)據(jù)錄入模塊將處理識別的數(shù)據(jù)按PMS系統(tǒng)要求自動逐條錄入,并在完成后自動返回錄入結(jié)果;
數(shù)據(jù)校驗階段:為避免錄入錯誤,根據(jù)自動記錄的操作日志,對錄入數(shù)據(jù)進(jìn)行自動校驗。
整體系統(tǒng)工作流程如圖2所示:
3.2數(shù)據(jù)識別自動錄入模塊
通過對試驗數(shù)據(jù)采集并經(jīng)過圖像預(yù)處理后,需要通過IDP對試驗數(shù)據(jù)進(jìn)行自動化分類整理和寫入文檔,然后根據(jù)PMS系統(tǒng)要求逐項進(jìn)行自動化錄入[10-11]。
3.2.1數(shù)據(jù)查找
該模塊首先根據(jù)多張圖像,查找需錄入系統(tǒng)的各種類型數(shù)據(jù),確定并鎖定相應(yīng)數(shù)據(jù)字段的起始位置、結(jié)束位置、字段內(nèi)容、大標(biāo)題名稱、小標(biāo)題名稱以及列名稱。該功能的軟件實現(xiàn)偽代碼如下:
//主函數(shù),處理掃描的試驗報告圖片
FunctionProcessScannedReport(image)
//步驟1:使用IDPOCR識別圖片文字
recognizedText=IDPOCR(image)
//步驟2:查找數(shù)據(jù)字段信息
dataFieldInfo=FindDataFieldInfo(recognized?Text)
//步驟3:查找標(biāo)題信息
headingInfo=FindHeadingInfo(recognizedText)
//步驟4:查找列名稱信息
columnNameInfo=FindColumnNameInfo(recog?nizedText)
ReturndataFieldInfo,headingInfo,columnNameI?nfo
EndFunction
//函數(shù):使用IDPOCR識別圖片文字
FunctionIDPOCR(image)
EndFunction
//函數(shù):查找數(shù)據(jù)字段信息
FunctionFindDataFieldInfo(text)
EndFunction
//函數(shù):查找標(biāo)題信息
FunctionFindHeadingInfo(text)
//模擬查找大標(biāo)題和小標(biāo)題的邏輯
FunctionSearchBigHeadings(text)
FunctionSearchSmallHeadings(text)
EndFunction
//函數(shù):查找列名稱信息
FunctionFindColumnNameInfo(text)
//模擬查找列名稱的邏輯
EndFunction
各關(guān)鍵函數(shù)說明如下:
ProcessScannedReport函數(shù):作為整個流程的主函數(shù),接收掃描后的試驗報告圖片作為輸入,依次調(diào)用IDPOCR函數(shù)進(jìn)行文字識別,然后分別調(diào)用Find?DataFieldInfo、FindHeadingInfo和FindColumnNameInfo函數(shù)查找數(shù)據(jù)字段、標(biāo)題及列名稱的相關(guān)信息,最終返回這些信息。
IDPOCR函數(shù):調(diào)用IDPOCR引擎對輸入圖片進(jìn)行文字識別,并返回識別結(jié)果。
FindDataFieldInfo函數(shù):根據(jù)識別文本,依據(jù)不同數(shù)據(jù)類型規(guī)則(如日期、數(shù)字等)查找數(shù)據(jù)字段相關(guān)信息,包括起始位置、結(jié)束位置及內(nèi)容,將信息存儲于數(shù)組并返回。
FindHeadingInfo函數(shù):分別調(diào)用SearchBigHead?ings和SearchSmallHeadings函數(shù)以查找大標(biāo)題和小標(biāo)題,將結(jié)果存儲于包含big和small兩個數(shù)組的對象中返回。
名稱相關(guān)信息FindColumnNameInfo,將結(jié)果存儲于數(shù)組并返回函數(shù):根據(jù)識別文本查找列。
此外,還需若干輔助函數(shù)實現(xiàn)具體操作邏輯。
整體流程圖如圖3所示:
3.2.2數(shù)據(jù)提取
根據(jù)不同試驗報告內(nèi)容自動提取文字并生成文件,該功能的軟件實現(xiàn)偽代碼如下所示:
保存文件//主函數(shù),在查找到數(shù)據(jù)字段后進(jìn)行數(shù)據(jù)提取并
FunctionExtractAndSaveData(dataResult)
//步驟1:提取數(shù)據(jù)
extractedData=ExtractDataFromResult(dataRe?
sult)
//步驟2:生成文件內(nèi)容
fileContent=GenerateFileContent(extractedData)
//步驟3:保存文件
SaveFile(fileContent)
Return\"數(shù)據(jù)提取并保存成功\"
EndFunction
//從查找結(jié)果中提取數(shù)據(jù)的函數(shù)
FunctionExtractDataFromResult//提取數(shù)據(jù)字段內(nèi)容(dataResult)
//提取大標(biāo)題內(nèi)容
//提取小標(biāo)題內(nèi)容
//提取列名稱內(nèi)容
EndFunction
//生成文件內(nèi)容的函數(shù)
FunctionGenerateFileContent(extractedData)
EndFunction
//保存文件的函數(shù)
FunctionSaveFile(fileContent)
EndFunction
//保存文件到指定路徑的函數(shù)
FunctionSaveToFile(filePath,content)
EndFunction
各關(guān)鍵函數(shù)說明如下:
ExtractAndSaveData函數(shù):主函數(shù),接收上一步查找并鎖定的數(shù)據(jù)字段結(jié)果dataResult作為輸入。依次調(diào)用ExtractDataFromResult函數(shù)提取數(shù)據(jù),Generate?FileContent函數(shù)生成文件內(nèi)容,SaveFile函數(shù)將內(nèi)容保存為文件,最后返回操作成功提示。
ExtractDataFromResult函數(shù):從dataResult中提取各類數(shù)據(jù)內(nèi)容,包括數(shù)據(jù)字段、大標(biāo)題、小標(biāo)題和列名稱,將內(nèi)容存儲在對象extractedData中并返回。
GenerateFileContent函數(shù):根據(jù)提取的數(shù)據(jù)生成文件內(nèi)容,將各類數(shù)據(jù)內(nèi)容按一定格式拼接成字符串file?Content,各部分間以換行符分隔,最后返回該字符串。SaveFile函數(shù):指定文件保存路徑filePath,調(diào)用SaveToFile函數(shù)將生成的文件內(nèi)容保存到指定路徑的文件中,最后返回文件保存成功提示信息。
SaveToFile函數(shù):將內(nèi)容保存到指定文件。
整體流程圖如圖4所示:
3.2.3數(shù)據(jù)錄入
在各類試驗數(shù)據(jù)報告數(shù)據(jù)收集完成并自動生成數(shù)據(jù)文件后,自動錄入階段啟動自動錄入程序。系統(tǒng)根據(jù)PMS系統(tǒng)實際數(shù)據(jù)位置和格式,自動讀取之前生成的數(shù)據(jù)文件并逐步完成錄入。該階段實現(xiàn)全自動化錄入,無需人工干預(yù)。該部分功能軟件實現(xiàn)偽代碼如下所示:
//主函數(shù):啟動自動錄入程序
FunctionStartAutoInputProcess()
//步驟1:讀取保存的數(shù)據(jù)文件
//步驟2:連接到PMS系統(tǒng)
//步驟3:按照PMS系統(tǒng)格式錄入數(shù)據(jù)
//步驟4:關(guān)閉PMS系統(tǒng)連接
EndFunction
//讀取保存的數(shù)據(jù)文件的函數(shù)
FunctionReadDataFile()
EndFunction
//連接到PMS系統(tǒng)的函數(shù)
FunctionConnectToPMS()
EndFunction
//按照PMS系統(tǒng)格式錄入數(shù)據(jù)的函數(shù)
FunctionInputDataToPMS(pmsConnection,data)
EndFunction
//關(guān)閉PMS系統(tǒng)連接的函數(shù)
FunctionClosePMSConnection(pmsConnection)
EndFunction
//從文件讀取數(shù)據(jù)的函數(shù)
FunctionReadFromFile(filePath)
EndFunction
//建立PMS系統(tǒng)連接的函數(shù)
FunctionEstablishPMSConnection()
EndFunction
//解析數(shù)據(jù)文件內(nèi)容的函數(shù)
FunctionParseData(data)
EndFunction
//拆分?jǐn)?shù)據(jù)的函數(shù)
FunctionSplitData(data)
EndFunction
//向PMS系統(tǒng)插入數(shù)據(jù)的函數(shù)
FunctionInsertDataIntoPMS(pmsConnection,item)
EndFunction
//關(guān)閉PMS系統(tǒng)連接的函數(shù)
FunctionCloseConnection(pmsConnection)
EndFunction
各關(guān)鍵函數(shù)說明如下:
StartAutoInputProcess函數(shù):整個自動錄入流程的主函數(shù),依次完成讀取保存的數(shù)據(jù)文件、連接PMS系統(tǒng)、按PMS系統(tǒng)格式錄入數(shù)據(jù)以及關(guān)閉PMS系統(tǒng)連接,最后返回數(shù)據(jù)自動錄入完成的提示信息。
ReadDataFile函數(shù):指定之前保存數(shù)據(jù)文件的路徑,調(diào)用ReadFromFile函數(shù)模擬讀取文件操作,并返回讀取的數(shù)據(jù)。
ConnectToPMS函數(shù):模擬連接PMS系統(tǒng)操作,調(diào)用EstablishPMSConnection函數(shù)建立連接,返回連接對象。
讀取的數(shù)據(jù)文件內(nèi)容InputDataToPMS函數(shù),然后遍歷解析后的數(shù)據(jù):先調(diào)用ParseData函數(shù)解析,調(diào)用InsertDataIntoPMS函數(shù)將數(shù)據(jù)按照PMS系統(tǒng)實際位置和格式錄入PMS系統(tǒng)。
ClosePMSConnection函數(shù):調(diào)用CloseConnection函數(shù)模擬關(guān)閉PMS系統(tǒng)連接,返回連接關(guān)閉的提示信息。
輔助函數(shù)如ReadFromFile、EstablishPMSConnec?tion、ParseData、SplitData、InsertDataIntoPMS和CloseC?onnection等,分別模擬文件讀取、連接建立、數(shù)據(jù)解析、數(shù)據(jù)拆分、數(shù)據(jù)插入和連接關(guān)閉的具體操作,實際應(yīng)用中需根據(jù)具體情況實現(xiàn)相應(yīng)邏輯。
整體流程圖如圖5所示:
4實驗驗證
為了驗證系統(tǒng)在實際應(yīng)用中的效果,針對本系統(tǒng)進(jìn)行了實驗。選取近一個月內(nèi)的三種試驗數(shù)據(jù)類型作為實驗樣本,詳見表2。實驗環(huán)境為IntelCorei7-10700處理器、16GB內(nèi)存的辦公計算機(jī),與人工錄入所用設(shè)備配置相同。對比實驗設(shè)有兩個對照組:傳統(tǒng)人工錄入組(5名具備三年以上工作經(jīng)驗的技術(shù)人員)和系統(tǒng)自動處理組(本系統(tǒng))。
經(jīng)過實驗,本系統(tǒng)在各類試驗報告中均表現(xiàn)出顯著的效率優(yōu)勢。時間效率對比分析詳見表3。
此外,為評估系統(tǒng)核心識別能力,選取了當(dāng)前主流OCR引擎進(jìn)行橫向?qū)Ρ?。實驗結(jié)果表明,本系統(tǒng)采用的改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)算法模型在電力專業(yè)符號識別方面具有顯著優(yōu)勢,同時在試驗數(shù)據(jù)圖片中的字符識別表現(xiàn)優(yōu)異。準(zhǔn)確識別率對比如表4所示。
5結(jié)論
本研究設(shè)計并提出了一套基于自動化的試驗數(shù)據(jù)自動識別與錄入方法,通過系統(tǒng)性的實驗驗證,取得了多方面的顯著成果。借助智能文檔處理(IDP)技術(shù)和RPA技術(shù),成功實現(xiàn)了手寫試驗數(shù)據(jù)的自動識別與錄入,大幅提升了數(shù)據(jù)處理效率。在錄入時間對比實驗中,以220kV變壓器例行試驗數(shù)據(jù)為例,人工錄入一份報告平均耗時21.3分鐘,而自動化工具僅需4.9分鐘。在220kVPT間隔例行試驗和110kV變壓器例行試驗等不同類型試驗報告的錄入中,相較于人工錄入效率提升均超77%。在識別準(zhǔn)確率方面,本系統(tǒng)采用的優(yōu)化算法總體識別準(zhǔn)確率達(dá)到97%,在文字字段和專業(yè)符號的識別準(zhǔn)確率上分別為96%和92%,有效減少了人為操作錯誤,識別準(zhǔn)確率均高于Tesser?act、百度OCR、阿里OCR等算法。該系統(tǒng)有力推動了電力公司數(shù)據(jù)處理工作從傳統(tǒng)人工模式向自動化、智能化模式的轉(zhuǎn)型升級。
不過,本研究仍存在一定局限性。目前自動識別準(zhǔn)確率尚未達(dá)到100%,試驗人員手寫試驗數(shù)據(jù)報告的字跡清晰度、書寫規(guī)范程度等因素對識別結(jié)果影響較大。同時,在面對一些極端復(fù)雜格式或特殊行業(yè)術(shù)語較多的試驗報告時,識別和理解能力有待提高。針對這些局限性,未來研究將著重從以下方向展開:一是進(jìn)一步優(yōu)化數(shù)據(jù)自動提取識別過程中的采集和識別算法,提升去噪、二值化、傾斜校正等預(yù)處理操作的性能,力求將自動識別準(zhǔn)確率提升至更高水平;二是拓展系統(tǒng)應(yīng)用范圍,深入研究如何將該系統(tǒng)有效應(yīng)用于其他類型的數(shù)據(jù)處理,如財務(wù)部門的財務(wù)和發(fā)票數(shù)據(jù)、運檢中心設(shè)備運行維護(hù)數(shù)據(jù)等,探索不同場景下數(shù)據(jù)的特點與共性,開發(fā)針對性的處理策略;三是加強(qiáng)與人工智能其他領(lǐng)域的融合,如知識圖譜技術(shù),提升系統(tǒng)對試驗數(shù)據(jù)語義理解和知識關(guān)聯(lián)的能力,為試驗數(shù)據(jù)分析提供更強(qiáng)大的支持。
本次研究成果具有廣闊的推廣應(yīng)用前景,將逐步在相應(yīng)工作場景中推廣應(yīng)用,并在實踐過程中持續(xù)完善,為各部門數(shù)據(jù)處理效率和質(zhì)量的提升提供有力支撐。
參考文獻(xiàn):
[1]SMITHJ,BROWNR.AutomatedDataCollectionandProcess?inginPowerSystems[J].IEEETransactionsonPowerSystems,2022,37(4):3215-3226.
[2]張強(qiáng),李文廣.智能文檔處理技術(shù)研究進(jìn)展[J].計算機(jī)應(yīng)用研究,2023,40(2):328-332.
[3]WANGL,CHENH.DeepLearningforDocumentProcessing:ASurveychineIntelligence[J].IEEETransactionsonPatternAnalysisandMa,2023,45(8):9456-9472.?
[4]劉明,王芳.電力系統(tǒng)數(shù)據(jù)智能處理技術(shù)及應(yīng)用[M].北京:中國電力出版社,2023.
[5]趙云,錢偉.基于深度學(xué)習(xí)的手寫字符識別研究[J].模式識別與人工智能,2023,36(5):89-95.
[6]張強(qiáng).中文文檔中的實體識別與信息抽取研究[J].計算機(jī)研究與發(fā)展,2023,59(4):789-802.
[7]ZHANGL.ADeepLearningApproachforDocumentLayoutAnalysis[J].JournalofMachineLearningResearch,2021,22(1):345-367.
[8]CHENX.AdvancesinHandwrittenTextRecognitionUsingRe?currentNeuralNetworks[J].InternationalJournalofComputerVision,2021,129(1):1234-1256.
[9]ALLENG.UsingNaturalLanguageProcessingtoExtractMean?ingfulDatafromLegalDocuments[J].LawandTechnologyQuarterly,2020,34(4):456-478.
[10]孫麗.基于自然語言處理的合同文本解析方法研究[J].情報雜志,2020,39(12):156-162.
[11]高翔.深度神經(jīng)網(wǎng)絡(luò)在手寫漢字識別中的應(yīng)用進(jìn)展[J].中文信息學(xué)報,2021,35(3):102-115.
[12]秦海波,曹莉,葉宜修,等.RPA流程自動化技術(shù)分析[J].自動化技術(shù)與應(yīng)用,2022,41(5):1-3,25
[13]周娟,周劼翀,倪玉,等.RPA技術(shù)自動化運維的研究及應(yīng)用[J].電腦編程技巧與維護(hù),2022(3):132-134.
[14]劉洋,趙亮.一種新的表格識別算法及其在財務(wù)報表處理中的應(yīng)用[J].軟件學(xué)報,2020,31(5):1234-1246.
[15]KIMY.DeepConvolutionalNeuralNetworksforDocumentImageSegmentation[J].IEEETransactionsonPatternAnaly?sisandMachineIntelligence,2022,44(3):567-581.
【通聯(lián)編輯:唐一東】