亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的CFD軟件界面高精度識(shí)別

        2023-10-10 08:59:12韋振宇羅祉婧鄭荻凡曾澤楷鐘漢斌
        河南科技 2023年17期
        關(guān)鍵詞:字符卷積界面

        韋振宇 羅祉婧 鄭荻凡 曾澤楷 鐘漢斌

        (1.西安石油大學(xué)化學(xué)化工學(xué)院,陜西 西安 710065;2.西安石油大學(xué)西安市高碳資源低碳化利用重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710065)

        0 引言

        計(jì)算流體力學(xué)(Computational Fluid Dynamics,CFD)通過(guò)計(jì)算機(jī)編程對(duì)化工反應(yīng)器內(nèi)的復(fù)雜流動(dòng)行為進(jìn)行數(shù)值模擬。相較于試驗(yàn)研究,CFD 模擬具有投資少、結(jié)果全面的優(yōu)點(diǎn),且不受測(cè)試手段的限制,但對(duì)工業(yè)規(guī)模反應(yīng)器的CFD 模擬或多參數(shù)的CFD 優(yōu)化,仍需大量時(shí)間。近年來(lái),隨著人工智能技術(shù)的快速發(fā)展,深度學(xué)習(xí)已逐步應(yīng)用于CFD模擬中,能有效提高CFD 的模擬效率。例如,Ouyang等[1]提出一種基于CFD 和人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)的混合模擬過(guò)程,根據(jù)固相動(dòng)量和體積分?jǐn)?shù)的誤差來(lái)完成CFD 模擬和ANN 預(yù)測(cè)的切換,從而使CFD 模擬節(jié)省了40%的時(shí)間。Xie等[2]基于卷積神經(jīng)網(wǎng)絡(luò)(Conventional Neural Network,CNN)和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)來(lái)建立預(yù)測(cè)模型,能很好地預(yù)測(cè)液-固流化床中的混合和分離行為,與原來(lái)的CFD-DEM 模擬相比,該模型節(jié)約了90%~95%的計(jì)算時(shí)間。雖然已有的研究在不同程度上均加快了CFD模擬的計(jì)算過(guò)程,但CFD模擬的工況設(shè)置及結(jié)果處理仍需大量的人工操作,且對(duì)個(gè)人經(jīng)驗(yàn)的依賴較大。因此,通過(guò)人工智能來(lái)實(shí)現(xiàn)CFD模擬操作的智能化是提高研究人員工作效率的關(guān)鍵。

        要實(shí)現(xiàn)CFD模擬的智能化,就要先解決CFD軟件界面的高精度識(shí)別問(wèn)題,為后續(xù)自動(dòng)化和智能化操作奠定基礎(chǔ)。目前,CNN 和LSTM 被廣泛用于文字識(shí)別中。例如,江楊心[3]基于CNN 和LSTM 來(lái)構(gòu)建中文發(fā)票識(shí)別模型,該模型的準(zhǔn)確率達(dá)到88.2%。吳雪等[4]基于數(shù)據(jù)增強(qiáng)的卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建4 層火災(zāi)識(shí)別模型,該模型包括3 層卷積池化層和1 層全連接層,并對(duì)數(shù)據(jù)增強(qiáng)后的數(shù)據(jù)集進(jìn)行仿真。在經(jīng)過(guò)2 000 次迭代訓(xùn)練后,該模型在測(cè)試集上的準(zhǔn)確率為92.51%。蘇云濤等[5]利用LSTM 算法建立了復(fù)雜環(huán)境下的車(chē)牌識(shí)別[6]模型,通過(guò)實(shí)際采集到的車(chē)牌數(shù)據(jù)對(duì)該模型進(jìn)行驗(yàn)證,試驗(yàn)結(jié)果表明,該模型的識(shí)別準(zhǔn)確率高、運(yùn)行效率快。以上這些研究均體現(xiàn)出文字識(shí)別應(yīng)用具有廣泛性[6-11]。而在化工方面,雖有相關(guān)流體識(shí)別[12]及圖像重構(gòu)[13]等的研究成果,但缺乏對(duì)CFD軟件界面文字識(shí)別的研究。

        因此,本研究基于卷積神經(jīng)網(wǎng)絡(luò)和雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò),建立CFD 軟件界面識(shí)別模型,生成符合CFD模擬實(shí)際操作場(chǎng)景的數(shù)據(jù)集,并將其用于對(duì)模型的訓(xùn)練中,最終通過(guò)數(shù)據(jù)增強(qiáng)、再訓(xùn)練等技術(shù)實(shí)現(xiàn)對(duì)CFD模擬軟件界面的有效識(shí)別。

        1 模型搭建及配置

        1.1 CRNN網(wǎng)絡(luò)

        基于深度學(xué)習(xí)的文本識(shí)別的步驟如下,即預(yù)處理、特征提取、序列建模、預(yù)測(cè)轉(zhuǎn)錄。其中,較為典型的網(wǎng)絡(luò)是CRNN 網(wǎng)絡(luò)[3],如圖1 所示。CRNN 網(wǎng)絡(luò)由卷積神經(jīng)網(wǎng)絡(luò)(Conventional Neural Network,CNN)、雙向長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(Bi-directional Long Short-Term Memory Network,Bi-LSTM)及連接時(shí)序分類器(Connectionist Temporal Classification,CTC)組成。

        圖1 CRNN網(wǎng)絡(luò)結(jié)構(gòu)

        在CRNN 網(wǎng)絡(luò)中,CNN 層用于提取文本特征序列。由于文本任務(wù)中的卷積網(wǎng)絡(luò)關(guān)注更多的是圖像的局部信息,缺乏長(zhǎng)依賴的聯(lián)系能力,只依靠卷積網(wǎng)絡(luò),難以挖掘出文本之間的上下文聯(lián)系。因此,可在CRNN 網(wǎng)絡(luò)結(jié)構(gòu)中的CNN 層后接入Bi-LSTM,用來(lái)增強(qiáng)文本的上下文聯(lián)系,還能有效解決長(zhǎng)序列訓(xùn)練過(guò)程中梯度消失和梯度爆炸問(wèn)題。為有效解決對(duì)同一字符可能多次預(yù)測(cè)的問(wèn)題,同時(shí)提高預(yù)測(cè)精度,CRNN 網(wǎng)絡(luò)通過(guò)接入含有獨(dú)特合并序列機(jī)制的CTC 來(lái)去除重復(fù)字符,通過(guò)CTC 引入blank字符,能有效避免合并本身存在的字符。

        1.2 訓(xùn)練配置

        本研究在飛槳(PaddlePaddle)深度學(xué)習(xí)框架的基礎(chǔ)上對(duì)模型進(jìn)行訓(xùn)練。模型的CNN部分以MobiletNetV3 網(wǎng)絡(luò)為骨干,其優(yōu)勢(shì)在于模型體積小,對(duì)網(wǎng)絡(luò)訓(xùn)練和推理所需的計(jì)算資源更少。模型具體配置見(jiàn)表1。設(shè)置模型最大迭代次數(shù)為500、批處理大小為64、初始學(xué)習(xí)率為0.000 5。采用Cosine學(xué)習(xí)率衰減策略可逐步減少學(xué)習(xí)率大小,從而使模型能盡快收斂。同時(shí),使用自適應(yīng)動(dòng)量估計(jì)(Adaptive moment estimation,Adam)對(duì)模型進(jìn)行優(yōu)化,并采用L2正則化防止模型過(guò)擬合。

        表1 訓(xùn)練配置

        1.3 數(shù)據(jù)集建立

        在數(shù)據(jù)集建立過(guò)程中,創(chuàng)建自定義數(shù)據(jù)集CFDataSet,創(chuàng)建流程如圖2 所示。首先,根據(jù)CFD 軟件界面內(nèi)容及配置文件來(lái)確定界面內(nèi)容的組成形式,并建立相應(yīng)的字體文件和配套的字典文件。其次,從字典文件中隨機(jī)抽取出相應(yīng)長(zhǎng)度的字符串,并將其導(dǎo)入到PIL 庫(kù)中,在相應(yīng)尺寸及背景下生成帶有字體樣式的文本圖片,試驗(yàn)中共生成約250 000 個(gè)文本圖片及相應(yīng)文本標(biāo)簽。最后,根據(jù)劃分比例來(lái)隨機(jī)抽取相應(yīng)數(shù)量的文本圖片及標(biāo)簽,并移動(dòng)到單獨(dú)文件夾中,據(jù)此生成訓(xùn)練集、驗(yàn)證集、測(cè)試集,并將其用于對(duì)模型的訓(xùn)練及測(cè)試中。

        圖2 圖片生成流程

        此外,對(duì)該模型的訓(xùn)練還會(huì)用到公開(kāi)數(shù)據(jù)集ICDAR2015(Incidental Scene Text Challenge)。其訓(xùn)練集的樣本數(shù)量為1 000、測(cè)試集的樣本數(shù)量為500。由于采集到的數(shù)據(jù)集中的字符區(qū)域形狀多為任意四邊形,在模型訓(xùn)練中加入ICDAR2015 公開(kāi)數(shù)據(jù)集,能有效增強(qiáng)輸入數(shù)據(jù)的多樣性,提高模型的泛化能力。

        1.4 數(shù)據(jù)增強(qiáng)

        在加入ICDAR2015 公開(kāi)數(shù)據(jù)集豐富數(shù)據(jù)的同時(shí),利用數(shù)據(jù)增強(qiáng)技術(shù)對(duì)自建數(shù)據(jù)集CFDataSet 進(jìn)行擴(kuò)充,對(duì)原始圖片進(jìn)行變換處理(如隨機(jī)裁剪、顏色干擾、隨機(jī)噪聲、模糊等),可增強(qiáng)圖片的多樣性。該方法能有效解決模型訓(xùn)練易出現(xiàn)的過(guò)擬合問(wèn)題,從而增強(qiáng)模型的泛化能力。本研究采取的數(shù)據(jù)增強(qiáng)手段如圖3 所示。①圖片模糊。隨機(jī)使用高斯濾波、均值濾波、中值濾波對(duì)圖片進(jìn)行模糊處理。②隨機(jī)裁剪。隨機(jī)裁剪掉原始圖片部分邊界。③圖片扭曲。對(duì)原始圖片的線條進(jìn)行一定程度的彎曲畸變。④仿射變換。對(duì)原始圖片進(jìn)行旋轉(zhuǎn)、縮放、平移、剪切。

        圖3 數(shù)據(jù)增強(qiáng)手段

        2 試驗(yàn)結(jié)果與分析

        為突出PaddleOCR 處理圖片的能力,同時(shí)也可讓試驗(yàn)更具參照性。首先,對(duì)開(kāi)源Tesseract 識(shí)別引擎與PaddleOCR 識(shí)別CFD 界面內(nèi)容的效果進(jìn)行對(duì)比。其次,利用飛槳開(kāi)發(fā)的識(shí)別框架PaddleOCR 來(lái)建立模型,并對(duì)其進(jìn)行訓(xùn)練。試驗(yàn)結(jié)果表明,利用PaddleOCR 識(shí)別套件開(kāi)發(fā)出的模型能實(shí)現(xiàn)對(duì)CFD界面的高精度識(shí)別。

        2.1 Tesseract與PaddleOCR效果對(duì)比

        2.1.1 文本檢測(cè)。以CFD 界面區(qū)域?yàn)槔瑢?duì)Tesseract 與PaddleOCR 的直接識(shí)別效果進(jìn)行對(duì)比,結(jié)果如圖4 所示。圖4(a)為CFD 界面,圖4(b)為T(mén)esseract 檢測(cè)結(jié)果,圖4(c)為PaddleOCR 采用DBnet 網(wǎng)絡(luò)的檢測(cè)結(jié)果。通過(guò)對(duì)比Tesseract 與PaddleOCR的直接識(shí)別效果可知,Tesseract檢測(cè)級(jí)別為字符級(jí),PaddleOCR 檢測(cè)級(jí)別為單詞級(jí)別檢測(cè)過(guò)程。字符級(jí)別的檢測(cè)要求是將每一個(gè)字符都單獨(dú)分割出來(lái),對(duì)檢測(cè)要求更高,如果一個(gè)字符未被檢測(cè)出或連續(xù)幾個(gè)字符未被分割開(kāi),會(huì)對(duì)識(shí)別精度產(chǎn)生較大的影響。PaddleOCR 只是將單詞區(qū)域檢測(cè)出來(lái),對(duì)檢測(cè)精度的要求不高。但從圖4(c)的檢測(cè)效果來(lái)看,“Solution”和“Results”對(duì)象未被檢測(cè)出,這是因?yàn)镻addleOCR 基礎(chǔ)模型并未根據(jù)實(shí)際應(yīng)用情況進(jìn)行微調(diào)整,說(shuō)明PaddleOCR模型有待改進(jìn)。

        圖4 Tesseract與PaddleOCR檢測(cè)對(duì)比

        2.1.2 文本識(shí)別。由于軟件界面的內(nèi)容豐富,在識(shí)別過(guò)程中,Tesseract 和PaddleOCR 均出現(xiàn)對(duì)圖標(biāo)符號(hào)誤識(shí)別的情況,但PaddleOCR 對(duì)圖標(biāo)符號(hào)的處理會(huì)更好。Tesseract 與PaddleOCR 的識(shí)別對(duì)比如圖5 所示。此外,因Tesseract 存在不少弊端,尤其是對(duì)深色背景及分辨率不高的圖片識(shí)別時(shí),Tesseract的錯(cuò)誤率更高,這是因?yàn)樵谖淖謾z測(cè)過(guò)程中,字符未被完全檢測(cè)出,導(dǎo)致識(shí)別錯(cuò)誤率高,甚至無(wú)識(shí)別內(nèi)容。雖然其有配套的校正工具jTessBoxEditor,但其對(duì)文字的校正過(guò)程過(guò)于煩瑣,且效率不高,導(dǎo)致對(duì)深色背景及分辨率不高的圖片幾乎無(wú)法校正?!癙arallel”深色圖片的校正過(guò)程如圖6 所示。校正后的識(shí)別結(jié)果為“ee ey”,可見(jiàn)其校正并未改善識(shí)別結(jié)果。因此,Tesseract 未被應(yīng)用于CFD 軟件界面的識(shí)別中。而在PaddleOCR 檢測(cè)識(shí)別中,即使存在著少量的遺漏情況,但通過(guò)大量圖片訓(xùn)練,也能輕易改善這種情況,從而實(shí)現(xiàn)高精度識(shí)別目標(biāo)。

        圖5 Tesseract與PaddleOCR識(shí)別對(duì)比

        圖6 Tesseract校正及結(jié)果

        2.2 PaddleOCR訓(xùn)練模型對(duì)比

        在PaddleOCR 訓(xùn)練模型中,使用預(yù)訓(xùn)練模型en-number-mobile-v2.0可加快訓(xùn)練進(jìn)程,這是飛槳團(tuán)隊(duì)公開(kāi)的英文識(shí)別模型。同時(shí),在3 種數(shù)據(jù)集模式下,即公開(kāi)數(shù)據(jù)集ICDAR2015、自建數(shù)據(jù)集(CFDataSet)及二者的組合,分別對(duì)PaddleOCR 模型進(jìn)行訓(xùn)練,并對(duì)得到的三種模型(CFD-m-1、CFD-m-2、CFD-m-3)進(jìn)行評(píng)估,結(jié)果見(jiàn)表2。

        表2 PaddleOCR訓(xùn)練模型對(duì)比

        由表2 可知,基于ICDAR2015 數(shù)據(jù)集訓(xùn)練得到的模型(CFD-m-1),因訓(xùn)練場(chǎng)景不適合實(shí)際應(yīng)用場(chǎng)景,且訓(xùn)練容量較少,導(dǎo)致其對(duì)CFD 界面幾乎無(wú)法識(shí)別?;贑FD 界面所建立的數(shù)據(jù)集(CFData-Set),用其訓(xùn)練出的模型CFD-m-2 對(duì)CFD 界面的識(shí)別效果明顯提高。同時(shí),CFDataSet、ICDAR2015數(shù)據(jù)集融合訓(xùn)練所得到的模型(CFD-m-3),因訓(xùn)練數(shù)據(jù)復(fù)雜度更高、模型泛化能力更強(qiáng),識(shí)別精度也得到進(jìn)一步提高。后續(xù)需要繼續(xù)增強(qiáng)數(shù)據(jù)集的容量及復(fù)雜度,并優(yōu)化模型參數(shù),從而改善模型的識(shí)別效果。

        3 結(jié)語(yǔ)

        本研究基于CFD 軟件界面內(nèi)容創(chuàng)建了多尺寸、多背景、多字體的數(shù)據(jù)集,并利用數(shù)據(jù)增強(qiáng)技術(shù)來(lái)增強(qiáng)數(shù)據(jù)集的多樣性,能有效防止模型出現(xiàn)過(guò)擬合的問(wèn)題。基于自建數(shù)據(jù)集和公開(kāi)數(shù)據(jù)集訓(xùn)練得到的模型,因數(shù)據(jù)集在內(nèi)容及組成形式豐富且復(fù)雜,模型泛化能力更強(qiáng),可明顯提高CFD模擬軟件界面的識(shí)別精度。本研究初步實(shí)現(xiàn)了對(duì)CFD 模擬軟件界面的高精度識(shí)別,為實(shí)現(xiàn)CFD模擬操作的智能化奠定重要基礎(chǔ)。

        猜你喜歡
        字符卷積界面
        尋找更強(qiáng)的字符映射管理器
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        國(guó)企黨委前置研究的“四個(gè)界面”
        字符代表幾
        一種USB接口字符液晶控制器設(shè)計(jì)
        電子制作(2019年19期)2019-11-23 08:41:50
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        消失的殖民村莊和神秘字符
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        基于FANUC PICTURE的虛擬軸坐標(biāo)顯示界面開(kāi)發(fā)方法研究
        人機(jī)交互界面發(fā)展趨勢(shì)研究
        亚洲精品高清你懂的| 亚洲人精品午夜射精日韩| 狠狠综合久久av一区二区| 欧美人与物videos另类xxxxx| 国产自产av一区二区三区性色| 一区二区三区av资源网| 国产情侣一区二区| 影音先锋男人站| 国产精品高潮无码毛片| 久久精品成人一区二区三区蜜臀| 麻豆91蜜桃传媒在线观看| 亚洲av蜜桃永久无码精品| 2021国产成人精品国产| 亚洲国产线茬精品成av| 精品人妻av一区二区三区| 少妇被猛男粗大的猛进出| 国产精品一区二区久久乐下载| 亚洲三区av在线播放| 一边摸一边抽搐一进一出口述 | 国产成人av综合色| 亚洲另类激情综合偷自拍图| av熟女一区二区久久| 亚洲综合第一页中文字幕| 亚洲第一se情网站| ZZIJZZIJ亚洲日本少妇| 青青操视频手机在线免费观看| 五月四房播播| 国产午夜成人久久无码一区二区| 日本韩国黄色三级三级| 亚洲av日韩一区二区| 国产丝袜视频一区二区三区| 亚洲欧美日韩高清一区二区三区| 日韩不卡一区二区三区色图| 女人被爽到高潮视频免费国产 | 香港三级日本三级a视频| 久久av无码精品一区二区三区| 青青视频一区| 黑人巨大亚洲一区二区久| 国内久久婷婷六月综合欲色啪| 国产精品老熟女露脸视频 | 免费无码AⅤ片在线观看|