亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        圖像識別和處理技術(shù)在汽車非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)挖掘中的應(yīng)用

        2023-11-27 10:52:46齊鑫劉思源
        消費(fèi)電子 2023年9期
        關(guān)鍵詞:關(guān)鍵特征信息

        齊鑫 劉思源

        引言

        隨著人工智能技術(shù)、智能制造業(yè)和智能汽車等新興技術(shù)、產(chǎn)業(yè)的高速發(fā)展,為提升智能制造行業(yè)的競爭力,我國汽車企業(yè)對于非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)挖掘的需求也愈發(fā)強(qiáng)烈。通過人工智能技術(shù),將各類車輛企業(yè)研發(fā)非結(jié)構(gòu)化信息如警告圖標(biāo)、檢測報告信息提取后處理,利用圖像識別處理技術(shù)的高效性和實(shí)用性,實(shí)現(xiàn)大量數(shù)據(jù)挖掘和收集。本文將在人工智能圖像識別與處理技術(shù)應(yīng)用的基礎(chǔ)上,對企業(yè)非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)信息進(jìn)行分析,根據(jù)現(xiàn)有深度學(xué)習(xí)圖像處理算法,探討算法的可行性,最終實(shí)現(xiàn)其在非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)挖掘上的應(yīng)用。

        一、研究背景

        在汽車智能制造領(lǐng)域、對于非結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用研究愈發(fā)重要,對于非結(jié)構(gòu)化數(shù)據(jù)中有用信息的提取是關(guān)鍵步驟。同時,人工智能深度學(xué)習(xí)技術(shù)、圖像識別技術(shù)、數(shù)據(jù)處理技術(shù)日漸成熟,已成為將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的有利手段。因此,本文面向車輛研發(fā)生產(chǎn)環(huán)節(jié)中的典型非結(jié)構(gòu)化數(shù)據(jù),包括危險品圖片、合格證圖片、檢測報告PDF版、車型照片等進(jìn)行分析,詳述其典型特征、利用圖像識別技術(shù)提取要素方法、圖像識別模型訓(xùn)練庫分類方法、以及為保證圖像識別的準(zhǔn)確度的注意事項(xiàng)等等,促進(jìn)多種非結(jié)構(gòu)化數(shù)據(jù)的信息提取和轉(zhuǎn)化,為企業(yè)可用數(shù)據(jù)資產(chǎn)的積累提供支持。

        二、圖像識別和處理技術(shù)

        圖像識別是新一代信息技術(shù)發(fā)展的重要應(yīng)用,它利用計算機(jī)視覺和模式識別的方法,將輸入的圖像與已知的圖像進(jìn)行比對和匹配,從而實(shí)現(xiàn)對圖像內(nèi)容的自動判斷和分類。該技術(shù)可以通過分析輸入圖像中的視覺特征,如顏色、紋理、形狀等,來識別和理解圖像中的物體、場景等信息[1]。圖像識別和處理技術(shù)的主要功能包括信息采集、預(yù)處理、壓縮處理、圖像特征提取以及最終的分類決策,經(jīng)過這些步驟,計算機(jī)可以從圖像中提取特征并對其進(jìn)行分類,用于滿足智能制造和智能汽車行業(yè)對非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)挖掘的需求。

        同時,神經(jīng)網(wǎng)絡(luò)算法的融入使圖像識別的準(zhǔn)確度、可用性得到進(jìn)一步的提升。神經(jīng)網(wǎng)絡(luò)算法作為一種深層次的處理方式,旨在模仿大腦神經(jīng)元的邏輯運(yùn)行,其方式與人類神經(jīng)細(xì)胞的視覺處理方式雖然存在差異,但能達(dá)到近似的學(xué)習(xí)效果。通過使用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)、圖像識別和處理技術(shù)效果進(jìn)一步增強(qiáng),能夠處理復(fù)雜的圖像信息,自動完成圖像識別任務(wù),并排除非關(guān)鍵特征。當(dāng)然,為了使神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)模型能夠解釋數(shù)據(jù),需要進(jìn)行大量的調(diào)節(jié)和訓(xùn)練,以模擬人腦的工作機(jī)制。

        卷積神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)模型的一種常見結(jié)構(gòu),通常由數(shù)據(jù)處理層、卷積計算層、修正線性單元層、全連接層和池化層組成。數(shù)據(jù)處理層作為第一層可以接收原始圖像數(shù)據(jù),并通過白化和去均值等操作進(jìn)行圖片處理,以便使模型能更加容易識別圖像信息;卷積計算層是神經(jīng)網(wǎng)絡(luò)模型的核心部分,通過對局部組織進(jìn)行操作并移動窗口來分析數(shù)據(jù)。每個神經(jīng)元可以視為一個功能強(qiáng)大的放大器,它對來自局部組織的數(shù)據(jù)進(jìn)行計算。而在具體的卷積網(wǎng)絡(luò)計算過程中,共享相關(guān)參數(shù)是關(guān)鍵,即每個神經(jīng)元與數(shù)據(jù)庫數(shù)據(jù)連接的權(quán)值不固定,每個神經(jīng)元只關(guān)注特定的外部特征。這一層的作用其實(shí)就是通過調(diào)整參數(shù),定位到想要識別圖像主體,來確定能表征圖片特征的主要特點(diǎn)的參數(shù);池化層通常用于壓縮數(shù)據(jù)量及相關(guān)參數(shù),以降低過擬合的風(fēng)險。池化層的功能包括外部特征不變性和外部特征降維,可去除不重要的相關(guān)信息,但同時保持顯示圖像的主要表達(dá)方式,避免過擬合的發(fā)生,該層的目的是提取圖像中最具表現(xiàn)力的特征、去除無用和冗余的相關(guān)信息,從而提升圖像識別的準(zhǔn)確度[2]。

        圖1 神經(jīng)網(wǎng)絡(luò)組成

        三、圖像識別和處理技術(shù)在企業(yè)非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)挖掘中的應(yīng)用

        車輛企業(yè)研發(fā)設(shè)計中的非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)常常包括合格證信息、危險標(biāo)識信息以及檢測報告數(shù)據(jù)信息等,這些數(shù)據(jù)信息通常是以PDF、JPG等形式存儲,并且大多需要通過人力進(jìn)行處理,將其轉(zhuǎn)化為企業(yè)可以正常利用的信息。但是對于這類信息通過人為一個一個緩慢地識別并將其保存為可處理的文本信息,會極大降低企業(yè)對于非結(jié)構(gòu)化的關(guān)鍵數(shù)據(jù)的轉(zhuǎn)換效率,同時還增加人力資源負(fù)擔(dān),增加企業(yè)的經(jīng)濟(jì)投入?;诖藛栴},對于需要分類識別的非結(jié)構(gòu)化數(shù)據(jù)而言,利用人工智能計算機(jī)視覺圖像識別和理解技術(shù),可以提高車輛企業(yè)非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)挖掘的準(zhǔn)確度、提升挖掘的效率、擴(kuò)大挖掘的范圍。

        簡單來說,車輛企業(yè)研發(fā)中,非結(jié)構(gòu)化關(guān)鍵信息的挖掘和收集是極為重要的,例如圖片、合格證、危險品、報告信息,均為圖片數(shù)據(jù)和PDF數(shù)據(jù)。利用條件規(guī)則對圖片和PDF中關(guān)鍵數(shù)據(jù)進(jìn)行提取后,可將此部分?jǐn)?shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。在實(shí)際應(yīng)用上,可延伸到多類企業(yè)的應(yīng)用場景,例如,場景一:通過對多張不同車型照片中背景環(huán)境的剔除、以車輛為主題提取關(guān)鍵特征顏色、型號等,可以精準(zhǔn)比對不同照片中的車輛是否為同一車型;場景二:對車輛生產(chǎn)后的合格證照片、檢驗(yàn)報告等進(jìn)行識別,可提取關(guān)鍵數(shù)據(jù),該數(shù)據(jù)可用與研發(fā)過程的數(shù)據(jù)進(jìn)行比對,從而判斷車輛研發(fā)和生產(chǎn)過程中主要變化;場景三:對危險品照片進(jìn)行識別,從而可以確定車輛的承載危險品的類型,例如易燃物品或者有毒氣體等,從而在車輛注冊時,針對是否滿足特殊用途給以重點(diǎn)檢查和確認(rèn)。利用圖像識別手段整理這些重要非結(jié)構(gòu)化信息,可以充分發(fā)揮數(shù)據(jù)價值,輔助確保車輛在研發(fā)、生產(chǎn)過程中的一致性,從而保證新型車輛的有效產(chǎn)出,推動智能制造業(yè)的高質(zhì)量發(fā)展。

        當(dāng)前如何科學(xué)有效地使用圖像識別和處理技術(shù),是企業(yè)非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)挖掘的一大難點(diǎn)。通常企業(yè)需要先收集一定量的圖片,作為數(shù)據(jù)集將其預(yù)處理,而預(yù)處理是圖像識別中相當(dāng)重要的一點(diǎn),預(yù)處理過程就是在圖片、PDF等非結(jié)構(gòu)化數(shù)據(jù)中提取關(guān)鍵特征的手段,關(guān)鍵特征點(diǎn)提取越準(zhǔn)確,后續(xù)在特征學(xué)習(xí)中,算法會被訓(xùn)練得越發(fā)有效;如果預(yù)處理未能做好,之后訓(xùn)練出來的模型將會出現(xiàn)識別不準(zhǔn)確的問題,即圖像中包含的有用信息過少,模型過多關(guān)注無用信息會導(dǎo)致無法收斂等問題。因此,首先對于數(shù)據(jù)集的預(yù)處理,以車輛企業(yè)非結(jié)構(gòu)化關(guān)鍵數(shù)據(jù)圖片為例,需要將圖片進(jìn)行分類,將這些圖片中屬于合格證、危險標(biāo)識、檢測報告等等分為大類,再將大類細(xì)化,以便獲得最小的預(yù)處理學(xué)習(xí)集合。以危險品標(biāo)識舉例,車輛危險品標(biāo)識共有9類,包括易燃固體、易燃液體、放射性物質(zhì)等,根據(jù)不同的危險標(biāo)識照片建立多個訓(xùn)練集和驗(yàn)證集,用于后續(xù)訓(xùn)練和驗(yàn)證算法。

        對于圖像分類而言,其主要目的是將各類企業(yè)非結(jié)構(gòu)化數(shù)據(jù)的圖片進(jìn)行分類,不同種類圖像的差異較為明顯,因此可選擇的分類器種類多,例如 Logistic Regression、Naive Bayes等算法都可納入圖像分類的初步選擇。分類器選擇完畢后,初始模型可利用訓(xùn)練集中的照片進(jìn)行訓(xùn)練,完成后使用驗(yàn)證集進(jìn)行驗(yàn)證,最終獲得能夠根據(jù)企業(yè)非結(jié)構(gòu)化數(shù)據(jù)圖片的關(guān)鍵特征進(jìn)行圖片分類的模型。而訓(xùn)練出的模型的出錯率則會直接影響后面圖像處理的效率和準(zhǔn)確度[3]。

        將不同種類的企業(yè)非結(jié)構(gòu)化數(shù)據(jù)圖片進(jìn)行處理,深度學(xué)習(xí)可以提取圖像特征,圖像特征的本質(zhì)是可以高度概括圖像內(nèi)容的抽象化信息,憑借人工經(jīng)驗(yàn)提取的特征是從人的角度將紋理、顏色、形狀等信息從原始像素中提取出來。這些特征都來源于圖像的原始像素,雖然是一種高效的信息抽象方式,但同時會損失掉很多信息,因此,可以利用模型直接在原始數(shù)據(jù)上學(xué)習(xí),能將信息損失大幅降低。然而圖像中除了我們關(guān)注的特征信息以外,也留有很多無用的干擾信息,例如對于在道路行駛的車輛照片來說,周圍的環(huán)境、樹木、人員,甚至其他移動物體都是干擾信息。這些無用信息過多地被關(guān)注,或者參與到模型學(xué)習(xí)中,會導(dǎo)致模型無法準(zhǔn)確提取到關(guān)鍵的圖像特征。因此,需要使用卷積神經(jīng)網(wǎng)絡(luò)精準(zhǔn)地提取圖像中的有用信息和高效地獲取訓(xùn)練集,更準(zhǔn)確地處理企業(yè)非結(jié)構(gòu)化數(shù)據(jù)。

        卷積神經(jīng)網(wǎng)絡(luò)算法,通過將原始數(shù)據(jù)與預(yù)設(shè)權(quán)重的卷積核做加權(quán),從原始數(shù)據(jù)中提取出關(guān)鍵信息,常用的CNN模型卷積神經(jīng)網(wǎng)絡(luò)算法有三種流派:ResNet、Inception和DenseNet。企業(yè)的非結(jié)構(gòu)化數(shù)據(jù)中,各類圖像特征區(qū)別通常較為明顯,例如圖像中危險標(biāo)識與檢測報告相比,前者主要根據(jù)形狀和顏色進(jìn)行區(qū)分,后者則是非常規(guī)律的文字信息,兩者具有顯著特征,因此通過卷積神經(jīng)網(wǎng)絡(luò)算法將其分類,準(zhǔn)確率可以得到保證。而進(jìn)一步的圖像識別則需要更加細(xì)節(jié)化的特征預(yù)設(shè)和卷積收斂[4]。

        車輛企業(yè)非結(jié)構(gòu)化數(shù)據(jù),以危險標(biāo)識和檢測報告兩類為例,前者圖像形狀的特征較為明顯,因此可以使用TensorFlow平臺現(xiàn)有的模型為基礎(chǔ),修改部分代碼、權(quán)重等,加以訓(xùn)練及驗(yàn)證后,則可識別危險標(biāo)識,判斷該項(xiàng)目是否需要重點(diǎn)檢查或者用于其他需要判斷危險標(biāo)識的情況;而后者則可通過圖像識別處理技術(shù),利用檢測報告主要為文字內(nèi)容的特點(diǎn),將其中的文字識別,再利用自然語言處理技術(shù)或者直接比對,將檢測項(xiàng)目中的內(nèi)容和實(shí)際數(shù)據(jù)輸出,用作車輛企業(yè)的研發(fā)數(shù)據(jù)信息。由此,通過人工智能圖像識別技術(shù)和處理技術(shù),利用深度學(xué)習(xí)的高效性、準(zhǔn)確性和實(shí)用性,將圖像數(shù)據(jù)中有關(guān)企業(yè)非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行挖掘和收集,最終在應(yīng)用上為企業(yè)增加產(chǎn)值和貢獻(xiàn)。

        結(jié)語

        在汽車智能制造過程中,傳統(tǒng)工作模式下,企業(yè)產(chǎn)生海量的圖片和照片數(shù)據(jù),對于企業(yè)而言是一座“金礦”,但是開采方式卻是難點(diǎn)痛點(diǎn),工業(yè)數(shù)據(jù)的應(yīng)用一直是制造業(yè)企業(yè)的研究重點(diǎn)。隨著新一代信息技術(shù)的發(fā)展,人工智能學(xué)習(xí)愈發(fā)成熟,圖像識別越發(fā)精確和快速,通過智能化圖像識別技術(shù)可以對海量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理,將圖像包含的信息進(jìn)行直觀、清晰的表達(dá),從而促進(jìn)工業(yè)數(shù)據(jù)在汽車企業(yè)研發(fā)、設(shè)計、生產(chǎn)環(huán)節(jié)上的應(yīng)用,助力制造業(yè)數(shù)字化轉(zhuǎn)型走深走實(shí)。

        猜你喜歡
        關(guān)鍵特征信息
        高考考好是關(guān)鍵
        如何表達(dá)“特征”
        不忠誠的四個特征
        抓住特征巧觀察
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        獲勝關(guān)鍵
        NBA特刊(2014年7期)2014-04-29 00:44:03
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        生意無大小,關(guān)鍵是怎么做?
        中國商人(2013年1期)2013-12-04 08:52:52
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        女人无遮挡裸交性做爰| 国内精品亚洲成av人片| 亚洲欧洲日产国码无码| 亚洲日韩成人av无码网站| 久久国产黄色片太色帅| 久久久久成人片免费观看蜜芽| 在线中文字幕一区二区| 日本熟妇中文字幕三级| 丰满五十六十老熟女hd| 国产精品永久久久久久久久久| 亚洲av色香蕉一区二区三区av| 亚洲是图一区二区视频| 国产免费无码一区二区三区| 国产做无码视频在线观看| 午夜视频在线观看国产19| 久久国产免费观看精品| 日韩人妻无码免费视频一区二区三区| 亚洲国产精品无码aaa片| 亚洲精彩av大片在线观看| 久久精品无码一区二区三区不卡| 99久久国产露脸精品竹菊传媒| 婷婷丁香开心五月综合| 青青草视频原手机在线观看| 国产suv精品一区二区883| 亚洲av中文无码乱人伦在线视色| 亚洲av色香蕉一区二区三区蜜桃 | 日韩性感av一区二区三区| 国产偷2018在线观看午夜| 欧美freesex黑人又粗又大| 国产做国产爱免费视频| 高清中文字幕一区二区| 国产精品日本一区二区三区在线 | 色大全全免费网站久久| 91国内偷拍精品对白| 久久视频在线视频精品| 亚洲a级片在线观看| 无码h黄动漫在线播放网站| 久久精品麻豆日日躁夜夜躁| 日韩av午夜在线观看| 黄色av亚洲在线观看| 亚洲熟女天堂av一区二区三区|