廖遠(yuǎn)富 榮莉 侯均衡
摘要 隨著大數(shù)據(jù)、數(shù)據(jù)挖掘、云計(jì)算等技術(shù)的快速發(fā)展和改進(jìn),不動(dòng)產(chǎn)登記工作引入了許多的新型技術(shù)。圖像識(shí)別作為一個(gè)先進(jìn)的計(jì)算機(jī)多媒體信息處理技術(shù),其可以利用特征學(xué)習(xí)、模式識(shí)別和機(jī)器學(xué)習(xí)等技術(shù)自動(dòng)化的識(shí)別不動(dòng)產(chǎn)登記系統(tǒng)中的圖片,提取圖片上的文字、圖案等信息,將這些信息內(nèi)容保存到數(shù)據(jù)庫中,實(shí)現(xiàn)不動(dòng)產(chǎn)登記的檢索、查詢、資料預(yù)審功能,提高了不動(dòng)產(chǎn)登記系統(tǒng)的智能化、信息化和共享化,具有重要的作用和意義。
【關(guān)鍵詞】圖像識(shí)別 不動(dòng)產(chǎn)登記系統(tǒng) 特征提取 數(shù)據(jù)挖掘
1 引言
隨著特征提取、語義分析、模式識(shí)別、自然交互等技術(shù)的快速發(fā)展和改進(jìn),機(jī)器學(xué)習(xí)已經(jīng)在多個(gè)領(lǐng)域得到廣泛普及和使用,比如在文本檢索、圖像識(shí)別、視頻追蹤等方面,提高了數(shù)據(jù)處理速度,實(shí)現(xiàn)了人類社會(huì)的信息化、智能化和自動(dòng)化。
不動(dòng)產(chǎn)是人民群眾的重要財(cái)產(chǎn),隨著我國(guó)房地產(chǎn)市場(chǎng)的發(fā)展和壯大,不動(dòng)產(chǎn)登記成為國(guó)土部門的重要工作,為了提高工作效率和質(zhì)量,國(guó)土部門已經(jīng)建立了不動(dòng)產(chǎn)登記系統(tǒng),該系統(tǒng)能夠?qū)崿F(xiàn)信息采集、圖片保存等功能,但是不動(dòng)產(chǎn)登記過程中常見的信息載體多為圖片,因此亟需引入先進(jìn)的模式識(shí)別技術(shù),在登記系統(tǒng)中引入人工智能圖像識(shí)別技術(shù),可以大大提高工作效率及實(shí)現(xiàn)圖像識(shí)別和處理。
因此,本文基于筆者多年的工作實(shí)踐,重塑一個(gè)新的不動(dòng)產(chǎn)登記系統(tǒng),申請(qǐng)人可以按照不動(dòng)產(chǎn)登記要求通過互聯(lián)網(wǎng)、微信、QQ等上傳申請(qǐng)資料,這些資料多為照片或掃描圖片,因此可以利用特征提取、語義分析、模式匹配等技術(shù)識(shí)別圖像中的內(nèi)容,將不動(dòng)產(chǎn)登記需要的信息提取出來,進(jìn)一步提高不動(dòng)產(chǎn)登記的自動(dòng)化、智能化。
2 不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別功能分析
不動(dòng)產(chǎn)登記操作流程多,錄入對(duì)象數(shù)量也非常多,傳統(tǒng)的人工、半人工處理模式,窗口工作人員采用掃描儀、高拍儀進(jìn)行圖像采集,效率低下,質(zhì)量也不高,不利于提高政府機(jī)關(guān)的服務(wù)水平。因此,為了提高不動(dòng)產(chǎn)登記效率和水平,本文針對(duì)不動(dòng)產(chǎn)登記系統(tǒng)進(jìn)行原型化分析,利用先進(jìn)人工智能技術(shù),分析不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別功能,主要功能如下所述:
2.1 圖像采集功能
不動(dòng)產(chǎn)登記過程中,申請(qǐng)對(duì)象可以通過多個(gè)渠道傳遞文件內(nèi)容,這些渠道包括網(wǎng)絡(luò)、微信、QQ或Email等,加入人工智能后,申請(qǐng)人可以通過網(wǎng)絡(luò)等渠道直接上傳申請(qǐng)材料到平臺(tái)中,將這些圖像導(dǎo)入到系統(tǒng)。
2.2 圖像預(yù)處理功能
不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別時(shí),由于申請(qǐng)對(duì)象拍攝的照片光線不均勻,因此圖像識(shí)別時(shí)產(chǎn)生的噪聲數(shù)據(jù)非常多,需要利用二值法、閾值法等針對(duì)圖像進(jìn)行預(yù)處理,降低圖像識(shí)別時(shí)的噪聲數(shù)據(jù),更加準(zhǔn)確的獲取圖像內(nèi)容。
2.3 圖像識(shí)別功能
圖像識(shí)別可以利用支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、遺傳算法等機(jī)器學(xué)習(xí)技術(shù)進(jìn)行特征提取,然后針對(duì)特征內(nèi)容進(jìn)行分類,將圖像劃分為背景內(nèi)容、目標(biāo)對(duì)象,然后針對(duì)圖像進(jìn)行加工,將這些內(nèi)容與數(shù)據(jù)庫中保存的模式進(jìn)行比對(duì),更好的識(shí)別申請(qǐng)對(duì)象提交的內(nèi)容。
2.4 圖像數(shù)據(jù)保存
圖像識(shí)別處理完畢之后,可以將識(shí)別出來的內(nèi)容分類保存到數(shù)據(jù)庫中,然后將識(shí)別結(jié)果提交給系統(tǒng),系統(tǒng)就通過人工智能完成預(yù)審,預(yù)審?fù)ㄟ^則可以在辦理窗口提交紙質(zhì)再來實(shí)現(xiàn)一窗式辦結(jié)。
3 不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別功能設(shè)計(jì)
不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別功能采用自動(dòng)化處理技術(shù),從系統(tǒng)接受不動(dòng)產(chǎn)登記圖像,然后利用嵌入到系統(tǒng)中的識(shí)別功能分析圖像內(nèi)容。不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別可以采用云計(jì)算和面向服務(wù)架構(gòu)技術(shù),為用戶提供一個(gè)并發(fā)的處理平臺(tái),為系統(tǒng)用戶操作提供一組接口組件,這些組件具有較強(qiáng)的可移植性、并發(fā)性、接入性等,非常易于操作和部署,具有重要的功能。具體的,系統(tǒng)處理架構(gòu)如圖l所示。
4 不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別處理關(guān)鍵技術(shù)研究
不動(dòng)產(chǎn)登記系統(tǒng)潛藏圖像識(shí)別技術(shù),這些技術(shù)也是當(dāng)前人工智能的一個(gè)重要研究方向,可以有效的完成圖像信息采集、特征檢測(cè)、特征提取、模式匹配、語義分析等技術(shù),獲取不動(dòng)產(chǎn)登記系統(tǒng)中圖像內(nèi)容,具有重要的作用和意義。具體的,不動(dòng)產(chǎn)登記系統(tǒng)中的關(guān)鍵技術(shù)很多,主要包括特征檢測(cè)、特征提取、模式匹配、語義分析等四個(gè)方面。
不動(dòng)產(chǎn)登記系統(tǒng)圖像識(shí)別可以使用攝像頭、傳感器采集外界的視頻圖像、文字語音信息,也可以直接接受網(wǎng)絡(luò)上傳數(shù)據(jù),然后就可以利用特征檢測(cè)技術(shù)對(duì)這些信息進(jìn)行預(yù)處理,獲取視頻圖像或語音文字中的目標(biāo)對(duì)象,標(biāo)定出這些目標(biāo)信息的輪廓大小。比如在一副圖像或一幀視頻中,其包含的內(nèi)容非常豐富,客觀物體的特征也較多,比如直方圖特征、模板各種、顏色特征、結(jié)構(gòu)特征等,特征檢測(cè)就是可以將有價(jià)值的信息挑出來,利用這些特征實(shí)現(xiàn)對(duì)象檢測(cè)。目前圖像識(shí)別能采用的圖像檢測(cè)方法非常多,比如神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、Adaboost等,這些算法是一種分類方法,能夠?qū)⑤^弱的分類方法集成在一起,構(gòu)建一個(gè)很強(qiáng)的分類方法。圖像檢測(cè)可以使用檢測(cè)算法挑選一些目標(biāo)對(duì)象矩形特征,按照加權(quán)投票方式為弱分類器構(gòu)建一個(gè)強(qiáng)分類器,然后通過訓(xùn)練學(xué)習(xí)就可以將強(qiáng)分類器串聯(lián)在一起,形成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類器,提高分類器的檢測(cè)速度。特征提取是圖像識(shí)別引入的另一個(gè)關(guān)鍵技術(shù)。由于視頻圖像、語音文本中包含的特征很多,經(jīng)過檢測(cè)之后,就可以將這些特征提取出來。特征提取是圖像識(shí)別學(xué)習(xí)建模的過程,又被人們稱為圖像表征描述,特征提取方法經(jīng)過分類可以劃分為兩個(gè)類別,分別是基于知識(shí)表征的方法,另一種是基于代數(shù)特征或統(tǒng)計(jì)學(xué)習(xí)表征方法。基于知識(shí)的表征方法可以根據(jù)目標(biāo)對(duì)象輪廓形狀以及距離度量特性獲取特征數(shù)據(jù),這個(gè)特征距離度量的種類包括曲率角度、歐氏距離等,目標(biāo)對(duì)象輪廓特征很多,可以將這些局部特征一一分解,利用局部特征之間的幾何結(jié)構(gòu),將常見的知識(shí)特征提取出來?;诖鷶?shù)特征和統(tǒng)計(jì)學(xué)習(xí)表征方法則是利用目標(biāo)對(duì)象像素的密度進(jìn)行統(tǒng)計(jì),然后可以充分的利用統(tǒng)計(jì)學(xué)的嚴(yán)密規(guī)則實(shí)現(xiàn)特征分離和提取,目前基于代數(shù)的特征提取方法包括K均值、密度聚類、譜聚類、支持向量機(jī)。
特征提取完畢之后,圖像識(shí)別就可以將這些特征與模式庫中保存的信息進(jìn)行匹配,匹配也是模式搜索、對(duì)比的過程。圖像識(shí)別可以設(shè)置一個(gè)模式匹配操作閩值,比如可以利用相似度作為度量,然后設(shè)置一個(gè)閾值,閩值設(shè)置完畢之后就可以進(jìn)行對(duì)比,如果相似度超過規(guī)定閾值,則判定模式匹配成功。目前,模式匹配最常用的算法為BM算法,這個(gè)算法是精確字符串匹配算法的改進(jìn),引入了模糊匹配的關(guān)鍵功能,能夠從右向左進(jìn)行數(shù)據(jù)比較,同時(shí)利用了啟發(fā)式的比較規(guī)則,也即是壞字符規(guī)則和好后綴規(guī)則,來決定向右跳躍的距離。BM算法實(shí)現(xiàn)模式匹配速度快,并發(fā)性好,更加適用于當(dāng)前的不動(dòng)產(chǎn)登記系統(tǒng),具有重要的作用。
模式匹配成功之后,圖像識(shí)別能需要將機(jī)器語言轉(zhuǎn)換為人們可以理解的自然語言,這樣就可以使用語義分析技術(shù),將識(shí)別的結(jié)果提供給人們,幫助人們進(jìn)行決策,比如下達(dá)下一步操作指令等。語義分析過程中,系統(tǒng)需要審查識(shí)別出來的每一個(gè)字符,針對(duì)字符進(jìn)行編譯,編譯可以按照系統(tǒng)規(guī)定的運(yùn)算實(shí)現(xiàn)邏輯處理,翻譯為自然語言,實(shí)現(xiàn)人機(jī)交互。
5 結(jié)束語
不動(dòng)產(chǎn)登記智能化管理是當(dāng)前電子政務(wù)發(fā)展的一個(gè)重要方向,可以極大的提高不動(dòng)產(chǎn)登記速度,方便群眾辦事。隨著不動(dòng)產(chǎn)登記的增多,利用掃描儀、攝像頭拍攝的照片日益增多,因此利用先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)構(gòu)建一個(gè)圖像識(shí)別功能,能夠提取圖像中潛藏的目標(biāo)對(duì)象特征,利用模式匹配分析圖像內(nèi)容,進(jìn)一步改進(jìn)不動(dòng)產(chǎn)登記效率,具有重要的作用和意義。
參考文獻(xiàn)
[1]羅維薇,基于圖像識(shí)別的火災(zāi)報(bào)警系統(tǒng)設(shè)計(jì)[J].自動(dòng)化與儀器儀表,2016 (01):177-178.
[2]鐘陽,李外云,金豫,基于圖像識(shí)別的智能文字閱讀系統(tǒng)[J],數(shù)字技術(shù)與應(yīng)用,2016(01):87-87.
[3]官洪運(yùn),許廣洋,于融正,基于云端的視頻圖像識(shí)別系統(tǒng)的實(shí)現(xiàn)[J].微型機(jī)與應(yīng)用,2016,35 (22):51-53.
[4]劉洋,黃欣,基于圖像識(shí)別的網(wǎng)上閱卷系統(tǒng)的設(shè)計(jì)[J].電子技術(shù)與軟件工程,2016 (19):90-91.
[5]嚴(yán)雷,楊曉剛,郭鴻飛等.結(jié)合圖像識(shí)別的移動(dòng)增強(qiáng)現(xiàn)實(shí)系統(tǒng)設(shè)計(jì)與應(yīng)用[J].中國(guó)圖象圖形學(xué)報(bào),2016,21(02):184-191.