沈文杰
(福建農(nóng)業(yè)職業(yè)技術(shù)學(xué)院,福建 福州 350119)
如今,多種形式的先進(jìn)拍照技術(shù)越來越普及,網(wǎng)絡(luò)的圖像保存量越來越大,廣泛存在于社交過程與圖像搜索的過程中。圖像可涉及豐富的信息數(shù)據(jù),部分不能借助語言和文學(xué)表達(dá)的場景都能通過圖像進(jìn)行充分呈現(xiàn),因此怎樣高效率地運(yùn)用圖像數(shù)據(jù)備受學(xué)術(shù)界以及工業(yè)界相關(guān)人員的重視。機(jī)械學(xué)習(xí)分析結(jié)合生理學(xué)知識(shí)與認(rèn)知科學(xué)知識(shí),創(chuàng)設(shè)與人們學(xué)習(xí)過程相匹配的模型,創(chuàng)新理論與方法,形成任務(wù)模式的結(jié)構(gòu)體系,立足于機(jī)器學(xué)習(xí)進(jìn)行圖像協(xié)同分類系統(tǒng)設(shè)計(jì)是強(qiáng)化圖像加工的優(yōu)質(zhì)手段,為此筆者具體、詳細(xì)地開展了相關(guān)研究。
機(jī)器學(xué)習(xí)算法研究對(duì)應(yīng)信息,在權(quán)重分配與其他類型參數(shù)的參考之下增強(qiáng)性能、實(shí)現(xiàn)目的這一過程就是“學(xué)習(xí)”的內(nèi)涵。掌握機(jī)器學(xué)習(xí)信息集十分關(guān)鍵,通常把最初信息劃分為訓(xùn)練集以及測試集,前者進(jìn)行分類器訓(xùn)練,也就是借助學(xué)習(xí)過程整理模型,在完成訓(xùn)練后,根據(jù)測試集對(duì)分類器進(jìn)行預(yù)測。針對(duì)圖像種類的信息源,以機(jī)器學(xué)習(xí)為主的圖像分類應(yīng)該獲取圖像基礎(chǔ)特點(diǎn),后續(xù)構(gòu)建特征向量,借助機(jī)器學(xué)習(xí)算法實(shí)現(xiàn)綜合分類器的性能,并將其視作預(yù)測樣本信息的有效工具[1]。近年來,機(jī)器學(xué)習(xí)算法分類器往往被運(yùn)用于制作BOW模型以及pbM模型的過程中,且成效較好。機(jī)器學(xué)習(xí)分類種類繁多,例如決策樹算法、K最近鄰算法等。任何類型的機(jī)器學(xué)習(xí)算法都存在局限,決策樹的局限就是僅在計(jì)算對(duì)應(yīng)信息時(shí)可獲取顯著成效。對(duì)樸素貝葉斯算法來說,應(yīng)將其作用于簡短文本中,決策樹處理簡短文本的成效不如樸素貝葉斯算法,因此要有針對(duì)性地挑選機(jī)器學(xué)習(xí)計(jì)算方法。
經(jīng)過一系列的分析,機(jī)器學(xué)習(xí)算法對(duì)圖像進(jìn)行分類的成效受到以下3個(gè)因素的影響:1) 圖像提取算法。優(yōu)質(zhì)的圖像提取算法可控制縮放與反射等外在因素的制約,全方位凸顯圖像信息。2) 機(jī)器學(xué)習(xí)算法分類器的性能設(shè)置。關(guān)聯(lián)向量機(jī)算法應(yīng)創(chuàng)設(shè)對(duì)應(yīng)核函數(shù),如果選取樸素貝葉斯應(yīng)嚴(yán)格要求樣本獨(dú)立性、引進(jìn)K最近鄰算法時(shí)應(yīng)確保K值穩(wěn)定且引進(jìn)決策樹算法時(shí)應(yīng)對(duì)樹進(jìn)行加工[2]。3) 圖像特征信息的多樣化。如果圖像比較單一,那么傳遞信息的過程就會(huì)存在難度,提倡綜合篩選多種類型的信息數(shù)據(jù),這樣就能提高圖像的表達(dá)性能,還可以達(dá)到有效強(qiáng)化圖像分類效率的目的。在當(dāng)前的系統(tǒng)編制中,對(duì)圖像特征向量的精確度進(jìn)行研究是一種相對(duì)可靠的方式,也是后續(xù)研究的關(guān)鍵點(diǎn),在很大程度上可以帶動(dòng)圖像分類系統(tǒng)的運(yùn)作與創(chuàng)新。
機(jī)器學(xué)習(xí)主要是進(jìn)行數(shù)據(jù)加工,以信息的形式輸出相關(guān)信息。第一種形式便是監(jiān)督學(xué)習(xí),也就是在某種情況下分析函數(shù),在接收全新信息數(shù)據(jù)的狀態(tài)下對(duì)函數(shù)進(jìn)行結(jié)果評(píng)估。監(jiān)督學(xué)習(xí)包括輸入過程與輸出過程,在訓(xùn)練集中通過人員自主標(biāo)注,監(jiān)督學(xué)習(xí)有決策樹學(xué)習(xí)類型與最近鄰居法類型[3]。監(jiān)督學(xué)習(xí)選取詞匯的出發(fā)點(diǎn)是分類,根據(jù)經(jīng)驗(yàn)法則降低信息數(shù)據(jù)面臨風(fēng)險(xiǎn)的概率,也就是經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化。第二種形式便是無監(jiān)督學(xué)習(xí),根據(jù)循環(huán)以及遞減運(yùn)算規(guī)律對(duì)信息誤差現(xiàn)象進(jìn)行規(guī)避,從而合理地對(duì)數(shù)據(jù)信息進(jìn)行分類。不需要給計(jì)算機(jī)發(fā)送指令,而是計(jì)算機(jī)自主完成數(shù)據(jù)統(tǒng)計(jì),由于不存在事先安排的樣本信息,因此可提高監(jiān)督學(xué)習(xí)方法的運(yùn)用率,對(duì)機(jī)器學(xué)習(xí)的模式進(jìn)行整合與加工,具體的機(jī)器學(xué)習(xí)算法圖像分類過程如圖1所示。
圖1 機(jī)器學(xué)習(xí)算法的圖像分類過程
基于機(jī)器學(xué)習(xí)構(gòu)建圖像協(xié)同分類系統(tǒng)體系,借助計(jì)算機(jī)定量研究圖像信息,對(duì)圖像的多個(gè)組成部分進(jìn)行類別判斷,替換人們的視覺感知。圖像協(xié)同分類系統(tǒng)是圖像檢索的內(nèi)在條件,分類系統(tǒng)可自動(dòng)化地處理樣本圖像,形成對(duì)應(yīng)訓(xùn)練模型,由此全方位預(yù)測其他類型的數(shù)據(jù)圖像。系統(tǒng)的特征以并行性與協(xié)同性為主,按照多種形式機(jī)器學(xué)習(xí)算法設(shè)計(jì)模型,關(guān)聯(lián)機(jī)器學(xué)習(xí)預(yù)測結(jié)果并記錄類別歸屬信息。機(jī)器學(xué)習(xí)算法是到現(xiàn)在為止比較穩(wěn)定的思路,尤其是決策樹算法與樸素貝葉斯算法[4]。針對(duì)圖像協(xié)同分類系統(tǒng)結(jié)構(gòu),引進(jìn)C/S模式,圍繞網(wǎng)絡(luò)平臺(tái)對(duì)客戶端進(jìn)行設(shè)置,利用C++語言編寫程序,對(duì)應(yīng)的服務(wù)器端MySQL數(shù)據(jù)庫在重要信息的保存與預(yù)測中可以發(fā)揮重要作用。
3.2.1 非功能性層面
在設(shè)計(jì)圖像協(xié)同分類系統(tǒng)之后,將其保存在一般模式的計(jì)算機(jī)中,由于系統(tǒng)訓(xùn)練以及樣本評(píng)估體現(xiàn)了信息的不確定性,要思考信息量大的情況,也就是輸入大量圖像,判斷系統(tǒng)是否能穩(wěn)定、安全地運(yùn)行,并輸出預(yù)測結(jié)果信息。因此系統(tǒng)的設(shè)計(jì)應(yīng)滿足以下5點(diǎn)要求:1) 減少內(nèi)存消耗,由于圖像分類過程給予圖像信息的每種處理方式都要保存在內(nèi)存中,科學(xué)的保存結(jié)構(gòu)能夠降低大比例占用內(nèi)存的概率,因此可挑選流式加載處理技術(shù)。2) 減少樣本訓(xùn)練需求的時(shí)間,引進(jìn)并行化理念處理樣本[5]。3) 保證預(yù)測結(jié)果的精準(zhǔn)度。傳統(tǒng)的預(yù)測方式僅選取相同機(jī)器學(xué)習(xí)算法,在圖像協(xié)同分類系統(tǒng)設(shè)計(jì)中應(yīng)利用多個(gè)機(jī)器學(xué)習(xí)方式來提升準(zhǔn)確率。4) 保持信息庫的讀寫分離狀態(tài),讀寫分離要求信息庫閱讀操作與寫作操作互相分割,由此緩解信息庫IO的壓力或者將外界環(huán)境中的讀寫請(qǐng)求均勻地分配到多個(gè)信息庫中。信息庫結(jié)合事物處理的性質(zhì)完成類別判斷,即主信息庫與從信息庫,前者實(shí)施寫作環(huán)節(jié),后者實(shí)施閱讀環(huán)節(jié)。5) 高維特征向量引保持降維的特征。數(shù)字圖像加工領(lǐng)域內(nèi)包括許多降維形式,尤其是PCA形式,關(guān)聯(lián)計(jì)算均值、方差與協(xié)方差矩陣計(jì)算等,需要用到的便是均值計(jì)算與方差計(jì)算,把矩陣的實(shí)際均值與方差信息視作圖像紋理的典型特點(diǎn)。
3.2.2 功能性需求層面
功能性需求是根據(jù)圖像協(xié)同分類系統(tǒng)布設(shè)要求分類別地對(duì)系統(tǒng)基礎(chǔ)進(jìn)行操作與劃分,思考如何設(shè)定參數(shù)、如何計(jì)算特征、如何預(yù)測樣本信息與如何統(tǒng)計(jì)最終結(jié)果等[6]。
完整的圖像協(xié)同分類系統(tǒng)設(shè)計(jì)應(yīng)該包括4層,詳細(xì)介紹如下。
3.3.1 設(shè)計(jì)系統(tǒng)的第一層——UI界面層
設(shè)計(jì)UI界面層,也就是為用戶提供可視化界面,以該界面為基礎(chǔ)對(duì)信息數(shù)據(jù)進(jìn)行傳遞。用戶可以直接感受UI界面層,親自觀察分類系統(tǒng)是如何處理圖像信息的,獲取具有價(jià)值的階段性數(shù)據(jù)。根據(jù)桌面應(yīng)用流程進(jìn)行標(biāo)準(zhǔn)化設(shè)計(jì),體現(xiàn)本地實(shí)時(shí)計(jì)算與迅速訪問的優(yōu)勢[7],它可以執(zhí)行參數(shù)設(shè)置、計(jì)算特征、訓(xùn)練樣本與預(yù)測樣本結(jié)果等操作,用戶可以在興趣愛好的驅(qū)使下進(jìn)行自主選取。
3.3.2 設(shè)計(jì)系統(tǒng)的第二層——邏輯控制層
邏輯控制層作為數(shù)據(jù)處理層以及UI界面層的鏈接媒介,首先是把UI界面層內(nèi)的信息數(shù)據(jù)發(fā)送到處理層結(jié)構(gòu)中;其次,把處理層獲取的結(jié)數(shù)據(jù)轉(zhuǎn)移到控制層中,通過恰當(dāng)?shù)男问奖4嬖赨I界面層中;最后,控制層有針對(duì)性地對(duì)信息數(shù)據(jù)進(jìn)行操作,促使處理層內(nèi)信息的真實(shí)性不受影響,安全、穩(wěn)定地運(yùn)作數(shù)據(jù)處理層。需要注意的是,信息真實(shí)性不受影響主要是執(zhí)行模塊在信息傳遞期間不會(huì)更改數(shù)據(jù),控制層安設(shè)讀寫鎖,全部的執(zhí)行模塊在傳遞信息之前都應(yīng)通過讀寫鎖的檢驗(yàn)后再開展繼續(xù)作業(yè),不然會(huì)一直保持等待狀態(tài)。在該過程及時(shí)納入并行化處理技術(shù),也就是發(fā)揮多線程技術(shù)的作用[8]。控制層在分析硬件數(shù)據(jù)與資源利用情況之后啟動(dòng)線程數(shù)據(jù),讓系統(tǒng)保持較高的信息處理效率,可以說線程也是工作線程的簡稱。如果某個(gè)線程在任務(wù)加工期間出現(xiàn)停止的情況,那么控制層會(huì)及時(shí)感知異常,啟動(dòng)其他形式的線程進(jìn)行替換,以完成尚未被全面加工的任務(wù)。發(fā)布新任務(wù)之后,如果控制層線程數(shù)目不多,就要適當(dāng)?shù)匾M(jìn)線程,此時(shí)控制層創(chuàng)設(shè)線層模塊來完成任務(wù),控制層規(guī)避線程調(diào)整的數(shù)目,也就是Mater-Worker模式,借助系統(tǒng)的整體資源,在不制約處理層運(yùn)作效率的基礎(chǔ)上不出現(xiàn)資源浪費(fèi)的現(xiàn)象,由此妥善完成邏輯控制層的核心任務(wù)。對(duì)應(yīng)的邏輯控制核心和相鄰兩層交互結(jié)構(gòu)圖如圖2所示。
圖2 邏輯控制核心和相鄰兩層交互結(jié)構(gòu)圖
3.3.3 設(shè)計(jì)系統(tǒng)的第三層——數(shù)據(jù)處理層
將數(shù)據(jù)處理層劃分為線程模塊、讀寫鎖模塊、大信息塊以及階段性信息傳遞模塊等。
3.3.3.1 設(shè)計(jì)線程模塊
線程模塊作為圖像協(xié)同分類系統(tǒng)的核心結(jié)構(gòu),大多數(shù)情況下它可以運(yùn)作多個(gè)類型的線程,任何線程都要求分配任務(wù),對(duì)應(yīng)任務(wù)涉及計(jì)算切割完成的小信息塊與傳遞控制層的信息結(jié)果。
3.3.3.2 設(shè)計(jì)讀寫鎖模塊
被加工的信息往往來源于磁盤文件,并且許多信息數(shù)據(jù)被保存在文件結(jié)構(gòu)中,尤其是訓(xùn)練模型與訓(xùn)練樣本集文件,利用數(shù)據(jù)處理層的安全來保證讀寫環(huán)節(jié)的正常運(yùn)作[9],可以將一些讀寫操作存在多個(gè)線程之內(nèi),如果在相同時(shí)刻進(jìn)行讀寫,就會(huì)缺少保護(hù)方案,可能出現(xiàn)文件信息不能真實(shí)傳遞的結(jié)果。另外,考慮閱讀文件的概率比較大,因此可擬定讀寫鎖來保障安全性。而不需要文件與讀寫鎖一一對(duì)應(yīng),而是適當(dāng)?shù)卦O(shè)置讀寫鎖的數(shù)量即可,不然大量讀寫鎖會(huì)制約系統(tǒng)性能的發(fā)揮。因此協(xié)同分類系統(tǒng)設(shè)計(jì)可對(duì)關(guān)鍵類型的文件配置讀寫鎖,為信息數(shù)據(jù)傳遞的真實(shí)性提供保障。
3.3.3.3 設(shè)計(jì)大信息塊
切割大信息塊的第一個(gè)形式就是基于個(gè)體的形式對(duì)樣本庫進(jìn)行劃分,這樣樣本個(gè)體都是單一化的信息塊。第二個(gè)形式便是為多維向量設(shè)置一定維度,這樣任何維度中的數(shù)據(jù)信息都是小信息塊。
3.3.3.4 設(shè)計(jì)階段性信息傳遞模塊
數(shù)據(jù)處理層主要進(jìn)行密集化的數(shù)據(jù)統(tǒng)計(jì),涉及樣本訓(xùn)練信息與樣本分析結(jié)果信息。操作加工的每個(gè)環(huán)節(jié)都與階段性信息傳遞存在關(guān)聯(lián),把信息傳遞給邏輯控制層,即保存在本地磁盤內(nèi)。還可以把信息傳遞給保存層,即向信息庫內(nèi)輸入信息數(shù)據(jù)。
3.3.4 設(shè)計(jì)系統(tǒng)的第四層——數(shù)據(jù)存儲(chǔ)層
圖像協(xié)同分類系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。數(shù)據(jù)存儲(chǔ)層是最后一層,存在于信息庫服務(wù)器的端口部位,對(duì)數(shù)據(jù)處理層發(fā)布的信息處理指令進(jìn)行響應(yīng)。數(shù)據(jù)存儲(chǔ)層借助MySQL信息庫,由于信息庫讀寫頻率是存在差異的,因此這一個(gè)層次不僅有唯一的信息庫,而且還包括許多信息庫。主信息庫進(jìn)行請(qǐng)求書寫,從信息庫發(fā)出響應(yīng)度請(qǐng)求。前者促使負(fù)載維持均衡,讓信息庫長時(shí)間運(yùn)作;后者借助主從復(fù)制實(shí)現(xiàn)同步信息統(tǒng)計(jì),根據(jù)讀寫分離技術(shù)強(qiáng)化信息庫整體并發(fā)負(fù)載水平,由此完整地設(shè)計(jì)基于機(jī)器學(xué)習(xí)的圖像協(xié)同分類系統(tǒng),把信息數(shù)據(jù)的處理作業(yè)推向高層次發(fā)展。
綜上所述,開展對(duì)基于機(jī)器學(xué)習(xí)的圖像協(xié)同分類系統(tǒng)的研究具有重要的價(jià)值,網(wǎng)絡(luò)發(fā)展讓圖像發(fā)展成為比較關(guān)鍵的信息源,圖像分類作為創(chuàng)新圖像檢索技術(shù)的有效途徑,相關(guān)人員要加大力度對(duì)機(jī)器學(xué)習(xí)的性能進(jìn)行研究,優(yōu)化圖像協(xié)同分類系統(tǒng)設(shè)置,爭取在較短時(shí)間內(nèi)獲取數(shù)據(jù)信息處理的最大化效果,增強(qiáng)信息統(tǒng)計(jì)的真實(shí)性與準(zhǔn)確性。