亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

淺談模式識(shí)別之概要

2019-09-10 11:04:22李星星

學(xué)習(xí)與科普 2019年36期

摘要：模式識(shí)別（Pattern?recognition）是上世紀(jì)七八十年代的流行術(shù)語。它是對(duì)原始數(shù)據(jù)信號(hào)（圖像、語音、文字、視頻等）進(jìn)行分析、解釋，從而得到其類別屬性，繼而進(jìn)行判斷的過程。模式識(shí)別技術(shù)是人工智能的基礎(chǔ)技術(shù)，是機(jī)器學(xué)習(xí)（machine?learning）的一個(gè)分支。

關(guān)鍵詞：模式識(shí)別;類別屬性;機(jī)器學(xué)習(xí)

一、模式識(shí)別的定義

模式識(shí)別（Pattern?recognition）是上世紀(jì)七八十年代的流行術(shù)語。它是對(duì)原始數(shù)據(jù)信號(hào)（圖像、語音、文字、視頻等）進(jìn)行分析、解釋，從而得到它的類別屬性，繼而進(jìn)行判斷的過程[1-3]。模式識(shí)別技術(shù)是人工智能的基礎(chǔ)技術(shù)，是機(jī)器學(xué)習(xí)（machine?learning）的一個(gè)分支，從某種意義來說，模式識(shí)別幾乎等同于機(jī)器學(xué)習(xí)。機(jī)器學(xué)習(xí)是一門多領(lǐng)域的交叉學(xué)科，涉及概率論、統(tǒng)計(jì)學(xué)等多門學(xué)科，它是一類從給定的數(shù)據(jù)中自動(dòng)分析其規(guī)律，并且利用所獲得的規(guī)律對(duì)未知的樣本數(shù)據(jù)進(jìn)行預(yù)測(cè)的算法。一個(gè)典型的機(jī)器學(xué)習(xí)流程如圖1所示：

二、模式識(shí)別的基本流程

模式識(shí)別的基本流程一般包括數(shù)據(jù)采集，數(shù)據(jù)預(yù)處理，特征提取，特征選擇以及模型的架構(gòu)這幾個(gè)模塊，如圖2所示：

（1）數(shù)據(jù)采集

很顯然，數(shù)據(jù)采集過程是整個(gè)模式識(shí)別系統(tǒng)最基本的前提條件，一個(gè)具有良好性能的模式識(shí)別系統(tǒng)必定會(huì)首先獲得較好的數(shù)據(jù)集。通過采集到的數(shù)據(jù)，就可以進(jìn)行后續(xù)的預(yù)處理、特征提取、特征選擇、以及分類模型架構(gòu)等一系列的工作。一般而言，數(shù)據(jù)采集過程是需要借助相應(yīng)的硬件設(shè)備，比如說聲音傳感器、圖像傳感器等設(shè)備來采集相應(yīng)的數(shù)據(jù)。倘若所使用的傳感器靈敏度不高，或者說傳感器的精度不高，那么一定會(huì)對(duì)所采集到的數(shù)據(jù)產(chǎn)生噪聲污染。盡管后續(xù)過程中一般會(huì)通過預(yù)處理操作來處理相應(yīng)的數(shù)據(jù)，可以減少部分的噪聲污染，但是卻不能完全消除噪聲的干擾。因此，數(shù)據(jù)采集部分應(yīng)該盡量保證所得到的數(shù)據(jù)純正、干凈。而隨著模式識(shí)別技術(shù)的快速發(fā)展，很多無私的學(xué)者將自己所獲得的公認(rèn)的數(shù)據(jù)集公開分享在各數(shù)據(jù)庫中，從而方便廣大的學(xué)術(shù)研究者方便使用。

（2）預(yù)處理

在模式識(shí)別技術(shù)領(lǐng)域內(nèi)，預(yù)處理的過程一般是指去除噪聲干擾，增強(qiáng)有效信息的過程。過程1）中也提到，在數(shù)據(jù)的采集過程中，不可避免地會(huì)引入一些干擾的因素。比如說，噪聲污染以及無效信息的引入等因素，這不僅會(huì)增加后續(xù)處理過程的復(fù)雜性，而且也會(huì)影響整個(gè)分類模型的性能。因此，預(yù)處理過程是模式識(shí)別系統(tǒng)中的一個(gè)必要的過程。但是需要注意的是，盡管預(yù)處理的功能基本上都是減弱甚至消除噪聲的干擾，同時(shí)也會(huì)加強(qiáng)有效信息的信息度，然而，對(duì)于不同的領(lǐng)域?qū)ο?，不同的特征，其預(yù)處理的方法也是千姿百態(tài)的。

（3）特征提取

一般來說，從傳感器中直接獲得的數(shù)據(jù)屬于原始測(cè)量空間的數(shù)據(jù)，然而原始測(cè)量空間中的數(shù)據(jù)是無法直接用來進(jìn)行判別分類的;或者說，直接利用原始測(cè)量空間中所得到的數(shù)據(jù)來進(jìn)行判別分類，其效果往往不盡如意。一般來說，需要將數(shù)據(jù)從原始的測(cè)量空間中轉(zhuǎn)換到二次空間中，也即特征空間。特征提取是計(jì)算機(jī)視覺和圖像處理中的一個(gè)概念。其指的是利用計(jì)算機(jī)來提取圖像信息，決定每個(gè)圖像的點(diǎn)是否屬于一個(gè)圖像特征。不同的領(lǐng)域內(nèi)，特征提取的方法也有所不同，有文本特征向量提取，視覺圖像特征提取，局部LBP特征等等。

（4）特征選擇

在經(jīng)過數(shù)據(jù)采集，數(shù)據(jù)預(yù)處理，特征提取過程之后，數(shù)據(jù)就從原始的測(cè)量空間中轉(zhuǎn)換到二次特征空間，而此時(shí)所提取的特征不一定是我們所最需要的特征，其中包含了大量的不相關(guān)以及冗余的特征，對(duì)最終的分類判別不一定有很好的效果。這些不相關(guān)或者冗余的特征不僅會(huì)極大地增加計(jì)算的復(fù)雜性，而且還會(huì)減弱分類器的分類性能。因此，模式識(shí)別過程中，需要進(jìn)行特征選擇，其作用就是從所提取的特征中去除那些不相關(guān)以及冗余的特征，從而挑選出對(duì)模式最終判別分類效果最好的特征，其實(shí)這也是一個(gè)尋優(yōu)問題。

（5）分類判別模型架構(gòu)

在經(jīng)過特征選擇技術(shù)后，就需要對(duì)所選擇出的特征進(jìn)行判別分類。一般來說，簡(jiǎn)單點(diǎn)的分類判別方法其實(shí)就是將特征表示為向量的形式。然后，利用像歐氏距離、馬氏距離、卡方距離、范數(shù)等手段來計(jì)算任意兩個(gè)向量之間的相似性，最后再根據(jù)計(jì)算所得到的向量之間的相似性來進(jìn)行分類判別。復(fù)雜點(diǎn)的分類判別方法是利用SVM、ANN、貝葉斯判別等方法將特征進(jìn)行某種線性或者非線性的變換，從而在變換后的空間進(jìn)行二次分類。

三、完整的模式識(shí)別過程

一個(gè)完整的模式識(shí)別過程包括三個(gè)步驟：學(xué)習(xí)模塊、訓(xùn)練模塊以及驗(yàn)證模塊，可以用如圖3來進(jìn)行表示

上述是對(duì)整個(gè)模式識(shí)別里面一些基本而又非常重要的概念、流程的簡(jiǎn)單介紹，也是學(xué)號(hào)模式識(shí)別與機(jī)器學(xué)習(xí)所要了解的基本知識(shí)，以可視化的圖形更易于去理解。

參考文獻(xiàn)

[1]楊淑瑩，張樺.模式識(shí)別與智能計(jì)算：MATLAB技術(shù)實(shí)現(xiàn)[M].City：電子工業(yè)出版社，2015.

[2]Fred A，Marsico M D.Pattern Recognition Applications and Methods[J].Advances in Intelligent Systems & Computing，2015，318：1-2.

作者簡(jiǎn)介：李星星，1991.4，男，江西九江，廣州工商學(xué)院，無，模式識(shí)別與圖像處理。