爾雅莉
(山西晉中理工學(xué)院 山西省晉中市 030060)
在互聯(lián)網(wǎng)時(shí)代背景下,隨著人工智能技術(shù)不斷發(fā)展以及在現(xiàn)實(shí)生活中的深入應(yīng)用,相關(guān)技術(shù)理念也得到了廣泛普及,人們已經(jīng)對(duì)人工智能不再感到陌生。尤其是對(duì)智能識(shí)別技術(shù)而言,當(dāng)下該項(xiàng)技術(shù)已經(jīng)在人們?nèi)粘9ぷ魃钪械玫搅藦V泛應(yīng)用。比如智能語(yǔ)音識(shí)別技術(shù)、人臉識(shí)別技術(shù)等。通過(guò)對(duì)這些智能識(shí)別技術(shù)應(yīng)用實(shí)踐進(jìn)行討論分析,并認(rèn)識(shí)到其中的技術(shù)發(fā)展瓶頸,提出一些解決策略,這對(duì)于推動(dòng)智能識(shí)別技術(shù)實(shí)現(xiàn)可持續(xù)深入發(fā)展有著重要的現(xiàn)實(shí)意義。
1.1.1 二維碼識(shí)別技術(shù)
當(dāng)前,隨著智能手機(jī)以及其他智能設(shè)備的普及,人們對(duì)二維碼識(shí)別技術(shù)已經(jīng)不再陌生,作為條形碼識(shí)別技術(shù)一種,二維碼識(shí)別技術(shù)能夠呈現(xiàn)一種形式各異但排列規(guī)律的平面圖形,每個(gè)不同圖形背后都有唯一的功能,“存儲(chǔ)”不同的信息,實(shí)現(xiàn)對(duì)數(shù)據(jù)符號(hào)信息的記錄;該項(xiàng)技術(shù)在代碼編制方面,充分利用了構(gòu)成計(jì)算機(jī)內(nèi)部邏輯基礎(chǔ)的“0”、“1”比特流概念,采用一些二進(jìn)制相對(duì)應(yīng)的幾何形體,來(lái)進(jìn)行文字信息的展示。我們可以借助智能設(shè)備,對(duì)這些二維碼進(jìn)行掃描,便能夠自動(dòng)進(jìn)行圖像識(shí)別,啟動(dòng)背后的程序,實(shí)現(xiàn)信息的自動(dòng)化處理。二維碼在進(jìn)行信息表達(dá)時(shí),既能在橫向方位表達(dá)信息,又在縱向方位表達(dá)信息,因此即使二維碼面積很小,也能夠成功表達(dá)大量的信息[1]。在具體應(yīng)用方面,二維碼除了用于現(xiàn)金支付,還可以用于互加好友、賬戶登錄等功能,只需要輕輕一掃,即可完成復(fù)雜操作,為人們娛樂(lè)、生活、工作帶來(lái)極大便利。
1.1.2 文字翻譯識(shí)別技術(shù)
機(jī)器翻譯智能識(shí)別技術(shù),能夠?qū)ξ淖诸愋畔⑦M(jìn)行智能識(shí)別,而再次進(jìn)行識(shí)別結(jié)果呈現(xiàn)時(shí),又能夠以另一種文字形式呈現(xiàn),從而達(dá)到不同語(yǔ)言轉(zhuǎn)換翻譯的效果。當(dāng)下該項(xiàng)智能識(shí)別技術(shù)也已經(jīng)逐漸應(yīng)用成熟化,在一些翻譯軟件比如谷歌翻譯、有道翻譯等得到了廣泛的應(yīng)用。但當(dāng)下這種文字翻譯技術(shù)依然有著很大的進(jìn)步空間,由于文字之間的連接主要靠語(yǔ)法,而語(yǔ)法比較靈活多變,在文字翻譯識(shí)別方面,尚未達(dá)到語(yǔ)法完全正確表達(dá)的目標(biāo),一般翻譯地均比較直接,且有很多語(yǔ)法錯(cuò)誤,并且無(wú)法對(duì)文章整體進(jìn)行智能識(shí)別判斷再進(jìn)行合適的翻譯,因此未來(lái)仍需要加強(qiáng)研究。
1.1.3 物流運(yùn)輸識(shí)別技術(shù)
當(dāng)下關(guān)于物流運(yùn)輸識(shí)別,多是依靠RFID 技術(shù)(指射頻識(shí)別技術(shù)),通過(guò)借助閱讀器與標(biāo)簽之間進(jìn)行非接觸式的數(shù)據(jù)通信,達(dá)到識(shí)別目標(biāo)的目的。如今隨著物流產(chǎn)業(yè)的快速發(fā)展,已經(jīng)難以滿足用戶對(duì)倉(cāng)儲(chǔ)生產(chǎn)率以及物流系統(tǒng)準(zhǔn)確識(shí)別的要求?;诖?,在當(dāng)下射頻識(shí)別技術(shù)之上,在物流運(yùn)輸中出現(xiàn)了一種新的識(shí)別技術(shù),即RFMs Pro 追蹤系統(tǒng),系統(tǒng)能夠通過(guò)創(chuàng)新的模塊化設(shè)計(jì),為不同的物流應(yīng)用情況快速地修改機(jī)械結(jié)構(gòu),實(shí)現(xiàn)物流的精準(zhǔn)化識(shí)別。在具體實(shí)踐過(guò)程中,還能夠結(jié)合用戶現(xiàn)有的物流基礎(chǔ)設(shè)施和物料流,靈活進(jìn)行設(shè)計(jì)。在物流運(yùn)輸方面,用戶無(wú)需親自進(jìn)行客戶物流產(chǎn)品掃描,只需將物流產(chǎn)品放置到傳送帶上,使其穿過(guò)系統(tǒng)智能識(shí)別通道,通道中的識(shí)別應(yīng)答器始終能夠準(zhǔn)確進(jìn)行對(duì)經(jīng)過(guò)物體的識(shí)別,無(wú)論物體呈現(xiàn)何種姿態(tài),抑或是物流傳輸速度如何快,該系統(tǒng)均能夠?qū)ξ锲沸畔⑦M(jìn)行精準(zhǔn)地識(shí)別,能夠顯著提升物流運(yùn)輸識(shí)別的效率。不僅如此,即使在傳送帶因故障停止運(yùn)行,在后續(xù)故障解除后,系統(tǒng)依然能夠從原始中斷地方,繼續(xù)進(jìn)行運(yùn)行,因此不會(huì)對(duì)正常物流運(yùn)輸帶來(lái)影響。在實(shí)際進(jìn)行物流運(yùn)輸時(shí),針對(duì)部分物品雖然配置了RFID 標(biāo)簽,但由于不需要記錄登記,因此被遺留在接近倉(cāng)庫(kù)附近物流的區(qū)域。RFMs Pro 追蹤系統(tǒng)軟件在實(shí)際進(jìn)行識(shí)別時(shí),也能夠采用過(guò)濾器,保證這些物品不會(huì)被系統(tǒng)識(shí)別記錄,從而有效保障了物流出貨站不會(huì)出現(xiàn)發(fā)貨錯(cuò)誤的問(wèn)題。不僅如此,RFMs Pro 追蹤系統(tǒng)還能對(duì)物流產(chǎn)品包裝進(jìn)行檢查,并將其與訂單信息對(duì)比,確保二者信息一致,從而有效降低運(yùn)輸信息錯(cuò)誤或者數(shù)量錯(cuò)誤的可能性。除此之外,RFMs Pro 追蹤系統(tǒng)還能夠借助集成條碼掃描器、二維碼閱讀器等,來(lái)對(duì)物流運(yùn)輸物體尺寸、體積等參數(shù)進(jìn)行識(shí)別策略,從而為后續(xù)物流運(yùn)輸定制高端識(shí)別解決方案,確保整個(gè)物流運(yùn)輸均能夠穩(wěn)定順利運(yùn)行。
1.2.1 語(yǔ)音識(shí)別技術(shù)
圖1:面部識(shí)別時(shí)的關(guān)鍵特征點(diǎn)示例
圖2:深度學(xué)習(xí)過(guò)程
語(yǔ)音識(shí)別技術(shù)主要識(shí)別對(duì)象是人類的語(yǔ)音,并通過(guò)分析語(yǔ)音具體的表達(dá),來(lái)將語(yǔ)音信息轉(zhuǎn)化為文字信息,從而為人們交流溝通帶來(lái)了較大的便利。在具體應(yīng)用方面,如今很多通信以及手機(jī)游戲APP 均配置了語(yǔ)音識(shí)別轉(zhuǎn)換功能,比如“微信”、“王者榮耀”等,這些軟件均能夠支持語(yǔ)音與文字的發(fā)送,并且還能夠促使二者實(shí)現(xiàn)相互轉(zhuǎn)換,且有著非常高的準(zhǔn)確轉(zhuǎn)化率。除此之外,在語(yǔ)音識(shí)別技術(shù)方面,一些智能家居、車載智能語(yǔ)音助手等也進(jìn)行了相關(guān)的應(yīng)用,這些人工智能系統(tǒng)能夠智能識(shí)別人類語(yǔ)音,然后根據(jù)具體的語(yǔ)音表達(dá)含義,完成相關(guān)的操作[2]。但這些語(yǔ)音識(shí)別有著一定的范圍,且語(yǔ)音指令一般不能太過(guò)復(fù)雜,很多語(yǔ)音識(shí)別只能針對(duì)特定的功能,因此這種智能識(shí)別技術(shù)在未來(lái)仍有著較大的發(fā)展空間。除此之外,在具體實(shí)踐應(yīng)用中,語(yǔ)音智能識(shí)別技術(shù)還需要徹底攻克兩大難題,一是環(huán)境噪聲干擾問(wèn)題,二是方言口音問(wèn)題。
1.2.2 面部識(shí)別技術(shù)
面部識(shí)別技術(shù)是一種非常復(fù)雜的智能識(shí)別技術(shù),在具體識(shí)別過(guò)程中,需要先采集人臉信息,然后對(duì)采集的面部信息進(jìn)行分析,找出其中的關(guān)鍵特征,最后,再將這些關(guān)鍵特征與面部模型庫(kù)進(jìn)行對(duì)比,若能夠成功匹配,便能夠?qū)崿F(xiàn)身份信息識(shí)別確認(rèn)。2014年是面部識(shí)別技術(shù)應(yīng)用的轉(zhuǎn)折點(diǎn),這一年人們正式將面部識(shí)別技術(shù)應(yīng)用到現(xiàn)實(shí)場(chǎng)景之中。早期面部識(shí)別多應(yīng)用考勤門(mén)禁、智能安防以及金融領(lǐng)域,如今隨著面部識(shí)別技術(shù)的日趨成熟,識(shí)別準(zhǔn)確性不斷提升,其應(yīng)用范圍也得到了有效的擴(kuò)展,比如在國(guó)內(nèi)很多省份中,在高考場(chǎng)合也引入了面部識(shí)別系統(tǒng),除此之外,一些手機(jī)APP 也進(jìn)行了人臉識(shí)別技術(shù)的應(yīng)用,比如支付寶、滴滴等在身份識(shí)別或者支付時(shí)可以應(yīng)用面部識(shí)別,一些游戲APP 也配置了“捏臉”功能,能夠通過(guò)識(shí)別自身面孔,再進(jìn)行“捏臉改進(jìn)”。面部智能識(shí)別技術(shù)在上述場(chǎng)景的應(yīng)用,均為人們的工作學(xué)習(xí)娛樂(lè)生活帶來(lái)的諸多便利,圖1 便是面部識(shí)別時(shí)的關(guān)鍵特征點(diǎn)示例。
1.2.3 步態(tài)識(shí)別技術(shù)
與上文提到的人臉、語(yǔ)音識(shí)別技術(shù)相比,步態(tài)識(shí)別技術(shù)起到最為顯著的突破便是從“靜態(tài)生命特征識(shí)別”轉(zhuǎn)為了“動(dòng)態(tài)生命特征識(shí)別”,因此在具體的識(shí)別流程方面,通常也更加得復(fù)雜。在大部分情況下,進(jìn)行人臉、語(yǔ)音等識(shí)別時(shí),都需要人進(jìn)行一定程度的配合,并且在識(shí)別時(shí),要求人與識(shí)別設(shè)備保持較近的距離,才能有效保障識(shí)別的準(zhǔn)確度。而步態(tài)識(shí)別則能夠進(jìn)行遠(yuǎn)距離識(shí)別,且整個(gè)識(shí)別過(guò)程不需要人專門(mén)的進(jìn)行配合。在常規(guī)環(huán)境下,應(yīng)用步態(tài)智能識(shí)別技術(shù)是,識(shí)別距離能夠達(dá)到50 米。如果識(shí)別設(shè)備采用的是4K 高清攝像頭,那么步態(tài)識(shí)別距離甚至可達(dá)100 米。并且整個(gè)識(shí)別過(guò)程是通過(guò)對(duì)人全身進(jìn)行360 度掃描識(shí)別,因此識(shí)別范圍更廣,適應(yīng)性更強(qiáng)。與上述幾種靜態(tài)識(shí)別技術(shù)相同的地方在于,步態(tài)識(shí)別也會(huì)面臨一定的干擾影響,但相較于靜態(tài)識(shí)別帶來(lái)的干擾,步態(tài)識(shí)別面臨的干擾顯然更小。究其原因在于,首先步態(tài)識(shí)別距離較遠(yuǎn),因此有足夠的時(shí)間與空間進(jìn)行識(shí)別過(guò)程調(diào)整,并且有效去除干擾的影響。與此同時(shí),由于步態(tài)識(shí)別能夠?qū)θ硇畔⑦M(jìn)行識(shí)別,因此即使外界光照存在明顯的變化,或者識(shí)別的人衣物發(fā)生變化,甚至面部被完全遮擋,依然不會(huì)對(duì)最終識(shí)別結(jié)果帶來(lái)影響。因此步態(tài)識(shí)別適應(yīng)性更廣,且更加靈活高效。更為重要的是,步態(tài)識(shí)別不需要人刻意的配合,能夠在目標(biāo)人物自然的狀態(tài)下進(jìn)行識(shí)別,用戶體驗(yàn)更加友好,且能夠保證識(shí)別的準(zhǔn)確性。這是因?yàn)?,長(zhǎng)時(shí)間以來(lái),一個(gè)人走路姿勢(shì)已經(jīng)養(yǎng)成了固定的習(xí)慣,在自然狀態(tài)下,很難進(jìn)行偽裝,因此在刑事偵查中,一些具有反偵察意識(shí)的罪犯,即便是能夠通過(guò)化妝、遮擋手段僥幸騙過(guò)人臉識(shí)別系統(tǒng),也難以通過(guò)偽裝走路姿勢(shì)來(lái)逃過(guò)偵查。因此在安防以及刑偵領(lǐng)域,步態(tài)智能識(shí)別技術(shù)有著不可比擬的優(yōu)勢(shì)。
針對(duì)當(dāng)下基于計(jì)算機(jī)人工智能的識(shí)別技術(shù),在未來(lái)發(fā)展方向上,將會(huì)有著以下發(fā)展趨勢(shì):首先,智能識(shí)別技術(shù)功能將會(huì)越來(lái)越強(qiáng)大,以當(dāng)下的人臉識(shí)別為例,早期人臉識(shí)別技術(shù)主要應(yīng)用于安防行業(yè),不僅給整個(gè)安防行業(yè)注入了新的生命活力,同時(shí)也有效開(kāi)辟了新的發(fā)展市場(chǎng)。如今該項(xiàng)智能識(shí)別技術(shù)已經(jīng)不再僅限于安防的使用,在一些冷門(mén)領(lǐng)域,人臉識(shí)別技術(shù)依然有著較大的應(yīng)用發(fā)展空間。比如在三維測(cè)量技術(shù)領(lǐng)域,通過(guò)借助3D 人臉識(shí)別算法,能夠?qū)υ摐y(cè)量技術(shù)的2D 投影的缺陷進(jìn)行有效地彌補(bǔ)。除此之外,從人臉識(shí)別技術(shù)本身來(lái)看,識(shí)別功能也越來(lái)越強(qiáng)大,傳統(tǒng)難點(diǎn)已經(jīng)被逐步解決,包括人臉旋轉(zhuǎn)、遮擋、相似度等在內(nèi)的都有了很好地應(yīng)對(duì),這也成為了人臉識(shí)別技術(shù)的另一個(gè)最為重要的發(fā)展路線。在實(shí)際進(jìn)行人臉識(shí)別時(shí),背后的AI 系統(tǒng)也在不斷進(jìn)行深度學(xué)習(xí),與機(jī)器學(xué)習(xí)不同,深度學(xué)習(xí)背后模仿的是人的神經(jīng)網(wǎng)絡(luò),我們只要把圖片交給神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)就會(huì)給我們分好結(jié)果。這個(gè)是神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)不同的地方。深度學(xué)習(xí)領(lǐng)域?qū)ξ覀儊?lái)說(shuō)就像一個(gè)黑盒,我們不知道中間發(fā)生了什么,所以這也是目前我們需要加大力度去學(xué)習(xí)的一個(gè)地方,深度學(xué)習(xí)過(guò)程圖圖2 所示。
另一方面,隨著大數(shù)據(jù)、深度學(xué)習(xí)等技術(shù)不斷發(fā)展,將其應(yīng)用于智能識(shí)別領(lǐng)域中,將會(huì)進(jìn)一步提升了智能識(shí)別的精確度,從而使得智能識(shí)別技術(shù)能夠“解鎖”更多應(yīng)用領(lǐng)域。比如在當(dāng)下的智能家電領(lǐng)域,主要應(yīng)有的智能識(shí)別技術(shù)為語(yǔ)言識(shí)別,而隨著人臉識(shí)別技術(shù)的不斷發(fā)展,同樣也能夠應(yīng)用于智能家居,因此智能家居與人臉識(shí)別技術(shù)的融合是未來(lái)發(fā)展的重點(diǎn)方向。不僅如此,在未來(lái),智能識(shí)別技術(shù)將會(huì)與大數(shù)據(jù)技術(shù)進(jìn)行深度的融合,進(jìn)而能夠?qū)ψR(shí)別采集的信息進(jìn)行深度的應(yīng)用,從而在這一過(guò)程中使得智能識(shí)別技術(shù)發(fā)揮出更大的作用價(jià)值。
綜上所述,智能識(shí)別技術(shù)是人工智能領(lǐng)域重要的技術(shù)內(nèi)容之一,并且隨著智能技術(shù)的不斷發(fā)展,很多智能識(shí)別技術(shù)已經(jīng)在我們的日常生活中得到了廣泛的應(yīng)用,比如語(yǔ)音識(shí)別技術(shù)、二維碼識(shí)別技術(shù)等,通過(guò)加強(qiáng)對(duì)這些智能識(shí)別技術(shù)的應(yīng)用實(shí)踐討論,能夠讓我們對(duì)這些技術(shù)有個(gè)更深刻認(rèn)識(shí),促使其得到更為廣泛的應(yīng)用,還有利于我們了解這些技術(shù)存在的一些問(wèn)題,并提出一些針對(duì)性對(duì)策,從而推動(dòng)智能識(shí)別技術(shù)應(yīng)用實(shí)踐實(shí)現(xiàn)更好地發(fā)展。