張麗
(山西管理職業(yè)學(xué)院,山西 臨汾 041000)
計(jì)算機(jī)語言識別技術(shù)的應(yīng)用分析
張麗
(山西管理職業(yè)學(xué)院,山西 臨汾 041000)
隨著科學(xué)技術(shù)的飛速發(fā)展,計(jì)算機(jī)大大地增加了人們的視野范圍,使得人們的知識更加充實(shí),也增加了接受新鮮事物的空間。本文分析和探討了計(jì)算機(jī)語言識別技術(shù)在人類社會的應(yīng)用價(jià)值和應(yīng)用范圍,探討語言識別技術(shù)將人類聲音錄入到計(jì)算機(jī)中,進(jìn)行了一系列算法處理之后,可以完成什么樣的處理工作,能夠如何服務(wù)于人類社會。
計(jì)算機(jī);語言識別;智能語言
計(jì)算機(jī)的交互方式一直推動著時(shí)代的發(fā)展和進(jìn)步。從早期的插拔線操作,到紙帶輸入與輸出,再到鍵盤與屏幕的搭配,直至喬布斯將鼠標(biāo)引入到PC體系之中,PC端的交互模式就算是暫時(shí)穩(wěn)定了下來。雖然智能移動端的飛躍進(jìn)步,同時(shí)又引入了觸控操作和感應(yīng)操作,但是我們都不應(yīng)該忽視還有一種已經(jīng)得到了一定的發(fā)展,但是尚未形成完整體系的操作方式,那就是語言。所以,國家應(yīng)當(dāng)在計(jì)算機(jī)應(yīng)用技術(shù)方面加大投資,這不僅僅是提高了我國的計(jì)算機(jī)產(chǎn)業(yè)水平,也與國家層面的整體經(jīng)濟(jì)實(shí)力休戚相關(guān)。因此為了保證計(jì)算機(jī)技術(shù)能夠更好地為人們提供便利,那就需要加強(qiáng)計(jì)算機(jī)語言識別技術(shù)。
如今的計(jì)算機(jī),本身的硬件性能已經(jīng)不再是人們關(guān)注的重點(diǎn),智能化才是當(dāng)今的發(fā)展主流。而計(jì)算機(jī)語言識別技術(shù)就是計(jì)算機(jī)全面智能化中的重要分支,目前的發(fā)展主要是針對語言中語義邏輯的解析。
2.1 對于人類語言不確定性的把握
任何一種語言雖然有自身的內(nèi)在邏輯和組織結(jié)構(gòu),但是因?yàn)檎Z言的表述主體是人,所以必然會受到人個(gè)體差異化的主觀影響。每個(gè)人生活的環(huán)境、以及個(gè)性和認(rèn)知面都是不同的,所以即使是使用同一門語言表述同一個(gè)意思,具體的語言表述也會迥然不同。這就是語言的不確定性,不同于具有嚴(yán)謹(jǐn)結(jié)構(gòu)的數(shù)學(xué)表達(dá)式。
人們在進(jìn)行彼此之間的交流的時(shí)候,大腦的知識庫中會有很多潛意識的認(rèn)知,這些認(rèn)知是我們不同于電腦的并發(fā)聯(lián)想能力,可以讓我們識別特定的縮略的短語和模糊的表達(dá)詞匯,這些表述我們自己聽得懂,但是想讓計(jì)算機(jī)進(jìn)行識別和分析就過于困難了。
所以,在對計(jì)算機(jī)語言識別技術(shù)進(jìn)行探索的時(shí)候,要合理掌握其中的不穩(wěn)定性。因?yàn)槿祟愓Z言比較特殊,針對不確定的表達(dá)能力具有一定的思維理解,而計(jì)算機(jī)語言識別技術(shù)就需要對這種獨(dú)特的人類語言進(jìn)行準(zhǔn)確的判斷,其中需要不斷完善的內(nèi)容還比較多。
2.2 對于人類自然語言的語義把握
從人類的角度來看計(jì)算機(jī)語言識別技術(shù)是不易實(shí)現(xiàn)的,因?yàn)槿祟惖乃季S方式與當(dāng)下馮諾依曼結(jié)構(gòu)的計(jì)算機(jī)截然不同,所以人類經(jīng)歷了數(shù)千年進(jìn)化出來的交流方式,要完美地轉(zhuǎn)化成計(jì)算機(jī)識別技術(shù),是有很大風(fēng)險(xiǎn)的。首要的問題就是如何讓計(jì)算機(jī)的識別能力能夠正常準(zhǔn)確地理解人類語言中包含的所有含義。首先人類個(gè)體之間表述同一個(gè)意思的語序結(jié)構(gòu)和詞匯選擇是截然不同的,其次語言本身就有不同種類,不同語種的表述方式和詞匯又是截然不同的。
就目前來看解決識別技術(shù)精準(zhǔn)度的研究思路有以下幾種:其一是采取機(jī)器學(xué)習(xí)的方式,通過人為地錄入大量的標(biāo)準(zhǔn)數(shù)據(jù)庫讓機(jī)器學(xué)習(xí)從而自我進(jìn)化產(chǎn)生最恰當(dāng)?shù)淖R別算法;其二是采用新架構(gòu)的計(jì)算機(jī),直接從硬件角度就去模擬人腦的思維方式,在此基礎(chǔ)之上再去構(gòu)建全新的識別算法。
計(jì)算機(jī)整體水平在早期的時(shí)候尚且稚嫩,所以那時(shí)候即使想到了語言是很好的交互模式,也沒能很好地實(shí)現(xiàn)這一想法。到了現(xiàn)在當(dāng)我們有能力完整地實(shí)現(xiàn)這個(gè)想法的時(shí)候,我們真正意識到了語言交互模式的巨大潛力。這種交互模式已經(jīng)不僅僅是當(dāng)初設(shè)想的那樣成為簡單的民用技術(shù),在社會的各個(gè)行業(yè)其實(shí)都具有巨大的使用價(jià)值,我們要做的就是將這種技術(shù)細(xì)分下去。
比如在通信行業(yè),這種高新技術(shù)行業(yè)的日常工作中囊括了大量的專業(yè)詞匯,那么要讓語音識別技術(shù)在通信行業(yè)得到實(shí)踐,就需要將此專業(yè)的詞匯庫納入到計(jì)算機(jī)中去,這樣才能保障語言識別在通信行業(yè)的高度精確。并且語言識別技術(shù)由于目前算法的高度進(jìn)步,也已經(jīng)不再局限于某一種語言或者行業(yè)了。對計(jì)算機(jī)語言識別技術(shù)在現(xiàn)在生活、工作中的分析,其主要發(fā)展模式,包含了以下幾個(gè)方面:
3.1 增加計(jì)算機(jī)語言識別技術(shù)系統(tǒng)的詞匯量
計(jì)算機(jī)語言識別技術(shù)的發(fā)展基礎(chǔ),就跟人們學(xué)習(xí)一門語言時(shí)的基礎(chǔ)是一致的,都是詞匯和語法的積累,人類的語言系統(tǒng)和計(jì)算機(jī)的語言識別體系都是在詞匯和語法結(jié)構(gòu)的基礎(chǔ)之上建立起來的。所以即使我們使用的語音技術(shù)的硬件設(shè)備再高級,并能夠準(zhǔn)確地識別每一段聲波,但是如果人類所說的詞匯超過了程序本身的數(shù)據(jù)庫囊括的范圍,就不可能做到對語言的含義正確地判斷了。也就是說,計(jì)算機(jī)語言識別技術(shù)的一大進(jìn)步就是詞匯數(shù)據(jù)庫的積累。而且不是一種語言或者同一個(gè)語義的單一性積累,要收集的數(shù)據(jù)應(yīng)當(dāng)是多種語言的某一詞義的同義詞、關(guān)聯(lián)詞和延伸詞。
3.2 提高計(jì)算機(jī)語言識別的可靠性技術(shù)
語言識別技術(shù)誕生的初衷就是為了更好地讓計(jì)算機(jī)服務(wù)于社會,這樣就給我們的日常生活提供了更大程度的便捷性。所以日常生活場景中的各種背景音就成了制約語言技術(shù)應(yīng)用的一個(gè)重要瓶頸。人類已經(jīng)進(jìn)化到了大腦可以自動屏蔽背景音的程度,可計(jì)算機(jī)的智能程度還做不到這一點(diǎn),所以我們的語言識別技術(shù)的重要一點(diǎn)就是如何屏蔽不相關(guān)的噪音。
以人類發(fā)展的角度來看,在嘈雜的環(huán)境中,人們會把一些噪音因素排除在外,從而得到一些有價(jià)值的語言信息,但是針對計(jì)算機(jī)的語言識別技術(shù)來說,以現(xiàn)在的發(fā)展?fàn)顩r來看,不容易做到。
所以,計(jì)算機(jī)語言識別技術(shù)在實(shí)際效用方面獲得了一定的進(jìn)步,計(jì)算機(jī)語言識別的穩(wěn)定性技術(shù)也得到了提升,而且要注意對計(jì)算機(jī)識別體系進(jìn)行智能化的發(fā)展,對于隨意性語言進(jìn)行研究,把握其規(guī)律,兩者相互融合,以便更好地提升識別體系的實(shí)際效果。
3.3 計(jì)算機(jī)語言識別系統(tǒng)的微型化發(fā)展
目前人們對于計(jì)算機(jī)智能化程度的需求越來越高,大家都樂于見到有越來越高智能的計(jì)算機(jī)設(shè)備應(yīng)用到自己生活的方方面面,而現(xiàn)實(shí)也確實(shí)地在朝著這個(gè)需求不斷前進(jìn)。這就導(dǎo)致了計(jì)算機(jī)系統(tǒng)變得越來越復(fù)雜,體積也朝著人們期望的方向變得越來越小巧,方便人們隨身攜帶。計(jì)算機(jī)設(shè)備想要縮小體積,關(guān)鍵瓶頸就是計(jì)算機(jī)處理芯片的微型化工藝是否足夠。
為了更好地滿足計(jì)算機(jī)語言識別體系的要求,第一要把計(jì)算機(jī)識別技術(shù)的使用體系穩(wěn)定到計(jì)算機(jī)芯片中,并且要以技術(shù)為基礎(chǔ),而且還要適當(dāng)降低微型芯片的生產(chǎn)投入,這樣就會得到消費(fèi)者的廣泛關(guān)注,從而有效地加強(qiáng)計(jì)算機(jī)語言識別技術(shù)所產(chǎn)生的經(jīng)濟(jì)效益。
一項(xiàng)技術(shù)的發(fā)明,主要是為了給人們的生活和工作帶來實(shí)際的效用。雖然計(jì)算機(jī)語言識別技術(shù)還存在一定的問題,但是對人們的生活和工作卻發(fā)揮了重要的作用。
4.1 學(xué)生語言學(xué)習(xí)的口語糾正
計(jì)算機(jī)語言識別系統(tǒng)采取的語言對比樣本一般是極為標(biāo)準(zhǔn)的語言輸入,所以這一特性可以極好地用來幫助學(xué)習(xí)外語的學(xué)生矯正自己的語言。計(jì)算機(jī)自帶的語言輸入庫保存著標(biāo)準(zhǔn)語言的波形圖,然后學(xué)生將自己的語言錄入后也會形成一段波紋圖,進(jìn)行特殊的匹配算法后我們就能知道學(xué)生自己的語言跟標(biāo)準(zhǔn)語言直接的差距了。這樣學(xué)生在了解了差距之后就會進(jìn)行自我矯正,直至將自己的語言矯正到跟標(biāo)準(zhǔn)輸入保持合理的誤差為止。不過目前的這種手段對學(xué)生來說只是被動的參考,無法在分析之后給學(xué)生的語言提出合理的建議,語言的糾正就需要學(xué)生自己努力。
4.2 智能查詢系統(tǒng)的語言識別應(yīng)用
無論是火車站、汽運(yùn)站的自動售票機(jī),還是銀行、酒店和旅游景點(diǎn)的智能查詢機(jī),對于大部分用戶來說如果能夠進(jìn)行高度智能化的語音操作是再適合不過了。就目前的研究成果來看,已經(jīng)可以做到在規(guī)定了一定語言指令的前提下,讓計(jì)算機(jī)得到合理的操作指示,從而滿足人們對于計(jì)算機(jī)的語言操作需求。而且語言的交互模式對于大眾來說更易于接受和理解,也更為親切,計(jì)算機(jī)本身想要傳達(dá)的信息也是極為適合用語言進(jìn)行表達(dá)的。
不過就目前來說,需要既定的語音指令本身就是一種功能的局限,無法讓使用者自如地與計(jì)算機(jī)進(jìn)行語言交互,也會讓口音偏重的操作者得不到應(yīng)有的操作效果。而且計(jì)算機(jī)本身用語言傳達(dá)出的信息也不具備人類的感情色彩,冰冷的電子音也不會讓人產(chǎn)生更多的交互舒適感,這些都是日后需要進(jìn)行再次優(yōu)化的方向。
4.3 軍事領(lǐng)域方面的應(yīng)用
由于語言操作的巨大便捷性,讓軍事研究者也不得不重視這一交互模式對于軍事裝備的巨大改進(jìn)。例如在軍事安全方向,聲紋已經(jīng)被驗(yàn)證跟指紋一樣具有獨(dú)特的識別關(guān)鍵特征,所以如果關(guān)鍵設(shè)備和數(shù)據(jù)庫的訪問操作加上聲紋權(quán)限限制的話,這會讓對于安全性要求極高的軍事項(xiàng)目得到更多的保證。而且在這一方面的實(shí)際運(yùn)用已經(jīng)十分成熟了,基本可以做到對于每個(gè)個(gè)體的聲紋特征的準(zhǔn)確甄選和記錄。飛機(jī)的操控需要極為繁瑣的步驟和流程,而作為高精尖科技的代表——戰(zhàn)斗機(jī),其操作的難度更是又上了一個(gè)量級,所以如果能夠讓飛行員的語言也成為操作的一部分的話,這會極大地減輕飛行員的實(shí)時(shí)工作強(qiáng)度,能夠讓飛行員將注意力更加集中到自己的戰(zhàn)斗任務(wù)中去。
4.4 文字編輯的實(shí)際應(yīng)用
目前的文字錄入工作仍然極為繁重,需要文印員花費(fèi)大量的時(shí)間將紙質(zhì)的記錄或者口頭的表達(dá)轉(zhuǎn)錄成電子文檔進(jìn)行保存和排版工作。這樣的過程是極為消耗人力物力的,而且也不夠高效,所以語言識別系統(tǒng)早在發(fā)展的初期就已經(jīng)思考如何用語言識別技術(shù)進(jìn)行文檔輸入工作了。比如進(jìn)行會議活動時(shí),或者研究工作者在進(jìn)行實(shí)時(shí)操作的時(shí)候,這時(shí)候進(jìn)行文字記錄工作時(shí)極為不方便的,而且也耗費(fèi)巨大。不過目前還有瓶頸存在,最為顯著的問題就是,識別的速度跟不上大部分人的工作要求,而語言的識別也僅僅能做到文字的輸入,對于文檔的結(jié)構(gòu)和排版得不到任何幫助。
隨著社會經(jīng)濟(jì)的不斷發(fā)展,科學(xué)技術(shù)也在不斷進(jìn)步,計(jì)算機(jī)的智能化也得到了人們的廣泛關(guān)注,人們在工作和生活中對于計(jì)算機(jī)智能化體系的要求也在逐漸增加,使其具備廣闊的發(fā)展?jié)撡|(zhì)。但是計(jì)算機(jī)語言識別技術(shù)是計(jì)算機(jī)智能化發(fā)展的主要內(nèi)容之一,對人們的工作、學(xué)習(xí)和生活產(chǎn)生了重要的影響。有效地發(fā)揮計(jì)算機(jī)的獨(dú)特優(yōu)勢,能夠有效地節(jié)省時(shí)間,提高工作質(zhì)量。所以,我們需要把計(jì)算機(jī)語言識別技術(shù)進(jìn)行進(jìn)一步的完善和加強(qiáng),使其朝著多元化的方向不斷發(fā)展,使其能夠更好地滿足人們的工作和生活。
[1]馮沖,陳肇雄,黃河燕,等.基于條件隨機(jī)域的復(fù)雜最長名詞短語識別[J].小型微型計(jì)算機(jī)系統(tǒng),2 0 16,2 7(6):113 4-113 9.
[2]張海軍,史樹敏,朱朝勇,等.中文新詞識別技術(shù)綜述[J].計(jì)算機(jī)科學(xué),2 0 10,3 7(3):6-10.
[3]農(nóng)顯峰.計(jì)算機(jī)語言識別技術(shù)的應(yīng)用分析[J].科學(xué)與財(cái)富,2 0 12 (4):476-47 6.
The Application of Speech Recognition Technology in Computer
Zhang Li
(Shanxi Management Vocational College,Linfen 041000,Shanxi)
With the rapid development of science and technology,the computer has increased not only the scope of people's vision greatly to make people's knowledge more rich,but also the space of accepting new things.This paper analyzes the application value and range of the laguage recognition technology of the computer in human society,discusses that after recording human voice into the computer using laguage recognition technology and doing a series of processing,it can complete what kind of processing and how to serve the human society.
computer;language recognition;intelligent language
TN912.34
A
1008-6609(2016)11-0045-03
張麗(19 8 1-),女,山西襄汾人,碩士,講師,研究方向?yàn)橛?jì)算機(jī)語言及應(yīng)用。