萬心媛 宋萌 趙渴欣 王繹然 劉千
摘要:隨著現(xiàn)代社會物質(zhì)文明的極大豐富與不斷發(fā)展,精神文明也在以飛快的速度發(fā)展,社會福利制度不斷健全。盲人作為社會的弱勢群體,他們的需求和自我價值的實(shí)現(xiàn)理應(yīng)得到我們更多的關(guān)注,秉承著這種人文關(guān)懷,本團(tuán)隊針對盲人特別開發(fā)了一款全新的盲人閱讀器來幫助盲人朋友解決日常生活的困難。本團(tuán)隊的盲人閱讀器的創(chuàng)新點(diǎn)為兩大技術(shù)體系的結(jié)合,分別為智能語音控制系統(tǒng)與盲人無障礙操作的結(jié)合和盲人閱讀器中文字?jǐn)?shù)據(jù)與聲音數(shù)據(jù)的結(jié)合。可以預(yù)見,產(chǎn)品推向市場后,會帶來非常好的經(jīng)濟(jì)效益、社會效益。
關(guān)鍵詞:新型;盲人閱讀器;智能語音
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2017)33-0198-04
Abstract:With the great enrichment and continuous development of material civilization in modern society, spiritual civilization is developing at a rapid pace, and the social welfare system is constantly improving.The blind as a social vulnerable groups, their needs and the realization of self-worth deserves more attention, uphold this humane care, the team specifically for the blind development of a new Of the blind reader to help blind friends solve the daily life of the difficulties.The team's blind reader's innovation is a combination of two major technical systems, namely the combination of intelligent voice control system and blind barrier-free operation and the combination of word data and sound data in blind readers.Can be expected, the product to the market, will bring a very good economic and social benefits.
Key words: Artificial intelligence; intelligent voice interaction; reading screen software; blind gestures; barrier-free voice verification
在當(dāng)今社會中,絕大多數(shù)的文字內(nèi)容都以可視化的信息出現(xiàn),而盲人及視障人士無法像正常人一樣進(jìn)行閱讀。在當(dāng)今學(xué)術(shù)領(lǐng)域?qū)γと碎喿x器研究的文章眾多,比如:2013年,《大連理工大學(xué)出版社》發(fā)表了一篇名為《盲人閱讀器的研究與開發(fā)》的文章,該文的主要方向是研究盲人閱讀器系統(tǒng),該系統(tǒng)能夠?qū)崿F(xiàn)將待閱讀文本進(jìn)行圖像采集,然后利用圖像處理技術(shù)完成圖像中文本的提取和文字識別,最后對識別的文字生成音頻輸出[1]。我們在此基礎(chǔ)上進(jìn)行大膽的技術(shù)創(chuàng)新與結(jié)合,致力于通過人工智能與盲人無障礙操作的結(jié)合以及文字?jǐn)?shù)據(jù)與聲音數(shù)據(jù)相結(jié)合,將新型閱讀器打造成為一個新型的智能系統(tǒng),解決盲人由于視力障礙造成的無法正常閱讀的難題。我隊研發(fā)的盲人閱讀器主要是理念創(chuàng)新,將現(xiàn)有的諸多技術(shù)進(jìn)行結(jié)合,經(jīng)過反復(fù)的調(diào)試和改進(jìn),該系統(tǒng)可以更好地實(shí)現(xiàn)盲人閱讀器的功能。
1 智能語音控制系統(tǒng)與盲人無障礙操作的結(jié)合
1.1 智能語音交互技術(shù)分析
智能語音交互技術(shù)屬于多學(xué)科交叉的邊緣學(xué)科,涉及語言學(xué)、心理學(xué)、工程和計算機(jī)技術(shù)等領(lǐng)域,不僅要對語音識別和語音合成技術(shù)進(jìn)行研究,還要對人在語音通道下的交互機(jī)理、行為方式等進(jìn)行研究[2]。智能語音交互是基于語音輸入的新一代交互模式,通過說話就可以得到反饋結(jié)果。典型的應(yīng)用場景—語音助手。自從iPhone 4S推出SIRI后,智能語音交互應(yīng)用得到飛速發(fā)展。中文典型的智能語音交互應(yīng)用如:蟲洞語音助手、訊飛語點(diǎn)已得到越來越多的用戶認(rèn)可。
1.1.1 智能語音交互技術(shù)起源與發(fā)展
首先,硬件聯(lián)網(wǎng)階段,硬件接入互聯(lián)網(wǎng),獲取云端信息,進(jìn)行遠(yuǎn)程操控,達(dá)到互通互聯(lián)。接下來,進(jìn)入硬件智能交互階段,人可以與硬件直接通過語言交流,通過語言獲取各種服務(wù)。最后進(jìn)入硬件智能化階段,硬件具備學(xué)習(xí)、感知、決策的能力,會了解主人的性格、情緒和習(xí)慣,具備云端大腦,具有決策能力,能夠更好地為主人服務(wù)。
在這整個實(shí)現(xiàn)的階段,AI 技術(shù)將作為基礎(chǔ)設(shè)施推動整個智能硬件從聯(lián)網(wǎng)階段到智能化階段的進(jìn)程,讓所有機(jī)器都是成為具備智慧的機(jī)器人,最終由萬物互聯(lián)走進(jìn)萬物智能時代。
從技術(shù)層面上講,AI 技術(shù)主要包括:語音識別、自然語言處理、計算機(jī)視覺。AI 成為物聯(lián)網(wǎng)時代最重要的基礎(chǔ)設(shè)施之一,相關(guān)核心技術(shù)就是組成基礎(chǔ)設(shè)施的核心管網(wǎng)。
在 PC 時代,鍵盤是最重要的交互方式,智能機(jī)時代,觸屏是最重要的交互方式,而物聯(lián)網(wǎng)(機(jī)器人)時代,語言將成為最重要的交互方式之一。這意味著未來整個機(jī)器人生態(tài)鏈,從上游的芯片、方案到終端產(chǎn)品研發(fā),從系統(tǒng)底層機(jī)器人OS,到上層 UI,應(yīng)用開發(fā),數(shù)據(jù)存儲,內(nèi)容呈現(xiàn)等等從都必須圍繞語音交互這種新的交互方式。
那么由此可見,掌握語音交互核心技術(shù)的平臺級公司未來或許會發(fā)揮巨大的價值,比如,喚醒、遠(yuǎn)距離語音識別、語義理解等。
就目前來說,語音交互技術(shù)主要有以下幾條線路。
第一:語音交互技術(shù)的應(yīng)用從下游終端往上游方案商、芯片走,形成軟硬一體化解決方案,出貨量數(shù)量級倍增。
第二:從車載、智能家居、玩具等垂直領(lǐng)域場景率先爆發(fā),出貨量達(dá)百萬級別,語音交互成為標(biāo)配。
第三:語義識別需求爆發(fā),與內(nèi)容和場景緊密結(jié)合。
語音識別需求爆發(fā)后,語義識別(即自然語言理解)需求也隨之爆發(fā)。語音識別是將一段音頻變成文本,但這段文本是什么意思,就需要進(jìn)行語義解析。當(dāng)智能硬件機(jī)器人能聽會說之后,更重要的是讓其和人一樣學(xué)會理解和思考,而且這種理解和思考需要與特定領(lǐng)域和場景相結(jié)合。
目前語音技術(shù)的應(yīng)用場景和產(chǎn)品還不夠多,當(dāng)未來億萬家庭中的數(shù)十億設(shè)備以語音交互作為主流交互方式,這條管道像太平洋那么粗時,萬物智能時代就真正來臨了。
1.1.2 智能語音交互技術(shù)研究現(xiàn)狀
在產(chǎn)業(yè)化的過程中,感知、認(rèn)知和通用智能是三個不斷深化發(fā)展的過程。目前語音交互技術(shù)正在經(jīng)歷著從感知智能向認(rèn)知智能的飛躍,不僅要讓機(jī)器聽見,更要讓機(jī)器聽懂并反饋有效信息,甚至自主做出決策。但語音交互與具體場景的融合仍需要時間來逐步成熟[3]。
1.2 盲人無障礙操作技術(shù)體系
1.2.1 讀屏軟件的技術(shù)優(yōu)化
讀屏軟件的工作原理就是將可見的信息轉(zhuǎn)化成語音,通過揚(yáng)聲器播報出來,或者可以理解成讀屏軟件加上喇叭就是另一個顯示器,只不過是用聲音來展示的顯示器。讀屏軟件的任務(wù)抓住屏幕上的文字,把它們傳送到語音合成單元,用戶可以用他們自己的方式閱讀屏幕的內(nèi)容[4]。
需要強(qiáng)調(diào)一點(diǎn)的是,讀屏軟件是被動型發(fā)音的,他是受人控制的,要他讀哪里他就讀哪里,這其實(shí)與鼠標(biāo)的移動有些類似。
問題可以轉(zhuǎn)換成如何將可見的信息轉(zhuǎn)化成語音播報出來?
windows有專門的可訪問性接口,提供給在windows平臺下開發(fā)應(yīng)用程序所用的無障礙接口。ios系統(tǒng)也有專門的可訪問性接口,adobe也有專門的接口,w3c也有專門的web可訪問性規(guī)范。
所以,只要開發(fā)者在做產(chǎn)品研發(fā)的時候,遵循這些已有的規(guī)范,就完全可以提供給盲人很好的使用體驗,給盲人無障礙的操作體驗。
1.2.2 盲人專用手勢技術(shù)分析
在針對盲人的智能產(chǎn)品界面設(shè)計中,手勢的設(shè)計也是必不可少的,研究表明:無論是早盲(包括出生即盲)還是晚盲都具有良好的空間感知及在空間中畫出正確形狀的能力[5]。盲人專用手勢技術(shù)被首次廣泛應(yīng)用于喬布斯創(chuàng)造的iphone手機(jī),對盲人來說,從傳統(tǒng)的按鍵手機(jī)到觸屏手機(jī)是一次巨大的轉(zhuǎn)變。這意味著盲人不再能通過對于按鍵凸起的感知來操作手機(jī) ,而手機(jī)操作的界面變成了一塊完整、光滑的平板,那么如何將觸屏手機(jī)上的操作界面被盲人所感知成為了一個亟待解決的技術(shù)難題;并且,觸屏手機(jī)的穩(wěn)定性與安全性也是值得開發(fā)者深入思考的。Iphone4手機(jī)注意到了這一點(diǎn),將操作界面統(tǒng)一歸攏于一起,讓操作界面變得易于被盲人所感知。可是好景不長,隨著iphone手機(jī)的系統(tǒng)升級,為了將手機(jī)的操作方式變得更為炫目,滿足明眼人的更多娛樂需要,將盲人專用手勢技術(shù)一再壓縮。后來更新?lián)Q代的更多系列手機(jī)更是為了滿足明眼人的更多娛樂需求,同時為了壓縮成本,廠商的利益傾軋,將盲人專用手勢技術(shù)完全減除。可以說盲人專用手勢技術(shù)還未完善,就已經(jīng)被扼殺在搖籃中。而中國的很多觸屏手機(jī)生產(chǎn)企業(yè)對于無障礙技術(shù)的開發(fā)意識更為淡薄,盲人專用手勢技術(shù)在中國的開發(fā)進(jìn)程極為緩慢,甚至陷入停滯的境地。
手勢的設(shè)計是采用具有文化、地域的兼容性通用符號來作為手勢的[6]。本團(tuán)隊的盲人閱讀器作為一個觸屏閱讀器,致力于進(jìn)一步開發(fā)盲人專用手勢技術(shù),重新研究已經(jīng)快要陷入停滯的盲人專用手勢技術(shù)的開發(fā)。我們團(tuán)隊對于盲人專用手勢技術(shù)的研究主要將延伸于以下幾個方面;第一點(diǎn),將盲人閱讀器的所有操作統(tǒng)一于一起,通過長按盲人閱讀器的側(cè)部開關(guān)即可啟動盲人閱讀器總操作開關(guān)。在長按啟動開關(guān)的同時,伴有智能語音控制系統(tǒng)的幫助,即伴有語音提示,通過語音介紹手機(jī)的基本功能,將這些功能通過編號的方式體現(xiàn)出來。盲人用戶通過喊出編號即可進(jìn)行對該項功能的開啟。
1.2.3 盲人無障礙語音驗證系統(tǒng)
隨著信息社會的不斷發(fā)展,人們對于信息的保密要求也不斷提高。例如最基本的網(wǎng)上購票系統(tǒng),通常會需要輸入一系列的驗證碼來保證是用戶本人進(jìn)行操作,保證用戶操作環(huán)境的安全。但是身為盲人這樣的視障群體,看不見就對他們進(jìn)行個人身份的驗證產(chǎn)生了諸多阻礙。就會出現(xiàn)“我不能證明我是我自己”這樣尷尬的問題。
就此,本團(tuán)隊的盲人閱讀器將致力于開發(fā)專門為盲人用戶設(shè)計的“盲人無障礙語音驗證系統(tǒng)”?;谡Z音身份驗證簡單來說就是說話人識別。它是一個通過對說話人語音信號的分析和特征提取,自動確定說話人是否在所記錄的說話人集合中,進(jìn)而確定說話人是誰的過程[7]。通過和主要購票軟件合作,設(shè)計盲人專用驗證碼,購票的全過程將由本團(tuán)隊盲人智能語音控制系統(tǒng)操作,在輸入驗證碼的時候,通過語音提示數(shù)字加漢字或英文字符方式,盲人通過觸摸閱讀器盲點(diǎn)智能鍵盤來實(shí)現(xiàn)驗證碼的輸入。這個問題解決以后,不僅能用在盲人購票上,在其他社交軟件及電子支付平臺上,也可以通過這種方式確保盲人的財產(chǎn),個人信息安全。將此技術(shù)推廣開來,將使盲人用戶受益匪淺。
1.2.4 盲人無障礙社交
此外,在盲人閱讀器現(xiàn)有基礎(chǔ)上可以添加人工智能系統(tǒng)。這種技術(shù)并不是多么的復(fù)雜,現(xiàn)在很多手機(jī)上也都有這種功能,類似Siri。所以如果要解決盲人想要通過QQ、微信與常人進(jìn)行交流的問題,只需用類似的技術(shù)。我們可以在盲人閱讀器上安裝一個類似home鍵的按鈕,當(dāng)盲人想要打開通話界面、微信、QQ進(jìn)行社交時,只需長按此按鈕,人工智能化服務(wù)會根據(jù)盲人的語音指示打開本閱讀器上安裝的社交軟件,之后盲人可以繼續(xù)發(fā)出指示收聽未讀聯(lián)系人的消息并對不同聯(lián)系人的消息進(jìn)行篩選,同樣也可以通過發(fā)出指令的方式與指定聯(lián)系人進(jìn)行交談。
1.3 智能語音交互技術(shù)與盲人無障礙操作體系的融合
本團(tuán)隊的盲人閱讀器在解決上述提到的科技創(chuàng)新點(diǎn)后,將這些技術(shù)模塊進(jìn)行安裝,配備于Android 7.1.1 正式版 ,因為相對于ios系統(tǒng)來說,Android 系統(tǒng)是一個開放系統(tǒng),可以任意下載app與讀屏軟件,有利于本盲人閱讀器智能語音交互系統(tǒng)與盲人無障礙操作體系技術(shù)模塊的安裝與融合。并且最新的Android 7.1.1 正式版在穩(wěn)定性和安全性方面有了更多的提高,這為本團(tuán)隊盲人閱讀器的所裝載的應(yīng)用運(yùn)行的速度和穩(wěn)定性提供了大量支持,以至于不會出現(xiàn)閱讀器突然黑屏和系統(tǒng)崩潰的技術(shù)失誤。
在智能語音交互技術(shù)體系與盲人無障礙操作體系的技術(shù)模塊被安裝在閱讀器上后,接下來,本團(tuán)隊將致力于解決這些技術(shù)模塊與Android 7.1.1之間的系統(tǒng)排異問題。將盡可能與技術(shù)部門合作,進(jìn)行反復(fù)調(diào)試,運(yùn)行。盡可能達(dá)到操作的簡潔化與速度的快捷化。
體系融合后的操作方式將變得極為簡單,本團(tuán)隊的盲人閱讀器將盡力做到將復(fù)雜都解決在閱讀器內(nèi)部,而在盲人用戶進(jìn)行操作時,將變得簡單,便捷,使本閱讀器做到用戶友好化。
以下內(nèi)容,將對本閱讀器的無障礙手勢按鍵及智能語音按鍵進(jìn)行介紹:
第一個無障礙按鍵即本閱讀器的智能語音體系啟動總開關(guān)中的社交功能鍵,位于本閱讀器的屏幕最下部,類似于iphone4s的home鍵的按鈕,這這就是控制著開關(guān)屏幕和啟動智能語音控制系統(tǒng)中社交操作的總開關(guān)。
這個按鍵的功能分為兩部分。
第一部分,當(dāng)盲人用戶短按此開關(guān)時,將控制著屏幕的開關(guān);第二部分,當(dāng)盲人用戶長按此開關(guān)時,將會啟動智能語音控制體系中的社交功能,人工智能化服務(wù)會根據(jù)盲人的語音指示打開盲人手機(jī)上的社交軟件,之后盲人可以繼續(xù)發(fā)出語音指示收聽未讀聯(lián)系人的消息并對不同聯(lián)系人的消息進(jìn)行篩選,同樣也可以通過發(fā)出指令的方式與指定聯(lián)系人進(jìn)行交談。所有的過程都通過盲人用戶的語音指示來完成,極大方便了盲人用戶的操作,解決了盲人用戶社交的困難。
第二部分,第二個無障礙按鍵即盲人閱讀器總操作開關(guān),位于盲人閱讀器的側(cè)部,通過長按盲人閱讀器的側(cè)部開關(guān)即可啟動盲人閱讀器總操作開關(guān)。在長按啟動開關(guān)的同時,伴有智能語音控制系統(tǒng)的幫助,即伴有語音提示,通過語音介紹手機(jī)的基本功能,將這些功能通過編號的方式體現(xiàn)出來。盲人用戶通過喊出編號即可進(jìn)行對該項功能的開啟。這是盲人閱讀器總操作的第一種語音控制方式,將閱讀器功能內(nèi)容進(jìn)行編號和介紹是以防盲人用戶初次使用對于本閱讀器的功能還不熟悉。在使用一段時間后,盲人用戶可以通過將本閱讀器進(jìn)行系統(tǒng)升級的方式,在使用本閱讀器時,直接通過喊出自己想要進(jìn)行的操作,本閱讀器將直接通過智能語音控制系統(tǒng)的控制,進(jìn)行對此項操作的運(yùn)行,這是盲人閱讀器總操作的第二種語音控制方式。此按鍵還將負(fù)責(zé)盲人閱讀器的無障礙語音驗證系統(tǒng)的操作。本閱讀器盡可能將閱讀器的操作結(jié)合于一起,使得盲人用戶的操作盡可能做到簡潔,提高用戶的效率,符合現(xiàn)代社會快節(jié)奏的生活。
1.4 盲人閱讀器與物聯(lián)網(wǎng)與現(xiàn)代“智造”的結(jié)合
1.4.1 盲人閱讀器和物聯(lián)網(wǎng)的結(jié)合
物聯(lián)網(wǎng)是通過射頻識別技術(shù)、紅外感應(yīng)器、全球定位系統(tǒng)、激光掃描器等信息傳感設(shè)備,利用現(xiàn)代通信技術(shù),把待識別物體與互聯(lián)網(wǎng)進(jìn)行連接,從而實(shí)現(xiàn)對物體的識別、定位、跟蹤、監(jiān)控和管理[8]。在未來的社區(qū),去超市買東西,不用付款,可以直接將物品拿回家,云端就會通過物聯(lián)網(wǎng)技術(shù),識別誰拿走了東西,并且自動扣款。盲人閱讀器可以與物聯(lián)網(wǎng)技術(shù)結(jié)合,當(dāng)盲人去超市買東西時,將盲人閱讀器靠近產(chǎn)品,就會語音播放這款產(chǎn)品的名字、功能、注意事項等,讓盲人也可以和常人一樣購物。
1.4.2 盲人閱讀器在生產(chǎn)過程中要和現(xiàn)代的“智造”理念相融合
“智造”一詞源于中國的工業(yè)發(fā)展?,F(xiàn)在中國已經(jīng)進(jìn)去了“工業(yè)4.0”,“中國制造2025”等時代,要將工業(yè)從過去的人工,推向信息化,自動化,智能化一體融合的時代。盲人閱讀器也要“制造”,在生產(chǎn)過程中信息化:把握住各個環(huán)節(jié)的信息反饋,做無誤的決策;自動化:生產(chǎn)過程要全自動化,增大容錯率;智能化:通過人工智能控制機(jī)器,能使其自動處理一些問題。
2 文字?jǐn)?shù)據(jù)與聲音數(shù)據(jù)的結(jié)合
2.1 單片機(jī)技術(shù)分析
單片機(jī)是一種集成的電路芯片,它采用超大規(guī)模的集成電路技術(shù)把具有數(shù)據(jù)處理能力的中央處理器CPU、隨機(jī)存儲器RAM、只讀處理器ROM、多種I/O口和中斷系統(tǒng)、定時器/計時器等功能(可能還包括顯示驅(qū)動電路、脈寬調(diào)制電路、模擬多路轉(zhuǎn)化器、A/D轉(zhuǎn)換器等電路)集成到一塊硅片上構(gòu)成的一個小而完善的計算機(jī)系統(tǒng)[9]。
單片機(jī)開發(fā)系統(tǒng)是指單片機(jī)開發(fā)調(diào)試的工具。單片機(jī)自問世以來,性能不斷提高和完善,其資源又能滿足很多應(yīng)用場合的需要,加之單片機(jī)具有集成度高、功能強(qiáng)、速度快、體積小、功耗低、使用方便、價格低廉等特點(diǎn),正在逐步取代現(xiàn)有的多片微機(jī)應(yīng)用系統(tǒng)。
2.2 音頻信息處理技術(shù)
數(shù)字音頻:在計算機(jī)中音頻必須以數(shù)字形式表示,因此,必須把模擬音頻信號轉(zhuǎn)化成有限個數(shù)字表示的離散序列,這稱為音頻數(shù)字化。
采集與量化:獲得數(shù)字音頻需要采樣技術(shù)和量化技術(shù)。采樣是每間隔一段時間讀取一次聲音信號幅度,使聲音信號在時間上被離散化。量化是把采樣得到的聲音信號幅度轉(zhuǎn)化為數(shù)字值,是聲音信號在幅度上被離散化。
獲得數(shù)字音頻的主要硬件是從模擬到數(shù)字的轉(zhuǎn)換器(A-D 轉(zhuǎn)換器),由他完成音頻信號的采樣工作,這一過程需要下面三個重要的指標(biāo)來控制。
采樣頻率:指每秒鐘采集聲音樣本的個數(shù),采樣頻率越高,聲音的保真度越高。量化位數(shù):指每個聲音樣本需要用多少位二進(jìn)制數(shù)來表示,常用的有八位、十二位和十六位。樣本位數(shù)越多,聲音的質(zhì)量越高。聲道數(shù):指所使用的聲音通道的個數(shù)。聲道個數(shù)是指記錄聲音時,如果每次生成一個聲波的數(shù)據(jù),稱為單聲道;每次生成兩個聲波數(shù)據(jù),稱為雙聲道(立體聲);每次生成兩個以上聲波的數(shù)據(jù),稱為多聲道(環(huán)繞立體聲)
采樣頻率、采樣精度和聲道數(shù)決定了聲音的音質(zhì)和占用的存儲空間,他們之間的關(guān)系是:存儲容量=采樣頻率*量化位數(shù)/8*通道數(shù)*時間
2.3 單片機(jī)與數(shù)據(jù)庫的智能鏈接
數(shù)據(jù)庫是按一定的結(jié)構(gòu)和規(guī)則組織起來的相關(guān)數(shù)據(jù)的集合。是綜合各用戶數(shù)據(jù)形成的數(shù)據(jù)集合,是存放數(shù)據(jù)的倉庫[10]。
我們可以在閱讀器內(nèi)部的芯片(也就是單片機(jī))上嵌入所需程序,智能鏈接一個數(shù)據(jù)庫,數(shù)據(jù)庫里存放多種數(shù)字音頻數(shù)據(jù),比如鳥叫聲,流水聲,雷聲,雨聲,鞭炮聲……各種不同的聲音數(shù)據(jù)對應(yīng)著春天,流水,雷,雨,鞭炮這些漢字在計算機(jī)中的二進(jìn)制碼。當(dāng)閱讀器閱讀到這些文字時,文字?jǐn)?shù)據(jù)和聲音數(shù)據(jù)就會進(jìn)行二者之間的對應(yīng)轉(zhuǎn)換,從而達(dá)到讀到相關(guān)文字時就會聽到對應(yīng)的音樂這樣的效果。具體而言就是:當(dāng)閱讀器識別到“春天”二字時,會伴隨清脆的鳥叫聲;當(dāng)掃描的文本中出現(xiàn)“鞭炮”、“流水”等漢字時,會伴隨喧鬧的鞭炮聲或者悅耳的流水聲等等。這是本團(tuán)隊盲人閱讀器的另一大技術(shù)特色。
這樣,盲人在利用本閱讀器進(jìn)行閱讀時,可以通過本閱讀器這樣情景再現(xiàn)的方式,對于文本內(nèi)容有更加直觀、形象的理解。使盲人讀者身臨其境,讓盲人用戶處理視覺以外的其他感官被充分地調(diào)動起來,滿足盲人朋友的更多需求。
3 結(jié)束語
本文重點(diǎn)闡述了盲人閱讀器的基本原理與技術(shù)創(chuàng)新點(diǎn),然后根據(jù)市場實(shí)際情況與政策環(huán)境,開展了一系列調(diào)研。在研究方法上,本文主要采用技術(shù)原理分析法、問卷調(diào)查法、實(shí)地調(diào)研法等方法,取得了市場的實(shí)際情況以及盲人朋友的真實(shí)需求情況。研究結(jié)果表明,本盲人閱讀器運(yùn)用科學(xué)的研究方法,不僅對盲人智能領(lǐng)域的技術(shù)進(jìn)行了深入創(chuàng)新研究,并且將已有智能技術(shù)與創(chuàng)新技術(shù)進(jìn)行結(jié)合。能夠較好滿足盲人朋友的生活、學(xué)習(xí)、娛樂等多方面的需求。
參考文獻(xiàn):
[1] 白雪英子. 盲人閱讀器的研究與開發(fā)[D].大連:大連理工大學(xué),2013.
[2] 胡郁,嚴(yán)峻. 智能語音交互技術(shù)及其標(biāo)準(zhǔn)化[J]. 信息技術(shù)與標(biāo)準(zhǔn)化,2015(4):14-17.
[3] 李志剛. 智能語音:從交互革命到人工智能入口[J]. 電器,2017(1):24-25.
[4] 孫靜. 網(wǎng)站可達(dá)性及視障用戶讀屏軟件可用性研究[D].大連海事大學(xué),2006.
[5] 邊坤. 基于視障人士信息產(chǎn)品界面的交互設(shè)計研究[J]. 包裝工程,2016(24):156-159.
[6] 鄒志丹. 基于盲人使用的電子產(chǎn)品通用化研究[J]. 裝飾,2009(5):120-121.
[7] 周娜. 基于TMS320C6713的小型語音身份驗證系統(tǒng)的設(shè)計及實(shí)現(xiàn)[D].華北電力大學(xué),2009.
[8] 燕妮. 淺論物聯(lián)網(wǎng)技術(shù)的應(yīng)用研究[J]. 科技信息,2013(19):81+94.
[9] 趙亞轉(zhuǎn). 淺談單片機(jī)應(yīng)用與單片機(jī)芯片——兼對八位單片機(jī)學(xué)習(xí)的感想[J]. 科技傳播,2010(8):111-112.
[10] 陳黎. 我國數(shù)據(jù)庫的發(fā)展現(xiàn)狀與趨勢[J]. 現(xiàn)代情報,2006(11):138-140.