童 新,姚 莉,倪 波
(湖北理工學(xué)院 計(jì)算機(jī)學(xué)院,湖北 黃石 435003)
隨著物聯(lián)網(wǎng)概念的提出和技術(shù)的發(fā)展,及人們對(duì)于物聯(lián)網(wǎng)的熱衷和市場(chǎng)的走向,各類智能產(chǎn)品已慢慢占據(jù)了日常家居產(chǎn)品市場(chǎng),豐富了人們對(duì)于智能產(chǎn)品的選擇[1]。越來(lái)越多的貼近生活的智能產(chǎn)品正在涌現(xiàn),將云計(jì)算技術(shù)應(yīng)用于智能家居產(chǎn)品設(shè)計(jì)中,也是物聯(lián)網(wǎng)技術(shù)深入居民日常生活的印證[2]。本文設(shè)計(jì)與實(shí)現(xiàn)的智能云鏡系統(tǒng)正是順應(yīng)以上趨勢(shì)把科技融入生活的樣品,高度體現(xiàn)了科技以人為本的理念。
系統(tǒng)微處理器選擇64位四核ARM Cortex-A53處理器系列的BCM2837芯片。該處理器是ARMv8架構(gòu)ARM Cortex-A50系列產(chǎn)品,其可擴(kuò)展性使ARM的合作伙伴能夠針對(duì)智能手機(jī)、高性能服務(wù)器等各類不同市場(chǎng)需求開發(fā)系統(tǒng)級(jí)芯片。Cortex-A53處理器不僅是功耗效率最高的ARM應(yīng)用處理器,也是全球最小的64位處理器。能夠支持所有最新的ARM GNU/Linux,支持各類音頻、視頻和以太網(wǎng)接口等。
7英寸通用LCD電容式觸摸顯示屏分辨率可達(dá)800×480,可支持常用的系統(tǒng)鏡像,如Raspberry Pi,Banana Pi和Banana Pro等。另外,該顯示屏支持背光控制,更節(jié)省電能。本系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)采用靜態(tài)加載對(duì)LCD屏驅(qū)動(dòng)的支持,需要在Linux內(nèi)核編譯時(shí)進(jìn)行配置。選中設(shè)備驅(qū)動(dòng)選項(xiàng)“Device Drivers->”進(jìn)入設(shè)備驅(qū)動(dòng)配置界面,選中“Graphics support”進(jìn)入圖形支持選項(xiàng)。進(jìn)入“Support for frame buffer devices”配置界面選擇“LCD init in kernel”選項(xiàng)加入內(nèi)核編譯就可使內(nèi)核實(shí)現(xiàn)對(duì)LCD屏驅(qū)動(dòng)的支持,為系統(tǒng)顯示設(shè)備提供編程接口。LCD驅(qū)動(dòng)配置界面如圖1所示。
圖1 LCD驅(qū)動(dòng)配置界面
原子鏡又稱單向玻璃或單面鏡,是一種對(duì)可見光具有高反射比的玻璃。透過(guò)玻璃的觀察面可以清晰觀察另一側(cè),而在玻璃的被觀察面只能看到反射的鏡像。原子鏡之所以能產(chǎn)生以上單面反光的效果,是因?yàn)殓R的兩面處于不同光度的環(huán)境。本系統(tǒng)利用LCD屏幕和原子鏡的疊加實(shí)現(xiàn)“智能云鏡”的外觀顯示。
ESP8266芯片可實(shí)現(xiàn)串口轉(zhuǎn)WiFi功能,ESP8266是一款超低耗通用非同步WiFi數(shù)據(jù)收發(fā)器,內(nèi)置TCP/IP協(xié)議棧,支持多路TCP Client連接。支持豐富的Socket AT指令,透?jìng)鲿r(shí)的數(shù)據(jù)最大傳輸速率為460 800 bit/s,傳輸可靠性好。本系統(tǒng)利用該WiFi模塊實(shí)現(xiàn)網(wǎng)絡(luò)服務(wù),利用互聯(lián)網(wǎng)上傳或接收信息。
LM393是雙電壓比較器集成電路。輸出負(fù)載電阻能銜接在可允許電源電壓范圍內(nèi)的任何電源電壓上,不受 Vcc端電壓值的限制。此輸出能作為一個(gè)簡(jiǎn)單的對(duì)地SPS開路(當(dāng)不用負(fù)載電阻沒被運(yùn)用),輸出部分的陷電流被可能得到的驅(qū)動(dòng)和器件的β值所限制。當(dāng)達(dá)到極限電流(16 mA)時(shí),輸出晶體管將退出且輸出電壓將很快上升。本系統(tǒng)利用比較器確認(rèn)啟用錄音功能的時(shí)間,當(dāng)用戶發(fā)出的聲音超過(guò)指定分貝時(shí)即表示向系統(tǒng)發(fā)出語(yǔ)音命令。
本系統(tǒng)還使用了LM386功放模塊、麥克風(fēng)、紅外傳感器和繼電器等硬件設(shè)備。
本系統(tǒng)是一款基于物聯(lián)網(wǎng)技術(shù),利用云平臺(tái)實(shí)現(xiàn)的人機(jī)交互智能云鏡系統(tǒng),摒棄了傳統(tǒng)鏡子功能的單一性。設(shè)計(jì)方案基于WiFi無(wú)線通信技術(shù)實(shí)現(xiàn)物聯(lián)網(wǎng)聯(lián)動(dòng),開發(fā)了GUI客戶端程序。用戶可根據(jù)個(gè)人的生活習(xí)慣或喜好,在照鏡子的同時(shí)和鏡子交流。系統(tǒng)內(nèi)置了感知組件,可根據(jù)用戶的語(yǔ)音和手勢(shì)動(dòng)作完成指令控制操作。例如,向它提出各種問(wèn)題,獲得日期、天氣、新聞、菜譜等常用信息;讓它像朋友一樣聊天、講笑話等。系統(tǒng)還包含了音樂(lè)播放和燈光控制功能,利用語(yǔ)音識(shí)別等方式進(jìn)行控制,實(shí)現(xiàn)了一物多用。本系統(tǒng)選擇Linux操作系統(tǒng)作為開發(fā)環(huán)境,結(jié)合百度語(yǔ)音云和圖靈機(jī)器人開發(fā)實(shí)現(xiàn)。
語(yǔ)音識(shí)別是指與機(jī)器進(jìn)行語(yǔ)音交流,讓機(jī)器明白你說(shuō)什么。中國(guó)物聯(lián)網(wǎng)校企聯(lián)盟形象地把語(yǔ)音識(shí)別比作為“機(jī)器的聽覺系統(tǒng)”。語(yǔ)音識(shí)別技術(shù)就是讓機(jī)器通過(guò)識(shí)別和理解過(guò)程把語(yǔ)音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的高技術(shù)[3]。語(yǔ)音合成是通過(guò)機(jī)械、電子方法產(chǎn)生人造語(yǔ)音的技術(shù)。TTS技術(shù)(又稱文語(yǔ)轉(zhuǎn)換技術(shù))隸屬于語(yǔ)音合成,它是將計(jì)算機(jī)自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)榭梢月牭枚⒘骼臐h語(yǔ)口語(yǔ)輸出技術(shù)[4]。
百度語(yǔ)音是語(yǔ)音技術(shù)、自然語(yǔ)言處理、智能搜索三方面的完美融合。以更自然的交互方式對(duì)用戶所說(shuō)語(yǔ)言進(jìn)行更準(zhǔn)確地識(shí)別,只有對(duì)用戶需求準(zhǔn)確理解,才能為用戶提供更滿意的結(jié)果。系統(tǒng)集成語(yǔ)音識(shí)別、語(yǔ)義理解、深度問(wèn)答、知識(shí)推理、多輪對(duì)話、智能摘要、情感分析、語(yǔ)言生成、語(yǔ)音合成等功能,能夠滿足用戶的多種復(fù)雜需求。
圖靈機(jī)器人是在人工智能的核心能力基礎(chǔ)上為開發(fā)人員提供云計(jì)算和大數(shù)據(jù)平臺(tái)的在線服務(wù)和開發(fā)接口,提供機(jī)器人和人的文字交互,實(shí)現(xiàn)前端業(yè)務(wù)邏輯的自定義[5]。圖靈機(jī)器人能用準(zhǔn)確、簡(jiǎn)潔的自然語(yǔ)言回答用戶用自然語(yǔ)言提出的問(wèn)題,以方便人們快速、準(zhǔn)確地獲取信息。隨著技術(shù)的進(jìn)步,問(wèn)答機(jī)器人目前已能夠處理常識(shí)性、開放性問(wèn)題及聊天問(wèn)候等。問(wèn)答機(jī)器人能夠給用戶提供非常智能化和人性化的服務(wù),為用戶帶來(lái)極大方便和美好體驗(yàn)。
在本系統(tǒng)中可實(shí)現(xiàn)機(jī)器人昵稱、性別、年齡等身份屬性設(shè)置,同時(shí)在自有平臺(tái)或產(chǎn)品上完成知識(shí)庫(kù)的新增、刪減、更改編輯以及批量導(dǎo)入等操作。此外還能夠?yàn)槊恳晃皇褂谜叻峙湟粋€(gè)獨(dú)立機(jī)器人。主要涉及的功能包括聊天對(duì)話、問(wèn)答百科、生活百科、知識(shí)庫(kù)、新聞資訊、成語(yǔ)接龍、故事大全、菜譜大全、笑話大全、天氣查詢和日期查詢等。
首先通過(guò)LM393雙電壓比較器來(lái)檢測(cè)周圍環(huán)境聲音的強(qiáng)度,當(dāng)聲音強(qiáng)度達(dá)到預(yù)設(shè)值時(shí),系統(tǒng)啟動(dòng),開始錄音。錄音結(jié)束后,通過(guò)post方式向百度語(yǔ)音平臺(tái)請(qǐng)求語(yǔ)音識(shí)別服務(wù),然后接收反饋數(shù)據(jù)。本系統(tǒng)通過(guò)對(duì)識(shí)別結(jié)果的分析做出相應(yīng)的響應(yīng),然后將處理后的文字信息上傳到圖靈平臺(tái),實(shí)現(xiàn)智能語(yǔ)音的目的。
系統(tǒng)對(duì)圖靈平臺(tái)處理后的數(shù)據(jù)進(jìn)行分析,并發(fā)送到百度語(yǔ)音平臺(tái),請(qǐng)求語(yǔ)音合成服務(wù),再驅(qū)動(dòng)聲卡程序播放合成的聲音。語(yǔ)言合成功能是在無(wú)需本系統(tǒng)處理命令的情況下(如聊天等)將百度語(yǔ)音合成的文字轉(zhuǎn)交給圖靈處理,圖靈處理完成后再交給百度語(yǔ)音進(jìn)行合成,待接收到合成后的語(yǔ)音時(shí)即可用系統(tǒng)的揚(yáng)聲器播放出來(lái)。
系統(tǒng)外觀和內(nèi)部結(jié)構(gòu)如圖2、圖3所示。
圖2 系統(tǒng)外觀圖
圖3 系統(tǒng)內(nèi)部結(jié)構(gòu)圖
本文主要介紹了在Linux操作系統(tǒng)下使用Cortex-A53處理器設(shè)計(jì)實(shí)現(xiàn)的智能云鏡系統(tǒng)。本系統(tǒng)具有良好的交互性,體現(xiàn)了物聯(lián)網(wǎng)感知層的特定含義。系統(tǒng)實(shí)現(xiàn)了文字、音頻、紅外等信息的采集和處理?;谖锫?lián)網(wǎng)技術(shù)把圖靈平臺(tái)與百度語(yǔ)音巧妙結(jié)合,使一面普通的鏡子有了“生命”,可以跟用戶自由交流。
[1]王昊天. 物聯(lián)網(wǎng)智能家居發(fā)展分析[J].信息系統(tǒng)工程, 2016(6):38.
[2]盧彪,邱慧麗,吳孝銀.云計(jì)算技術(shù)在物聯(lián)網(wǎng)平臺(tái)的應(yīng)用研究[J].蘭州文理學(xué)院學(xué)報(bào)(自然科學(xué)版),2016,29(3):49-52.
[3]劉金剛,周翊,馬永保,等.用于自動(dòng)語(yǔ)音識(shí)別系統(tǒng)的切換語(yǔ)音功率譜估計(jì)算法[J].計(jì)算機(jī)應(yīng)用,2016,36(12):3369-3373,3384.
[4]張斌,全昌勤,任福繼.語(yǔ)音合成方法和發(fā)展綜述[J].小型微型計(jì)算機(jī)系統(tǒng), 2016,37(1):186-192.
[5]柳琳,羅軍.基于Android的圖靈聊天機(jī)器人設(shè)計(jì)[J].電腦知識(shí)與技術(shù), 2016,12(17):169-171.
[6]范靈.基于Cortex-A8的物聯(lián)網(wǎng)智能應(yīng)用[D].成都:電子科技大學(xué),2014.
[7]熊林云.基于ARM Cortex-M3的語(yǔ)音合成軟件系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].成都:電子科技大學(xué),2014.
[8]耿琳瑩,陳登偉,安新源,等.語(yǔ)音業(yè)務(wù)多系統(tǒng)融合技術(shù)研究與實(shí)現(xiàn)[J].物聯(lián)網(wǎng)技術(shù),2016,6(12):96-98.