趙力瑾
(榆林學(xué)院,陜西榆林 719000)
隨著我國近年來計(jì)算機(jī)信息技術(shù)的不斷創(chuàng)新研發(fā),手機(jī)作為移動終端設(shè)備,目前在人們的社會生活、工作學(xué)習(xí)等各領(lǐng)域占據(jù)重要地位。而近年來國際間各領(lǐng)域的交流滲透,使得每年中國出境總?cè)藬?shù)呈遞增趨勢,那么身處異國他鄉(xiāng)遇到不認(rèn)識的文字時,就可以運(yùn)用移動手機(jī),將攝像頭打開從而獲得文字翻譯結(jié)果,所以本研究旨在能夠設(shè)計(jì)可以滿足實(shí)時、準(zhǔn)確翻譯的系統(tǒng)。如今手機(jī)可以支持的互譯語言包括了中文、日語、韓語、俄語、西班牙語等,部分公開翻譯軟件有:有道翻譯、Google 翻譯、百度翻譯等。不僅如此,國內(nèi)手機(jī)云應(yīng)用近年來也獲得了飛速發(fā)展,譬如百度、阿里巴巴,阿里巴巴于2011 年便成功發(fā)布手機(jī)計(jì)劃,先后推出了阿里云、云智能OS 等功能,讓用戶無需在手機(jī)終端下載應(yīng)用,便可以實(shí)現(xiàn)在網(wǎng)絡(luò)環(huán)境下登錄云賬號正常應(yīng)用。如今,多數(shù)應(yīng)用都基于云平臺成功搭設(shè)服務(wù)器,來擴(kuò)充計(jì)算資源提高整體應(yīng)用性能?;诖?,本次研究立足實(shí)際翻譯所需,與云計(jì)算技術(shù)、移動應(yīng)用開發(fā)技術(shù)相結(jié)合,設(shè)計(jì)基于移動終端的云計(jì)算實(shí)時翻譯系統(tǒng),來針對性結(jié)合動態(tài)化運(yùn)行環(huán)境,保證短時間內(nèi)可以成功獲得最高效的翻譯使用體驗(yàn)。
模擬圖像作為在空間中無連續(xù)性分割且無等級劃分信號值的一種圖像,數(shù)字圖像處于空間中被持續(xù)分割形成離散像素,主要表現(xiàn)方式為二維數(shù)組,應(yīng)用于該文圖像處理中,通過采集圖像功能轉(zhuǎn)換為數(shù)字化圖像之后再進(jìn)行處理。
圖像信號在具體處理過程中,進(jìn)行邊緣檢測可以有效減少數(shù)據(jù)量,同時也能夠?qū)⒋笈坎幌嚓P(guān)信息成功剔除,從而有效保留圖像結(jié)構(gòu)屬性。目前常見的邊緣檢測算子分別包括了Canny 算子、Sobel 算子、Roberts 算子等。
圖像膨脹腐蝕操作中的基本組成是結(jié)構(gòu)元素,一般情況下主要包括了多個待處理圖像矩陣,在結(jié)構(gòu)元素中心點(diǎn)則明確指定圖像中所需要加以處理的主要像素范圍,設(shè)定結(jié)構(gòu)元素為1,作為鄰域像素膨脹腐蝕操作參與計(jì)算的關(guān)鍵依據(jù)。
OCR 主要經(jīng)電子設(shè)備成功獲取文字圖像具體信息后,對于圖像的亮暗度等情況進(jìn)行檢測,運(yùn)用字符識別法翻譯圖像信息,獲得計(jì)算機(jī)文字光學(xué)轉(zhuǎn)換處理圖像中文字,最終可得黑白點(diǎn)陣圖像文件,從而運(yùn)用識別軟件轉(zhuǎn)換文字形成的文本格式。在OCR 技術(shù)運(yùn)用中,會存在書寫習(xí)慣、圖像品質(zhì)等影響,導(dǎo)致OCR 識別結(jié)果的差異。所以運(yùn)用OCR 就是為了有效降低文字識別時誤識、拒識等情況的發(fā)生率,并提升整體識別的穩(wěn)定速率。
本次系統(tǒng)設(shè)計(jì)是為了在手機(jī)終端平臺中,運(yùn)行基于移動云計(jì)算的實(shí)時翻譯系統(tǒng),將手機(jī)攝像頭預(yù)覽圖像英文文字轉(zhuǎn)換為中文,用戶可以通過手機(jī)屏幕實(shí)現(xiàn)圖像場景預(yù)覽,同時也可以實(shí)現(xiàn)對場景預(yù)覽圖像的實(shí)時改變。實(shí)際應(yīng)用通過定義整個運(yùn)行過程為多個任務(wù)序列組合,包括實(shí)時翻譯的圖像獲取、文字定位、識別、翻譯、顯示結(jié)果等五大任務(wù)功能。該系統(tǒng)的實(shí)時翻譯任務(wù)路徑如圖1 所示。
圖1 實(shí)時翻譯任務(wù)路徑
圖2 作為本次系統(tǒng)設(shè)計(jì)架構(gòu)圖,采用C/S 網(wǎng)絡(luò)總架構(gòu),用戶可以通過手機(jī)終端完成系統(tǒng)安裝,并經(jīng)手機(jī)網(wǎng)絡(luò)或無線網(wǎng),訪問該手機(jī)的云計(jì)算服務(wù)器,之后計(jì)算分擔(dān)服務(wù)器便可經(jīng)有線網(wǎng)絡(luò)訪問百度翻譯服務(wù)器,從而形成該系統(tǒng)的正常運(yùn)行所需條件。與傳統(tǒng)C/S 云服務(wù)運(yùn)行不同,本次系統(tǒng)架構(gòu)云服務(wù)器計(jì)算過程均在云端執(zhí)行,經(jīng)代碼實(shí)現(xiàn)整個文字定位、識別,實(shí)際運(yùn)行中也可以通過手機(jī)運(yùn)行云端。
圖2 系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)鋱D
本次設(shè)計(jì)的基于移動云計(jì)算技術(shù)的實(shí)時翻譯系統(tǒng)功能模塊,如圖3 所示,包括了實(shí)時翻譯、云計(jì)算動態(tài)分擔(dān)兩大功能模塊。
圖3 系統(tǒng)功能模塊圖
圖4為本次系統(tǒng)設(shè)計(jì)中的實(shí)時翻譯模塊結(jié)構(gòu)圖。
圖4 實(shí)時翻譯模塊結(jié)構(gòu)圖
1)圖像采集中,能夠?qū)崟r采集經(jīng)攝像頭獲取的用戶所在場景圖像信息,不需要按下快門,即可成功獲取相應(yīng)的圖像信息,并且顯示于手機(jī)屏幕中實(shí)現(xiàn)圖像信息預(yù)覽。在本次功能設(shè)計(jì)中選用了Andorid攝像頭接口,能夠?qū)鼍靶畔⑦M(jìn)行實(shí)時捕捉和獲取,經(jīng)onPveiwFrame 即可完成圖像像素字節(jié)組的妥善保存,并將不同像素點(diǎn)RGB 值保存為三維數(shù)據(jù)。
2)文字定位。通過分析處理場景圖像,可以對于復(fù)雜化背景圖像,成功完成文本定位,最終返回至文字區(qū)域中的外界矩形頂點(diǎn)坐標(biāo)。通過運(yùn)用圖像形態(tài)學(xué)結(jié)合連通域,成功定位文字區(qū)域,并進(jìn)行圖像預(yù)處理,即可根據(jù)文字特征成功定位,需要經(jīng)過灰度化處理、邊緣檢測、圖像膨脹腐蝕、填充孔洞、標(biāo)記和分析連通域等步驟。
3)文字識別。在識別圖像中存在的數(shù)據(jù)文本信息,操作中可以識別為英文數(shù)據(jù)字符加以處理,運(yùn)用光學(xué)字符識別能夠成功識別?;赥esseracr-OCR引擎成功識別文本,從而支持各類編程語言。
4)文字翻譯。本次系統(tǒng)設(shè)計(jì)中基于百度云翻譯API 智能識別翻譯文本,能夠以帶翻譯的原文本語言和最終翻譯的目標(biāo)語言,以百度接口向API 提供從而獲得相應(yīng)的存儲翻譯JSON 字符串。
5)顯示結(jié)果。經(jīng)過顯示文字定位、翻譯最終結(jié)果,可以在預(yù)覽圖像中,根據(jù)用戶的指定位置,完成翻譯文本添加并覆蓋。
本次系統(tǒng)設(shè)計(jì)主要基于移動云計(jì)算技術(shù)實(shí)現(xiàn),在云計(jì)算動態(tài)分擔(dān)模塊中,主要功能點(diǎn)包括了資源監(jiān)控預(yù)估、分擔(dān)決策、分擔(dān)執(zhí)行以上3 個模塊,具體如圖5 所示。
圖5 云計(jì)算動態(tài)分擔(dān)模塊架構(gòu)
1)資源監(jiān)控預(yù)估
想要獲取在資源運(yùn)行過程中,系統(tǒng)CPU 和具體的網(wǎng)絡(luò)傳輸總速度、數(shù)據(jù)總量各類歷史資源數(shù)據(jù),還有以往系統(tǒng)運(yùn)行過程中所獲取的真實(shí)歷史數(shù)據(jù)資源,設(shè)計(jì)出基于系統(tǒng)歷史數(shù)據(jù)的計(jì)算評估模型,從而評估未來系統(tǒng)運(yùn)行的資源數(shù)量。以該部分為例設(shè)計(jì)代碼示例如下:
2)選擇分擔(dān)路徑
結(jié)合具體監(jiān)控資源并選擇預(yù)估模塊內(nèi)部的資源數(shù)據(jù),本系統(tǒng)可以經(jīng)過云端計(jì)算以及運(yùn)作協(xié)作方案,尋找最優(yōu)化分擔(dān)執(zhí)行路徑方案。執(zhí)行路徑在選擇過程中,對性能產(chǎn)生主要影響的因素包括T、E,分別表示時間消耗、電能消耗。其中時間消耗又包括了數(shù)據(jù)的傳輸所耗時間,執(zhí)行數(shù)據(jù)任務(wù)獲得結(jié)果的所需時間,以及云端文字識別的計(jì)算時間。對于策略制定過程中,假設(shè)本地執(zhí)行、遠(yuǎn)程執(zhí)行兩個時間分別為Tloeal、Tremote,計(jì)算遠(yuǎn)程執(zhí)行時間和遠(yuǎn)程執(zhí)行能耗公式如下:
3)分擔(dān)執(zhí)行
本系統(tǒng)通過封裝處理每一個任務(wù)作為可序列化處理對象,并進(jìn)行單獨(dú)封裝作為任務(wù)序列,經(jīng)本地或云端執(zhí)行每一步任務(wù),并經(jīng)分散決策動態(tài)化制定具體運(yùn)行位置,最終分別執(zhí)行于本地、云端等,可以獲得相應(yīng)的運(yùn)行結(jié)果,并向分擔(dān)決策功能模塊提供真實(shí)的運(yùn)行數(shù)據(jù),包括數(shù)據(jù)量的上傳下載、運(yùn)行時長等均作為關(guān)鍵的預(yù)估依據(jù)。經(jīng)Java 序列化、反序列及反射從而成功云端執(zhí)行,定義C 類擁有p 方法,C 類實(shí)例對象o,假若o 采用的m 方法可以向云端執(zhí)行成功遷移,那么則可以傳輸o、o、m 對象調(diào)用p 參數(shù)序列化可傳輸byte 數(shù)組。同步傳輸m 至云端服務(wù)器,接收云端服務(wù)器后,反序列byte 數(shù)組,成功恢復(fù)為o 對象,可以喚起o 對象的m 方法,最終獲得運(yùn)行結(jié)果。
以歷史運(yùn)行數(shù)據(jù)為依據(jù),完成執(zhí)行任務(wù)的時間、能量具體消耗情況,完成總運(yùn)行消耗量計(jì)算,最終選擇消耗量較小的路徑,作為主要的實(shí)際運(yùn)行路徑。
經(jīng)本次測試發(fā)現(xiàn),通常情況下該系統(tǒng)的靜態(tài)圖像文字定位精準(zhǔn)率可以達(dá)到80%以上,可以成功識別90%以上的正確定位區(qū)域文字。并且經(jīng)本次測試研究結(jié)果,也發(fā)現(xiàn)該算法可以準(zhǔn)確識別小傾斜角度文字區(qū)域。通過將文字場景圖片展開測試,將系統(tǒng)打開后對準(zhǔn)圖片進(jìn)行拍攝,其程序運(yùn)行結(jié)果如圖6 所示,發(fā)現(xiàn)可以在原圖文字位置實(shí)時顯示翻譯后的文字信息。
圖6 實(shí)時翻譯運(yùn)行截圖
文中通過與移動應(yīng)用需求相結(jié)合,設(shè)計(jì)了基于移動云計(jì)算的實(shí)時翻譯系統(tǒng),能夠經(jīng)攝像頭實(shí)時取景后獲取翻譯結(jié)果,經(jīng)云計(jì)算動態(tài)分擔(dān)獲取資源信息,并經(jīng)Java 程序?qū)崿F(xiàn)云端分擔(dān)執(zhí)行翻譯任務(wù),證實(shí)了該文設(shè)計(jì)的實(shí)時翻譯系統(tǒng)的翻譯效果,未來也將在翻譯領(lǐng)域有一定的發(fā)展前景。