李月潔+柳長(zhǎng)安+劉星平+賈聰
摘 要: 互聯(lián)網(wǎng)隱式文本感知技術(shù)能夠在圖像中提取相應(yīng)文本格式內(nèi)容,但存在信息吞吐量低、運(yùn)算速度差等問(wèn)題。為此,提出基于Hadoop的互聯(lián)網(wǎng)隱式文本感知技術(shù)。引入Hadoop分布式框架,承接互聯(lián)網(wǎng)隱式文本感知技術(shù),利用隱式文本感知方式,實(shí)現(xiàn)圖像特征向量生成提取。實(shí)驗(yàn)數(shù)據(jù)表明,設(shè)計(jì)的基于Hadoop的互聯(lián)網(wǎng)隱式文本感知技術(shù)能夠進(jìn)行高信息的吞吐,實(shí)現(xiàn)隱式文本感知提取。
關(guān)鍵詞: Hadoop; 互聯(lián)網(wǎng)隱式文本; 感知技術(shù); 信息吞吐量; 分布式框架; 圖像特征向量
中圖分類號(hào): TN711?34; TP393 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)06?0121?04
Abstract: The Internet implicit text perception technology can extract the corresponding text format content from the image, but there exist problems of low information throughput and arithmetic speed. Therefore, an Internet implicit text perception technology based on Hadoop is proposed. The Hadoop distributed framework is introduced to undertake Internet implicit text perception technology. The implicit text perception mode is adopted to realize generation and extraction of image feature vectors. The experimental data shows that the designed Internet implicit text perception technology based on Hadoop can perform high information throughput, and realize implicit text perception and extraction.
Keywords: Hadoop; Internet implicit text; perception technology; information throughput; distributed framework; image feature vector
0 引 言
在互聯(lián)網(wǎng)中,圖像是互聯(lián)網(wǎng)數(shù)據(jù)重要的組成部分,在圖像中會(huì)蘊(yùn)含很多顯式以及隱式的文本信息,顯式的文本信息能夠通過(guò)數(shù)據(jù)掃描以及提取技術(shù)進(jìn)行識(shí)別,但隱式文本只能通過(guò)感知技術(shù)進(jìn)行感知性的提取。傳統(tǒng)的聯(lián)網(wǎng)隱式文本感知技術(shù)受到信息吞吐量的限制,很難全面地進(jìn)行隱式文本的全面認(rèn)知[1?2]。同時(shí)運(yùn)算速率決定感知技術(shù)的最終結(jié)果,本文提出基于Hadoop的互聯(lián)網(wǎng)隱式文本感知技術(shù)。引入Hadoop分布式框架,能夠接受流形式的訪問(wèn),有效地承接了互聯(lián)網(wǎng)隱式文本感知技術(shù),放寬了HDFS,提高了容錯(cuò)性,利用隱式文本感知方式,實(shí)現(xiàn)圖像特征向量生成提取。為了保證該方法的有效性,模擬使用過(guò)程進(jìn)行仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明,基于Hadoop的互聯(lián)網(wǎng)隱式文本感知技術(shù)能夠進(jìn)行高信息量的感知識(shí)別,并能夠提取全部隱式文本。
1 基于Hadoop的互聯(lián)網(wǎng)隱式文本感知技術(shù)
1.1 導(dǎo)入Hadoop分布式框架
互聯(lián)網(wǎng)中的圖像一般具有可下載存儲(chǔ)等屬性特點(diǎn),在互聯(lián)網(wǎng)圖像的隱式文本一般不具有以上屬性[3?4]。廣義上講Hadoop能夠利用集群的屬性進(jìn)行多維度的混合剝離,將非隱式文本進(jìn)行有效剝離后,有助于感知技術(shù)的使用。
導(dǎo)入Hadoop分布式框架作用有以下幾點(diǎn):
1) 對(duì)于不同信道、不同互聯(lián)網(wǎng)渠道的圖像能夠識(shí)別;
2) 進(jìn)行圖像的初級(jí)剝離;
3) 有效的成績(jī)感知技術(shù)的識(shí)別提取模塊。
1.2 互聯(lián)網(wǎng)隱式文本協(xié)作感知技術(shù)的實(shí)現(xiàn)
圖像識(shí)別過(guò)程中首先進(jìn)行初始信道識(shí)別?;ヂ?lián)網(wǎng)中的識(shí)別信道以數(shù)據(jù)的形式,對(duì)圖像中的隱式文本進(jìn)行傳輸。每個(gè)圖像中的隱式文本以屬性鏈的形式相互關(guān)聯(lián),圖像識(shí)別過(guò)程實(shí)際上是光感以及灰度上的掃描選舉,經(jīng)過(guò)分布式的結(jié)構(gòu)已經(jīng)完成了對(duì)圖像原始處理,并且已將非隱式文本進(jìn)行剝離,因此圖像隱式文本通邊緣算子確認(rèn)、去灰度處理、識(shí)別認(rèn)證三個(gè)步驟便可以實(shí)現(xiàn)圖像識(shí)別[5]。邊緣算子的確認(rèn)過(guò)程也是對(duì)隱式文本的定位過(guò)程,互聯(lián)網(wǎng)狀態(tài)的圖像中攜帶Tx屬性,將Tx屬性標(biāo)識(shí)為點(diǎn)位屬性,便可以實(shí)現(xiàn)邊緣算子的確定,也是完成對(duì)隱式文本確認(rèn)過(guò)程。去灰度處理使用不同幀頻進(jìn)行去除,居策頻率是去灰度最佳使用頻率。識(shí)別認(rèn)證階段使用的GTF的光感識(shí)別認(rèn)證碼,由于去除灰度后的圖像,剩下的碼包括:式隱性碼以及屬性碼,GTF的光感識(shí)別認(rèn)證碼默認(rèn)屬性碼的存在,直接識(shí)別隱性碼便可以完成識(shí)別。GTF的光感識(shí)別認(rèn)證碼識(shí)別過(guò)程如下:
public partial class anpai_show chuli:System.Web LTLPage
{protected void Page?Load(object sender,EventArgs e)
客服熱線:400-656-5456??客服專線:010-56265043??電子郵箱:longyuankf@126.com
電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證:京icp證060024號(hào)
Dragonsource.com Inc. All Rights Reserved