劉 異,趙 輝
(1. 南昌鐵路局干部學(xué)校,信息教研室,江蘇 南昌 330002;2. 中南大學(xué) 信息與網(wǎng)絡(luò)中心,湖南 長(zhǎng)沙 410083)
全球WWW網(wǎng)站總數(shù)量龐大,為全球數(shù)以幾十億計(jì)的網(wǎng)民提供各種服務(wù)。截至2016年底,我國(guó)基于互聯(lián)網(wǎng)的電子商務(wù)市場(chǎng)總額已經(jīng)突破 300000億人民幣。2017年我國(guó)手機(jī)網(wǎng)民規(guī)模達(dá)7.39億,網(wǎng)民使用手機(jī)上網(wǎng)比例逐年攀升?;ヂ?lián)網(wǎng)技術(shù)在我國(guó)的迅速發(fā)展,使人們更多依賴互聯(lián)網(wǎng)來(lái)獲取信息。
目前在人們的日常生活中,搜索引擎占互聯(lián)網(wǎng)應(yīng)用的地位舉足輕重?!度蚧ヂ?lián)網(wǎng)統(tǒng)計(jì)信息跟蹤報(bào)告》中指出,“搜索引擎網(wǎng)站是目前所有網(wǎng)站類型中發(fā)展最快的網(wǎng)站”。另?yè)?jù)該報(bào)告顯示,今后中國(guó)搜索引擎將呈現(xiàn)若干新的發(fā)展趨勢(shì),垂直搜索獲得迅速發(fā)展,成為重要的發(fā)展方向。垂直搜索引擎在細(xì)分行業(yè)及專業(yè)領(lǐng)域的全面應(yīng)用與深入挖掘,通過(guò)進(jìn)一步整合信息內(nèi)容,帶來(lái)大量的用戶流量與廣告機(jī)會(huì)。
當(dāng)今社會(huì),視頻信息占互聯(lián)網(wǎng)多媒體信息很大比例,視頻搜索用戶規(guī)模的增長(zhǎng)速度遠(yuǎn)遠(yuǎn)高于傳統(tǒng)搜索用戶規(guī)模的增長(zhǎng)速度,預(yù)計(jì)未來(lái)三年將會(huì)保持年均 100%以上的增長(zhǎng)率。雖然 Google、YouTube和優(yōu)酷等紛紛推出了各自的視頻搜索服務(wù),但大多基于固定的 PC機(jī)關(guān)鍵詞查詢模式。這種查詢視頻的方式代價(jià)大而且返回的結(jié)果存在歧義。例如,用戶提交“蘋(píng)果”關(guān)鍵詞時(shí),系統(tǒng)可能返回多個(gè)與“蘋(píng)果”相關(guān)的搜索結(jié)果,如iMac電腦、iPad平板、iPhone手機(jī)及水果等。而面向生活類的垂直搜索引擎(如搜房網(wǎng),www.fang.com)和面向商業(yè)領(lǐng)域的垂直搜索引擎(如ebay,www.ebay.com)等,已成為未來(lái)互聯(lián)網(wǎng)搜索領(lǐng)域研究的新熱點(diǎn)。
用戶在使用關(guān)鍵詞搜索傳統(tǒng)視頻信息時(shí),查詢視頻幀是對(duì)幀圖像進(jìn)行編號(hào)和注釋,一般使用描述性的文字或數(shù)字給幀圖像加上注釋,再用搜索引擎檢索匹配相應(yīng)的注釋,這就是基于注釋的查詢。[1]這種查詢的方法雖然簡(jiǎn)單,但經(jīng)常不能精確檢索到海量視頻信息。這是因?yàn)橛萌斯し绞綄?duì)海量視頻數(shù)據(jù)進(jìn)行標(biāo)注,工作量極大并且效率很低,視頻內(nèi)容片段僅靠文字標(biāo)簽簡(jiǎn)單地表達(dá)意思會(huì)以偏概全。同時(shí),受各體差異性影響,不同的用戶使用不同的描述標(biāo)注信息,基于內(nèi)容的查詢于是應(yīng)運(yùn)而生。用戶無(wú)需對(duì)視頻片段進(jìn)行人工標(biāo)注,只需通過(guò)提取底層視覺(jué)或聽(tīng)覺(jué)等特征進(jìn)行相似性檢索。
隨著移動(dòng) 4G互聯(lián)網(wǎng)的迅猛發(fā)展和網(wǎng)購(gòu)課程規(guī)模的不斷擴(kuò)大,越來(lái)越多的商家把課程“搬到”互聯(lián)網(wǎng)上,課程以虛擬電子文件的形式存在更有利于授課者向?qū)W習(xí)者隨時(shí)隨地傳播知識(shí),省去了學(xué)習(xí)者去實(shí)體學(xué)校學(xué)習(xí)來(lái)回路上耽誤的時(shí)間,也公平照顧了學(xué)習(xí)者家離學(xué)校距離遠(yuǎn)近不一的問(wèn)題;隨著各大酒店、咖啡屋、快餐店、商場(chǎng)、公交車(chē)等免費(fèi)Wi-Fi服務(wù)設(shè)施的提供,這些學(xué)習(xí)場(chǎng)所不僅環(huán)境優(yōu)雅還免費(fèi)提供高雅舒緩的音樂(lè),使越來(lái)越多的學(xué)習(xí)者轉(zhuǎn)變了去傳統(tǒng)學(xué)校學(xué)習(xí)的觀念,逐漸接受了這種新潮的學(xué)習(xí)方式,而移動(dòng)搜課寶能讓學(xué)習(xí)者在新型學(xué)習(xí)場(chǎng)所更便捷地搜索到課程資源,每天學(xué)習(xí)一小節(jié)課程,給學(xué)習(xí)者的大腦快速充電補(bǔ)充知識(shí)能量,特別是那些上班族和家庭主婦在每天忙碌之后,還想繼續(xù)學(xué)習(xí)可是抽不出時(shí)間來(lái),而課程培訓(xùn)機(jī)構(gòu)大多都在難找的寫(xiě)字樓上,寫(xiě)字樓昂貴的租金增加了培訓(xùn)機(jī)構(gòu)的經(jīng)濟(jì)負(fù)擔(dān),培訓(xùn)資訊的最新傳播力度不給力,不易于學(xué)習(xí)者及時(shí)了解到相關(guān)課程,開(kāi)課時(shí)間往往因?yàn)殄e(cuò)過(guò)最佳的學(xué)習(xí)機(jī)會(huì)只能再次等待。移動(dòng)搜課寶平臺(tái)讓培訓(xùn)資訊更便捷地發(fā)布到互聯(lián)網(wǎng)平臺(tái)上,學(xué)習(xí)者可以同時(shí)選擇網(wǎng)絡(luò)學(xué)習(xí)和實(shí)體學(xué)習(xí),學(xué)習(xí)者的受益面是廣泛的,不同行業(yè)不同年齡的社會(huì)人群均可以加入到學(xué)習(xí)者的行列中來(lái)。
當(dāng)今社會(huì)處于知識(shí)大爆炸時(shí)代,知識(shí)改變命運(yùn),知識(shí)締造傳奇,學(xué)習(xí)是終身性質(zhì)的,人們的大腦如果不學(xué)習(xí)時(shí)間久了就會(huì)生銹,這很直觀地說(shuō)明了學(xué)習(xí)的重要性?;ヂ?lián)網(wǎng)凝聚了全球整個(gè)地球村的海量多媒體課程資源,網(wǎng)絡(luò)視頻課程讓學(xué)習(xí)者在家里也能接受跟學(xué)校一樣的教育,不久的將來(lái)“家庭學(xué)?!币欢〞?huì)像“家庭辦公”一樣普及。隨著不同的勞動(dòng)力在社會(huì)化分工程度的不斷細(xì)分,人們已不滿足從通用搜索引擎(如 Google、Baidu等)獲得結(jié)果,而是產(chǎn)生了面向企業(yè)需求的垂直搜索網(wǎng)站,本平臺(tái)主要研究的是面向課程視頻資源的搜索,創(chuàng)新之處在于使用拍照搜索課程?,F(xiàn)代社會(huì)的不斷發(fā)展使人們的移動(dòng)性日益增強(qiáng),無(wú)論是小孩還是老人人手至少一部手機(jī),可見(jiàn)手機(jī)在當(dāng)今社會(huì)的普及率有多高,隨著人們對(duì)信息需求量的不斷增長(zhǎng),人們可以輕松通過(guò)搜索引擎查詢到所需信息,上網(wǎng)搜一下,你就知道。為了提供給人們更優(yōu)質(zhì)的服務(wù),關(guān)鍵是找到適合移動(dòng)手機(jī)環(huán)境下的搜索技術(shù)。4G的普及和5G的出現(xiàn),使手機(jī)、PDA等移動(dòng)終端通信設(shè)備傳輸數(shù)據(jù)帶寬、傳輸質(zhì)量得以進(jìn)一步提高,能滿足高速帶寬應(yīng)用的需求。
作為垂直搜索的主要應(yīng)用之一,近年來(lái),移動(dòng)商務(wù)搜索引擎得以迅速發(fā)展。人們已不滿足通過(guò)查看課程的文字和圖片信息了解到所要購(gòu)買(mǎi)的課程。課程視頻試看已逐漸成為人們?nèi)轿涣私庹n程的重要途徑。某些網(wǎng)上商城營(yíng)銷(xiāo)課程時(shí)也會(huì)推出課程試看。因此,基于移動(dòng)手機(jī)的課程視頻檢索將成為可能。這種移動(dòng)搜索技術(shù)基于IOS平臺(tái),通過(guò)PDA、移動(dòng)手機(jī)登錄移動(dòng)通信終端環(huán)境,以微信、微博、QQ、手機(jī)瀏覽器等方式接入移動(dòng)通信,來(lái)獲取信息。[2]移動(dòng)搜課寶平臺(tái)不僅可以方便同城以及異地的學(xué)習(xí)者快速找到附近感興趣的課程教學(xué)點(diǎn),還可以自己錄制課程視頻發(fā)布到網(wǎng)上課程商城平臺(tái),經(jīng)管理員審核通過(guò)后課程發(fā)布者就可以售賣(mài)該網(wǎng)絡(luò)課程。用戶可以上傳課程縮略圖參加搜課平臺(tái)的優(yōu)秀課程評(píng)比比賽,用戶通過(guò)注冊(cè)搜課平臺(tái)軟件賬號(hào)就可以對(duì)喜歡的用戶進(jìn)行投票或者直接使用自己的IP地址進(jìn)行匿名投票。移動(dòng)搜課寶平臺(tái)的注冊(cè)商戶可以隨時(shí)發(fā)布培訓(xùn)課程開(kāi)課信息、課程視頻試看以及介紹實(shí)體培訓(xùn)機(jī)構(gòu)學(xué)習(xí)環(huán)境的宣傳片以供學(xué)習(xí)者查閱、購(gòu)買(mǎi)課程。
在線投票系統(tǒng)包括前臺(tái)用戶界面和后臺(tái)數(shù)據(jù)庫(kù)管理系統(tǒng)。用戶進(jìn)入前臺(tái)用戶界面(留言板、投票、新聞中心)進(jìn)行選擇項(xiàng)目,判斷選擇選項(xiàng)是單選模式還是多選模式,查看投票權(quán)限是否限制用戶IP地址,不限制可以直接投票;若限制用戶IP地址,系統(tǒng)先檢測(cè)用戶IP地址,使用用戶通行證進(jìn)行第一次投票,檢測(cè)系統(tǒng)允許投票時(shí)間,時(shí)間不允許,彈出已投過(guò)票的對(duì)話框,時(shí)間允許,可以再次進(jìn)行投票,例如投票時(shí)間間隔為1天,那么今天投過(guò)票以后就不能繼續(xù)投了,只能明天登錄繼續(xù)投票支持,這樣就避免了同一IP地址用戶刷票的嫌疑,也不至于使系統(tǒng)訪問(wèn)流量過(guò)大而引發(fā)系統(tǒng)崩潰。
前臺(tái)投票用戶界面和后臺(tái)投票數(shù)據(jù)庫(kù)管理流程圖如圖1所示。經(jīng)過(guò)系統(tǒng)統(tǒng)一身份認(rèn)證以后,客戶直接提交課程信息,管理員則管理投票課程,進(jìn)行更新、管理系統(tǒng)配置、管理選項(xiàng)操作,管理系統(tǒng)配置具有編輯、刪除功能,管理選項(xiàng)具有刪除、更新、
添加功能。其中,刪除子選項(xiàng)用于系統(tǒng)管理員審核是否有投票權(quán),若沒(méi)有投票權(quán),則管理員刪除投票課程。投票課程有截止日期,如果是過(guò)期的投票,則系統(tǒng)管理員一律視為作廢投票無(wú)效。
圖1 前臺(tái)投票用戶界面和后臺(tái)投票數(shù)據(jù)庫(kù)管理流程圖Fig.1 The flow chart of the front voting user interface and the background voting database management
用戶可以通過(guò)五種搜索方式搜索課程:關(guān)鍵詞搜索、圖片搜索、視頻搜索、拍照搜索、錄像搜索。課程的圖像搜索引擎框架圖如圖2所示。學(xué)習(xí)者用戶可以通過(guò)從其他教育資源網(wǎng)站上下載示例課程視頻(如:VeryCD網(wǎng)站上有很多課程視頻附帶Simple示例視頻),如果原課程視頻的存儲(chǔ)容量很大,學(xué)習(xí)者沒(méi)有那么多的時(shí)間等待下載完成,或者學(xué)習(xí)者想搜索相關(guān)類似的自己滿意的視頻而不是費(fèi)眼神、費(fèi)精力地等待一個(gè)個(gè)很大的課程文件打包下載完成后一個(gè)個(gè)地點(diǎn)擊播放再一個(gè)個(gè)地刪除或者保留視頻文件,移動(dòng)搜課寶避免了學(xué)習(xí)者成為下載狂而不把時(shí)間和精力放在學(xué)習(xí)上的普遍問(wèn)題。學(xué)習(xí)者只需要下載一個(gè)大小不超過(guò)幾十MB的示例課程視頻(使用IE8.0以上瀏覽器下載特別方便)或者上傳任何自己滿意的課程短視頻至移動(dòng)搜課寶進(jìn)行在線課程搜索,搜到自己滿意的課程便可加入購(gòu)物車(chē)隨時(shí)付款,商家收到付款后隨時(shí)提供課程視頻下載鏈接。這種網(wǎng)購(gòu)模式給學(xué)習(xí)者挑選課程帶來(lái)便捷的同時(shí)也會(huì)產(chǎn)生一些新的問(wèn)題:1.如何在茫茫課程中直觀了解到自己中意的課程并快速購(gòu)買(mǎi)自己滿意的課程;2.對(duì)于不同商家的同一種課程如何進(jìn)行比較,這些是移動(dòng)搜課寶的研究重點(diǎn)。隨著 4G智能手機(jī)的普及,移動(dòng) 4G網(wǎng)絡(luò)最大的優(yōu)勢(shì)是網(wǎng)速快、更靈活方便,4G通信系統(tǒng)的速度達(dá)到10Mb/s~ 20Mb/s,最高上限是100Mb/s,4G網(wǎng)絡(luò)終端具有更好的兼容性,能無(wú)縫對(duì)接不同的系統(tǒng)來(lái)回自由切換,具有全球通信漫游、開(kāi)放接口、能和多個(gè)網(wǎng)絡(luò)系統(tǒng)聯(lián)接等特點(diǎn),4G通信方便了人們的日常生活,人們可以隨時(shí)隨地
互相通信,實(shí)現(xiàn)異地同步雙向上傳或下載資料、圖片、視頻等網(wǎng)絡(luò)數(shù)據(jù),人們可以充分利用手機(jī)的照相功能和錄像功能,結(jié)合視頻搜索,隨時(shí)隨地購(gòu)買(mǎi)課程。移動(dòng)搜課寶通過(guò)對(duì)課程視頻關(guān)鍵幀的自動(dòng)識(shí)別,可以在海量課程視頻數(shù)據(jù)中快速、準(zhǔn)確地尋找到學(xué)習(xí)者感興趣的課程。
網(wǎng)上搜課怎樣找到自己心中理想的課程呢?有的用戶知道自己要的課程名稱但是不知道課程內(nèi)容。而有的用戶已經(jīng)了解想要的課程內(nèi)容,卻不知道課程名稱。這就需要搜索引擎提供兩種方式的搜索,一種是基于文本的搜索,另一種是基于視頻內(nèi)容片段的搜索。[3]基于文本的搜索是通過(guò)提交關(guān)鍵詞進(jìn)行搜索,它是利用文本描述的方式描述課程的信息,如課程的名稱、錄制日期、課程所在地及文件的大小等,該方式適合第一類用戶的搜索需求。而基于內(nèi)容的檢索是對(duì)視頻片段中的視覺(jué)及聲音特征等進(jìn)行分析和檢索的技術(shù),適合第二類用戶的搜索方式。
通過(guò)運(yùn)用GPRS技術(shù),在課程搜索的同時(shí)用數(shù)學(xué)公式將網(wǎng)絡(luò)在線課程所在的地址和用戶的距離進(jìn)行計(jì)算,以幫助用戶定位課程,節(jié)約時(shí)間。
由于移動(dòng)網(wǎng)絡(luò)帶寬以及手機(jī)內(nèi)存和速度的限制,如何在移動(dòng)環(huán)境下使搜索更加快捷,同時(shí)使用戶獲得良好的應(yīng)用體驗(yàn)成為技術(shù)的關(guān)鍵。首先,根據(jù)圖像的自身信息,通過(guò)在客戶端進(jìn)行視頻序列特征的提取,并將視頻序列特征信息上傳到服務(wù)器端與視頻特征數(shù)據(jù)庫(kù)中特征信息進(jìn)行相似性比較。最后將相似度大小、課程所在地及用戶所在地等多種信息進(jìn)行綜合分析和排序,輸出查詢結(jié)果。這一方法避免了上傳視頻的大量流量損耗,節(jié)約了資源,而且提供的給予位置的搜索服務(wù)能大大提高用戶的體驗(yàn)度。
本系統(tǒng)主要實(shí)現(xiàn)以下功能:用戶可選擇不同的搜索方式進(jìn)行課程搜索。如果選擇基于文本的搜索,則輸入關(guān)鍵詞后,系統(tǒng)根據(jù)用戶提交的關(guān)鍵詞進(jìn)行匹配。若用戶選擇基于內(nèi)容的搜索方式,則當(dāng)用戶上傳該視頻或者圖片后,客戶端對(duì)上傳的課程視頻或圖片進(jìn)行特征提取并上傳到服務(wù)器,與服務(wù)器中已提取特征的課程視頻進(jìn)行相似匹配,根據(jù)其相似度、課程及買(mǎi)家所在地的位置信息綜合度量排序后返回客戶端。本移動(dòng)搜課寶系統(tǒng)的總體框架結(jié)構(gòu)如圖3所示。
圖3 系統(tǒng)總體架構(gòu)圖Fig.3 Overall architecture diagram of the system
1. 查詢模塊。查詢模塊接收用戶需要查詢的課程視頻和關(guān)鍵詞,將查詢請(qǐng)求傳給檢索模塊進(jìn)行操作。
2. 描述模塊。描述模塊將用戶的查詢要求轉(zhuǎn)化為對(duì)視頻內(nèi)容較抽象的內(nèi)容表達(dá)和描述,即通過(guò)視頻分析,以一種計(jì)算機(jī)可以方便表達(dá)的數(shù)據(jù)結(jié)構(gòu)建立對(duì)視頻內(nèi)容的描述。這個(gè)模塊是建立課程視頻數(shù)據(jù)庫(kù)和實(shí)現(xiàn)課程視頻檢索的基礎(chǔ)。
3. 檢索匹配模塊。檢索是指對(duì)用戶提交的查詢條件與數(shù)據(jù)庫(kù)中的視頻對(duì)象進(jìn)行相似匹配,返回結(jié)果對(duì)象。該模塊首先對(duì)接收到的用戶查詢請(qǐng)求進(jìn)行分析,對(duì)于文本查詢直接進(jìn)行搜索關(guān)鍵詞與視頻描述的匹配;對(duì)于提交的視頻,則通過(guò)提取視覺(jué)特征,并與服務(wù)器端特征庫(kù)中的視頻特征進(jìn)行相似匹配,查找出符合條件的視頻集。最后向用戶返回匹配結(jié)果并顯示。除此之外,還需匹配課程所在地與買(mǎi)家所在地的空間位置,綜合上述三者匹配結(jié)果進(jìn)行綜合排序。
4. 提取模塊。提取模塊包含客戶端和服務(wù)器端。服務(wù)器端用于提取數(shù)據(jù)庫(kù)中課程視頻的特征信息,客戶端用于提取客戶提交的視頻片段的特征信息。這樣能有效減少網(wǎng)絡(luò)數(shù)據(jù)傳輸及服務(wù)器開(kāi)銷(xiāo)。
本系統(tǒng)主要包括數(shù)據(jù)采集、數(shù)據(jù)檢索、數(shù)據(jù)顯示和推送服務(wù)等功能,具體功能模塊結(jié)構(gòu)如圖4所示。
圖4 系統(tǒng)具體功能模塊結(jié)構(gòu)圖Fig.4 The structure diagram of the specific function module of the system
本系統(tǒng)為用戶提供了一個(gè)通過(guò)手機(jī)快速查找網(wǎng)絡(luò)課程的平臺(tái)。系統(tǒng)開(kāi)發(fā)環(huán)境采用Mac OS X,開(kāi)發(fā)工具采用 Xcode。系統(tǒng)架構(gòu)采用 C/S結(jié)構(gòu),視頻數(shù)據(jù)采集使用Microsoft SQL Server2005數(shù)據(jù)庫(kù)。[4]本系統(tǒng)支持avi、wmv、3gp等視頻格式的檢索。
下面從數(shù)據(jù)采集、檢索、顯示、推送及后臺(tái)管理五個(gè)模塊詳細(xì)介紹該移動(dòng)搜課寶檢索系統(tǒng)的實(shí)現(xiàn)。
(1)數(shù)據(jù)采集模塊
通過(guò)對(duì)采集的網(wǎng)頁(yè)分析,進(jìn)行正則表達(dá)式匹配,解析出Deep Web中網(wǎng)頁(yè)中課程視頻的實(shí)際URL,有效地實(shí)現(xiàn)課程視頻的自動(dòng)批量下載。
信息采集方式包括人工采集和自動(dòng)采集,即可以人工手動(dòng)設(shè)定網(wǎng)址或者網(wǎng)頁(yè)自動(dòng)分析url地址。本系統(tǒng)數(shù)據(jù)采集模塊實(shí)現(xiàn)采用網(wǎng)頁(yè)機(jī)器人。網(wǎng)頁(yè)機(jī)器人是以Web為基礎(chǔ)的程序集合,它通過(guò)請(qǐng)求網(wǎng)站站點(diǎn)上的HTML網(wǎng)頁(yè)響應(yīng)后下載程序集,網(wǎng)頁(yè)機(jī)器人依次遍歷指定范圍內(nèi)的Web空間,不停地采集各個(gè)Web站點(diǎn)的子網(wǎng)頁(yè)加入到HTML網(wǎng)頁(yè)索引數(shù)據(jù)庫(kù)。網(wǎng)頁(yè)機(jī)器人工作時(shí)會(huì)搜索到新網(wǎng)頁(yè)上的所有鏈接,為了優(yōu)化網(wǎng)頁(yè)機(jī)器人搜索操作,首先我們需要為網(wǎng)頁(yè)機(jī)器人構(gòu)建一個(gè)原始網(wǎng)頁(yè)集,以這個(gè)原始網(wǎng)頁(yè)集為起點(diǎn),逐步搜索到全部鏈接,方便收集到整個(gè)范圍內(nèi)的Web空間網(wǎng)頁(yè)。
(2)數(shù)據(jù)檢索模塊
無(wú)限查詢子系統(tǒng)是垂直視頻搜索引擎最重要的模塊之一,它采用Web界面。如圖5所示,用戶端通過(guò)手機(jī)或 PDA等無(wú)線輸入設(shè)備進(jìn)行基于關(guān)鍵詞或視頻片段的無(wú)線檢索。在搜索服務(wù)器進(jìn)行基于混合(語(yǔ)義和內(nèi)容)索引的查詢。將查詢得到的視頻片段返回應(yīng)用服務(wù)器,并對(duì)其結(jié)果進(jìn)行基于語(yǔ)義的視頻聚類,提高查詢結(jié)果的精度。最終返回用戶端。
圖5 無(wú)線檢索子系統(tǒng)框架Fig. 5 Wireless retrieval subsystem framework
本系統(tǒng)中視頻特征數(shù)據(jù)通過(guò)文本檢索關(guān)鍵幀的特征信息,這些關(guān)鍵幀的特征數(shù)據(jù)均以字符串的形式存儲(chǔ)在數(shù)據(jù)庫(kù)中,使用分隔符將每個(gè)關(guān)鍵幀的特征字符串分隔開(kāi)來(lái)。在進(jìn)行搜索時(shí),只需讀取數(shù)據(jù)庫(kù)中的特征表,并通過(guò)字符串操作解析出來(lái)即可完成一系列比較操作。其他數(shù)據(jù)包括視頻的路徑名、視頻的來(lái)源及類別等,與視頻路徑等信息一起存放在數(shù)據(jù)庫(kù)中。
數(shù)據(jù)檢索模塊由查詢接口和相似性匹配兩個(gè)子模塊組成。查詢接口模塊負(fù)責(zé)用戶以什么樣的方式輸入,通常輸入方式有很多種,如提交關(guān)鍵詞、直接提交視頻片段或者給定一張圖片等。本系統(tǒng)采用例子視頻查詢作為用戶需求的輸入方式。用戶可向系統(tǒng)提交一段待查詢的實(shí)例視頻。同時(shí),在手機(jī)端對(duì)實(shí)例視頻提取關(guān)鍵幀,并得到對(duì)應(yīng)的特征向量,然后系統(tǒng)將示例視頻與服務(wù)器端的視頻特征庫(kù)中的視頻特征向量進(jìn)行相似度匹配,得到查詢結(jié)果。[5]
主界面分為四個(gè)部分,自上到下分別為搜索欄、Logo欄、廣告與推送欄、快捷菜單欄。搜索欄共有三個(gè)組件:關(guān)鍵詞輸入框、錄像(選擇視頻)搜索按鈕、關(guān)鍵詞搜索按鈕。Logo欄為軟件的Logo與標(biāo)語(yǔ)。廣告與推送欄則由預(yù)留廣告和系統(tǒng)自動(dòng)計(jì)算出的推送課程組成??旖莶藛螜趦?nèi)有快捷登錄與退出按鈕。
(3)數(shù)據(jù)顯示模塊
將視頻數(shù)據(jù)庫(kù)中的每個(gè)視頻與Simple視頻的相似度值進(jìn)行相似性計(jì)算并匹配,然后把結(jié)果反饋給用戶。[6]搜索結(jié)果使用兩種顯示方式:一種是縮略圖,另一種是列表。搜索結(jié)果共分為三個(gè)部分,分別為快捷搜索欄、結(jié)果列表以及菜單欄。除了結(jié)果列表,其他與上面相同,列表項(xiàng)內(nèi)容按照以下部分顯示:左邊為課程圖片,右邊自上而下分別為課程名稱、播放課程視頻、課程價(jià)格、關(guān)注訂閱、課程評(píng)價(jià)、課程推薦指數(shù)及課程所在地與用戶當(dāng)前所在地距離。同時(shí),該系統(tǒng)還可以定位課程所在的位置。這樣可以方便買(mǎi)家進(jìn)行實(shí)體學(xué)校培訓(xùn)。
(4)數(shù)據(jù)推送模塊
視頻信息個(gè)性化推送子系統(tǒng)如圖6所示,首先由用戶通過(guò)移動(dòng)網(wǎng)絡(luò)制定訂閱規(guī)則及用戶喜好,并存放到訂閱庫(kù)中。在這之前,系統(tǒng)將會(huì)對(duì)用戶的身份進(jìn)行識(shí)別。然后推送服務(wù)器根據(jù)這些制定的信息對(duì)收集視頻信息的系統(tǒng)進(jìn)行分析判斷,并將符合條件的信息條目通過(guò)訂閱工具推送給客戶或者通過(guò)郵件系統(tǒng)發(fā)送Email通知客戶。[7]
圖6 課程信息個(gè)性化推送子系統(tǒng)框架Fig. 6 The framework of personalized push subsystem for curriculum information
系統(tǒng)個(gè)性化推送界面已經(jīng)集成在主界面中。此部分的數(shù)據(jù)均為系統(tǒng)自動(dòng)計(jì)算出的結(jié)果,系統(tǒng)根據(jù)當(dāng)前用戶的喜好推送相關(guān)課程。
(5)后臺(tái)管理模塊
本系統(tǒng)使用Web系統(tǒng)作為系統(tǒng)的管理模塊,實(shí)現(xiàn)了隨時(shí)隨地?zé)o縫維護(hù)操作。[8]后臺(tái)管理界面如圖8所示。它分為頂部導(dǎo)航欄、側(cè)邊導(dǎo)航欄及管理面板三部分。頂部導(dǎo)航欄吸附了最常用的操作,可快速地實(shí)現(xiàn)對(duì)搜索引擎的設(shè)置管理,以及相關(guān)幫助的查詢。左側(cè)導(dǎo)航欄詳細(xì)羅列出了所有支持的系統(tǒng)管理操作,通過(guò)點(diǎn)擊這些鏈接即可完成整個(gè)系統(tǒng)的詳細(xì)設(shè)置維護(hù)功能。管理面板實(shí)現(xiàn)了詳細(xì)的子項(xiàng)管理功能。通過(guò)該Web在線管理系統(tǒng),搜索引擎能夠便捷地完成一系列的維護(hù)管理操作。
本文主要闡述了基于IOS平臺(tái)的移動(dòng)搜課寶系統(tǒng)設(shè)計(jì)。該系統(tǒng)提供給用戶多模態(tài)的課程視頻搜索服務(wù),并且能實(shí)現(xiàn)個(gè)性化課程信息制定與推送,滿足用戶多種需求。用戶通過(guò)視頻描述本身能更好地詮釋課程內(nèi)容,知道并了解學(xué)習(xí)者更想要哪種視頻課程的需求,填補(bǔ)了目前國(guó)內(nèi)外真正的基于內(nèi)容理解的系統(tǒng)不多的現(xiàn)狀。