何泰伯
摘 要: 針對傳統(tǒng)的多媒體信息檢索系統(tǒng)存在信息檢索速度緩慢、檢索精度低等問題,提出一種大數(shù)據(jù)分析的多媒體信息檢索系統(tǒng)的設(shè)計(jì)。首先從數(shù)據(jù)源追蹤組件、數(shù)據(jù)挖掘組件、系統(tǒng)預(yù)警組件對檢索系統(tǒng)的硬件部分進(jìn)行設(shè)計(jì);然后分析軟件設(shè)計(jì)流程圖以及信息檢索的算法,對多媒體信息檢索系統(tǒng)的軟件部分進(jìn)行設(shè)計(jì);最后以教學(xué)多媒體信息為依據(jù)進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明,所設(shè)計(jì)的多媒體信息檢索系統(tǒng)檢索速度快、精度高,為教育機(jī)構(gòu)提供了一個(gè)完美的平臺,日后將會成為各個(gè)學(xué)校一個(gè)重要的組成部分。
關(guān)鍵詞: 大數(shù)據(jù); 多媒體; 教學(xué); 數(shù)據(jù)挖掘; 信息檢索; 系統(tǒng)設(shè)計(jì)
中圖分類號: TN02?34; G40?057 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)03?0111?04
Abstract: The traditional multimedia information retrieval system has the problems of slow information retrieval speed and low retrieval accuracy. Therefore, a design of multimedia information retrieval system based on large data analysis is presented. The hardware components of the retrieval system were designed in the aspects of data source tracking component, data mining component and system warning component. The software design flowchart and information retrieval algorithm are analyzed to design the software of the multimedia information retrieval system. The teaching multimedia information is taken as the basis for experiment. The experimental results show that the multimedia information retrieval system has fast retrieval speed and high precision, provides a perfect platform for educational institutions, and should become an important component for each school.
Keywords: big data; multimedia; teaching; data mining; information retrieval; system design
0 引 言
隨著教育改革的不斷深入,對高校的實(shí)踐教育多媒體信息管理工作的改革和運(yùn)行模式的分析成為人們關(guān)注的熱點(diǎn)課題。教學(xué)多媒體信息檢索工作是衡量學(xué)校對學(xué)生的實(shí)踐教學(xué)和管理的重要指標(biāo),實(shí)踐教學(xué)管理是通過實(shí)踐教學(xué)的信息化檢索平臺得以實(shí)現(xiàn)[3?4]?;诖髷?shù)據(jù)分析的多媒體信息檢索是一種全新模式,打破了傳統(tǒng)固有的多媒體信息檢索模式,借助多媒體信息強(qiáng)大的覆蓋性能為更多的人提供學(xué)習(xí)的機(jī)會,多媒體教育不僅僅是針對學(xué)生,還可以為很多不同身份的人提供接受教育的途徑[5]。多媒體信息檢索系統(tǒng)設(shè)計(jì)的目的在于:可以反映數(shù)據(jù)參數(shù)的相關(guān)系統(tǒng)進(jìn)行融合,并以簡單明了的形式展現(xiàn)給設(shè)計(jì)人員;設(shè)計(jì)人員利用挖掘到的數(shù)據(jù)對系統(tǒng)的硬件以及軟件進(jìn)行理論上的分析,并將運(yùn)行的實(shí)時(shí)數(shù)據(jù)與參數(shù)變化記錄下來;具有一定的預(yù)警功能,如果出現(xiàn)學(xué)生學(xué)習(xí)進(jìn)度落后的情況,應(yīng)立刻啟動警告模式[6]。
文獻(xiàn)[7]詳細(xì)地分析了國內(nèi)外多媒體信息檢索方法的標(biāo)準(zhǔn)與原理,介紹了多媒體信息系統(tǒng)設(shè)計(jì)的主要工具和模型;文獻(xiàn)[8]研究了多媒體信息檢索系統(tǒng)的安全性能,從隨機(jī)的模型與評價(jià)的技術(shù)著手分析多媒體安全的評價(jià)指標(biāo);文獻(xiàn)[9]提出協(xié)同式的病毒入侵對抗理念,為多媒體信息檢索系統(tǒng)設(shè)計(jì)豎起了一個(gè)安全的屏障;文獻(xiàn)[10]專門為檢索系統(tǒng)設(shè)計(jì)進(jìn)行了虛擬物理的實(shí)驗(yàn),得出多媒體信息檢索系統(tǒng)的設(shè)計(jì)具有不可估量的前景的結(jié)論。
傳統(tǒng)的教學(xué)多媒體信息檢索方法的空間限制性很強(qiáng),無法全面展示大多數(shù)學(xué)生的學(xué)習(xí)情況,基于上述觀點(diǎn),本文提出大數(shù)據(jù)分析下教學(xué)多媒體信息檢索系統(tǒng)的設(shè)計(jì)。首先對檢索系統(tǒng)的硬件部分從數(shù)據(jù)源追蹤組件、數(shù)據(jù)挖掘組件、系統(tǒng)預(yù)警組件這3個(gè)主要的組件進(jìn)行設(shè)計(jì),并著重分析了數(shù)據(jù)挖掘算法;然后對檢索系統(tǒng)的軟件部分從軟件的設(shè)計(jì)流程圖開始分析,并運(yùn)用數(shù)據(jù)檢索的算法得到模型函數(shù);最后將傳統(tǒng)的方法與本系統(tǒng)的教育方法進(jìn)行對比。實(shí)驗(yàn)結(jié)果證明,檢索系統(tǒng)的設(shè)計(jì)對教育的發(fā)展具有重要意義。
1 大數(shù)據(jù)分析的多媒體信息檢索系統(tǒng)硬件設(shè)計(jì)
傳統(tǒng)的教學(xué)多媒體信息檢索方法存在學(xué)習(xí)行為的繁瑣性與多因素性,其檢索信息的目的性非常模糊,大量的不確定因素導(dǎo)致出現(xiàn)半結(jié)構(gòu)化的問題。從統(tǒng)計(jì)學(xué)的角度來分析,傳統(tǒng)的教學(xué)多媒體信息難以實(shí)現(xiàn)檢索模型的建立;從控制學(xué)的角度分析,無法精準(zhǔn)地跟蹤教學(xué)信息。因此,基于大數(shù)據(jù)分析下的教學(xué)多媒體信息檢索系統(tǒng)的硬件設(shè)計(jì)是非常必要的,在教學(xué)過程中,大數(shù)據(jù)分析的多媒體挖掘的目的就是使學(xué)生了解學(xué)習(xí)行為的特征數(shù)據(jù),其系統(tǒng)設(shè)計(jì)主要從以下幾個(gè)硬件組成部分進(jìn)行分析。
1) 數(shù)據(jù)源追蹤組件的設(shè)計(jì)
大數(shù)據(jù)分析下的教學(xué)多媒體信息檢索硬件系統(tǒng)中,數(shù)據(jù)源追蹤的設(shè)計(jì)主要是對學(xué)生的多媒體學(xué)習(xí)情況進(jìn)行跟蹤,及時(shí)收集學(xué)生的學(xué)習(xí)行為特征數(shù)據(jù),主要設(shè)計(jì)的部分包括:學(xué)生學(xué)習(xí)的時(shí)長、學(xué)生學(xué)習(xí)的人數(shù)、與老師實(shí)時(shí)互動的情況、積極解答老師提出的問題、學(xué)習(xí)完成的進(jìn)度、各種考試成績的情況、成績反應(yīng)出來的知識點(diǎn)等各種多媒體信息的數(shù)據(jù)源。這些數(shù)據(jù)源全部來自于多媒體服務(wù)器終端中的備忘記錄系統(tǒng),每隔3 min就會自動保存一次,因此數(shù)據(jù)源收集的誤差非常小,對數(shù)據(jù)源追蹤具有良好的效果。endprint
2) 數(shù)據(jù)挖掘的組件設(shè)計(jì)
多媒體信息檢索系統(tǒng)的設(shè)計(jì)核心就是對知識庫的選擇,知識庫是一個(gè)具有規(guī)則性的集合體,采用基于數(shù)據(jù)熵的數(shù)據(jù)挖掘算法能夠挖掘出不同的有效數(shù)據(jù)。
設(shè)為一個(gè)多媒體信息的數(shù)據(jù)系統(tǒng),,為系數(shù),若:
那么對象相對于的數(shù)據(jù)挖掘信息為:
式中:為的信息熵;為數(shù)據(jù)挖掘?qū)ο蠛蟮男畔㈧亍?/p>
隨著數(shù)據(jù)挖掘的深入,知識庫將不斷添加新的規(guī)則來制約系統(tǒng)的智能性?;跀?shù)據(jù)熵的多媒體信息挖掘的設(shè)計(jì)不但可以將方法用知識庫的形式展現(xiàn)出來,還可以解析挖掘出來的數(shù)據(jù)結(jié)果。
3) 系統(tǒng)預(yù)警的組件設(shè)計(jì)
系統(tǒng)預(yù)警的設(shè)計(jì)主要針對學(xué)生在課程上學(xué)習(xí)的進(jìn)度,通過設(shè)計(jì)自動推理的指標(biāo)系統(tǒng),綜合指標(biāo)對學(xué)員多媒體學(xué)習(xí)情況進(jìn)行評價(jià),根據(jù)教學(xué)系統(tǒng)設(shè)定的教學(xué)多媒體信息來判斷學(xué)生的學(xué)習(xí)情況。如果在某個(gè)時(shí)間段學(xué)生在組件上學(xué)習(xí)的進(jìn)度低于標(biāo)準(zhǔn)值的70%,就會發(fā)出警告的信息。
由上述主要的三個(gè)組件的設(shè)計(jì),可以得出檢索系統(tǒng)的硬件設(shè)計(jì),如圖1所示。
由圖1可知,學(xué)生通過教育學(xué)習(xí)知識,多媒體信息檢索系統(tǒng)的備忘錄設(shè)計(jì)將記錄學(xué)生的學(xué)習(xí)情況,并對數(shù)據(jù)進(jìn)行收集,數(shù)據(jù)經(jīng)過預(yù)處理傳遞給數(shù)據(jù)追蹤組件,數(shù)據(jù)組件通過數(shù)據(jù)挖掘的計(jì)算用知識庫的形式展現(xiàn)出來,并解析挖掘后的數(shù)據(jù)結(jié)果,最后將數(shù)據(jù)傳送到系統(tǒng)的報(bào)警裝置,如若學(xué)生的學(xué)習(xí)進(jìn)度落后,那么就會啟動警告系統(tǒng),整個(gè)檢索的硬件設(shè)計(jì)就此完成。
2 大數(shù)據(jù)分析下多媒體信息檢索系統(tǒng)軟件設(shè)計(jì)
為了實(shí)現(xiàn)檢索系統(tǒng)軟件部分的設(shè)計(jì),必須遵循3項(xiàng)基本原則:規(guī)范制度、數(shù)據(jù)編號、事實(shí)遵循表,4個(gè)步驟:每一個(gè)學(xué)生的學(xué)習(xí)進(jìn)度只有進(jìn)行系統(tǒng)備忘錄后才可以影響系統(tǒng)的檢索;系統(tǒng)備忘錄儲存的是學(xué)生學(xué)習(xí)進(jìn)度的數(shù)據(jù),對數(shù)據(jù)進(jìn)行挖掘;挖掘后的數(shù)據(jù)具有一定的規(guī)范性,追溯到數(shù)據(jù)源,經(jīng)過分析得出檢索的初始值;最后數(shù)值確定進(jìn)行檢索。
具體的軟件設(shè)計(jì)流程如圖2所示。
對于軟件設(shè)計(jì)數(shù)據(jù)的檢索可以使用圖生成算法。設(shè)收集到的數(shù)據(jù)信息為儲存速度為分別為學(xué)生學(xué)習(xí)進(jìn)度,由此可得出軟件設(shè)計(jì)的模型函數(shù)為:
模型函數(shù)的建立是為了保證數(shù)據(jù)儲存的順利,其空間大小也要依據(jù)模型函數(shù)進(jìn)行設(shè)計(jì),其中包含了數(shù)據(jù)用于現(xiàn)實(shí)代理的各種編碼機(jī)制。檢索的軟件設(shè)計(jì)不僅為大數(shù)據(jù)分析下的多媒體教育建立了監(jiān)督機(jī)制,還確保了學(xué)習(xí)情況的進(jìn)度,為系統(tǒng)的設(shè)計(jì)奠定了堅(jiān)實(shí)的基礎(chǔ)。
3 實(shí)驗(yàn)結(jié)果與分析
為了測試本文設(shè)計(jì)的大數(shù)據(jù)分析的教學(xué)多媒體信息檢索系統(tǒng)的性能,選取某地區(qū)學(xué)校的多媒體信息為研究對象,在Linux/WindowsCE開發(fā)平臺下進(jìn)行開發(fā),測試BIM數(shù)據(jù)檢索系統(tǒng)的運(yùn)行性能,使用hpe1432_createChannelGroup()函數(shù)配置教學(xué)多媒體信息檢索系統(tǒng)的模塊列表、通道號等參量,數(shù)據(jù)口設(shè)置為Local Bus,RESAMP_ DATA接口讀取采樣數(shù)據(jù)的頻率設(shè)定為14.8 kHz。根據(jù)上述實(shí)驗(yàn)環(huán)境和參量設(shè)定,進(jìn)行教學(xué)多媒體信息檢索系統(tǒng)的性能測試。
實(shí)驗(yàn)1:采用不同方法測試系統(tǒng)對聚焦于多媒體信息檢索的速度,得到的對比結(jié)果如圖3所示。
通過圖3可以明顯地看出,本文設(shè)計(jì)的大數(shù)據(jù)分析的教學(xué)多媒體信息檢索系統(tǒng)能夠在短時(shí)間內(nèi)進(jìn)行數(shù)據(jù)的檢索,傳統(tǒng)的多媒體信息檢索速度比本文設(shè)計(jì)的要慢一半左右。
實(shí)驗(yàn)2:對多媒體信息檢索的各種行為模塊進(jìn)行數(shù)據(jù)檢索,模塊包括:論壇、課程、作業(yè)、資源、用戶消息、聊天室。選取一個(gè)學(xué)期的師生教學(xué)視頻情況,從論壇的參與討論、學(xué)生作業(yè)的完成情況、資源瀏覽次數(shù)、師生視頻交流這幾方面開始收集實(shí)驗(yàn)數(shù)據(jù)。
采取縱交叉的算法:
式中:表示提取的教學(xué)多媒體信息數(shù)據(jù);表示數(shù)據(jù)的修正系數(shù);表示數(shù)據(jù)的方位參數(shù);表示學(xué)生成績的差值參數(shù);表示檢索結(jié)果的數(shù)據(jù);表示檢索數(shù)據(jù)的理想?yún)?shù);表示檢索數(shù)據(jù)的差值;分別表示視頻次數(shù)數(shù)據(jù)的修正、教師授課人數(shù)的修正、學(xué)生聽課人數(shù)的修正。
根據(jù)式(5)中的算法對檢索的數(shù)據(jù)進(jìn)行收集,進(jìn)而得到其檢索精度,如圖4所示。
由圖4可見,利用大數(shù)據(jù)分析的檢索系統(tǒng)方法和傳統(tǒng)方法對教學(xué)信息進(jìn)行檢索,隨著實(shí)驗(yàn)次數(shù)的增多,傳統(tǒng)方法的檢測精度在10%~40%之間,雖然浮動不大,但是精度較低。本文提出的檢測方法精度遠(yuǎn)遠(yuǎn)高于傳統(tǒng)方法,隨著實(shí)驗(yàn)次數(shù)的增多,本文檢測精度一直處于較高水平,且穩(wěn)定性好,上下浮動范圍很小,精度穩(wěn)定在80%~90%。
從上述實(shí)驗(yàn)的過程可以看出,大數(shù)據(jù)分析的教學(xué)多媒體信息的檢索設(shè)計(jì)與傳統(tǒng)檢索方法相比,具有一定的有效性。除此之外,采用大數(shù)據(jù)分析的教學(xué)多媒體信息檢索系統(tǒng),檢索到的多媒體信息數(shù)量也較為理想,通過圖5可以更加清晰地了解到本文所設(shè)計(jì)系統(tǒng)的優(yōu)點(diǎn)。
由圖5可以看出:利用大數(shù)據(jù)分析的教學(xué)多媒體信息檢索系統(tǒng),檢索到的多媒體信息數(shù)量明顯高于傳統(tǒng)方法檢索的信息數(shù)量,可見,本文設(shè)計(jì)的系統(tǒng)不僅檢索數(shù)據(jù)速度快、精度高,而且檢索能力很強(qiáng),充分表明了本文所設(shè)計(jì)系統(tǒng)性能高,具有很大的應(yīng)用價(jià)值。
通過表1可以看出:傳統(tǒng)方法檢索到的教學(xué)教師的人數(shù)占總?cè)藬?shù)的一半,而大數(shù)據(jù)分析的教學(xué)教師占總?cè)藬?shù)的90%;傳統(tǒng)的教學(xué)學(xué)生在線人數(shù)占總?cè)藬?shù)的45%,大數(shù)據(jù)分析下的教學(xué)學(xué)生占總?cè)藬?shù)的95%;傳統(tǒng)的教學(xué)學(xué)生成績合格率為40%,大數(shù)據(jù)分析的教學(xué)學(xué)生的成績合格率為80%;在家長的支持率中,大數(shù)據(jù)分析的系統(tǒng)得到了100%的支持。因此,基于大數(shù)據(jù)分析的多媒體信息檢索系統(tǒng)更為突出。
4 結(jié) 語
網(wǎng)絡(luò)的日趨普及為大數(shù)據(jù)分析教育的發(fā)展提供了一定的保障,采用靈活性強(qiáng)、準(zhǔn)確率高的智能化教育成為當(dāng)下最流行的手段。而多媒體信息檢索系統(tǒng)設(shè)計(jì)的意義就要遵循教育的高信息、高效率、低成本、大規(guī)模的4大準(zhǔn)則?;诖髷?shù)據(jù)分析下的教學(xué)多媒體信息檢索系統(tǒng)的硬件設(shè)計(jì)對學(xué)生的學(xué)習(xí)進(jìn)度信息進(jìn)行追蹤,運(yùn)用檢索的軟件設(shè)計(jì)對教學(xué)信息進(jìn)行分析。隨著系統(tǒng)的進(jìn)一步完善,教育課程內(nèi)有必要將老師的授課方式與內(nèi)容體系進(jìn)行實(shí)時(shí)的錄制并儲存,為日后學(xué)生的復(fù)習(xí)提供一條路徑,大數(shù)據(jù)分析下的教學(xué)多媒體信息檢索的設(shè)計(jì)為我國的教育事業(yè)奠定了堅(jiān)實(shí)的基礎(chǔ)。endprint
參考文獻(xiàn)
[1] 曲朝陽,孫立擎,潘峰,等.基于流形排序的電網(wǎng)截面數(shù)據(jù)檢索[J].科學(xué)技術(shù)與工程,2016,16(15):239?244.
QU Chaoyang, SUN Liqing, PAN Feng, et al. The grid section data retrieval based on manifold ranking [J]. Science technology and engineering, 2016, 16(15): 239?244.
[2] 甘麗新,李志剛,涂偉.大數(shù)據(jù)時(shí)代高職院校信息檢索課程改革的研究[J].職教論壇,2015,33(17):78?82.
GAN Lixin, LI Zhigang, TU Wei. Research on information retrieval curriculum reform of higher vocational colleges in the era of big data [J]. Vocational & technical education forum, 2015, 33(17): 78?82.
[3] 伍振興,曾令偉,汪文彬.基于概念格特征分區(qū)的多源信息檢索優(yōu)化[J].科技通報(bào),2015,31(8):174?176.
WU Zhenxing, ZENG Lingwei, WANG Wenbin. Optimization of multi?source information retrieval based on concept lattice feature partition [J]. Bulletin of science and technology, 2015, 31(8): 174?176.
[4] 楊瑩.基于Oracle數(shù)據(jù)庫大數(shù)據(jù)的檢索優(yōu)化分析與設(shè)計(jì)[J].數(shù)碼世界,2017,26(4):31?32.
YANG Ying. Retrieval optimization analysis and design of big data based on Oracle database [J]. Digital space, 2017, 26(4): 31?32.
[5] 韋必忠,魏紅,英紅.海量多媒體圖像信息高效檢索算法優(yōu)化及仿真[J].計(jì)算機(jī)仿真,2016,33(11):280?283.
WEI Bizhong, WEI Hong, YING Hong. Huge amounts of multimedia image information efficient retrieval algorithm optimization and simulation [J]. Computer simulation, 2016, 33(11): 280?283.
[6] 王佳利.大數(shù)據(jù)視角下高校網(wǎng)絡(luò)教學(xué)平臺應(yīng)用的實(shí)踐與反思[J].中國現(xiàn)代教育裝備,2015,34(21):13?16.
WANG Jiali. Practice and reflection on e?learning platform in big data perspective [J]. China modern educational equipment, 2015, 34(21): 13?16.
[7] 呂冬雪.基于大數(shù)據(jù)環(huán)境的NoSQL技術(shù)分析[J].電子設(shè)計(jì)工程,2016,24(14):33?36.
L? Dongxue. Analysis of NoSQL technology based on big data environment [J]. Electronic design engineering, 2016, 24(14): 33?36.
[8] 王曉艷,李慧穎.大數(shù)據(jù)環(huán)境下信息檢索的變革[J].科技情報(bào)開發(fā)與經(jīng)濟(jì),2015,26(4):117?119.
WANG Xiaoyan, LI Huiying. The changes of information retrieval in the big data environment [J]. Sci?tech information development & economy, 2015, 26(4): 117?119.
[9] 楊立超.基于大數(shù)據(jù)的高職院校計(jì)算機(jī)網(wǎng)絡(luò)教學(xué)平臺創(chuàng)新研究[J].經(jīng)濟(jì)管理,2016,32(8):78.
YANG Lichao. Innovation research of computer network teaching platform in higher vocational colleges based on big data [J]. Economic management journal, 2016, 32(8): 78.
[10] 袁紅,朱睿琪.用戶信息搜索行為大數(shù)據(jù)分析框架及其關(guān)鍵技術(shù)[J].圖書館學(xué)研究,2016,25(24):39?46.
YUAN Hong, ZHU Ruiqi. Large data analysis framework and key technologies of user information search behavior [J]. Research on library science, 2016, 25(24): 39?46.endprint