吳懿慧
[摘要]隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字圖書館越來越被人所重視,多媒體數(shù)據(jù)挖掘成為數(shù)字圖書館信息檢索的一個重要手段。在分析多媒體數(shù)據(jù)挖掘的概念及特點的基礎(chǔ)上,提出多媒體數(shù)據(jù)挖掘系統(tǒng)的一般結(jié)構(gòu),闡述多媒體數(shù)據(jù)的挖掘過程, 并就多媒體數(shù)據(jù)挖掘中的幾個關(guān)鍵技術(shù)進(jìn)行討論。
[關(guān)鍵詞]多媒體 數(shù)據(jù)挖掘 數(shù)字圖書館
中圖分類號:TP3文獻(xiàn)標(biāo)識碼:A文章編號:1671-7597(2009)0510051-01
隨著網(wǎng)絡(luò)技術(shù)的發(fā)展,數(shù)字圖書館越來越被人所重視。對于數(shù)字圖書館這樣一個分布的信息空間,多媒體數(shù)據(jù)挖掘可以迅速、準(zhǔn)確為用戶提供適量的所需信息,因而成為數(shù)字圖書館信息檢索的一個重要研究方向。
一、多媒體數(shù)據(jù)挖掘的概念及特點
(一)多媒體數(shù)據(jù)挖掘的概念
多媒體數(shù)據(jù)挖掘是數(shù)據(jù)挖掘技術(shù)和多媒體技術(shù)的綜合產(chǎn)物。通過綜合分析視聽特性和語義,發(fā)現(xiàn)隱含的、有效的模式,得出事件的趨向和關(guān)聯(lián),從而為用戶提供決策支持能力。
(二)多媒體數(shù)據(jù)挖掘的特點
(1)多媒體數(shù)據(jù)相對于常規(guī)數(shù)據(jù)為非結(jié)構(gòu)化、異構(gòu)數(shù)據(jù)。要在這些非結(jié)構(gòu)化或半結(jié)構(gòu)化的多媒體數(shù)據(jù)中抽取隱藏的知識必須將這些非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)數(shù)據(jù)[1]。(2)多媒體數(shù)據(jù)的特征向量通常是數(shù)十維甚至數(shù)百維。(3)多媒體信息語義關(guān)聯(lián)性強。各自獨立的對象內(nèi)蘊含極為豐富的語義聯(lián)系。(4)知識表達(dá)和解釋比較困難,通過挖掘所得出的模式往往較隱晦。
二、多媒體數(shù)據(jù)挖掘的一般系統(tǒng)結(jié)構(gòu)
因為多媒體數(shù)據(jù)是非結(jié)構(gòu)化的,而且包含豐富的難以用常規(guī)數(shù)據(jù)庫屬性描述的信息內(nèi)容,因此要引入新的媒體處理、描述方法和新的處理模塊的支持。其系統(tǒng)結(jié)構(gòu)見圖1所示:
1.多媒體數(shù)據(jù)庫。多媒體數(shù)據(jù)庫中包含原始數(shù)據(jù)庫和元數(shù)據(jù)庫。原始數(shù)據(jù)庫中包含原始的多媒體數(shù)據(jù),如圖像、視頻和音頻等,它們的媒體結(jié)構(gòu)與元數(shù)據(jù)庫中描述關(guān)聯(lián),用于可視化表現(xiàn)和存取。元數(shù)據(jù)庫是一種按照挖掘要求組織的多維、多層次、多媒體屬性數(shù)據(jù)庫,支持高效的多媒體數(shù)據(jù)挖掘。
2.預(yù)處理模塊。它是對多媒體原始數(shù)據(jù)進(jìn)行預(yù)處理,提取有效特征,可以是對多媒體數(shù)據(jù)的結(jié)構(gòu)化處理,如圖像對象分割、視頻和音頻對象分割、視覺和聽覺特征提取、語義關(guān)聯(lián)等,它們以元數(shù)據(jù)的形式記錄在元數(shù)據(jù)庫中。
3.挖掘引擎。其包含一組快速的挖掘算法,如分類、聚類、關(guān)聯(lián)、總結(jié)和摘要、趨勢分析等,系統(tǒng)可以根據(jù)具體的應(yīng)用選擇一個或多個相應(yīng)的挖掘算法,對元數(shù)據(jù)進(jìn)行挖掘。
4.用戶接口。挖掘結(jié)果的可視化和解釋界面,也可以為用戶提供交互接口和擴展SQL挖掘語言。由于多媒體的視聽和時空特性,挖掘出來的模式應(yīng)該以新的表現(xiàn)方式呈現(xiàn)出來,如導(dǎo)航式知識展開和交互式問題求解過程,以及提供挖掘結(jié)果的可視化接口。
三、多媒體數(shù)據(jù)挖掘過程
多媒體數(shù)據(jù)挖掘要經(jīng)過數(shù)據(jù)準(zhǔn)備、挖掘、結(jié)果表達(dá)和解釋四個階段。在數(shù)據(jù)準(zhǔn)備階段,多媒體的集成可以增強自動預(yù)處理分析的準(zhǔn)確性,解決語義模糊性;在挖掘階段,各種媒體的元數(shù)據(jù)可以互補使用,挖掘出意想不到的合理的信息線索、模式、趨勢或關(guān)系[2];在結(jié)果表達(dá)和解釋階段,多媒體的同步和互補成形式的知識可視化和交互接口更直觀、更易于理解。
四、多媒體挖掘技術(shù)
(一)圖像相似搜索
圖像相似搜索主要考慮兩種檢索,一是基于文本的圖像檢索用文本對圖像進(jìn)行標(biāo)注;二是基于內(nèi)容的圖像檢索用顏色、紋理、形狀等低層可視特征或小波系數(shù)等對圖像的標(biāo)識進(jìn)行相似檢索。在基于內(nèi)容檢索系統(tǒng)中,通常有兩種查詢[3]:基于圖像樣本的查詢和基于圖像特征描述的查詢?;趫D像樣本的查詢是把從樣本中提取的特征向量與已經(jīng)提取出并在圖像數(shù)據(jù)庫中已經(jīng)索引過的圖像特征向量相比較,基于這一比較結(jié)果,可以得到與樣本圖像近似的圖像。圖像特征描述查詢是指給出圖像的特征描述,把其轉(zhuǎn)換為特征向量,與數(shù)據(jù)庫中已有的圖像特征向量匹配。
(二)時序趨勢分析
數(shù)據(jù)挖掘中的趨勢和奇異點分析方法可以用來挖掘視頻的特征、對象行為、事件隨時間發(fā)生的模式與趨勢。文獻(xiàn)[4]的挖掘算法簡單而強大,它利用視頻和音頻特征在全局與局部時窗中的不同分布狀態(tài),實現(xiàn)了從狀態(tài)突變中檢測視頻主角、體育精彩鏡頭及異常事件的功能。
(三)多維分析
多媒體數(shù)據(jù)的多維分析可以按傳統(tǒng)的從關(guān)系數(shù)據(jù)庫中構(gòu)造數(shù)據(jù)立方體的方法去設(shè)計和構(gòu)造出多媒體數(shù)據(jù)立方體。多媒體數(shù)據(jù)立方體的建立有助于多媒體數(shù)據(jù)的多維分析和多種知識挖掘。
(四)關(guān)聯(lián)規(guī)則挖掘
多媒體數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘是在相關(guān)的多媒體對象集中,找到一組關(guān)聯(lián)規(guī)則,顯示一組對象或特征的模式或相互關(guān)系的發(fā)生頻率。一個典型的關(guān)聯(lián)規(guī)則為
X→Y[s%,c%」 (1)
其中,X和Y是一組特征描述的謂詞,s%是規(guī)則的支持度(X,Y共同出現(xiàn)的概率),c%是規(guī)則的可信度(X出現(xiàn)時Y出現(xiàn)的概率),為說明這個問題,我們以圖像中關(guān)聯(lián)規(guī)則的挖掘為例:
圖像的關(guān)聯(lián)規(guī)則是指圖像對象或特性之間頻繁出現(xiàn)的模式。設(shè)D為圖像集,那么關(guān)聯(lián)規(guī)則可以表示為:
P1∧P2∧...∧Pn→Q1∧Q2∧...∧Qm(c%) (2)
其中,P1,P2,...,Pn,Q1,Q2, ...,Qm是D中圖像的描述謂詞,可以是圖像的大小、顏色、紋理、密度、對象、空間位置、文本描述等;c%表示該規(guī)則的可信度,其含義為當(dāng)P1,P2,...,Pn都發(fā)生時,Q1,Q2,...,Qm也都發(fā)生的概率。
在挖掘過程中,首先建立描述集,如{P1,P2,...,Pn}。對于每一個描述,定義一個支持度來表示該描述在整個圖像集中出現(xiàn)的概率,記作σ(Pi/D)。描述集的支持度表示集合內(nèi)的所有描述同時發(fā)生的概率,記作σ(P1∧P2∧...∧Pn/D)。滿足最小值尺度的描述集被稱為頻繁描述集,從頻繁描述集中可以推導(dǎo)出規(guī)則。例如,從頻繁描述集(P1,P2,P3,P4)可以推出規(guī)則:
P1→P2∧P3∧P4 (3)
P1∧P2→P3∧P4 (4)
P1∧P2∧P3 →P4(5)
...
只有滿足最小可信度的規(guī)則才是我們所關(guān)心的規(guī)則,即強關(guān)聯(lián)規(guī)則。規(guī)則的可信度可以用條件概率公式求得,如式(4)表示的第一個規(guī)則的可信度為:
P(P1|P2∧P3∧P4)=σ(P1∧P2∧P3∧P4)/σ(P1) (6)
圖像的關(guān)聯(lián)規(guī)則的挖掘分兩個步驟:找出所有的頻繁描述集;從頻繁描述集中推導(dǎo)出關(guān)聯(lián)規(guī)則,并確定強關(guān)聯(lián)規(guī)則。
五、總結(jié)
本文在分析多媒體數(shù)據(jù)挖掘特點的基礎(chǔ)上,闡述了多媒體數(shù)據(jù)挖掘的一般系統(tǒng)結(jié)構(gòu)和挖掘過程,并就挖掘技術(shù)進(jìn)行了討論。有關(guān)多媒體數(shù)據(jù)的內(nèi)容特征算法等還需進(jìn)一步研究。
參考文獻(xiàn):
[1]Jiawei Han,Micheline Kamber.DataMining:Concept and Techniques[M].Morgan Kaufmann Publishes,Inc.2004.
[2]邵峰晶、于忠清,數(shù)據(jù)挖掘原理與算法[M].北京:中國水利水電出版社,2003.
[3]王凱、渠芳、王輝,利用Web挖掘技術(shù)實現(xiàn)個性化推送服務(wù)[J].情報雜志,2006,(11):86-88.
[4]Radhakrishnan R,xiong Z,etal.Generation of Sports Highlights Using a combination of supervised and Unsupervised techniques in the Audio Domain[C].Singapore:IEEE PCM 2003.