當(dāng)前,研究多媒體數(shù)據(jù)庫(kù)內(nèi)容檢索、數(shù)據(jù)特點(diǎn)、數(shù)據(jù)庫(kù)系統(tǒng)構(gòu)建等都是熱點(diǎn)問題,研究多媒體數(shù)據(jù)的管理和有效檢索具有重要的理論與應(yīng)用價(jià)值。高性能計(jì)算機(jī)支持下的多媒體數(shù)據(jù)庫(kù)性能的迅速提升,使得內(nèi)容多媒體檢索技術(shù)走向成熟,利用這門新型的數(shù)據(jù)庫(kù)技術(shù)可以有效進(jìn)行內(nèi)容檢索和查詢。因此,研究媒體數(shù)據(jù)庫(kù)系統(tǒng)中的關(guān)鍵問題,如多媒體數(shù)據(jù)庫(kù)系統(tǒng)的建模問題、多媒體數(shù)據(jù)庫(kù)存儲(chǔ)問題、多媒體數(shù)據(jù)庫(kù)組織的策略與技術(shù)問題、內(nèi)容檢索的多媒體數(shù)據(jù)庫(kù)體系結(jié)構(gòu)問題、內(nèi)容的多媒體數(shù)據(jù)的查詢和檢索問題、內(nèi)容檢索的圖像和視頻信息處理問題等方面的研究,都是目前從事多媒體數(shù)據(jù)庫(kù)與內(nèi)容檢索研究者的重點(diǎn)研究課題。
為此,由馬修軍撰寫的《多媒體數(shù)據(jù)庫(kù)與內(nèi)容檢索》(2007年7月由北京大學(xué)出版社出版)一書,對(duì)內(nèi)容檢索的多媒體數(shù)據(jù)庫(kù)系統(tǒng)研究,具有一定的啟發(fā)、參考意義和作用。該教材綜合性地論述了多媒體信息檢索最新技術(shù)以及多媒體信息管理技術(shù)和發(fā)展趨勢(shì)。本書在系統(tǒng)闡述各種媒體的內(nèi)容檢索技術(shù)基礎(chǔ)之上,通過一個(gè)統(tǒng)一的理論框架,探究各種媒體檢索技術(shù)的深度和廣度。在目前最新內(nèi)容檢索技術(shù)背景之下,重點(diǎn)闡述了多媒體數(shù)據(jù)庫(kù)的關(guān)鍵技術(shù),以便于讀者理解和掌握。多媒體數(shù)據(jù)庫(kù)建設(shè)與理論研究也是當(dāng)前設(shè)計(jì)所需要的,多媒體數(shù)據(jù)庫(kù)建設(shè)、內(nèi)容檢索系統(tǒng)和商業(yè)多媒體數(shù)據(jù)庫(kù)系統(tǒng),都是當(dāng)前我國(guó)重要科研課題,為圖書查詢工作帶來了極大的便利。
書中,第一,闡述了特征抽取、內(nèi)容表示、索引、數(shù)據(jù)檢索、信息檢索、用戶任務(wù)、多媒體相關(guān)技術(shù)等有關(guān)概念,在此基礎(chǔ)上,闡述了多媒體信息管理的技術(shù)需求、多媒體信息分類、多媒體信息管理功能需求,進(jìn)一步闡述了多媒體技術(shù)、數(shù)據(jù)庫(kù)管理系統(tǒng)、信息檢索技術(shù)、模式識(shí)別技術(shù)等相關(guān)技術(shù)問題,以及發(fā)展趨勢(shì)和未來的研究問題。第二,論述了多媒體數(shù)據(jù)類型與編碼,關(guān)于簡(jiǎn)單文本、結(jié)構(gòu)化文本、文本壓縮、數(shù)字圖像、圖形表示、圖像壓縮原理、靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG、聲音和音頻、聲音的物理特性、聲音的數(shù)字表示、電子樂器數(shù)字接口、音頻壓縮、視頻和動(dòng)畫、模擬視頻、數(shù)字視頻、視頻壓縮、其他視頻標(biāo)準(zhǔn)、多媒體表示標(biāo)準(zhǔn)、同步多媒體集成語(yǔ)言、MHEG標(biāo)準(zhǔn)、多媒體元數(shù)據(jù)標(biāo)準(zhǔn)、XML技術(shù)、語(yǔ)義Web與互操作、多媒體元數(shù)據(jù)標(biāo)準(zhǔn)化框架等。這些基本理論的闡釋有助于學(xué)生對(duì)多媒體數(shù)據(jù)庫(kù)知識(shí)體系的理解和掌握。第三,闡述了文本處理與信息檢索。具體在信息檢索模型研究方面,闡述了信息檢索模型分類、經(jīng)典檢索模型和擴(kuò)展經(jīng)典檢索模型;在文本處理方面,闡述了文本預(yù)處理、文本特性和文本聚類;在文本索引方面,闡述了倒排文件表、后綴數(shù)組、簽名文件、相關(guān)反饋和查詢擴(kuò)展等。第四,分別論述了Web信息檢索、基于內(nèi)容的音頻和音像的檢索、視頻索引、檢索與結(jié)構(gòu)化、多媒體數(shù)據(jù)庫(kù)、多媒體數(shù)據(jù)庫(kù)中高維特征的索引和檢索技術(shù)、多媒體通信與分布式多媒體數(shù)據(jù)庫(kù)系統(tǒng)、數(shù)字圖書館和多媒體信息安全等。
多媒體數(shù)據(jù)包含有文字、圖像、視頻和音頻等十分豐富的信息內(nèi)容。利用多媒體數(shù)據(jù)庫(kù)可以按照內(nèi)容檢索提取出特定的信息,使得人們可以很便捷地、有效地利用存儲(chǔ)的多媒體信息。內(nèi)容檢索是一個(gè)逐步求精的過程,先要對(duì)初始化檢索進(jìn)行說明,通過相似性進(jìn)行匹配,選擇一個(gè)滿意的示例進(jìn)行特征調(diào)整以形成新的查詢,最后逐步縮小檢索范圍,直到用戶滿意為止。多媒體數(shù)據(jù)庫(kù)數(shù)據(jù)模型的實(shí)現(xiàn)有賴于關(guān)系數(shù)據(jù)庫(kù)的多媒體擴(kuò)展、面向?qū)ο蟮亩嗝襟w數(shù)據(jù)庫(kù)和超媒體數(shù)據(jù)庫(kù)三種方式?;趦?nèi)容的圖像表示方面,圖像媒體相似性檢索主要通過顏色相似性、紋理相似性和形狀相似性特征進(jìn)行?;趦?nèi)容檢索多媒體數(shù)據(jù)庫(kù)構(gòu)建,包括內(nèi)容檢索多媒體數(shù)據(jù)庫(kù)的總體結(jié)構(gòu)、一般媒體處理系統(tǒng)、面向?qū)ο蠖嗝襟w數(shù)據(jù)庫(kù)存儲(chǔ)管理系統(tǒng)、媒體特征提取系統(tǒng)、檢索引擎、用戶查詢接口等方面的理論建構(gòu)。多媒體數(shù)據(jù)庫(kù)層次結(jié)構(gòu)具有:媒體支持層、存取與存儲(chǔ)數(shù)據(jù)模型層、概念數(shù)據(jù)模型層、多媒體用戶接口層等四個(gè)層次;基于內(nèi)容檢索應(yīng)用系統(tǒng)的體系結(jié)構(gòu)建構(gòu),包括插入子系統(tǒng)、特征提取子系統(tǒng)、數(shù)據(jù)庫(kù)、查詢子系統(tǒng)等。圖像對(duì)象的創(chuàng)建內(nèi)容,包括圖像區(qū)域的分割和特征提取,如顏色特征、形狀特征與紋理特征的提取。在內(nèi)容檢索視頻處理技術(shù)方面做到鏡頭的切換和鏡頭內(nèi)的運(yùn)動(dòng);視頻處理技術(shù)包括鏡頭邊界的檢測(cè)、代表幀的選取、特征提取和視頻聚類等。總之,多媒體數(shù)據(jù)庫(kù)系統(tǒng)構(gòu)建與內(nèi)容檢索理論知識(shí)研究,有助于大學(xué)生多媒體數(shù)據(jù)庫(kù)信息的查詢。
(曾子力/碩士,海口經(jīng)濟(jì)學(xué)院網(wǎng)絡(luò)學(xué)院講師)