亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種基于全文檢索技術(shù)交互式電子期刊的設計

        2008-04-12 00:00:00于麗杰郭文榮
        現(xiàn)代電子技術(shù) 2008年8期

        摘 要:在分析光盤型電子期刊需求和功能基礎上,結(jié)合《中國農(nóng)村信用合作》電子期刊的設計,提出借助結(jié)構(gòu)化數(shù)據(jù)庫系統(tǒng)和結(jié)構(gòu)化查詢語言實現(xiàn)全文檢索和結(jié)構(gòu)查詢相結(jié)合的交互式電子期刊的設計方法,并利用CDWeb技術(shù)實現(xiàn)了B/S結(jié)構(gòu),用戶界面簡單易用。該設計方法具有實現(xiàn)簡單、通用性強、應用方便等特點,并已實際中得到了驗證和應用,可以推廣應用于其他電子出版物中。

        關(guān)鍵詞:全文檢索;CDWeb;電子出版物;光盤型電子期刊

        中圖分類號:TP311.138文獻標識碼:B

        文章編號:1004-373X(2008)08-061-03

        Design of Alternant Ejournal Based on Fulltext Search

        YU Lijie,GUO Wenrong

        (College of Automation,Beijing Union University,Beijing,100101,China)

        Abstract:Based on the analysis of requirements and functions of the CDROM electronic journal,consideringthe design of Ejournal of \"Rural Credit Cooperative of China\".This paper proposes the method to design the alternant Ejournal,it can Structured Query and fulltext search by dint of the Structured database and the Structured Query Language,and implement Broswer/Server model by means of CDWeb technology,the user interface is simple.The model presented is characterized by its simplicity,generality and convenience for users,and it is also verified and applied in practice,it can be widely used in other electronic publications.

        Keywords:fulltext search;CDWeb;electronic publication;CDROM Ejournal

        1 引 言

        電子出版物是一種新興的信息媒體,將文字、聲音、圖片、動畫等多種媒體與計算機程序融合,以數(shù)字信息形式存放在光盤中,并通過多媒體計算機進行閱讀,具有信息量大、體積小、重量輕,易于管理、價格低廉等傳統(tǒng)印刷型出版物不可比擬的優(yōu)勢。特別是全文檢索技術(shù)的發(fā)展及其在電子出版物中的運用,方便快捷的檢索功能使電子出版物的社會影響和社會地位變的越來越重要。

        目前光盤型電子出版物一般以專門軟件開發(fā)設計,靈活性較差。本文在光盤型電子出版物檢索功能需求的基礎上,提出了一種將非結(jié)構(gòu)化的文本轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)庫的模型,充分發(fā)揮數(shù)據(jù)庫技術(shù)管理結(jié)構(gòu)化數(shù)據(jù)、海量數(shù)據(jù)的優(yōu)勢和全文檢索技術(shù)管理及檢索非結(jié)構(gòu)化文本數(shù)據(jù)的優(yōu)勢,并且提出了一種支持超文本信息全文檢索的解決方案,在《農(nóng)村金融雜志》光盤型電子期刊的設計中得到了實際應用和驗證。

        2 系統(tǒng)設計

        2.1 總體結(jié)構(gòu)設計

        B/S(Broswer/Server)模式的用戶界面完全通過WWW瀏覽器實現(xiàn),易學易用、操作友好,適合于圖文資料和數(shù)據(jù)庫檢索,因此系統(tǒng)采用光盤Web服務結(jié)構(gòu),采用標準的Web瀏覽器作為瀏覽檢索結(jié)果的操作界面,所有的操作都在同一個窗口中通過超文本鏈接完成,用戶可以方便地信息瀏覽和導航,使用簡單。同時,Web瀏覽器支持圖文混排,支持圖像、視頻、動畫等多媒體信息的直接播出,支持各種排版格式的WORD/PDF文件,能夠方便實現(xiàn)原版面顯示瀏覽。

        2.2 系統(tǒng)功能設計與工作流程

        根據(jù)期刊的內(nèi)容和檢索需要,系統(tǒng)功能分為期刊瀏覽和檢索2部分。期刊瀏覽設計每一期刊物對應一個封面以及若干頁目錄,可以通過調(diào)用某一期刊物,打開封面、目錄,進一步瀏覽全文。檢索系統(tǒng)分為全文檢索、分類檢索、標題檢索、關(guān)鍵詞檢索、作者檢索和時間檢索等部分,同時還可以進行二次檢索。系統(tǒng)的基本功能和工作流程如圖1所示。

        3 光盤Web服務技術(shù)

        目前光盤多媒體信息檢索系統(tǒng)引入Web技術(shù),主要有3種方式,第一種是光盤Web文件方式,即檢索界面和檢索方式采用傳統(tǒng)的專用程序,檢索結(jié)果通過瀏覽器來查看,主要利用Web頁面多媒體元素集成的優(yōu)點,不需要任何Web服務器支持。系統(tǒng)擴充性差,不能發(fā)揮Web技術(shù)的優(yōu)勢。第二種是Java技術(shù)。瀏覽器嵌入Java小程序?qū)崿F(xiàn)數(shù)據(jù)庫檢索,檢索結(jié)果以頁面方式顯示,以充分利用瀏覽器的Java解釋功能。不過操作系統(tǒng)需要支持Java虛擬機,由于Java小程序每次都有下載過程,而且程序運行效率較低,比較適合于數(shù)據(jù)量不大的數(shù)據(jù)庫檢索。一般產(chǎn)品說明書的全文檢索多采用這種方式。第三種是光盤Web服務器方式,引入Web服務器功能,采用瀏覽器/服務器技術(shù),整個系統(tǒng)就是一個Web站點,界面好,功能強,需要TCP/IP協(xié)議支持,網(wǎng)絡應用實現(xiàn)容易。

        本系統(tǒng)采用光盤Web服務器方式,應用DynamicCD軟件實現(xiàn)Web服務。DynamicCD可以直接從CD/DVD介質(zhì)運行提供所有互聯(lián)網(wǎng)Web服務器的各種功能,不需要安裝。支持數(shù)據(jù)庫訪問,支持用VBScript和ASP腳本開發(fā)的應用程序,可以實時生成HTML頁面,還能提供數(shù)據(jù)加密的功能。

        4 數(shù)據(jù)庫設計

        數(shù)據(jù)庫中存儲的已不再是簡單的單一的結(jié)構(gòu)化數(shù)據(jù),而是包含了大量的非結(jié)構(gòu)化數(shù)據(jù),如: 文本、圖形、圖像、聲音等多媒體數(shù)據(jù)。對于結(jié)構(gòu)化數(shù)據(jù),數(shù)據(jù)庫系統(tǒng)通常采用關(guān)鍵詞對主碼的倒排文件方式,進行簡單的精確的或模糊的檢索。

        為了幫助用戶快速方便查詢所需期刊資料,在數(shù)據(jù)庫設計過程中按期刊欄目類型分類,將全文資料按HTML格式保存在Web服務器發(fā)布目錄下,在數(shù)據(jù)庫的表中記錄文件路徑,不同欄目的資料存放在不同的路徑下。其數(shù)據(jù)邏輯結(jié)構(gòu)如圖2所示。

        URL地址對應Web服務器的文件目錄、子目錄、文件名,用于發(fā)布超文本全文。目前入庫的內(nèi)容包含了《中國農(nóng)村信用合作》2005年出版的全部內(nèi)容。

        5 系統(tǒng)功能實現(xiàn) 

        5.1 全文檢索的實現(xiàn)

        實現(xiàn)全文檢索主要有2種方法[1]:

        (1) 直接對文章進行字符匹配的方法,這種方法由于沒有建立索引庫,因此所占空間較少,但同時正是因為他沒有索引庫,所以在進行全文匹配時要花費大量的時間;

        (2) 全文建立倒排索引庫的方法,這種方法可以大大節(jié)省檢索的時間。但同時,這種方法需要占用一定的存儲空間來建立索引庫。本文通過將非結(jié)構(gòu)化的超文本文件集轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)庫,并對數(shù)據(jù)庫中文本記錄的特征字段進行標引,形成完整的全文數(shù)據(jù)庫,在此基礎上開發(fā)相應的檢索引擎,實現(xiàn)全文文本查詢的目的。

        全文檢索實現(xiàn)的核心技術(shù)是將源文檔中所有基本元素的出現(xiàn)信息記錄到索引庫中。在中文系統(tǒng)中“基本元素”可以是單個漢字字符,也可以是詞,這樣,就存在2種基本的索引庫結(jié)構(gòu),即基于字表的索引庫和基于詞表的索引庫。字表法是把源文檔中每一個字的出現(xiàn)位置信息記錄到索引庫中,索引庫對每個不同的字符都保存一個字表,記錄同一個字在文檔中的所有出現(xiàn)位置。與此相對應,詞表法以能表達一定意義的詞為基本獨立單位建立索引庫。

        本文采用字表索引,字表結(jié)構(gòu)見圖3。其中字符對應的字表記錄了該字符的源文檔中的所有出現(xiàn)位置,出現(xiàn)位置通常用字符相對于文檔頭的偏移字節(jié)數(shù)表示。

        建立字表索引時,需要掃描整個源文檔,對所出現(xiàn)的每一個有效字符,計算其在文檔中的出現(xiàn)位置并將該位置值加入到對應的字表中。本文使用使用SQL語言設計數(shù)據(jù)庫觸發(fā)器,在數(shù)據(jù)存儲過程中掃描存入全文表的正文字段,定位字符的位置,寫入每個字符的索引信息到索引表。

        5.2 數(shù)據(jù)檢索流程

        檢索過程如圖4所示。

        (1) 輸入檢索條件,如“農(nóng)村金融”;

        (2) 應用程序進行分析,整理出全文檢索和數(shù)據(jù)庫查詢,提交給數(shù)據(jù)庫;

        (3) 檢索關(guān)系型字段,并將結(jié)果存入臨時表中;

        (4) 全文檢索,見結(jié)果保存在臨時表;

        (5) 取出兩個臨時表的內(nèi)容,生成最后結(jié)果集;

        (6) 將結(jié)果返給用戶。

        數(shù)據(jù)庫系統(tǒng)同時有3張臨時表,用于存儲關(guān)系檢索結(jié)果、全文檢索結(jié)果和最終處理結(jié)果。另外系統(tǒng)還支持二次檢索的功能。在進行二次檢索時,用戶的檢索條件增加一些額外的信息,例如文檔的時間以及作者等。通過二次檢索,可以大大減少結(jié)果文檔的數(shù)量,提高檢索的精度,同時也節(jié)省了用戶的查找時間。

        5.3 檢索結(jié)果顯示

        檢索結(jié)果采用HTML語言設計頁面,應用分級查看的方式顯示,在檢索結(jié)果界面系統(tǒng)列出檢索條件、滿足檢索條件的命中記錄總數(shù)、當前顯示記錄數(shù)、頁面快速定位、排序方式設置以及命中記錄的題錄列表。如果想改變檢索結(jié)果的輸出格式,可點擊通用工具欄中的“參數(shù)設置”按鈕,自行設定每頁輸出的記錄數(shù)和輸出格式。檢索結(jié)果列[LL]表包括題名、作者、期刊名、出版日期、年卷期頁碼、全文提供方式以及是否包含圖片文件等相關(guān)信息。點擊文獻題名鏈接進入文獻簡介界面,該界面下列出了文獻的詳細信息,包括文獻標題、作者、摘要、關(guān)鍵詞等,點擊“全文”鏈接可瀏覽原文。

        6 結(jié) 語

        通過結(jié)構(gòu)化數(shù)據(jù)庫系統(tǒng)和結(jié)構(gòu)化查詢語言相結(jié)合實現(xiàn)了非結(jié)構(gòu)化的超文本數(shù)據(jù)的檢索,發(fā)揮了數(shù)據(jù)庫系統(tǒng)管理結(jié)構(gòu)化數(shù)據(jù)的優(yōu)勢,借助自建的全文索引實現(xiàn)快速的全文檢索,使得多媒體的電子期刊系統(tǒng)在檢索時響應速度達到秒級,而且查詢結(jié)果令人滿意;并將光盤Web服務技術(shù)應用于交互式電子期刊設計中,利用ASP,VBScript和Dreamwear 8在DynamicCD3.0和Accese2003下調(diào)試通過,將全文數(shù)據(jù)庫、HTML文檔、聯(lián)機幫助文擋、光盤封面、CDWEB服務器等進行合成,形成一個獨立的Web系統(tǒng),經(jīng)測試后制成光盤應用。

        參 考 文 獻

        [1]楊寶峰.數(shù)據(jù)庫全文檢索技術(shù)[J].黑龍江科技信息,2007(5):45.

        [2]陳淑燕,瞿高峰.全文檢索系統(tǒng)的數(shù)據(jù)庫設計[J].延安大學學報:自然科學版,2001,20(1):3134.

        [3]趙澤英,彭志良,王海,等.《貴州農(nóng)業(yè)科學》全文數(shù)據(jù)庫系統(tǒng)的設計與實現(xiàn)[J].貴州農(nóng)業(yè)科學,2005,33(4):7173.

        [4]肖文,龐麗萍.電子出版物的全文檢索技術(shù)研究[J].計算機與數(shù)字工程,2002,30(4):4550.

        [5]錢愛兵.全文檢索算法設計及全文檢索系統(tǒng)概述[J].現(xiàn)代圖書情報技術(shù),2003(2):4245.

        [6]謝鶴宜,梁妙園,馮剛,等.報業(yè)圖文數(shù)據(jù)光盤檢索系統(tǒng)的設計與實現(xiàn)[J].計算機應用,2000,20(1):5759.

        手机看片自拍偷拍福利| 26uuu欧美日本在线播放| 中文字幕中文字幕人妻黑丝| 很黄很色的女同视频一区二区 | 精品人妻少妇av中文字幕| 亚洲看片lutube在线观看| 99久久婷婷国产综合亚洲91 | 日韩无码视频淫乱| 日韩有码中文字幕第一页| 久久国产精品一区av瑜伽| 人妻少妇精品视频三区二区一区| 丰满人妻妇伦又伦精品国产| 欧美激情国产一区在线不卡| 国产诱惑人的视频在线观看| 欧美激情肉欲高潮视频| 日日碰狠狠躁久久躁96avv| 亚洲色婷婷综合开心网 | 亚洲一区二区三区中文视频| 亚洲天堂av一区二区| 内射欧美老妇wbb| 天天爽夜夜爽人人爽曰喷水| 日韩一二三四区免费观看| 日本一区二区视频免费在线看| 日本无码人妻波多野结衣| 国产乱色国产精品免费视频| 一区二区三区四区国产亚洲| 国产午夜av秒播在线观看| 欧美丰满大屁股ass| 校花高潮一区日韩| 国内嫩模自拍偷拍视频| 日本丰满熟妇videossex8k| 99精品成人片免费毛片无码| 日本一二三区在线视频观看 | 成人免费av高清在线| 国产精品理论片| 亚洲日本欧美产综合在线| 亚洲熟女一区二区三区不卡| 亚洲第一狼人天堂网亚洲av| 亚洲av无码电影网| 亚洲av五月天天堂网| 熟妇人妻无乱码中文字幕av |