亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        讀秀與萬方:二維檢索空間與多維檢索空間的演繹?

        2014-12-25 02:15:38
        圖書館 2014年2期
        關(guān)鍵詞:標(biāo)引字段全文

        (安徽大學(xué)管理學(xué)院 安徽合肥 230601)

        科學(xué)研究的起始建立在獲取大量真實(shí)并且有價(jià)值的信息數(shù)據(jù)之上。優(yōu)質(zhì)的學(xué)術(shù)搜索引擎可以滿足研究人員在不同研究階段所需的諸如起源性、全面性、新穎性的文獻(xiàn)要求。從使用者角度判別用戶信息需求是否完全實(shí)現(xiàn),可以通過兩個(gè)指標(biāo)鑒定,即信息檢索結(jié)果的準(zhǔn)確性和信息原文獲取的便捷性。同時(shí),任何學(xué)術(shù)搜索引擎從基礎(chǔ)檢索服務(wù)到高級知識服務(wù)都需為用戶提供易于上手的檢索方法并實(shí)現(xiàn)檢索結(jié)果的便捷獲取。實(shí)現(xiàn)這一復(fù)雜過程,專業(yè)的學(xué)術(shù)搜索引擎系統(tǒng)需從信息資源來源、信息組織方式、信息檢索方式、信息篩選方式到原文顯示與提供做精心的布置。

        1 讀秀學(xué)術(shù)搜索與萬方知識服務(wù)平臺概況

        讀秀學(xué)術(shù)搜索擁有豐富的文獻(xiàn)類型、龐大的全文數(shù)據(jù)資源、簡明的檢索方式和330萬篇數(shù)字化圖書聯(lián)合成員館本地館藏書目,提供深入全文和章節(jié)目錄的知識檢索,實(shí)現(xiàn)館藏紙質(zhì)圖書、電子圖書、學(xué)術(shù)文章等各種異構(gòu)資源在同一平臺的一站式檢索,海量全文數(shù)據(jù)通過系統(tǒng)自動(dòng)化文獻(xiàn)傳遞服務(wù),為研究人員學(xué)習(xí)、寫論文、做課題提供全面的學(xué)術(shù)資料和獲取知識資源的捷徑。

        萬方知識服務(wù)平臺融合了12種類型數(shù)據(jù)庫,以其強(qiáng)大的外文文獻(xiàn)庫、專利信息庫、科技成果庫成為研究人員查找科技信息必備的搜索引擎,數(shù)據(jù)庫對資源的有序組織配備完備的檢索系統(tǒng),達(dá)到高檢準(zhǔn)率的要求。

        2 讀秀庫與萬方庫功能對比

        2.1 資源覆蓋對比

        從資源類型來看,萬方數(shù)據(jù)庫覆蓋13種資源類型,分別是學(xué)術(shù)論文、期刊、學(xué)位論文、會(huì)議論文、學(xué)者、專利、標(biāo)準(zhǔn)、成果、圖書、法規(guī)、機(jī)構(gòu)和專家;讀秀數(shù)據(jù)庫覆蓋25種資源類型,除去萬方庫已有類型,還有電子書、視頻、詞條、詞典、課程、文檔、考試輔導(dǎo)、圖片、電影、音樂和虛擬咨詢。除了公開正式出版的學(xué)術(shù)文獻(xiàn),讀秀庫還涉及了隱藏在博客、論壇、網(wǎng)頁、新聞、講座內(nèi)的學(xué)術(shù)信息,同時(shí)通過提供例如考試資料、電影、音樂資源滿足研究人員生活化和娛樂化信息需求。從資源數(shù)量來看,讀秀庫以7610萬的學(xué)術(shù)論文、330萬圖書和8300萬報(bào)紙數(shù)量優(yōu)勝于萬方庫的2680萬學(xué)術(shù)論文和4500萬圖書數(shù)量(見表1)。

        表1 文獻(xiàn)數(shù)量與類型對比

        綜上,讀秀庫文獻(xiàn)來源種類新穎繁多,資源數(shù)量龐大,涉及面廣,覆蓋面全,各種類型的資源收錄均勻。萬方庫的資源覆蓋面有限,分布的重點(diǎn)在全文收錄、按月更新的外文期刊庫、外文會(huì)議論文庫、學(xué)者庫、科技成果庫和專利庫,資源量總體少于讀秀庫(見圖1)。

        圖1 資源覆蓋對比

        2.2 檢索功能對比〔1〕

        標(biāo)引深度。檢索功能的強(qiáng)大與否體現(xiàn)了數(shù)據(jù)庫的標(biāo)引程度。讀秀知識搜索只提供輸入關(guān)鍵詞的初級檢索,對于查找資料的廣泛性和全面性達(dá)到保障,但是無法有效的保障查找資料的準(zhǔn)確性。尤其是面對資源量龐大的讀秀庫,只通過關(guān)鍵詞的初級檢索得到的檢索結(jié)果亦是龐大的數(shù)量,用戶難以在短時(shí)間內(nèi)找出最精準(zhǔn)的一篇文獻(xiàn)。萬方提供初級檢索、高級檢索和專業(yè)檢索。高級檢索的檢索模式為“某字段”匹配“精準(zhǔn)度”匹配“年限”匹配“文獻(xiàn)類型”,字段與字段之間的運(yùn)算關(guān)系運(yùn)用“與”、“或”、“非”邏輯算符表達(dá)。專業(yè)檢索可以提供一段文本(比如科學(xué)技術(shù)要點(diǎn)),由系統(tǒng)推薦檢索詞。使用高級檢索和專業(yè)檢索查找文獻(xiàn)是研究人員提高檢準(zhǔn)率必需掌握的檢索策略。

        表2 讀秀和萬方檢索字段對比

        檢索字段。一個(gè)字段即一個(gè)檢索入口,通過字段檢索用戶可以快速準(zhǔn)確地查找所需文獻(xiàn),每一個(gè)字段入口都是數(shù)據(jù)庫的一個(gè)倒排文檔。通過表2可以看出,讀秀庫提供的可檢索字段有13個(gè),占所列字段的37%,僅僅提供文獻(xiàn)類型的主要特征檢索,降低檢準(zhǔn)性。萬方庫提供的檢索字段共26個(gè),占列出35個(gè)字段的74%,檢索字段豐富,提供用戶多入口檢索。萬方庫的檢索字段有主題檢索,說明在文獻(xiàn)入庫時(shí)加工人員對每篇文獻(xiàn)重新進(jìn)行準(zhǔn)確的主題標(biāo)引和深加工。

        檢準(zhǔn)率。以“學(xué)術(shù)搜索”為關(guān)鍵詞,分別在讀秀庫和萬方庫的期刊庫中使用關(guān)鍵詞字段檢索,讀秀庫得到85篇題錄,經(jīng)過排查,85篇題錄均為庫內(nèi)全文數(shù)據(jù),其中56篇的關(guān)鍵詞有“學(xué)術(shù)搜索”,29篇期刊論文無法檢索關(guān)鍵詞字段,說明讀秀庫對于29篇論文沒有做關(guān)鍵詞標(biāo)引,只有題名、作者、刊名、出版日期、ISSN、期號、參考文獻(xiàn)格式、摘要。因此檢索讀秀庫的全文獲取率為100%,檢準(zhǔn)率為56/85=66%。在萬方庫檢得文獻(xiàn)70篇,經(jīng)過檢查,67篇文獻(xiàn)為全文信息,并且都滿足檢索條件,因此全文獲取率為95%,檢準(zhǔn)率為100%。

        圖2 檢索功能對比

        通過檢索功能的數(shù)據(jù)對比(見圖2),可以看出讀秀庫的檢索入口覆蓋率正好是萬方庫的一半。多字段匹配檢索某一文獻(xiàn)相當(dāng)于在多維空間中多坐標(biāo)定位某一點(diǎn),快速而精準(zhǔn)。庫內(nèi)文獻(xiàn)量龐大而系統(tǒng)檢索功能不充足,想要準(zhǔn)確找到需求文獻(xiàn)需要花費(fèi)一定時(shí)間和精力,這是檢索人員不希望遇到的情況。因此檢索功能強(qiáng)大的萬方庫檢準(zhǔn)率必然比讀秀庫高。但從全文獲得率來說,讀秀庫的全文數(shù)據(jù)比萬方庫高。

        2.3 結(jié)果篩選對比

        讀秀庫的結(jié)果篩選方便易操作,在用戶檢索某一類型文獻(xiàn)時(shí),系統(tǒng)自動(dòng)將其他所有類型文獻(xiàn)執(zhí)行相同檢索,在同一界面顯示。檢索結(jié)果可以通過左側(cè)的年代、學(xué)科、期刊名、期刊種類篩選,或右側(cè)的匹配方式和排序方式篩選。

        萬方庫的結(jié)果篩選只有兩種方式:年份和學(xué)科兩大類。萬方數(shù)據(jù)庫對于入庫文獻(xiàn)的充分組織和標(biāo)引,保證較高的檢索準(zhǔn)確率,結(jié)果僅作基本篩選即可滿足需求。讀秀庫的檢索功能無法達(dá)到較高檢準(zhǔn)率時(shí),必須依靠強(qiáng)大的結(jié)果篩選功能才能保證檢索結(jié)果可視化。

        2.4 文獻(xiàn)獲取對比

        讀秀庫的文獻(xiàn)獲取方式多樣,主要方式為“圖書館文獻(xiàn)傳遞”,輸入接收電子郵箱和驗(yàn)證碼即可,系統(tǒng)自動(dòng)將文獻(xiàn)發(fā)送郵箱。這種獲取方式規(guī)避了未知數(shù)量的用戶點(diǎn)擊鏈接自主批量下載的法律風(fēng)險(xiǎn),我國信息網(wǎng)絡(luò)傳播權(quán)規(guī)定在電子文獻(xiàn)通過網(wǎng)絡(luò)一對一傳遞的情況下,屬于合理適用范圍。其他獲取方式還有文獻(xiàn)互助、本地館藏信息、網(wǎng)絡(luò)書店信息推送。萬方的獲取方式只有一種,即點(diǎn)擊相應(yīng)鏈接下載。

        3 檢索空間的構(gòu)建

        數(shù)據(jù)庫對文獻(xiàn)組織和知識加工的目的在于有序揭示文獻(xiàn)資源,并建立一個(gè)簡潔明了、便于使用的檢索系統(tǒng)。一方面,文獻(xiàn)經(jīng)過深加工與挖掘,需要配備相應(yīng)良好功能的檢索系統(tǒng),讓研究人員在不同檢索過程中深刻體驗(yàn)到系統(tǒng)數(shù)據(jù)加工的有序性和檢索功能的易用性。另一方面,對文獻(xiàn)的標(biāo)引深度、有序組織程度和知識挖掘程度影響研究人員對文獻(xiàn)和文獻(xiàn)間知識關(guān)聯(lián)的理解程度?!?〕按照知識挖掘深度,本文把數(shù)據(jù)庫組織程度分為如下幾個(gè)層次:

        ①一維組織是指對大量文獻(xiàn)有序的收納入庫,這個(gè)“序”可能是文獻(xiàn)入藏的序列號,所有文獻(xiàn)按照序號排列形成一維組織空間。一維空間是一條直線,決定直線長度的即文獻(xiàn)量的多少,對一維組織空間里的文獻(xiàn)進(jìn)行檢索稱為一維檢索空間,特征是只有一條X軸,數(shù)據(jù)按序列號順排查找。從本質(zhì)講,維度組織空間和維度檢索空間是同一空間,每個(gè)坐標(biāo)軸和軸上的刻度、量才是一樣的,每條軸對應(yīng)一個(gè)檢索字段。標(biāo)引人員使用則稱為組織空間,檢索人員使用則稱為檢索空間。②二維組織在一維組織的基礎(chǔ)上,對入藏文獻(xiàn)的外部特征進(jìn)行二次標(biāo)引和組織,外部特征主要有著者姓名、出版者、文獻(xiàn)題名、出版日期,增加檢索字段即增加一條軸,同時(shí)增加檢索維度形成二維檢索空間。二維空間是一個(gè)平面,特征是有兩條坐標(biāo)軸:X軸和Y軸。③三維組織在二維組織的基礎(chǔ)上,增加標(biāo)引深度同時(shí)也增加了檢索維度,在這一維的組織中,通常使用的組織方法是對文獻(xiàn)內(nèi)容特征進(jìn)行挖掘,主要有關(guān)鍵詞、主題詞的標(biāo)引、賦予分類號。三維空間是一個(gè)立體空間。④四維組織利用文獻(xiàn)間內(nèi)容的關(guān)聯(lián),諸如文獻(xiàn)與文獻(xiàn)的引證與被印證關(guān)系、科技查新對比尋求空間里點(diǎn)對點(diǎn)(點(diǎn)指代某篇文獻(xiàn))的關(guān)系,組織成四維檢索空間。⑤五維組織主要是知識發(fā)現(xiàn)與趨勢預(yù)測技術(shù),尋求點(diǎn)對面(面指代某個(gè)倒排文檔)、面對面的關(guān)系。例如用專利地圖分析A公司發(fā)展策略,檢索到某公司與其最大競爭對手公司所發(fā)明的專利,并用相應(yīng)軟件平臺繪制兩家公司主要的技術(shù)分布和研發(fā)重點(diǎn)(見圖3)。圖中A圈區(qū)域表示A公司擁有專利的主題地形,B圈部分表示其競爭對手擁有專利的主題地形,C圈區(qū)表示兩公司專利申請的空缺部分,可以看出對手在此領(lǐng)域中專利申請量較少,對A公司而言,可適當(dāng)考慮技術(shù)合作或并購其對手,避免技術(shù)重復(fù)研發(fā)或因?qū)@Wo(hù)造成兩敗俱傷。這種利用深層知識挖掘支持決策、預(yù)測方向在信息咨詢中具有較大應(yīng)用價(jià)值。⑥多維組織。從一維空間到多維空間的組織,同時(shí)也是對文獻(xiàn)從定量分析到定性分析的過程,使得雜亂無序的文獻(xiàn)庫從線到面、從面到體,逐漸可視化?!?〕而研究人員在研究過程中的文獻(xiàn)需求,正符合這個(gè)由線到體逐漸細(xì)化的特征:研究之初,科研人員需要研讀大量文獻(xiàn),逐漸確定研究結(jié)構(gòu)后,從文獻(xiàn)需求過渡到知識需求,這個(gè)知識需求的滿足可能就是某篇文章里的幾句話對作者的啟發(fā)。

        圖3 兩家公司專利分布地形圖〔3〕

        4 二維檢索空間和多維檢索空間的演繹

        讀秀庫的特色:①讀秀中文圖書資源不僅擁有超星數(shù)字圖書館公司所支持的海量書籍資源,同時(shí)聯(lián)合成員館實(shí)地館藏目錄和網(wǎng)上大型書店的圖書目錄。揭示資源在各館分布情況,保障使用者多種途徑獲取文獻(xiàn)。②可以大幅深入全文的知識點(diǎn)查找,提高檢全率;比如在圖書章節(jié)中,某段話中陳述的一個(gè)結(jié)論、提出的新名詞或關(guān)于研究的發(fā)展方向,這些新知識點(diǎn)雖還未成系統(tǒng)的在論文或?qū)V姓撌?,但很可能成為研究之初最寶貴的資料。需要檢索關(guān)于某主題在公開發(fā)表文獻(xiàn)中最早的資料,可以通過讀秀學(xué)術(shù)搜索引擎檢索知識點(diǎn),不僅可以查找到專門、系統(tǒng)論述的文獻(xiàn),還可以查找到隱藏在文獻(xiàn)內(nèi)容之間的起源知識點(diǎn)。③全文獲取率高,系統(tǒng)根據(jù)用戶郵箱自動(dòng)將所需文獻(xiàn)發(fā)送至用戶郵箱。④實(shí)現(xiàn)一站式檢索,輸入一個(gè)關(guān)鍵詞,檢索結(jié)果包涵了25種類型的文獻(xiàn)。

        萬方庫的特色:①廣博的外文文獻(xiàn)庫保證了科研人員查找外文資料的信息需求。②包涵專利數(shù)據(jù)庫、科技成果數(shù)據(jù)庫、中外標(biāo)準(zhǔn)數(shù)據(jù)庫的科技信息庫成為萬方庫資源的最大特色。③數(shù)據(jù)庫對文獻(xiàn)進(jìn)行精確的標(biāo)引,加深數(shù)據(jù)標(biāo)引程度的同時(shí)對文獻(xiàn)間的知識關(guān)聯(lián)漸進(jìn)可視化。④檢索功能強(qiáng)大,多字段檢索入口保證用戶快速準(zhǔn)確查找到空間內(nèi)某節(jié)點(diǎn)文獻(xiàn)。

        因此,擁有龐大的資源量但未配備強(qiáng)大、深入、可視化的檢索系統(tǒng),使得讀秀庫像平面一樣在二維檢索空間無限伸展,大量資源只能以單個(gè)特征存在于這個(gè)平面上,無法立體化展示點(diǎn)對點(diǎn)(某篇文獻(xiàn)與文獻(xiàn)或知識點(diǎn)與知識點(diǎn))的關(guān)系、點(diǎn)對面(文獻(xiàn)與某個(gè)倒排文檔或知識點(diǎn)與所有文獻(xiàn))的關(guān)系以及面對面(知識的深層挖掘)的關(guān)系。如果把擁有海量資源但標(biāo)引未延伸到立體、可視化深度的讀秀庫比作二維檢索空間,那么萬方庫則可稱為多維檢索空間。多維首先體現(xiàn)在檢索入口的多樣化,雖然資源量少但質(zhì)量高,經(jīng)過數(shù)據(jù)庫組織人員的重新標(biāo)引和逐步知識間關(guān)聯(lián)挖掘,使得使用者在數(shù)據(jù)庫中多維(一個(gè)維即一個(gè)倒排文檔的檢索入口)、多坐標(biāo)定位檢索精準(zhǔn)至某個(gè)文獻(xiàn)?!?〕

        5 結(jié)語

        高檢全率的讀秀庫和高檢準(zhǔn)率的萬方庫以其各自的特色為科研人員提供了不同廣度和深度的信息服務(wù)。海量資源以平面空間分布為特征、附帶便捷獲取方式的讀秀庫為科研人員在初期研究提供了廣泛、全面搜羅學(xué)術(shù)資源、網(wǎng)絡(luò)資源和館藏資源的平臺;精質(zhì)資源以立體空間分布為特征、深入挖掘知識關(guān)聯(lián)的萬方庫為研究人員提供了深層標(biāo)引、準(zhǔn)確定位科技信息和知識的平臺。讀秀庫在發(fā)揮其廣博資源量的基礎(chǔ)上,應(yīng)該強(qiáng)化系統(tǒng)的檢索功能和標(biāo)引深度,對于龐大的數(shù)據(jù)庫,可以嘗試自動(dòng)標(biāo)引輔以人工修正標(biāo)引的方式進(jìn)行,加深知識關(guān)聯(lián)和數(shù)據(jù)挖掘。萬方庫務(wù)必完善全文獲取途徑,在使用高檢準(zhǔn)率的檢索系統(tǒng)時(shí),檢索結(jié)果如果只是題錄信息,亦是使用者不希望看到的。數(shù)據(jù)庫的建設(shè)一方面需要包涵充足的資源,另一方面要加深文獻(xiàn)標(biāo)引和文獻(xiàn)間知識關(guān)聯(lián)的挖掘,為科研人員提供可操作的知識發(fā)現(xiàn)平臺。

        1.肖滬衛(wèi).專利地圖方法與應(yīng)用.上海:上海交通大學(xué)出版社,2011:337-338

        2.湯梅.主要國際性學(xué)術(shù)搜索引擎的比較分析.中國科技期刊研究,2011(3):385-387

        3.L.Ermann1,A.D.Towards Two - dimensional Search Engines.Journal of Physics A,2012(27):275-297

        4.Qinghua Zhu.Using a Delphi method and the analytic hierarchy process to evaluate Chinese search engines A case study on Chinese search engines.Online Information Review,2011(6):942 -956

        5.Koutsoudis,A .3DSSE -A 3D Scene Search Engine Exploring 3D scenes using keywords.Journal Of Cultural Heritage ,2011(2):187 -194

        猜你喜歡
        標(biāo)引字段全文
        圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
        全文中文摘要
        全文中文摘要
        檔案主題標(biāo)引與分類標(biāo)引的比較分析
        本刊對來稿中關(guān)鍵詞標(biāo)引的要求
        青年再造
        本刊對來稿中關(guān)鍵詞標(biāo)引的要求
        CNMARC304字段和314字段責(zé)任附注方式解析
        無正題名文獻(xiàn)著錄方法評述
        構(gòu)思精巧余味無窮 諷刺鞭撻淋漓盡致——再談“虛榮”貫穿《項(xiàng)鏈》全文
        語文知識(2014年5期)2014-02-28 21:59:59
        精品国产三级a∨在线欧美| 人人妻人人澡人人爽人人精品97| 人妻 日韩 欧美 综合 制服| 成人国产精品一区二区视频| 亚洲 欧美 国产 日韩 精品| 99久久国语露脸国产精品| 青青手机在线视频观看| 精品色老头老太国产精品| 成人久久精品人妻一区二区三区| 人妻少妇不满足中文字幕| 国产在线 | 中文| 国产大学生粉嫩无套流白浆 | 人妻人妻少妇在线系列| 亚洲av网站在线免费观看| 久久久国产精品黄毛片| 亚洲av无码精品无码麻豆| 少妇性饥渴bbbbb搡bbbb| 乌克兰少妇xxxx做受6| 韩国三级大全久久网站| 一级老熟女免费黄色片| 在线观看视频播放| 国产成人精品av| 欧美精品v欧洲高清| 国产女人乱码一区二区三区| 国产69精品久久久久app下载| 中文成人无字幕乱码精品区| 亚欧AV无码乱码在线观看性色 | 日本成本人三级在线观看| 中文字幕无线码中文字幕| 囯产精品无码一区二区三区| 国产精品美女久久久久浪潮AVⅤ | 亚洲看片lutube在线观看| 亚洲成年网站在线777| 国内激情一区二区视频| 欧美怡春院一区二区三区| 精品久久久久久777米琪桃花| 亚洲精品动漫免费二区| 少妇又色又爽又高潮在线看| 狠狠综合久久av一区二区| 久久精品无码一区二区三区蜜费| 91精品国产综合久久青草|