瞿 輝(華僑大學(xué)經(jīng)濟與金融學(xué)院 福建 泉州 362021)周 磊(武漢紡織大學(xué)會計學(xué)院 湖北 武漢 430000)
?
基于主題關(guān)聯(lián)的館藏數(shù)字資源多維語義標引研究*
瞿 輝(華僑大學(xué)經(jīng)濟與金融學(xué)院 福建 泉州 362021)
周 磊(武漢紡織大學(xué)會計學(xué)院 湖北 武漢 430000)
[摘 要]以主題關(guān)聯(lián)為基礎(chǔ)的多維語義標引方法可用于館藏數(shù)字資源管理與導(dǎo)航,即通過構(gòu)建館藏數(shù)字資源多維語義標引體系來對不同數(shù)字資源知識對象間的語義關(guān)聯(lián)進行標引,進而實現(xiàn)以內(nèi)容主題關(guān)聯(lián)為核心的館藏數(shù)字資源組織與多維展示。與傳統(tǒng)數(shù)據(jù)庫檢索相比,該方法更加準確、直觀和有效,可以作為一種知識發(fā)現(xiàn)工具和技術(shù)應(yīng)用于中小型機構(gòu)知識庫建設(shè)。
[關(guān)鍵詞]館藏數(shù)字資源 主題關(guān)聯(lián) 多維語義 標引方法
當前,數(shù)字化、網(wǎng)絡(luò)化已成為館藏資源組織的常態(tài),對圖書館事業(yè)產(chǎn)生了深遠影響:一方面,使得館藏資源的生產(chǎn)與加工越來越容易,傳播越來越便利;另一方面,造成館藏資源數(shù)量的急劇增長,針對海量數(shù)字化館藏資源的組織與服務(wù)工作面臨巨大壓力??梢哉f,由于缺乏對日益增加的數(shù)字資源進行深入、有效的組織和規(guī)范控制,館藏數(shù)字資源管理和服務(wù)工作的主要矛盾已從提高資源存量轉(zhuǎn)為如何高效滿足用戶的多元化、多層次知識需求[1]。因此,有效揭示館藏數(shù)字資源所包含的各類知識對象及其關(guān)聯(lián)就成了圖書館資源建設(shè)與管理工作適應(yīng)知識經(jīng)濟時代“信息服務(wù)知識化”的必然要求,而其首要任務(wù)就是對館藏數(shù)字資源中各種知識對象及其之間存在的語義關(guān)聯(lián)進行揭示和描述,以幫助用戶進行準確的知識獲取,提高館藏數(shù)字資源的服務(wù)效率。為此,本文提出一種以主題關(guān)聯(lián)為核心的館藏數(shù)字資源組織與展示方法,即通過主題關(guān)聯(lián)來對館藏數(shù)字資源知識對象之間不同的語義關(guān)系進行多維描述和標引,以提高用戶資源訪問的準確性、便捷性,為館藏數(shù)字資源的組織與管理實踐工作提供一些有益的探索。
2.1館藏數(shù)字資源組織
從整體上來看,館藏數(shù)字資源是以資源實體和內(nèi)容實體兩種形式存在的。所謂資源實體,是指日益增長并不斷異構(gòu)和分散化的各種數(shù)字化資源,如數(shù)字化圖書、期刊、報紙、數(shù)據(jù)及其他數(shù)字出版物[2]。從資源實體角度上看,雖然館藏數(shù)字資源在采集時就已經(jīng)具備了一定的形式,但整體上還較為凌亂、無序,給用戶利用造成諸多不便,因而對其進行組織與管理的實質(zhì)就是要對資源實體進行序化。與資源實體不同,內(nèi)容實體主要是指蘊含在資源實體中的各種知識對象,如概念、定義、公式及推理等[3]。因此,從內(nèi)容實體角度而言,館藏數(shù)字資源組織就是對資源實體各種知識對象的組織與管理;其核心任務(wù)首先是知識對象的識別,其次是不同知識對象間語義關(guān)聯(lián)的描述與標引,以便適應(yīng)資源深度開發(fā)與利用的需要。而在各種類型館藏數(shù)字資源急劇增加的時代背景下,面向內(nèi)容實體的組織管理變得更加重要和緊迫,這正如Kodama所指出的那樣,只有有效地整合零散、無序的知識才能實現(xiàn)對數(shù)字資源的真正管理[4]。
圖1 館藏數(shù)字資源常見館語義關(guān)聯(lián)舉例
2.2館藏數(shù)字資源語義關(guān)聯(lián)
根據(jù)所表征內(nèi)容的不同,館藏數(shù)字資源語義關(guān)聯(lián)總體上可以劃分為主題關(guān)聯(lián)[5]、主體關(guān)聯(lián)[6]和指向關(guān)聯(lián)[7]3種類型。其中,主題關(guān)聯(lián)是指基于不同知識對象(如關(guān)鍵詞、主題詞、概念、公式等)所建立起來的資源內(nèi)容關(guān)聯(lián)關(guān)系,如描述關(guān)系、共生(共現(xiàn))關(guān)系等;主體關(guān)聯(lián)是指館藏數(shù)字資源相關(guān)主體(如作者、出版物、研究機構(gòu)/出版機構(gòu))之間所構(gòu)成的各種約束關(guān)系,如撰寫關(guān)系、出版關(guān)系、隸屬關(guān)系及合作關(guān)系等;而指向關(guān)聯(lián)則是館藏數(shù)字資源與其數(shù)據(jù)源之間所具有的鏈接關(guān)系(網(wǎng)址、全文鏈接等)。以期刊類館藏數(shù)字資源為例,通過4個基本的知識對象(關(guān)鍵詞、作者、期刊以及研究機構(gòu))可以構(gòu)建出包含以上3種類型的關(guān)聯(lián)體系來描述館藏資源的內(nèi)容語義特征(見圖1)。在實踐中,這些語義關(guān)聯(lián)具體又可分為兩種類型:一類是同類知識對象語義關(guān)聯(lián),即同屬性知識對象所構(gòu)成的關(guān)聯(lián)關(guān)系,包括“關(guān)鍵詞-關(guān)鍵詞(K-K)”“期刊-期刊(J-J)”“作者-作者(A-A)”和“研究機構(gòu)-研究機構(gòu)(O-O)”4種關(guān)聯(lián);另一類是不同知識對象語義關(guān)聯(lián),指不同屬性知識對象之間所構(gòu)成的關(guān)聯(lián),包括“關(guān)鍵詞-作者(K-A)”“期刊-關(guān)鍵詞(K-J)”“關(guān)鍵詞-機構(gòu)(K-O)”“作者-期刊(A-J)”“作者-機構(gòu)(A-O)”以及“期刊-機構(gòu)(JO)”6種關(guān)聯(lián)關(guān)系。
從科學(xué)學(xué)角度來看,對館藏數(shù)字資源不同知識對象間所存在的語義關(guān)聯(lián)進行描述和呈現(xiàn),既可以提高相似主題資源內(nèi)容被發(fā)現(xiàn)的概率,進而促進知識的快速轉(zhuǎn)化,也能夠為館藏數(shù)字資源動態(tài)聚合成細粒度、具有內(nèi)在邏輯聯(lián)系的語義路徑提供基礎(chǔ)[8]。因此,構(gòu)建系統(tǒng)的多維語義關(guān)聯(lián)描述機制就成為了科學(xué)組織館藏數(shù)字資源的關(guān)鍵,即通過對知識對象及其相互關(guān)系的精確描述來對館藏數(shù)字資源進行深度的組織和管理。同時,豐富、完整的語義關(guān)聯(lián)體系能夠從多角度揭示館藏數(shù)字資源的內(nèi)容結(jié)構(gòu)特征,而這正是館藏數(shù)字資源建設(shè)工作的重要目標。例如,關(guān)聯(lián)“A-J”反映了作者與出版期刊之間的對應(yīng)關(guān)系,從中可以發(fā)現(xiàn)不同作者論文在發(fā)表中的期刊偏好,即在哪類期刊上發(fā)表論文較多、某期刊擁有哪些穩(wěn)定作者群,進而通過作者的群體特征來確定期刊定位,而通過關(guān)聯(lián)“J-K”則可以揭示期刊發(fā)表文獻的主題分布。
如前所述,不同關(guān)聯(lián)類型對館藏資源內(nèi)容的語義特征描述能力是不同的,其中主題關(guān)聯(lián)的描述能力最強,主體關(guān)聯(lián)次之,而指向關(guān)聯(lián)則最弱。因此,基于關(guān)鍵詞在資源內(nèi)容描述方面的重要作用,由關(guān)鍵詞共現(xiàn)所構(gòu)成的主題關(guān)聯(lián)就成為了所有關(guān)聯(lián)中最為重要的一組語義關(guān)系,是構(gòu)建館藏數(shù)字資源多維語義標引體系的基礎(chǔ),以關(guān)鍵詞共現(xiàn)所反映的主題關(guān)聯(lián)為核心,可以將不同的資源實體利用不同知識對象(內(nèi)容實體)間所具有的豐富語義關(guān)聯(lián)連接起來,構(gòu)成一個基于多維語義關(guān)聯(lián)視角的館藏數(shù)字資源描述與呈現(xiàn)框架。
基于主題關(guān)聯(lián)的館藏數(shù)字資源多維語義標引的關(guān)鍵是以資源內(nèi)容主題關(guān)聯(lián)為核心構(gòu)建的一套穩(wěn)定、可擴展的多維語義體系,以便對不同知識對象間的語義關(guān)系進行標引,最終實現(xiàn)對館藏數(shù)字資源的多維語義標引。基于此,本文構(gòu)建了基于主題關(guān)聯(lián)的館藏數(shù)字資源多維語義標引方法,其流程主要包括以下幾個步驟:
(1)知識對象實例庫建設(shè)。即在館藏數(shù)字資源知識對象的識別基礎(chǔ)上,對知識對象進行抽取與處理,并以其實例形式——特征詞來構(gòu)建領(lǐng)域?qū)ο笾R庫。其中,特征詞是指從文章中選取出來用于反映資源知識對象的名詞或術(shù)語[9],在規(guī)范后作為知識對象的實例進行匯總添加成為館藏數(shù)字資源知識對象庫;本文中,“特征詞”的外延有了進一步的擴大,即只要能夠揭示館藏資源內(nèi)容的獨立名詞或詞組(如關(guān)鍵詞、作者、機構(gòu)名、期刊名等)都應(yīng)被視為館藏數(shù)字資源的特征詞。由于特征詞能夠清晰、有效反映包含于館藏資源的語義關(guān)聯(lián),因此對特征詞的提取要盡可能全面,涵蓋所有知識對象,并需要對不同特征詞之間的關(guān)系進行精確描述,以構(gòu)成對館藏數(shù)字資源(文獻)內(nèi)容語義關(guān)聯(lián)進行描述和標引的基礎(chǔ)[10]。根據(jù)需要,本文對館藏數(shù)字資源的6類特征詞進行了抽取,并以此構(gòu)建了對應(yīng)的知識對象實例庫:學(xué)者庫(包含作者信息)、文獻庫(包含不同類型文獻的題名及DOI)、機構(gòu)庫(主要包括研究機構(gòu)與出版機構(gòu))、關(guān)鍵詞庫(主要包含文獻關(guān)鍵詞或主題詞)、熱點主題庫(通過對高頻關(guān)鍵詞、主題詞的共現(xiàn)分析得到)以及基金庫(包含國內(nèi)主要的科研基金項目資助信息)。根據(jù)不同知識對象之間所具有的不同語義關(guān)系,實例庫之間相應(yīng)設(shè)置了不同的邏輯關(guān)系,其具體的體系結(jié)構(gòu)如圖2所示。
圖2 知識對象實例庫體系結(jié)構(gòu)
例如,針對《基于知識位勢的技術(shù)創(chuàng)新合作中的知識擴散研究》[11],可以提取包括題名=“基于知識位勢的技術(shù)創(chuàng)新合作中的知識擴散研究”、學(xué)者=“李莉”and“黨興華”and“張首魁”、機構(gòu)=“西安理工大學(xué)工商管理學(xué)院”and“陜西省行政學(xué)院”and“科學(xué)學(xué)與科學(xué)技術(shù)管理”、關(guān)鍵詞=“知識擴散”and“知識主體”and“知識深度和寬度”and“知識位勢”、基金=“國家自然科學(xué)基金資助項目”and“教育部博士點基金資助項目”等特征信息,這些特征詞添加后根據(jù)知識庫之間的體系結(jié)構(gòu)將能夠自動建立起各知識對象之間的不同語義關(guān)聯(lián)。
(2)主題關(guān)聯(lián)分析與構(gòu)建。主要是通過對抽取的關(guān)鍵詞進行共現(xiàn)分析,以確定目標館藏數(shù)字資源的“關(guān)鍵詞-關(guān)鍵詞”(K-K)主題關(guān)聯(lián),進而以主題關(guān)聯(lián)為基礎(chǔ)將其他語義關(guān)聯(lián)進行組配,構(gòu)成用于館藏數(shù)字資源標引的多維語義關(guān)聯(lián)集。以K-K關(guān)聯(lián)和A-A關(guān)聯(lián)組配為例(見圖3),一方面,關(guān)鍵詞之間存在著共現(xiàn)關(guān)系(關(guān)聯(lián)1),而作者與作者之間則存在著合作關(guān)系(關(guān)聯(lián)2);另一方面,在作者間不存在直接合作的情況下,因其文獻中使用關(guān)鍵詞的不同而存在如下兩種情況:①如果同時使用某一關(guān)鍵詞,則其間存在語義關(guān)聯(lián)(關(guān)聯(lián)3);②雖然沒有使用同一關(guān)鍵詞,但這些關(guān)鍵詞之間存在共現(xiàn)關(guān)系,那么其間存在耦合語義關(guān)聯(lián)(關(guān)聯(lián)4)。在完成主題關(guān)聯(lián)分析結(jié)果基礎(chǔ)上,可以通過不同主題及其包含的關(guān)鍵詞將相同或不相同主題下的所有知識對象連接起來。
圖3 學(xué)科知識庫及所包含關(guān)聯(lián)示意圖
(3)知識對象多維語義標引。經(jīng)過特征詞抽取、主題關(guān)聯(lián)的分析與建構(gòu),就可以對所獲得的資源知識對象進行多維度語義標引。實際上,由于館藏數(shù)字資源包含的各類知識對象都經(jīng)由圖2所示的知識對象實例庫構(gòu)造了較為完整的關(guān)系,因此在標引過程中只需將任何館藏數(shù)字文獻與其相應(yīng)的熱點主題相匹配(關(guān)聯(lián)r4),便自動與其他知識對象關(guān)聯(lián)起來,并能夠方便地通過不同知識對象建立起與其他具有相關(guān)館藏資源實體之間的多維語義關(guān)聯(lián)關(guān)系。
以上過程可以利用本體軟件(如Proté g é )實現(xiàn),也可通過主題圖工具(如Ontopia[12])來完成。與本體類似,主題圖(Topic Maps)是“一種用來描述知識以及知識與信息資源聯(lián)系的元數(shù)據(jù)格式,既可以定位某一知識對象的資源位置,也可以用來表示不同知識對象之間的相互聯(lián)系”[13]。但與本體相比,主題圖技術(shù)所提供的XTM標簽集與語法規(guī)范具有操作簡單、描述性強等特點,能夠使整個工作過程變得簡單、高效。因此,本文選用Ontopia作為館藏數(shù)字資源多維語義標引方法的實現(xiàn)平臺。
為測試基于主題關(guān)聯(lián)的館藏數(shù)字資源多維語義標引方法的實際效果,本文以國內(nèi)知識擴散(Knowledge Diffusion)研究領(lǐng)域期刊數(shù)字文獻為例進行了驗證。
4.1數(shù)據(jù)來源和處理
本文以“知識擴散”為主題在CNKI期刊全文數(shù)據(jù)庫中進行檢索(檢索時間為2015年8月2日),檢索到相關(guān)文獻1 074篇,對非相關(guān)文獻進行剔除后,得到符合要求的結(jié)果1 069篇,從中對相關(guān)特征詞進行抽取,共獲得1 897個關(guān)鍵詞、2 451名作者(251個研究機構(gòu))、237個期刊及36個基金信息。為提高準確性,本文參考專家意見并結(jié)合自建詞表對所獲取的特征詞特別是關(guān)鍵詞進行了規(guī)范與合并,最后將所得到的數(shù)據(jù)添加到知識對象庫中,以備后續(xù)工作使用。
4.2主題分析及結(jié)果
利用系統(tǒng)聚類方法對所獲取的高頻關(guān)鍵詞進行主題聚類,得到國內(nèi)知識擴散研究領(lǐng)域的5個熱點研究主題及其對應(yīng)的相關(guān)核心關(guān)鍵詞(見表1),其結(jié)果與采用概念空間圖和社會網(wǎng)絡(luò)分析方法進行分析所得結(jié)果基本吻合;在后續(xù)的標引過程中,這些熱點主題將作為實例添加到圖2所示的“熱點主題庫”中,并建立主題與核心關(guān)鍵詞之間的包含關(guān)系,完成后續(xù)多維語義標引的準備工作。
4.3館藏數(shù)字資源知識對象的多維語義標引
實現(xiàn)館藏數(shù)字資源多維語義標引,需要將主題聚類的結(jié)果用于相關(guān)館藏數(shù)字資源知識對象關(guān)聯(lián)的連接中去,也就是對文獻進行基于主題關(guān)聯(lián)的多維語義標引。為此,本文利用主題圖工具Ontopia構(gòu)建了“知識擴散知識對象實例庫”(見圖3)來完成對知識擴散館藏期刊數(shù)字資源的多維語義標引。具體過程包括以下兩個步驟:
(1)添加研究主題。根據(jù)表1,將5個研究主題作為知識對象實例添加到“熱點主題庫”中并分別命名,然后依據(jù)圖4所示的熱點主題庫語義關(guān)聯(lián)結(jié)構(gòu),對相應(yīng)主題建立“包含作者”“包含文獻”“包含關(guān)鍵詞”及“涉及機構(gòu)”4個關(guān)聯(lián)類型設(shè)置功能以及多個開放的主題說明信息——主題含義(Topic Meaning)、參考鏈接(Reference Links)、備注信息(Remarks)、多媒體附件(Multimedia Attachments)、關(guān)鍵詞含義(Keyword Meaning)等,用于對主題的深度說明,以增強內(nèi)容主題的導(dǎo)航功能。
圖4 熱點主題庫語義關(guān)聯(lián)結(jié)構(gòu)
表1 知識擴散領(lǐng)域熱點主題及核心關(guān)鍵詞
(2)多維語義標引。主題實例添加完成之后,就可以用來對不同的知識對象進行多角度的語義關(guān)聯(lián),進而實現(xiàn)對館藏數(shù)字資源的多維語義標引。具體來講,就是將每個主題與其所涉及的不同作者、文獻、關(guān)鍵詞、機構(gòu)等知識對象聯(lián)系起來。實際上,鑒于圖2所示的“知識擴散知識對象實例庫”中本身已經(jīng)定義好了“學(xué)者庫”“文獻庫”“關(guān)鍵詞庫”及“機構(gòu)庫”等6個資源實體類型及其之間的豐富語義關(guān)系,因此在具體的標引過程中只需對每一個主題實例與另外任意一個資源實體類型進行完整的關(guān)聯(lián),就可以自動實現(xiàn)對其他語義關(guān)聯(lián)的標引。
4.4基于多維語義的館藏資源展示效果
完成對館藏數(shù)字資源的多維語義標注,實質(zhì)上也就實現(xiàn)了不同數(shù)字資源知識對象之間基于主題的語義關(guān)聯(lián)建構(gòu),使基于主題關(guān)聯(lián)的館藏數(shù)字資源可視化與檢索有了可能。本文利用主題圖工具所進行的多維語義標引結(jié)果會生成一個包含全部內(nèi)容語義關(guān)聯(lián)標引結(jié)果的XTM文檔包,可以方便地導(dǎo)出、保存、維護和瀏覽;同時,對XTM文檔結(jié)果的查詢方式既可以利用相關(guān)插件來可視化瀏覽,也可通過文檔列表進行訪問。圖5為本文利用Ontopia提供的Vizigator插件[14]對知識擴散領(lǐng)域館藏數(shù)字期刊文獻多維語義標引結(jié)果的可視化效果。
圖5 多維語義標引結(jié)果的可視化效果(局部)
從圖5可以看出,通過多維語義標引可以得到一個以主題關(guān)聯(lián)為核心的、多維集成、語義化程度高的館藏數(shù)字資源內(nèi)容實體(知識對象)展示結(jié)果。從中可以方便地對與某一主題相關(guān)的資源實體(如期刊、作者、關(guān)鍵詞、機構(gòu)等)進行查詢與訪問,同時也可以反向針對知識對象查詢其所屬的主題及該主題下包含有哪些知識對象,通過簡單的點擊來發(fā)現(xiàn)不同的館藏資源內(nèi)容主題與知識對象;同時,針對不同需要還可以通過對展示的深度進行控制,以便獲得不同強度和豐富程度的理想效果。
為了對該方法應(yīng)用性和效果進行檢驗,本文設(shè)計了基于多維語義關(guān)聯(lián)的館藏數(shù)字資源導(dǎo)航系統(tǒng)(以下簡稱系統(tǒng)),并進行了小范圍的測試。系統(tǒng)主要圍繞實現(xiàn)基于主題關(guān)聯(lián)的館藏數(shù)字資源多維語義可視化推薦功能來構(gòu)架,系統(tǒng)核心通過ASP.NET技術(shù)集成主題圖工具Ontology軟件包來實現(xiàn)。系統(tǒng)基本滿足了用戶通過關(guān)鍵詞搜索或者目錄瀏覽的方式來查詢和獲取某一領(lǐng)域相關(guān)主題信息的需求,同時可以按照不同主題去方便地查詢相關(guān)領(lǐng)域的關(guān)鍵詞、機構(gòu)、作者、文獻及出版物等信息。在對主題進行查詢和瀏覽時,系統(tǒng)為用戶提供了目錄瀏覽和可視化兩種訪問方式;在兩種模式下,用戶都可根據(jù)需要預(yù)設(shè)訪問的深度。
表2為本文對華僑大學(xué)經(jīng)濟學(xué)專業(yè)二年級本科生所進行的定題檢索效率對比實驗結(jié)果,其中準確率采用專家判斷方法予以確認,所有參與測試的同學(xué)并無相關(guān)知識擴散領(lǐng)域知識背景。通過對3組數(shù)據(jù)(平均時間與準確率)的對比來看,使用導(dǎo)航服務(wù)系統(tǒng)的小組在定題檢索的平均速度和準確率(2.47/98.3%)上都有較為可靠的保證,高于使用CNKI小組的4.63/91.7%和無限制組9.50/84.7%。
表2 不同途徑檢索效率對比數(shù)據(jù) 單位:分鐘/準確率
本文提出了基于主題關(guān)聯(lián)的館藏數(shù)字資源多維語義標引方法,并對以其為基礎(chǔ)的系統(tǒng)原型的應(yīng)用效果進行了實驗。結(jié)果顯示,作為一種有效的館藏數(shù)字資源知識管理工具,該方法克服了傳統(tǒng)數(shù)據(jù)庫方法在資源內(nèi)容揭示上的不足,能夠通過更細粒度的知識對象來為館藏數(shù)字資源的組織提供多種語義標引角度,在集成相關(guān)語義工具基礎(chǔ)上用于館藏數(shù)字資源的管理與導(dǎo)航,其效果相對于傳統(tǒng)方法來講更為直觀和高效。同時,該方法實現(xiàn)了基于主題關(guān)聯(lián)的館藏數(shù)字資源知識對象的多維聚合與展示,能夠構(gòu)成集成度高的內(nèi)容呈現(xiàn)模式,可以廣泛應(yīng)用于當前各類在線中小型機構(gòu)庫的建設(shè)。由于篇幅的限制,本文在對有關(guān)問題(如知識對象實例庫構(gòu)建過程中的自動化等問題)上的分析未能充分展開,同時對特征詞抽取過程中的相似度量化、特征詞關(guān)系標注等問題還需要在后續(xù)工作中進行深入研究、完善。
參考文獻 :
[1]成 全, 許 爽.館藏數(shù)字資源語義關(guān)聯(lián)研究現(xiàn)狀及發(fā)展趨勢探析[J].圖書館建設(shè), 2014, 238(4):28-33.
[2]劉壽華, 殷 勤.探討藏書老化規(guī)律 優(yōu)化文獻資源實體:圖書老化實測報告[J].圖書館建設(shè), 1991, 61(1):26-29.
[3]陳嘉勇, 周 婕, 李 玲, 等.基于文獻實體關(guān)系模型的高校機構(gòu)知識庫作者認領(lǐng)模式研究[J].情報理論與實踐, 2015, 38(2): 59-63.
[4]Kodama M.Knowledge Creation Through Networked Strategic Communities: Case Studies on New Product Development in Japanese Companies [J].Long Range Planning, 2005, 38(1):27-49.
[5]王立學(xué), 孫 楊, 楊代慶.基于引文的情報學(xué)領(lǐng)域主題關(guān)聯(lián)特征分析[J].情報雜志, 2012, 31(10):27-31.
[6]唐 義.關(guān)聯(lián)科學(xué)核心詞匯規(guī)范:提出、優(yōu)化及展望[J].圖書館雜志, 2013, 32(3):55-60.
[7]游 毅, 成 全.試論基于關(guān)聯(lián)數(shù)據(jù)的館藏資源聚合模式[J].情報理論與實踐, 2013,36(1):109-114.
[8]任瑞娟, 濮德敏, 王劍宏, 等.基于Drupal實現(xiàn)多類型學(xué)術(shù)資源的語義化組織與關(guān)聯(lián)化聚合[J].情報科學(xué), 2015,33(5):63-67.
[9]丁 潔, 王曰芬.基于特征項的文獻共現(xiàn)網(wǎng)絡(luò)在學(xué)術(shù)信息檢索中的應(yīng)用[J].圖書情報工作, 2014,58(15):135-141.
[10]胡昌平, 陳 果.科技論文關(guān)鍵詞特征及其對共詞分析的影響[J].情報學(xué)報, 2014,33(1):23-32.
[11]李 莉, 黨興華, 張首魁.基于知識位勢的技術(shù)創(chuàng)新合作中的知識擴散研究[J].科學(xué)學(xué)與科學(xué)技術(shù)管理, 2007,28(4):107-112.
[12]Pepper S.The TAO of Topic Maps [J].Proceedings of Xml Europe, 2000,52(11):4362-4365.
[13]王石林.主題地圖及其在軟件工程專業(yè)知識管理中的應(yīng)用研究[D].武漢: 武漢理工大學(xué)計算機科學(xué)與技術(shù)學(xué)院, 2006:6.
[14]Beaman R, Wieczorek J.Determining Space from Place for Natural History Collections [J].D-Lib Magazine, 2004,10(5):1082-1089.
Research on Multidimensional Semantic Indexing of Digital Resource of Collection Based on Topic Relevance
[Abstract]The multidimensional semantic indexing method that based on topic relevance can be used for digital resource of collection management and navigation, that is, through the construction of Library Digital Resource of collection multidimensional semantic indexing system to index the semantic relationship between different digital resource knowledge objects, and to realize the organization and multidimensional display of the digital resource of collection, which is based on the core of the content theme.Compared with traditional database retrieval, this method is more accurate, intuitive and effective.It can be used as a knowledge discovery tool and technology that applied in the construction of small and medium sized institutional repository.
[Key words]Digital resource of collection; Topic relevance; Multidimensional semantic; Indexing method
[中圖分類號]G254.73
[文獻標識碼]A
*本文系國家社會科學(xué)基金項目“區(qū)域創(chuàng)新中的知識擴散規(guī)律及其保障機制研究”,項目編號:14CTQ020;福建省軟科學(xué)研究項目“面向福建省縣域經(jīng)濟創(chuàng)新的知識服務(wù)平臺及其利用研究”,項目編號:2015R0054的研究成果之一。
[作者簡介]
瞿 輝 男,1980年生,博士,華僑大學(xué)經(jīng)濟與金融學(xué)院講師,碩士生導(dǎo)師,研究方向為知識管理、電子商務(wù)、信息經(jīng)濟與政策,已發(fā)表論文20余篇。
周 磊 女,1986年生,博士,武漢紡織大學(xué)會計學(xué)院講師,碩士生導(dǎo)師,研究方向為專利情報分析、技術(shù)創(chuàng)新,已發(fā)表論文20余篇。
[收稿日期:2015-11-09]