全紅
本文從本體知識(shí)表示基礎(chǔ)上出發(fā),采用OWL描述本體知識(shí),闡述了OWL語(yǔ)言的描述敘詞表的方法及其本體轉(zhuǎn)化的過(guò)程,為中文敘詞表的網(wǎng)絡(luò)化和智能化發(fā)展提供了技術(shù)上的參考.
基于OWL語(yǔ)言描述網(wǎng)絡(luò)敘詞表的方法
由于互聯(lián)網(wǎng)的發(fā)展,出現(xiàn)了像谷歌、百度等大型網(wǎng)絡(luò)搜索引擎,可以通過(guò)日志標(biāo)注來(lái)獲取用戶檢索用詞的種類(lèi)頻次,敘詞表由敘詞及敘詞之間關(guān)系組成,采用參考符號(hào)顯示并清楚的區(qū)分間敘詞間基本語(yǔ)義關(guān)系,習(xí)慣上主要分為3種:①等同關(guān)系(Equivalence Relationship)又稱(chēng)同一關(guān)系、用代關(guān)系,指含義相同或相近的敘詞與非敘詞之間的關(guān)系;②等級(jí)關(guān)系(Hierarchical Relationship),包含屬種、整部和多層級(jí)關(guān)系;③相關(guān)關(guān)系(Associative Relationship),又稱(chēng)類(lèi)緣關(guān)系,表示一個(gè)概念與另一個(gè)概念相關(guān)。通過(guò)“、代、屬、分、族、參(分別以漢語(yǔ)拼音字母首字Y、D、S、F、Z、C表示)”示敘詞關(guān)系。其中,“Y、D”表示同一關(guān)系“S、F”等級(jí)關(guān)系,“Z”表示一組詞中最大的族首詞,“C”表示相關(guān)關(guān)系。在OWL語(yǔ)言中,用類(lèi)、個(gè)體與屬性等關(guān)系語(yǔ)句描述實(shí)體間的關(guān)系,用OWL描述敘詞間的關(guān)系,與(漢表)的敘詞關(guān)系表示有很多相似的地方和相應(yīng)的語(yǔ)句。如圖1所示。
(三)相關(guān)關(guān)系的OWL描述
基于OWL語(yǔ)言網(wǎng)絡(luò)環(huán)境下本體知識(shí)表示
中文敘詞表作為一種規(guī)范化詞表,在信息結(jié)構(gòu)化檢索中起到準(zhǔn)確匹配的作用。但同現(xiàn)有的本體相比,中文敘詞表更多的面向人而不是面向計(jì)算機(jī)構(gòu)建,沒(méi)有采用計(jì)算機(jī)形式化語(yǔ)言表述,因而限制其發(fā)展。我國(guó)專(zhuān)家利用一些本體加以利用構(gòu)建新的的本體,以尋求語(yǔ)義網(wǎng)環(huán)境下的新的發(fā)展[4]。
在OWL知識(shí)表示中,首先需要對(duì)信息資源和知識(shí)資源進(jìn)行面向?qū)ο螅槿?duì)象概念以及他們之間的關(guān)系,然后遵循OWL知識(shí)表示的語(yǔ)法要求,建立對(duì)應(yīng)的抽類(lèi)(包括概念、屬性、關(guān)系等),并將這些類(lèi)存放在一個(gè)OWL類(lèi)型聲明文檔中,然后再定義這些類(lèi)的實(shí)例,放到另一個(gè)OWL知識(shí)文檔。有這些OWL文檔構(gòu)成知識(shí)庫(kù)。
基于OWL環(huán)境下網(wǎng)絡(luò)敘詞表本體轉(zhuǎn)化
當(dāng)前,本體是圖書(shū)情報(bào)領(lǐng)域的研究熱點(diǎn)。英美兩國(guó)以對(duì)其受控詞表的編制標(biāo)準(zhǔn)進(jìn)行了修訂等;2005年,美國(guó)國(guó)家信息標(biāo)準(zhǔn)組織NISO發(fā)布了Z39.19的四版Z39.19-2005,而同年英國(guó)標(biāo)準(zhǔn)協(xié)會(huì)(British Standards Instiution,BSI)也發(fā)布了BS5723的升級(jí)版本。說(shuō)明國(guó)外在這方面的研究已取得了第三階段,而我國(guó)中文敘詞表電子化網(wǎng)絡(luò)化的發(fā)展整體水平方面還比較薄弱??偨Y(jié)OWL描述的網(wǎng)絡(luò)敘詞表的本體轉(zhuǎn)換的步驟。
本體重在概念及其關(guān)系的體現(xiàn),其內(nèi)在的關(guān)系規(guī)則在表達(dá)不同詞之間的等同、從屬和相關(guān)關(guān)系的同時(shí),也提供一種推理的機(jī)制。因此,應(yīng)充分利用敘詞表進(jìn)行本體的構(gòu)建,將敘詞表轉(zhuǎn)化為本體等在網(wǎng)絡(luò)時(shí)代知識(shí)組織系統(tǒng)中發(fā)揮作用。
(一)準(zhǔn)備階段
主要任務(wù)是分析敘詞表,敘詞表的概念模型作為本體轉(zhuǎn)換的背景知識(shí)的分析,概念模型和數(shù)字模型之間的關(guān)系的分析。
(二)類(lèi)和屬性確定
從敘詞表到OWL的語(yǔ)義轉(zhuǎn)換規(guī)范,只有這樣才能充分利用現(xiàn)有詞表資源進(jìn)行OWL描述,縮短工作時(shí)間,減輕勞動(dòng)效率。通過(guò)一系列準(zhǔn)備步驟可以通過(guò)建立通用的轉(zhuǎn)化規(guī)則映射表來(lái)實(shí)現(xiàn)。
(三)描述階段
按照前面步驟中確定的關(guān)系、類(lèi)、屬性和語(yǔ)法、語(yǔ)義對(duì)照表進(jìn)行表示和描述。
在轉(zhuǎn)化過(guò)程中應(yīng)該遵循以下規(guī)則:使用基于XML的數(shù)據(jù)類(lèi)型;盡量保持原始命名;盡量和敘詞表的原始結(jié)構(gòu)保持相近;不要轉(zhuǎn)化一些與語(yǔ)義無(wú)關(guān)的命令信息,避免信息過(guò)量。
(作者單位:新疆石河子大學(xué)圖書(shū)館)