摘要:本體構(gòu)造就是利用各種數(shù)據(jù)源以半自動(dòng)方式新建或擴(kuò)充改編已有本體以構(gòu)建一個(gè)新本體。現(xiàn)有的本體構(gòu)造方法大都以大量領(lǐng)域文本和背景語(yǔ)料庫(kù)為基礎(chǔ)抽取大量概念術(shù)語(yǔ),然后從中選出領(lǐng)域概念構(gòu)造出一個(gè)本體。Cluster-Merge算法首先對(duì)領(lǐng)域文檔先用k-means聚類算法進(jìn)行聚類,然后根據(jù)文檔聚類的結(jié)果來(lái)構(gòu)造本體,最后根據(jù)本體相似度進(jìn)行本體合并得到最終的輸出本體。通過實(shí)驗(yàn)可證明用Cluster-Merge算法得出的本體可以提高查全率、查準(zhǔn)率。
關(guān)鍵詞:本體學(xué)習(xí);文檔聚類;k-means聚類算法;相似度;本體合并
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A