喬亞男 齊 勇 侯 迪
摘要:針對傳統(tǒng)查詢詞臨近性(QTP)分析方法無法有效提高查準(zhǔn)率的問題,提出了一種孤立項(xiàng)過濾的信息檢索查詢詞分析方法,該方法根據(jù)詞匯相似度較高的查詢詞對之間具有強(qiáng)可替代性這一事實(shí),從查詢詞及其實(shí)例中分解出查詢內(nèi)的孤立項(xiàng)和文檔內(nèi)的孤立項(xiàng),在分析查詢詞臨近性之前預(yù)先進(jìn)行孤立項(xiàng)過濾,使之不參與QTP統(tǒng)計(jì)量的計(jì)算,由此減小了過分強(qiáng)調(diào)臨近性對查準(zhǔn)率的影響,實(shí)驗(yàn)結(jié)果表明,對于詞匯相似度差異比較顯著的查詢,進(jìn)行孤立項(xiàng)過濾的查詢詞臨近性分析方法的平均檢索精確度比傳統(tǒng)分析方法提高14%。