作者簡介:孫菲菲(1984-),女,內(nèi)蒙古自治區(qū)通遼人,研究方向:電子商務(wù),語義網(wǎng)。
摘要:汽車服務(wù)電子商務(wù)平臺上零配件等資源目錄和內(nèi)容具有語義相似和數(shù)據(jù)異構(gòu)特征,造成了資源目錄和內(nèi)容中術(shù)語間關(guān)聯(lián)關(guān)系的識別困難。為解決該難題,本文梳理了汽車服務(wù)電子商務(wù)資源目錄內(nèi)與資源內(nèi)容間的語義關(guān)系,設(shè)計并開發(fā)了具有強(qiáng)擴(kuò)展性的汽車服務(wù)電子商務(wù)語義詞典,提高了汽車服務(wù)電子商務(wù)資源檢索的精度與速度。
關(guān)鍵詞:汽車服務(wù);語義詞典;設(shè)計實現(xiàn)
1.引言
汽車服務(wù)電子商務(wù)業(yè)務(wù)不斷發(fā)展,汽車零部件等服務(wù)資源等都是由不同廠商提供,然而不同廠商對同一資源的描述存在差異,比如“空氣格”、“空氣濾清器”指的是同一個東西,在汽車服務(wù)電子商務(wù)資源目錄和內(nèi)容存在的大量類似的語義相似和相關(guān)問題,造成了識別汽車服務(wù)電子商務(wù)資源目錄和內(nèi)容中術(shù)語間的關(guān)聯(lián)關(guān)系的困難。
目前電子商務(wù)推薦技術(shù)種類繁雜,然而在汽車服務(wù)電子商務(wù)服務(wù)資源語義推薦上的研究并不多,縱觀國內(nèi)外語義詞典方面的研究,國際通用語義詞典WordNet雖然提供大量的術(shù)語語義關(guān)系,也提供相應(yīng)的語義查詢接口,但是它只支持英文詞匯的語義計算,無法支持中文環(huán)境下的計算;國內(nèi)知網(wǎng)開發(fā)HowNet中文語言知識庫,雖然支持中文術(shù)語的語義關(guān)系查詢,但并未收錄汽車服務(wù)電子商務(wù)中的相關(guān)術(shù)語及詞匯,并且不具有擴(kuò)展性和提供接口,所以無法適應(yīng)中文環(huán)境下面向汽車服務(wù)電子商務(wù)的語義計算。
因此,利用Eclipse.RCP技術(shù),設(shè)計并開發(fā)汽車服務(wù)電子商務(wù)語義詞典系統(tǒng),簡稱CSEC(Car.Service.Electronic.Commerce)語義詞典,并將其應(yīng)用于汽車服務(wù)電子商務(wù)服務(wù)資源檢索與推薦,為其提供語義查詢和語義匹配接口,以提高檢索與推薦的深度、規(guī)模和精度。
2.汽車服務(wù)電子商務(wù)語義詞典的設(shè)計
2.1.詞典語義關(guān)系類型
鑒于Wordnet的應(yīng)用廣泛性和國際影響力,而且是以同義詞集合(synset)作為基本建構(gòu)單位進(jìn)行組織的,符合解決數(shù)據(jù)異構(gòu)表達(dá)問題的求解,因此CSEC語義詞典設(shè)計了類似Wordnet的詞庫結(jié)構(gòu)。而詞典所收錄詞匯包括汽車服務(wù)電子商務(wù)領(lǐng)域資源專業(yè)名稱、定義、功能、屬性等,CSEC語義詞典概念詞性均為名詞。
CSEC語義詞典中語義關(guān)系類型有上下位關(guān)系、屬性關(guān)系、同義詞關(guān)系和整體部分關(guān)系,而上下位關(guān)系作為最基本語義類型,包括上位詞匯和下位詞匯,構(gòu)成了整個詞典的樹形結(jié)構(gòu);屬性關(guān)系指的是描述一個零部件術(shù)語的名稱、尺寸、顏色等信息;同義關(guān)系指該零部件術(shù)語的同義詞;整體部分指的是該零部件由那些子部件組成。
2.2.詞典詞匯獲取方法
CSEC語義詞典現(xiàn)收錄汽車售后零件資源目錄概念10200個,其中概念詞匯及其關(guān)系的獲取主要利用火車頭采集器(http://www.locoy.com/)軟件,從各種汽車零部件網(wǎng)站,如汽車零部件門戶網(wǎng)(http://www.chinaauto-parts.cn/)、中國汽車配件網(wǎng)(http://www.autoho.com/)和慧聰汽配網(wǎng)(http://www.qipei.hc360.com/)等進(jìn)行抓取,輔以人工梳理到Excel的構(gòu)建方法,然后映射成數(shù)據(jù)庫模式,實現(xiàn)了CSEC語義詞典的樹狀結(jié)構(gòu)。
2.3.詞典的語義相似度計算
語義相似度是指詞的可替換度和詞義的符合程度,CSEC語義詞典語義相似度計算采取Wu-Palmer算法
3汽車服務(wù)電子商務(wù)語義詞典的實現(xiàn)
CSEC語義詞典系統(tǒng)采用Java語言開發(fā),采用C/S架構(gòu)設(shè)計,利用Eclipse.RCP技術(shù)開發(fā),相關(guān)的環(huán)境如表1所示。
如圖1所示,該系統(tǒng)由三個模塊組成,即語義詞典編纂模塊、語義詞典管理模塊和語義詞典查詢模塊。
CSEC語義詞典系統(tǒng)主要分為三個功能模塊,(1)詞典管理模塊是面向開發(fā)人員,為建立基本的詞典結(jié)構(gòu)提供,包括導(dǎo)入詞庫文件功能;(2)詞典編纂模塊是為詞典編纂人員或詞匯錄入人員準(zhǔn)備,提供了語義關(guān)系的編纂、詞匯的增刪改;(3)語義詞典查詢模塊,面向詞典使用人員,提供可視化的詞匯語義查詢工具,可方便查詢詞匯的語義關(guān)系和語義相似度。
3.結(jié)論及展望
本文針對汽車服務(wù)零部件術(shù)語間關(guān)聯(lián)關(guān)系識別困難的問題,設(shè)計了語義詞典的方法予以解決,并且研究了語義詞典的結(jié)構(gòu)設(shè)計、詞匯獲取方法、語義相似度算法和詞典的實現(xiàn)手段等方面內(nèi)容,而且開發(fā)了這個語義詞典,形成了一個汽車服務(wù)電子商務(wù)領(lǐng)域的語料庫,里面的總詞匯現(xiàn)有1萬多條詞匯,各詞匯按照這四種語義關(guān)系形成一個結(jié)構(gòu)清晰、層次分明的語義樹。這樣在進(jìn)行商品搜索時,就可以準(zhǔn)確地將所有這類商品搜索出來,這會極大地提高企業(yè)的交易機(jī)會,為電子商務(wù)銷售渠道的拓展發(fā)揮重要的作用。(作者單位:新奇特車業(yè)服務(wù)股份有限公司)
基金項目:國家科技支撐計劃項目“汽車維修及配件電子商務(wù)平臺研發(fā)及示范應(yīng)用”(2013BAH13F01)。
參考文獻(xiàn)
[1]Hongzhe.Liu,Hong.Bao,De.Xu,Concept.vector.for.semantic.similarity.and.relatedness.based.on.WordNet.Structure[J].The.Journal.of.Systems.and.Software,2012,85:370-381.
[2]邊振興,WordNet中概念語義相似度IC參數(shù)模型研究[J].計算機(jī)工程與應(yīng)用.2011,47(19):128-131.
[3]曾淑琴,吳揚(yáng)揚(yáng).基于HowNet的詞語相關(guān)度計算模型[J].微型機(jī)與應(yīng)用.2012.31(8):77- 80.