□ (湖南理工學院經(jīng)濟與管理學院湖南岳陽414000)
面向產(chǎn)品全生命周期成本管理的知識庫的構建厘清了成本控制與相關知識的關系,促進了組織成員之間的知識共享。知識庫易用的關鍵是用戶要能快速有效地獲取知識,因而知識匹配方法受到人們重視?,F(xiàn)有知識匹配方法主要有基于文檔的方法和基于查詢?nèi)罩镜姆椒?。Dumais T等于1988年提出LSI(隱性語義標引)模型,該模型已在文本匹配領域已得到廣泛應用?,F(xiàn)有知識匹配的研究往往忽略崗位對知識的重要性需求,而用戶的崗位調(diào)動或個人工作職責變更也經(jīng)常發(fā)生,現(xiàn)有文獻也較少從控制全生命周期成本的角度進行知識匹配。因此,已有知識匹配方法直接應用于企業(yè)全生命周期成本知識庫均存在一定的局限性?;诖?,利用控制生命周期成本的崗位知識重要性和LSI模型,提出一種基于全生命周期理論的知識匹配方法。
按全生命周期成本理論,產(chǎn)品按其生命的產(chǎn)生到結束可分為設計過程、制造過程、銷售過程、使用過程、處置回收過程。
圖1 全生命周期成本組成圖
每個過程又包括成多個任務,完成每個任務都需要耗費成本,這些成本之和組成產(chǎn)品生命周期成本。
由于按產(chǎn)品從產(chǎn)生到消亡的生命周期可分成多個階段,每個階段可分成多個過程,每個過程又可分成多個任務,在完成任務時,該崗位積累了所需的控制生命周期成本的知識。
利用專家經(jīng)驗,可以為每份知識文檔在各崗位下定義重要性,例如文檔j在崗位l下控制產(chǎn)品生命周期成本的重要性為Zlj,其取值范圍為0—1,值越大表示該崗位越需要該知識,據(jù)此可構建控制全生命周期成本的崗位知識重要性的數(shù)據(jù)表。
基于生命周期成本理論的知識匹配方法仍需要利用LSI模型實現(xiàn)知識匹配,當用戶從知識庫中輸入查詢條件后,系統(tǒng)根據(jù)用戶所在的崗位找到該崗位所需的知識文檔,同時將用戶查詢視同“偽文檔”,利用LSI模型計算用戶查詢和知識庫文檔的相關性,并根據(jù)崗位知識重要性,確定需匹配的知識,具體過程見圖2。
圖2 基于LSI模型的知識匹配過程
如圖所示,首先,構建隱性語義空間,通過對特征詞i在崗位所需的文檔j中出現(xiàn)的頻率和反文檔頻數(shù)因子組成的特征詞-文檔矩陣進行預處理,生成矩陣X,利用式(1)對矩陣X進行奇異值分解,其中:U0TU0=1,V0TV0=1,S0為r階對角矩陣。
選擇S0中k個最大的奇異值,將其余的元素都置為0,構成矩陣S。同時,取U0和V0的前k列得矩陣U和V,利用Xk=USVT構建X的k秩近似矩陣Xk;其次,計算查詢文本與文檔j的相似度,把查詢文本視同一份“偽文檔”,則可轉換為查詢文本向量q,并利用q*=S-1UTq將q投影到k維語義空間形成向量q*。
利用式(2)計算查詢文本與文檔j在隱性語義空間相似度,其中dj為文檔j的隱性語義空間中的投影;再次,據(jù)式(3)計算該崗位下查詢文本與知識文檔的匹配度,選擇匹配度大于閥值的知識,降序排列送給用戶。
某企業(yè)構建了基于生命周期成本知識庫,知識庫中存儲了用戶、崗位、崗位知識重要性、特征詞、知識等實體。我們選擇五份知識文檔 K1、K2、K3、K4、K5,一個用戶,兩個崗位B1、B2,通過變更查詢條件,變更人員崗位來測試匹配方法的有效性。
與生命周期成本相關的六個特征詞在該五份文檔中形成矩陣A,五份文檔在兩個崗位B1、B2下控制全生命周期成本的重要性矩陣為(B1,B2)T,將崗位 B1分配給用戶,查詢文本的特征詞詞頻向量(1,1,0,0,0,0)T。
可計算出歸一化的特征詞權重矩陣A*。
映射到k=3的隱性語義空間形成矩陣X3。則查詢文檔在該隱性語義空間中的映射向量 q*為 (-0.4229,0.6114,-0.7355)T,據(jù)式(2)得相似性向量(0.6282,-0.2712,0.8707,0.3198,0.2123),據(jù)式(3)得匹配度為(0.6282,-0.2712,0.8707,0.3198,0.2123),設置閥值 0.2,則選擇知識(K3,K1,K4,K5)依序推送給用戶。
實驗表明:在崗位知識重要性相同的情況下,查詢文本和知識文檔越相似,匹配度越高,表明方法合理有效。
保持以上實驗中其他參數(shù)不變,更改查詢向量,實驗結果如表1所示。表1中各列的值表示知識Ki與各查詢向量的匹配度。由于崗位B1下各項知識重要性相等,實驗結果等同于不考慮崗位知識重要性的LSI法。
由表1可知,查詢文本向量與某份知識的詞頻向量越相似,則匹配度就越高,如第四行,當所有特征詞均放入查詢文本時,5份知識與查詢文本的匹配度均大于0.2,文檔均能成功匹配,說明LSI方法的有效性。
表1 知識匹配度與查詢文本向量的關系
保持以上實驗中其他參數(shù)不變,將用戶分配的崗位由B1更改為B2,實驗結果如表2所示。表2中各列的值表示知識 Ki與各查詢向量(1,1,0,0,0,0)T的匹配度。
表2 知識匹配度與崗位分配的關系
由表2可見,更換用戶分配的崗位,知識匹配度發(fā)生變化,這表明匹配的知識會隨用戶的崗位變動而變動,既說明了匹配方法的合理性,也證實了方法滿足企業(yè)崗位輪換的需求。
在生命周期成本知識庫的應用過程中,考慮知識在控制生命周期成本作用的重要性差異,且輪崗常態(tài)的特點,提出基于生命周期成本理論的知識匹配方法。建立崗位知識重要性的數(shù)據(jù)表,利用LSI模型形成隱性語義空間,在隱性語義空間中計算查詢向量和知識文檔的相似度,結合用戶查詢時的所在崗位、崗位知識重要性計算查詢與知識文檔的匹配度,實現(xiàn)知識匹配和推送。實驗表明該方法的有效性和可用性,可為企業(yè)知識庫的應用提供參考,后續(xù)工作可圍繞如何基于生命周期成本理論更好確定崗位知識重要性展開研究。