余興武,鄭大元,韓鵬,楊明川
(北京奔馳汽車有限公司,北京 100176)
備件倉儲管理是指對備件進行的計劃、實施、考核的管理,備件管理為了保證生產(chǎn)過程連續(xù)均衡地進行,做好備件的采購、供應、存儲、合理使用等工作;備件倉儲管理是對倉儲物資的入庫、出庫、結存等活動的切實有效控制。為了滿足備件倉儲的科學管理,越來越多企業(yè)引入了信息化ERP管理系統(tǒng),然而備件倉儲系統(tǒng)主數(shù)據(jù)普遍存在料賬不準確、重復備件等問題,嚴重影響備件采購決策,甚至造成呆料與缺料停工損失。
在理想情況下,不同備件應該有不同的型號和訂貨號;同一種備件必須使用統(tǒng)一的備件信息。但由于實際工作的多變性和備件信息管理的不規(guī)范性,導致很多重復備件產(chǎn)生。
如何查找匹配出備件數(shù)據(jù)的重復特征是實現(xiàn)ERP管理系統(tǒng)備件主數(shù)據(jù)準確而無重復的關鍵技術。
根據(jù)MRP Controller(物料管理控制員)以及庫房管理人員對備件倉儲管理的工作總結,備件的屬性標識主要由型號和訂貨號,大致總結了以下重復備件的可能性。
(1)型號和訂貨號一樣,但分配的物料號不一樣。
(2)型號和訂貨號填寫不規(guī)范,可能是包含關系,如兩個備件型號分別是6005-2RSH和SKF:6005-2RSH。
(3)型號和訂貨號使用符號不統(tǒng)一,如6005-2RSH和6005/2RSH,有可能存在“-”“/”“_”等混用的情況,但主體內(nèi)容一樣。
相似度查詢是計算機學科中的一個重要問題,它的應用遍及多個領域,例如,數(shù)據(jù)庫、數(shù)據(jù)集成、互聯(lián)網(wǎng)、數(shù)據(jù)挖掘等。林學民、王煒利用集合和字符串進行分析和歸類,研究數(shù)據(jù)的重復特征的關鍵算法;李星毅等研討的數(shù)據(jù)集合中相似重復記錄匹配算法,通過設置不同字段不同的權值,分組重復多次計算各個關鍵字段的相似度,可以有效解決相似重復記錄數(shù)據(jù)的問題;姜華、韓安琪等提出了一種改進的編輯距離相似度算法,解決了編輯距離標準算法在求解相似度過程中只考慮編輯操作次數(shù),未考慮字符串包含關系對重復度匹配結果的影響,實現(xiàn)字符串重復相似度計算的高準確性。
根據(jù)重復備件的特征,總結前人研究成果,本文提出一種基于編輯距離相似度和字符相似度算法相結合匹配算法,可以準確而迅速得找出系統(tǒng)中重復備件數(shù)據(jù),保證ERP系統(tǒng)中備件主數(shù)據(jù)的準確性,優(yōu)化備件存儲結構,降低備件采購成本。
編輯距離:兩個字符串r和s之間的編輯距離(記作ed(r,s)或ED(r,s))是通過使用三種編輯操作形式,刪除、插入或者替換單個字符,將字符串r轉(zhuǎn)化為字符串s的所需要的最少編輯操作個數(shù)。如果字符串r和s的編輯距離越大,說明字符串r和s越不相似,反之相反。
標準化編輯距離:字符串r和字符串s的標準化編輯距離sed公式如下,sed的取值范圍為[0,1]:
計算兩個字符串r和s的編輯距離相似度,采用標準編輯距離動態(tài)規(guī)劃計算方法,時間復雜度為O(|r|*|s|),空間復雜度為O(min(|r|,|s|))。
建立|r|+1行|s|+1列的矩陣D,計算兩個字符串之間的編輯距離,其中初始化D[i][0]=i,0≤i≤|r|,D[0][j]=j,0≤j≤|s|,然后我們可以迭代計算D[i][j],1≤i≤|r|,0≤j≤|s|,按照下邊公式:
其 中,如 果r[i]=s[j],δ=0;否 則δ=1。最 終D[|r|][|s|]為字符串r和s之間的編輯距離。
由于備件主數(shù)據(jù)重復特征較復雜,標準編輯距離算法在兩個字符串長度差不多的情況下效果較理想,但重復備件特征字符串常常是包含關系,字符串長度可能差異巨大,使用編輯距離相似度算法達不到相關高效高精度匹配的結果,因此引用字符相似度算法。
字符相似度:兩個字符串r和s,長度分別為L1和L2,分別拆分成單個字符集合r[L1]和s[L2],定義三種字符串相似度組合:
(1)字符集合r[L1]和s[L2]每個字符元素互相包含所占百分比,字符集合r[L1]有a個包含于字符集合s[L2];字符集合s[L2]有b個包含于字符集合r[L1];相似度charSimilarRate1計算公式如下:
生理學源自于人體解剖生理學,它是將人體解剖學、生理學、組織胚胎學等科學進行有機融合、重組而形成的一門綜合性學科.該學科的前沿發(fā)展很快,如何在新的條件下,在創(chuàng)建跨學科、多層次人體解剖生理學教學和實驗課的研究與實踐中進行教學改革, 就成為當下亟待解決的問題了.另外,在生理學的教學中,既要結合結構來學習功能(與組織胚胎學、解剖學的關系),還要進行正常生理功能和病理現(xiàn)象之間的多層次聯(lián)系(與病理生理學、藥理學、臨床醫(yī)學等之間的關聯(lián)),這也是生理學課程學習中的重要問題.基于上述原因,本課程存在教與學之間各自所具有不同程度的難點.
(2)字符集合r[L1]和s[L2]每兩個相鄰字符元素互相包含所占百分比;字符集合r[L1]有i個兩字符相鄰包含于字符集合s[L2];字符集合s[L2]有j個兩字符相鄰包含于字符集合r[L1];相似度charSimilarRate2計算公式如下:
(3)字符集合r[L1]和s[L2]每三個相鄰字符元素互相包含所占百分比;字符集合r[L1]有x個三字符相鄰包含于字符集合s[L2];字符集合s[L2]有y個三字符相鄰包含于字符集合r[L1];相似度charSimilarRate3計算公式如下:
通過字符相似度可以有效查詢匹配出字符長度差異較大且多重包含關系,提高重復備件查詢匹配的覆蓋率。
系統(tǒng)開發(fā)采用JAVA編程語言,運用了軟件工程思想、面向?qū)ο蟮募夹g來進行分析、設計和實現(xiàn),系統(tǒng)包含軟件客戶端、局域網(wǎng)服務器和數(shù)據(jù)庫三部分。系統(tǒng)框架如圖1所示。
圖1 系統(tǒng)框架
重復備件處理系統(tǒng)的基本功能包括備件主數(shù)據(jù)批量存儲、重復備件查詢匹配算法選擇、查詢匹配參數(shù)設置、導出結果等。
(1)批量查詢匹配重復備件,如圖2所示。
圖2 批量查詢匹配重復備件
①選擇相似度查詢算法——距離相似度或字符相似度,設置相應算法的相似度百分比;
②輸入批量查詢型號或訂貨號;③批量查詢匹配重復備件結果。
(2)備件主數(shù)據(jù)全自動查詢匹配重復備件
備件的特征參數(shù)是型號和訂貨號,系統(tǒng)支持所有備件主數(shù)據(jù)交叉智能查詢匹配重復備件功能。查詢結果如圖3所示。
圖3 備件主數(shù)據(jù)全自動查詢匹配重復備件
重復備件處理主要負責人是備件控制工程師和庫房管理員,其流程角色和職責如圖4所示。
圖4 重復備件處理流程角色和職責
通過使用編輯距離算法和字符相似度算法分析備件的重復特征,將ERP設備備件主數(shù)據(jù)重復庫存率從15%降低到1%以內(nèi),處理重復備件產(chǎn)生的經(jīng)濟效益達2000萬元,實現(xiàn)了ERP系統(tǒng)中備件主數(shù)據(jù)的準確性,優(yōu)化了備件庫存價值。
本文對企業(yè)的ERP系統(tǒng)中備件主數(shù)據(jù)特征進行分析研究,使用編輯距離和字符相似度算法,開發(fā)重復備件處理系統(tǒng),匹配出重復備件并批量自動處理,杜絕重復備件的產(chǎn)生,保證ERP系統(tǒng)中備件主數(shù)據(jù)的準確性,優(yōu)化備件存儲結構,降低備件采購成本。通過實踐證明,本文所研究的重復物料查詢匹配算法以及自主開發(fā)的重復物料處理系統(tǒng),可以廣泛應用于ERP系統(tǒng)重復物料處理的問題。