張守京,李夢(mèng)丹
(西安工程大學(xué) 機(jī)電工程學(xué)院,陜西 西安 710048)
目前,我國(guó)汽車市場(chǎng)正面臨著總體市場(chǎng)空間不斷擴(kuò)大的良好機(jī)遇,同時(shí)汽車工業(yè)的高速發(fā)展也帶來了售后服務(wù)基礎(chǔ)設(shè)施的缺乏問題和對(duì)售后服務(wù)的高需求和個(gè)性化要求,使得企業(yè)之間的競(jìng)爭(zhēng)也日益激烈。由于我國(guó)汽車售后服務(wù)發(fā)展滯后,給汽車工業(yè)的發(fā)展帶來了一定的阻礙。在汽車行業(yè)激烈的競(jìng)爭(zhēng)中,競(jìng)爭(zhēng)的焦點(diǎn)已不僅僅限于產(chǎn)品和價(jià)格,同時(shí),要善于發(fā)現(xiàn)和了解顧客需求,創(chuàng)造服務(wù)差異化,不斷完善售后服務(wù)體系以提高客戶滿意度,因此建立服務(wù)站就顯得尤為重要。加快服務(wù)站建設(shè)對(duì)重卡汽車的發(fā)展同樣具有十分重要的意義,因此本文在滿足服務(wù)需求的基礎(chǔ)上對(duì)此展開研究。
選址是一個(gè)傳統(tǒng)的話題,涉及方方面面,例如公共設(shè)施[1]、售后服務(wù)站[2-4]、物流配送中心[5-8]、加油站[9]、充電站[10-11]等設(shè)施的選址,合適的選址不僅可以降低成本,同時(shí)還可以提高顧客滿意度。維修服務(wù)站是售后服務(wù)系統(tǒng)的核心部分,因此選擇合適的方法就顯得尤為重要。集合覆蓋模型[12-16]在選址問題中是一種比較常用的模型,可以在成本最小的情況下達(dá)到最大的顧客滿意度。該模型可以結(jié)合傳統(tǒng)的線性規(guī)劃,利用LINDO 軟件求解以及采用科學(xué)的評(píng)價(jià)方法[17],也可以利用啟發(fā)式算法如粒子群算法[18]、聚類算法進(jìn)行選址[19],使結(jié)果更加具有科學(xué)性。新興的數(shù)據(jù)挖掘[20-21]也可以給選址提供一定的思路,可以結(jié)合車聯(lián)網(wǎng)信息,利用地理信息系統(tǒng)[22-23]相關(guān)軟件直觀的顯示需求地點(diǎn)并進(jìn)行數(shù)據(jù)分析。
已經(jīng)有許多學(xué)者對(duì)選址做了大量研究,但是基于大數(shù)據(jù)的維修服務(wù)站選址相對(duì)較少。許多企業(yè)在服務(wù)站的建設(shè)方面都是依據(jù)以往經(jīng)驗(yàn),忽略了需求量與建站數(shù)量相一致的原則,這就造成了一定的資源浪費(fèi),部分地區(qū)設(shè)施因需求小而閑置,部分設(shè)施因需求大而不能滿足當(dāng)前維修需求。為滿足用戶需求,建立車聯(lián)網(wǎng)大數(shù)據(jù)信息管理平臺(tái)對(duì)車輛的運(yùn)行軌跡以及維修等進(jìn)行記錄與管理,通過對(duì)海量數(shù)據(jù)的挖掘與分析,歸納客戶需求,將有助于維修服務(wù)站的選址。本文利用k-means 算法對(duì)車聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行聚類分析,結(jié)合集合覆蓋模型對(duì)重卡維修服務(wù)站展開選址。
圖1 維修站選址研究流程
維修站選址,即基于車輛行駛軌跡以及歷史維修記錄等大數(shù)據(jù),通過采取數(shù)據(jù)、分析整理、歸納總結(jié)等,選擇合適的維修服務(wù)站點(diǎn),旨在第一時(shí)間滿足客戶需求,提高客戶滿意度,打造高標(biāo)準(zhǔn)服務(wù)體驗(yàn)。本文首先對(duì)數(shù)據(jù)進(jìn)行區(qū)域劃分,采用K-means 算法進(jìn)行聚類,然后在某區(qū)域中進(jìn)行集合覆蓋選址,依此類推,得到全國(guó)范圍內(nèi)的選址方案。研究流程如圖1所示。
本文所要分析的數(shù)據(jù)量相對(duì)較大,屬于空間地理位置信息,因此采用K-means 算法對(duì)其進(jìn)行分析與歸類,將某一區(qū)域內(nèi)距離較近的點(diǎn)劃分為一個(gè)區(qū)域(即將具有相似特征的點(diǎn)歸為一類)。
K-means 聚類算法是聚類分析在現(xiàn)實(shí)應(yīng)用中最重要的算法,它能夠快速有效地處理較大的數(shù)據(jù)集合。K-means算法根據(jù)聚類的個(gè)數(shù)K,將已有的數(shù)據(jù)集劃分成K個(gè)簇,算法采用迭代更新的方法,在第一輪中,根據(jù)隨機(jī)選定的K 個(gè)初始中心點(diǎn)將對(duì)象集劃分成K 個(gè)初始簇,之后根據(jù)每個(gè)簇的中心迭代重新劃分每個(gè)對(duì)象所屬的類,而每個(gè)簇的平均值將被作為下一輪迭代的中心點(diǎn),直到中心點(diǎn)不再發(fā)生改變,即產(chǎn)生了最后的聚類結(jié)果。K 表示類的數(shù)量;K-means可以自動(dòng)分配樣本到不同的類,但是不能決定究竟要分幾個(gè)類。K 必須是一個(gè)比訓(xùn)練集樣本數(shù)小的正整數(shù)。K-means 算法常采用誤差平方和準(zhǔn)則函數(shù)作為聚類準(zhǔn)則函數(shù),定義為:
其中,Mi是類Ci中全部數(shù)據(jù)對(duì)象的均值,p是類Ci中的每個(gè)數(shù)據(jù)對(duì)象??梢钥闯?,Jc是樣本和聚類中心的函數(shù)。在樣本集給定的情況下,Jc的值取決于K個(gè)聚類中心Mi。Jc描述了n個(gè)樣本聚類成K個(gè)類型時(shí)所產(chǎn)生的總的誤差平方和。顯然,若Jc值越大,說明誤差越大,聚類結(jié)果不好,因此尋求使Jc最小的聚類結(jié)果,即在誤差平方和準(zhǔn)則下的最優(yōu)結(jié)果。
本文利用K-means 算法將全國(guó)范圍內(nèi)的車輛需求點(diǎn)進(jìn)行聚類分析,在給定K值的情況下,找到一個(gè)點(diǎn)使某區(qū)域內(nèi)所有點(diǎn)到達(dá)該點(diǎn)的距離最小,該點(diǎn)即為聚類中心。該區(qū)域內(nèi)的點(diǎn)具有一定的相似特征,即該區(qū)域內(nèi)的需求點(diǎn)為一類。
在利用K-means 算法對(duì)數(shù)據(jù)進(jìn)行聚類分析的基礎(chǔ)上,對(duì)車輛所行駛的軌跡進(jìn)行了區(qū)域劃分,接下來根據(jù)分類結(jié)果,在給定的選址區(qū)域內(nèi)使用特定的選址模型求出模型的可行解,并從中選擇最符合目標(biāo)函數(shù)的一組作為模型的最優(yōu)解,轉(zhuǎn)化為實(shí)際選址問題的結(jié)果。以聚類結(jié)果中數(shù)量最多的一個(gè)區(qū)域?yàn)槔?,做出區(qū)域內(nèi)選址。維修站的建設(shè)目的在于可以快速高效的為行駛的車輛提供各種服務(wù),因此建立的維修站應(yīng)滿足以下需求:建立的維修站可以滿足全部的需求點(diǎn),同時(shí)考慮顧客滿意度最大,因此考慮使用覆蓋模型進(jìn)行求解。
對(duì)于大多數(shù)的覆蓋類選址問題,可以敘述如下:已知需求點(diǎn)集合和潛在的設(shè)施點(diǎn)集合,對(duì)于給定的服務(wù)半徑,①設(shè)施點(diǎn)的數(shù)量無限制時(shí),要求尋找一種設(shè)施點(diǎn)的配置方式,使得使用最少的服務(wù)設(shè)施以覆蓋所有的需求點(diǎn);②給定設(shè)施點(diǎn)數(shù)量時(shí),要求找到一種設(shè)施點(diǎn)配置方式,使得其覆蓋的需求點(diǎn)盡可能的多。其中情形一為集合覆蓋問題,而情形二為最大覆蓋問題。為了滿足所有需求點(diǎn)的需求,使服務(wù)水平盡可能的達(dá)到最大,因此選擇集合覆蓋模型(如圖2所示)進(jìn)行區(qū)域內(nèi)維修站的選址。
圖2 集合覆蓋模型圖示
覆蓋模型是對(duì)已知的一些需求點(diǎn)確定一組服務(wù)設(shè)施來滿足這些需求點(diǎn)的需求。該模型中,需要確定服務(wù)設(shè)施的數(shù)量和合適的位置。集合覆蓋模型為用最小數(shù)量的設(shè)施點(diǎn)覆蓋所有需求點(diǎn)。如何確定設(shè)施點(diǎn)能夠覆蓋需求點(diǎn),由于基本覆蓋模型的應(yīng)用較為廣泛,其符號(hào)記法一般也稍有差異,在介紹模型之前,先對(duì)部分符號(hào)做如下規(guī)定:
N—區(qū)域中的需求點(diǎn)(車輛??奎c(diǎn))集合,N={1,2,···,n};
M—區(qū)域中可建立設(shè)施的候選點(diǎn)結(jié)合,M={1,2,···,m};
xi為0-1變量,xi=1,在i 點(diǎn)建立設(shè)施;xi=0,不在i點(diǎn)建立設(shè)施,i∈M;
令sij表示設(shè)施點(diǎn)i到需求點(diǎn)j的距離,L表示某設(shè)施點(diǎn)最大覆蓋半徑,定義變量yij,滿足
在產(chǎn)品差異化逐漸縮小的環(huán)境下,各類產(chǎn)品致勝的關(guān)鍵已經(jīng)逐漸由質(zhì)量演變?yōu)槭酆蠓?wù),而重型汽車行業(yè)體現(xiàn)的尤為明顯。在此基礎(chǔ)上,展開對(duì)某重汽維修服務(wù)站的選址,確保用戶在最短時(shí)間內(nèi)得到最好的售后維修服務(wù)。
首先進(jìn)行數(shù)據(jù)收集與處理。車輛信息包含車輛識(shí)別號(hào)碼(VIN)、車輛停靠點(diǎn)以及軌跡的經(jīng)緯度坐標(biāo)、高度、行駛里程等,見表1。將汽車的運(yùn)行以及停靠軌跡作為需求點(diǎn),在進(jìn)行聚類時(shí)只需考慮經(jīng)緯度坐標(biāo)即可達(dá)到聚類效果,因此對(duì)數(shù)據(jù)進(jìn)行剔除,得到目標(biāo)所需要的數(shù)據(jù)。
表1 原始數(shù)據(jù)包含信息
本文選取兩個(gè)月的記錄進(jìn)行數(shù)據(jù)分析,共包含七萬多條數(shù)據(jù),即共需要對(duì)76 160 對(duì)地理坐標(biāo)點(diǎn)進(jìn)行聚類分析。
K-means算法需要對(duì)輸入的數(shù)據(jù)進(jìn)行處理,針對(duì)??恳约熬S修點(diǎn)進(jìn)行選址,則選取行駛軌跡、??奎c(diǎn)維修點(diǎn)的地理坐標(biāo)作為輸入數(shù)據(jù)組,用matlab 進(jìn)行仿真,車輛運(yùn)行軌跡可視化如圖3所示。利用kmeans算法對(duì)車輛的行駛軌跡、??奎c(diǎn)等76 160個(gè)地理坐標(biāo)進(jìn)行聚類劃分,從車輛運(yùn)行軌跡可以看出,需求點(diǎn)的分布不夠均勻,西北和東北區(qū)域相對(duì)分散,中部和南部較集中,因此除去東北和西北兩個(gè)區(qū)域,其他按照四個(gè)方位分為四個(gè)區(qū)域,因此設(shè)定初始聚類數(shù)目為6,利用K-means算法將全國(guó)范圍內(nèi)的需求點(diǎn)劃分為6 個(gè)區(qū)域,并用不同的顏色標(biāo)識(shí),如圖4所示。利用Arcgis工具繪制需求點(diǎn)在地圖上的方位,如圖5所示。
圖3 車輛運(yùn)行軌跡可視化
圖4 車輛軌跡聚類可視化
圖5 需求點(diǎn)聚類結(jié)果可視化
經(jīng)過迭代計(jì)算,在聚類個(gè)數(shù)為6 的情況下,每一類的聚類中心以及每個(gè)區(qū)域所含需求點(diǎn)的個(gè)數(shù)見表2。
表2 聚類結(jié)果
可以看出,第三個(gè)區(qū)域需求點(diǎn)較多,第六個(gè)區(qū)域需求點(diǎn)較少。通過觀察,選取包含需求點(diǎn)數(shù)量最多的區(qū)域進(jìn)行區(qū)域內(nèi)選址。接下來需要考慮所有的需求點(diǎn),建立合適的模型,考慮約束條件,在選定區(qū)域內(nèi)進(jìn)行選址,以此類推,在其他區(qū)域內(nèi)選址,做出全國(guó)范圍內(nèi)的維修服務(wù)站選址決定。
維修站的選址采取集合覆蓋模型,要求滿足所有的維修需求,本文考慮距離因素,距離在一定程度上可以反映響應(yīng)時(shí)間、服務(wù)水平等因素。選址的首要依據(jù)是進(jìn)行需求分析,車輛經(jīng)過的任何地方都有可能成為需求點(diǎn),最終選擇的候選維修站需要滿足在統(tǒng)計(jì)內(nèi)的所有需求點(diǎn)的需求,且維修站數(shù)量最少。
按照該企業(yè)原有維修數(shù)據(jù)統(tǒng)計(jì),全國(guó)范圍內(nèi)的臨時(shí)維修服務(wù)活動(dòng)大多集中在270 個(gè)左右的臨時(shí)維修服務(wù)站點(diǎn),企業(yè)可接受建立300個(gè)左右維修服務(wù)站的費(fèi)用。兩個(gè)月內(nèi)需求點(diǎn)的數(shù)量76 160 個(gè),可以得出,一個(gè)維修站需要滿足大概260個(gè)需求點(diǎn)的維修需求。根據(jù)聚類的結(jié)果,得出每一個(gè)區(qū)域所需要建立的維修站數(shù)量最多如下:35、65、76、36、40、33 個(gè),總數(shù)為285個(gè)。利用matlab2018a得到滿足需求的維修站地理坐標(biāo)。
首先選擇需求點(diǎn)最多的范圍進(jìn)行集合覆蓋模型選址,以第三個(gè)區(qū)域?yàn)槔?,主要包括?nèi)蒙、河北、山東、吉林、河南等地,得出不同覆蓋半徑下的維修站數(shù)量,在滿足費(fèi)用要求的情況下,建立76 個(gè)維修站,維修半徑0.998 4L(地理半徑),可以覆蓋該區(qū)域的全部需求點(diǎn)20 336 個(gè),使顧客滿意度最大。76 個(gè)維修站坐標(biāo)見表3,不同覆蓋半徑所需維修站數(shù)量變化趨勢(shì)如圖6所示,第三區(qū)域維修站可視化如圖7所示。
表3 第三區(qū)域內(nèi)設(shè)施坐標(biāo)列表
得出第三個(gè)區(qū)域內(nèi)選址地點(diǎn)后,需要對(duì)其他五個(gè)區(qū)域利用聚類算法進(jìn)行集合覆蓋模型的選址,在滿足成本的要求下,求出各自范圍內(nèi)維修服務(wù)站的數(shù)量,完成全國(guó)范圍內(nèi)的選址計(jì)劃。最終得到285組地理坐標(biāo),部分地理坐標(biāo)對(duì)應(yīng)實(shí)際地理位置見表4。
圖6 不同覆蓋半徑下維修站數(shù)量
圖7 第三區(qū)域內(nèi)選址地點(diǎn)可視化
表4 各區(qū)域內(nèi)選址地點(diǎn)呈現(xiàn)
通過對(duì)集合覆蓋模型的求解,得出各個(gè)區(qū)域內(nèi)維修站的坐標(biāo),根據(jù)地理信息系統(tǒng)得出實(shí)際對(duì)應(yīng)的地點(diǎn),共得出285個(gè)維修站的選址地點(diǎn)。利用ArcGis軟件在全國(guó)范圍內(nèi)的選址結(jié)果,如圖8所示。
圖8 全國(guó)范圍服務(wù)站選址地點(diǎn)可視化
維修服務(wù)站的選址大多依據(jù)經(jīng)驗(yàn)進(jìn)行,對(duì)于小范圍小規(guī)模的選址具有一定的可行性,但是大范圍連鎖性質(zhì)的選址以及大批量的建設(shè)服務(wù)設(shè)施必須以科學(xué)的方法為依據(jù)。
隨著信息技術(shù)的發(fā)展,大數(shù)據(jù)的成熟與應(yīng)用,使得在解決實(shí)際問題時(shí)有了新的思路。本文結(jié)合車聯(lián)網(wǎng)大數(shù)據(jù)中的軌跡信息以及??啃畔ⅲ瑢⑵渥鳛檫x址所需要考慮的因素,對(duì)于大規(guī)模的選址具有一定的意義。對(duì)于維修服務(wù)站選址相似課題,可以將車輛的記錄作為選址的依據(jù)。本文所考慮的選址因素較為單一,今后的研究應(yīng)聚焦于因素的選擇上,比如服務(wù)水平、距離成本、運(yùn)營(yíng)成本等。此外,應(yīng)加大信息共享程度,通過車聯(lián)網(wǎng)將數(shù)據(jù)及時(shí)反饋,涵蓋的信息應(yīng)該更加多樣,可以和地理信息系統(tǒng)相結(jié)合,及時(shí)調(diào)整以達(dá)到最大的顧客滿意度。