□ 鄭詩禹,李 莉
(新疆農(nóng)業(yè)大學(xué) 交通與物流工程學(xué)院,新疆 烏魯木齊 830052)
近年來,數(shù)據(jù)在經(jīng)濟(jì)社會發(fā)展中扮演著舉足輕重的角色,是國家基礎(chǔ)性戰(zhàn)略資源,是21世紀(jì)的“鉆石礦”。黨中央、國務(wù)院高度重視大數(shù)據(jù)在經(jīng)濟(jì)社會發(fā)展中的作用,黨的十八屆五中全會提出“實(shí)施國家大數(shù)據(jù)戰(zhàn)略”,國務(wù)院印發(fā)《促進(jìn)大數(shù)據(jù)發(fā)展行動綱要》,全面推進(jìn)大數(shù)據(jù)發(fā)展,加快建設(shè)數(shù)據(jù)強(qiáng)國[1]。數(shù)據(jù)正在快速堆積與存儲,人們越來越認(rèn)識到數(shù)據(jù)對于國家、政府、企業(yè)及個(gè)人的重要作用。因此,如何從海量的數(shù)據(jù)中提取出有價(jià)值的信息,就成了各國學(xué)者研究的焦點(diǎn)問題。數(shù)據(jù)挖掘技術(shù)就是在這樣的背景下應(yīng)運(yùn)而生。數(shù)據(jù)挖掘技術(shù)是指在海量的、未知的、模糊的、不確定的數(shù)據(jù)中,尋找到可以給經(jīng)濟(jì)社會帶來價(jià)值的、有用的信息的技術(shù)。換言之,數(shù)據(jù)挖掘技術(shù)就是從原始積累的大量數(shù)據(jù)中發(fā)現(xiàn)其隱藏的信息和規(guī)律?,F(xiàn)階段數(shù)據(jù)挖掘技術(shù)已經(jīng)在交通運(yùn)輸、金融保險(xiǎn)、批發(fā)零售、醫(yī)療衛(wèi)生、工業(yè)工程等行業(yè)中發(fā)揮著關(guān)鍵性作用。
我國現(xiàn)代物流起步較晚,欠發(fā)達(dá)地區(qū)的物流企業(yè)仍然沿用傳統(tǒng)的物流運(yùn)營模式,不利于我國建設(shè)南北物流大通道。為了打造區(qū)域經(jīng)濟(jì)大走廊,發(fā)展“一帶一路”絲綢之路經(jīng)濟(jì)帶的建設(shè),越來越多的人將目光轉(zhuǎn)向了數(shù)據(jù)挖掘技術(shù)在物流工程領(lǐng)域的應(yīng)用?,F(xiàn)代物流企業(yè)在物流、資金流、信息流之間具有相互作用、相互制約的特點(diǎn),而數(shù)據(jù)挖掘技術(shù)能夠更加精準(zhǔn)的、高效的從海量的物流數(shù)據(jù)中搜尋到準(zhǔn)確、有價(jià)值的信息,提高物流企業(yè)的運(yùn)作效率,降低企業(yè)由于物流信息閉塞導(dǎo)致的損失;除此之外,還能夠使企業(yè)運(yùn)營者可以快速決策,更加科學(xué)地制定出物流決策方案,提高企業(yè)收益[2]。
在信息大爆炸的時(shí)代中,人們經(jīng)常面臨著持有海量數(shù)據(jù)而缺少有用信息的困擾。由于數(shù)據(jù)資料的復(fù)雜性,傳統(tǒng)的檢索分析方法已經(jīng)難以滿足現(xiàn)代人從龐大的數(shù)據(jù)中提取有價(jià)值信息的強(qiáng)烈需求,人們急切地希望能夠得到一種更加準(zhǔn)確的數(shù)據(jù)分析與處理方法,從這些海量的數(shù)據(jù)中抽取出有價(jià)值的信息,從而更好地滿足人類經(jīng)濟(jì)社會發(fā)展的需求。數(shù)據(jù)挖掘技術(shù)就是在這樣的背景下應(yīng)運(yùn)而生的。
數(shù)據(jù)挖掘(Data Mining)是指從大量數(shù)據(jù)中,分析并且檢索出隱藏有價(jià)值信息的技術(shù),是一門多學(xué)科交叉研究的邊緣性綜合類的學(xué)科。其中,涉及機(jī)器語言學(xué)習(xí)、算法設(shè)計(jì)、模塊化識別、數(shù)據(jù)庫、神經(jīng)網(wǎng)絡(luò)和數(shù)據(jù)處理分析等多門學(xué)科。數(shù)據(jù)挖掘是一種新的處理數(shù)據(jù)分析方法,對分析海量的數(shù)據(jù)集和統(tǒng)計(jì)傳統(tǒng)數(shù)據(jù)都具有重要的現(xiàn)實(shí)意義[3]。與傳統(tǒng)的數(shù)據(jù)分析方法相比,是在傳統(tǒng)的數(shù)據(jù)分析方法基礎(chǔ)上,加入當(dāng)前復(fù)雜的算法,獲取有用信息的過程。
數(shù)據(jù)挖掘技術(shù)可以分為統(tǒng)計(jì)類數(shù)據(jù)挖掘和知識類數(shù)據(jù)挖掘。統(tǒng)計(jì)類數(shù)據(jù)挖掘技術(shù)的應(yīng)用領(lǐng)域廣泛且研究較為成熟,其主要包含聚集與度量技術(shù)、各種回歸技術(shù)、聚類挖掘技術(shù)和最近鄰技術(shù)等[4]。知識類挖掘技術(shù)則是靠知識驅(qū)動的一種把數(shù)據(jù)庫中挖掘業(yè)務(wù)模式的知識發(fā)現(xiàn)技術(shù),與統(tǒng)計(jì)類相比,其不需要借助分析人員的介入驅(qū)動,在短時(shí)間內(nèi)找到有用知識,因此,在現(xiàn)在的數(shù)據(jù)處理中較為常見,主要包括關(guān)聯(lián)分析、遺傳算法、神經(jīng)網(wǎng)絡(luò)、粗糙集和決策樹。
①關(guān)聯(lián)分析:關(guān)聯(lián)分析又稱為關(guān)聯(lián)規(guī)則,主要是從給定的數(shù)據(jù)集中發(fā)現(xiàn)隱藏在其中的必然規(guī)律,其規(guī)律也許是群體法則的,也有可能是自然法則。關(guān)聯(lián)規(guī)則特別適用于從相互關(guān)系中挖掘知識,如市場營銷、事務(wù)分析等應(yīng)用領(lǐng)域。
②遺傳算法:就是模擬人工優(yōu)良育種的思路,從某一個(gè)初始種群開始,進(jìn)行一系列不間斷的隨機(jī)選擇、交叉和變異過程,產(chǎn)生新一代的種群,將群體進(jìn)化到搜索區(qū)域中越來越好的領(lǐng)域,最后收斂于最為適應(yīng)的群體。
③神經(jīng)網(wǎng)絡(luò):從結(jié)構(gòu)上是模仿生物的神經(jīng)網(wǎng)絡(luò),是通過一定的訓(xùn)練去學(xué)習(xí)非線性的一種預(yù)測模型,其基本單元構(gòu)成是模仿人腦神經(jīng)元,稱之為節(jié)點(diǎn);并且通過鏈接進(jìn)行連接節(jié)點(diǎn),類似于人體大腦中個(gè)神經(jīng)元之間的連接。神經(jīng)網(wǎng)路的優(yōu)點(diǎn)是在預(yù)測的過程中實(shí)現(xiàn)精準(zhǔn)預(yù)測,而缺點(diǎn)就是難以理解,容易受到過度訓(xùn)練的影響。
④粗糙集:是一個(gè)處理模棱兩可問題的新型數(shù)學(xué)分析工具,在處理數(shù)據(jù)的過程中可以不利用相關(guān)問題的先驗(yàn)知識,可以自動地尋找出內(nèi)在的聯(lián)系。近年來,粗糙集已經(jīng)發(fā)展成為人工智能領(lǐng)域中決策分析與模糊識別的一個(gè)重要方向,也成為數(shù)據(jù)挖掘技術(shù)中最重要的方法之一。
⑤決策樹:主要是應(yīng)用于分類與預(yù)測之中,展示出了一種在假設(shè)條件下會得到相應(yīng)數(shù)值的方法。通常一個(gè)決策樹表示一系列問題,每個(gè)分支表示不同條件下解決問題所能得到的值。決策樹方法也可以理解為利用圖形解析的方法展示出訓(xùn)練集中的數(shù)據(jù)收到不同變量而變化的預(yù)測的模型。數(shù)據(jù)挖掘中的決策樹是一種經(jīng)常采用的技術(shù),常用的算法有CART、CHAID、ID3和C5.0等。
市場預(yù)測精準(zhǔn)性的不高,在一定程度上制約著物流行業(yè)的發(fā)展。我國發(fā)展初期,受當(dāng)時(shí)計(jì)劃經(jīng)濟(jì)的影響,許多企業(yè)采用傳統(tǒng)經(jīng)營模式的組織方式。通過企業(yè)內(nèi)部的、專門的采購運(yùn)輸部門根據(jù)國家需求計(jì)劃進(jìn)行原材料采購和成品銷售。隨著我國經(jīng)濟(jì)體制改革,市場在資源配置中起決定性作用,市場需求預(yù)測逐漸成為現(xiàn)代企業(yè)組織生產(chǎn)的一個(gè)重要的參考依據(jù),尤其是港航、鐵路、航空運(yùn)輸?shù)刃袠I(yè),市場需求預(yù)測在一定程度上決定各行業(yè)未來的運(yùn)營投入,決定著企業(yè)未來的發(fā)展方向。因此,市場的精準(zhǔn)預(yù)測在一定程度上影響著現(xiàn)代物流業(yè)的發(fā)展。而現(xiàn)代物流中的精準(zhǔn)預(yù)測只有在少數(shù)的經(jīng)濟(jì)發(fā)達(dá)地區(qū)和一些擁有先進(jìn)管理經(jīng)驗(yàn)的企業(yè)中得到發(fā)展。在欠發(fā)達(dá)區(qū)域,物流行業(yè)還是保持著傳統(tǒng)運(yùn)營方式,物流一體化、社會化、市場化的程度相對較低,在一定程度影響和限制了高效的企業(yè)運(yùn)營。所以說,市場預(yù)測精準(zhǔn)性在一定程度上制約著我國現(xiàn)代物流業(yè)的快速發(fā)展。
盡管近年來我國物流業(yè)發(fā)展勢頭迅猛,但與西方發(fā)達(dá)國家相比仍然有明顯差距,主要體現(xiàn)在物流管理運(yùn)營水平上,尤其是倉儲管理水平與客戶分析等方面。由于我國百分之六十左右的物流企業(yè)還停留在傳統(tǒng)的運(yùn)輸和倉儲方面,對物流企業(yè)的管理運(yùn)營水平投入較少,這就導(dǎo)致了我國物流企業(yè)規(guī)模較小,數(shù)量較少,缺少核心競爭力的物流業(yè)發(fā)展現(xiàn)象。溯其根源主要有兩方面原因:一是我國物流企業(yè)集中于車輛運(yùn)輸方面的投入,倉儲管理投入相對較少,尤其是在倉庫庫位設(shè)計(jì),流程優(yōu)化,揀貨效率,倉容利用率等方面。這造成了倉庫管理缺少企業(yè)特色和專業(yè)競爭力;二是我國物流企業(yè)對潛在客戶分析深度不夠,不善于挖掘深層次客戶需求、開發(fā)增值服務(wù)、滿足客戶個(gè)性化需求。
傳統(tǒng)的物流運(yùn)營模式常常專注于某一區(qū)域或者某一領(lǐng)域的物流活動,尤其體現(xiàn)在物流中心選址時(shí)缺乏系統(tǒng)思維,這導(dǎo)致物流行業(yè)的發(fā)展水平不一致。對于現(xiàn)代物流業(yè)而言,物流企業(yè)依托物流中心規(guī)劃進(jìn)行企業(yè)設(shè)計(jì)布局,存在一定的局限性,主要體現(xiàn)在路徑規(guī)劃方面,由于相對應(yīng)物流中心特定選址,會出現(xiàn)貨物運(yùn)輸距離增長,運(yùn)輸時(shí)間加長等問題。因此,這在一定程度上制約著我國綜合物流體系建設(shè)。
數(shù)據(jù)挖掘在物流管理中有三大優(yōu)勢:①物流管理中挖掘信息更加貼合顧客需求;②數(shù)據(jù)挖掘使物流管理更加準(zhǔn)確、科學(xué)、高效;③物流決策更加依托數(shù)據(jù)挖掘技術(shù)的支持[5]。
計(jì)算機(jī)網(wǎng)絡(luò)信息技術(shù)的快速發(fā)展,為現(xiàn)代物流的實(shí)時(shí)交互提供了可能。越來越多的學(xué)者將研究的重點(diǎn)由原來單一化逐漸向多元化轉(zhuǎn)變,這逐漸形成了多學(xué)科之間相互滲透的發(fā)展趨勢,這也就為現(xiàn)在的數(shù)據(jù)挖掘技術(shù)在物流領(lǐng)域的應(yīng)用打下了良好的基礎(chǔ)。隨著交叉學(xué)科的進(jìn)一步發(fā)展,目前數(shù)據(jù)挖掘技術(shù)在物流領(lǐng)域則主要應(yīng)用于市場的預(yù)測,物流中心選擇,路徑優(yōu)化,優(yōu)化倉儲管理,客戶價(jià)值分析和物流需求等方面。主要可以歸納為以下三個(gè)方面。
現(xiàn)代物流活動中,由于涉及到三種源流的相互影響,在各個(gè)環(huán)節(jié)中都會產(chǎn)生大量的物流數(shù)據(jù),增加了物流企業(yè)的決策難度,使企業(yè)決策存在更多的隨機(jī)性、復(fù)雜性以及不確定性,尤其體現(xiàn)在路徑優(yōu)化、物流中心選址等方面。由于物流中心選址是綜合物流體系構(gòu)建過程中最為重要的部分,直接決定著總成本(運(yùn)輸成本、固定成本和變動成本)最小化的問題。因此,在選址時(shí)需要考慮中心點(diǎn)分布情況和數(shù)量,特別是構(gòu)建區(qū)域物流綜合體系時(shí),多中心選址問題更為復(fù)雜,需要涉及到路徑優(yōu)化、交通運(yùn)輸條件、地理?xiàng)l件、顧客分布和中心點(diǎn)分布情況等一系列問題。這些問題中路徑優(yōu)化又直接影響到運(yùn)輸成本的高低,這無疑就增加了物流決策的難度。而數(shù)據(jù)挖掘可以利用分類樹法和遺傳算法求解多目標(biāo)的優(yōu)化方法進(jìn)行解決。這在一定程度上為決策者提供了參考依據(jù)。
國內(nèi)學(xué)者對需求預(yù)測的研究始于二十世紀(jì)初,物流預(yù)測主要集中在市場供應(yīng)與需求情況、經(jīng)濟(jì)、運(yùn)輸?shù)确矫妗F渲饕蚴鞘袌龈偁幖觿?,從而迫使物流企業(yè)深度挖掘可用數(shù)據(jù)資源拓展業(yè)務(wù)、開發(fā)客戶、提高利潤、增強(qiáng)核心競爭力。根據(jù)產(chǎn)品特性制定合理的庫存方法和運(yùn)輸策略,建立相應(yīng)預(yù)測模型并進(jìn)行精準(zhǔn)預(yù)測,可達(dá)到提前預(yù)測市場的目的。在我國大型港航運(yùn)輸類企業(yè)中,需求預(yù)測就顯得更為重要,港口企業(yè)可以根據(jù)近年數(shù)據(jù)建立適當(dāng)?shù)幕貧w預(yù)測模型,例如,王錫淮等針對上海港集裝箱吞吐量預(yù)測年度數(shù)據(jù)預(yù)測利用基于徑向基函數(shù)的神經(jīng)網(wǎng)絡(luò)預(yù)測模型,使預(yù)測精度有了進(jìn)一步提升[6]。樂美龍等提出了一個(gè)新的非線性系統(tǒng)預(yù)測方法是基于遺傳規(guī)劃方法的集裝箱吞吐量預(yù)測模型,并將該模型運(yùn)用于寧波港集裝箱吞吐量的預(yù)測中,利用寧波港的集裝箱歷史數(shù)據(jù)訓(xùn)練和檢測樣本、預(yù)測寧波港未來九年的集裝箱發(fā)展趨勢[7]。根據(jù)預(yù)測結(jié)果進(jìn)行港口發(fā)展戰(zhàn)略部署,為我國成為航運(yùn)強(qiáng)國奠定堅(jiān)實(shí)基礎(chǔ)。
數(shù)據(jù)挖掘在現(xiàn)代物流業(yè)的應(yīng)用的一個(gè)重要方面集中于運(yùn)營管理方面,特別是客戶分析和倉儲管理等方面?,F(xiàn)代物流企業(yè)需要完善新的運(yùn)營管理模式以提高企業(yè)新的利潤增長點(diǎn)。而客戶價(jià)值分析就通過交叉銷售、客戶忠誠滿意度、客戶價(jià)值細(xì)分以及客戶流失等方面分析,制定個(gè)性化方案去滿足客戶特定需求。一般可以利用決策樹對客戶關(guān)系進(jìn)行細(xì)分,發(fā)現(xiàn)其中潛在規(guī)律,更好地針對不同客戶群體進(jìn)行定制化服務(wù),從而建立并維持客戶關(guān)系,增加企業(yè)的利潤。同時(shí),根據(jù)挖掘大客戶數(shù)據(jù),了解個(gè)性需求,然后根據(jù)大客戶的需求優(yōu)化倉庫管理模式,實(shí)施固定貨位預(yù)留,減少第三方租賃倉庫租金,優(yōu)先中轉(zhuǎn)貨物等舉措,增強(qiáng)客戶粘稠度,培養(yǎng)固定客戶群體,拓展新的業(yè)務(wù)模式。還可以利用數(shù)據(jù)挖掘技術(shù)中的關(guān)聯(lián)分析法優(yōu)化倉庫儲存,運(yùn)用合理安排普通客戶的商品儲存、擺放位置、提高貨物分揀效率,壓縮商品存貨成本等措施吸引普通客戶群體。因此,將大客戶與普通客戶進(jìn)行價(jià)值分析,完善運(yùn)營管理模式可以進(jìn)一步的提高物流企業(yè)利潤增長點(diǎn),提升核心競爭力,促進(jìn)現(xiàn)代物流業(yè)的發(fā)展。
數(shù)據(jù)挖掘技術(shù)已經(jīng)在商業(yè)、金融、通信、施工等領(lǐng)域廣泛應(yīng)用,并取得了較為滿意的結(jié)果。隨著我國現(xiàn)代物流業(yè)的發(fā)展,數(shù)據(jù)挖掘技術(shù)將會應(yīng)用在物流運(yùn)營的各個(gè)環(huán)節(jié)之中。大數(shù)據(jù)的時(shí)代已經(jīng)到來,傳統(tǒng)的數(shù)據(jù)處理模式已經(jīng)不能滿足現(xiàn)代物流業(yè)的發(fā)展,這就需要物流企業(yè)根據(jù)自身情況,從基本的數(shù)據(jù)挖掘應(yīng)用方面著手,不斷地開展新的領(lǐng)域的應(yīng)用,促進(jìn)現(xiàn)代物流業(yè)的發(fā)展。