程麗麗
(臺(tái)州職業(yè)技術(shù)學(xué)院,浙江臺(tái)州318000)
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的高速發(fā)展,為網(wǎng)絡(luò)商店的繁盛提供了技術(shù)的支持、交易的平臺(tái)和豐富的資源。網(wǎng)絡(luò)商店已經(jīng)由小規(guī)模不斷發(fā)展為大規(guī)模,而傳統(tǒng)的網(wǎng)絡(luò)商店的人工管理方式,已經(jīng)無(wú)法適應(yīng)快速發(fā)展的需求。越來(lái)越多的網(wǎng)絡(luò)商店考慮使用電子化的信息管理系統(tǒng)來(lái)代替人工管理方式,提高運(yùn)營(yíng)效率,增加收益。
傳統(tǒng)的信息管理系統(tǒng)中數(shù)據(jù)庫(kù)技術(shù)的應(yīng)用往往將關(guān)注的重點(diǎn)放在如何進(jìn)行日常業(yè)務(wù)的處理、如何實(shí)現(xiàn)數(shù)據(jù)的收集、查詢、存儲(chǔ)、統(tǒng)計(jì)、處理等功能,更多的是數(shù)據(jù)事務(wù)系統(tǒng)。隨著網(wǎng)絡(luò)商店的數(shù)量不斷遞增,規(guī)模不斷擴(kuò)大,對(duì)系統(tǒng)的要求不是僅局限于數(shù)據(jù)的一般事務(wù)處理,而是如何借助系統(tǒng),把原始的銷(xiāo)售經(jīng)營(yíng)數(shù)據(jù)轉(zhuǎn)化為網(wǎng)絡(luò)商店決策支持的價(jià)值信息,獲取最大的競(jìng)爭(zhēng)優(yōu)勢(shì),搶占市場(chǎng)。
數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的應(yīng)用則能夠解決目前網(wǎng)絡(luò)商店經(jīng)營(yíng)者思考的問(wèn)題,彌補(bǔ)傳統(tǒng)的數(shù)據(jù)庫(kù)技術(shù)在分析應(yīng)用、決策支持上的缺陷[1],快速、準(zhǔn)確、高效地從大量的歷史數(shù)據(jù)、報(bào)表、單據(jù)中萃取信息,獲得知識(shí)。數(shù)據(jù)倉(cāng)庫(kù)是研究和解決從數(shù)據(jù)庫(kù)中獲取信息的問(wèn)題,是決策支持系統(tǒng)和聯(lián)機(jī)分析應(yīng)用數(shù)據(jù)源的結(jié)構(gòu)化數(shù)據(jù)環(huán)境,它的特點(diǎn)是面向主題的、集成的、穩(wěn)定的和時(shí)變的[2]。數(shù)據(jù)倉(cāng)庫(kù)是分析系統(tǒng)的數(shù)據(jù)平臺(tái),為用戶提供分析和決策的支持,把有價(jià)值的分析數(shù)據(jù)從事務(wù)處理環(huán)境中提取出來(lái)進(jìn)行重新組織,同時(shí)建立分析處理的環(huán)境[3]。
目前網(wǎng)絡(luò)商店數(shù)量急速增加,經(jīng)營(yíng)者與客戶是一種距離交易方式,這和實(shí)體店的面對(duì)面交易方式有很大的不同,提高網(wǎng)店的點(diǎn)擊率、吸引顧客的眼球、獲得良好的信譽(yù)評(píng)價(jià)、提高網(wǎng)店的等級(jí)等等都是網(wǎng)店經(jīng)營(yíng)者所關(guān)心的問(wèn)題。如何將利益最大化、如何摸清市場(chǎng)需求、如何組織銷(xiāo)售行為、如何控制庫(kù)存、如何尋找最優(yōu)供應(yīng)商、如何分析客戶群等等都成為了經(jīng)營(yíng)者亟待解決的問(wèn)題。
數(shù)據(jù)倉(cāng)庫(kù)可以保證對(duì)業(yè)務(wù)數(shù)據(jù)的便捷訪問(wèn),解決負(fù)責(zé)的問(wèn)題。通過(guò)對(duì)大量原始數(shù)據(jù)的分析,幫助網(wǎng)絡(luò)商店經(jīng)營(yíng)者解決最關(guān)心、最敏感的問(wèn)題,這些問(wèn)題中可能是如何選擇商品打造爆款、熱銷(xiāo)款;如何對(duì)商品進(jìn)行布局設(shè)計(jì)、組合設(shè)計(jì),以提高銷(xiāo)量;如何控制庫(kù)存,保證爆款熱銷(xiāo)商品的有效供應(yīng),如何對(duì)滯銷(xiāo)商品進(jìn)行庫(kù)存清倉(cāng);如何對(duì)市場(chǎng)需求進(jìn)行預(yù)測(cè),保證商品采購(gòu)的合理提前期;如何對(duì)商品評(píng)價(jià)結(jié)果進(jìn)行分析,尋找客戶最關(guān)心的問(wèn)題,并解決問(wèn)題。
這些問(wèn)題,可以通過(guò)建立基于數(shù)據(jù)倉(cāng)庫(kù)的網(wǎng)絡(luò)商店決策支持系統(tǒng),利用數(shù)據(jù)挖掘技術(shù),獲得有價(jià)值的決策信息,在日益激烈的網(wǎng)絡(luò)商店競(jìng)爭(zhēng)中脫穎而出。
數(shù)據(jù)倉(cāng)庫(kù)是在原有的數(shù)據(jù)庫(kù)系統(tǒng)的基礎(chǔ)上,利用抽取、轉(zhuǎn)換、裝載等方法去分析、集成和挖掘現(xiàn)有的數(shù)據(jù)資源,為管理者提供決策支持[4]。數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)由三部分組成,分別是數(shù)據(jù)獲取、數(shù)據(jù)存儲(chǔ)管理和數(shù)據(jù)展現(xiàn),基于數(shù)據(jù)倉(cāng)庫(kù)的網(wǎng)絡(luò)商店決策支持系統(tǒng)體系結(jié)構(gòu)如圖1。
在該三層結(jié)構(gòu)中,我們把它分為四個(gè)部分,分別為:處理對(duì)象、核心構(gòu)件、手段方法、工具。
(1)處理對(duì)象。也就是數(shù)據(jù)源,數(shù)據(jù)源作為該系統(tǒng)的處理對(duì)象,是整個(gè)系統(tǒng)數(shù)據(jù)的源泉。一般分為企業(yè)的內(nèi)部信息和外部信息,在這里數(shù)據(jù)源主要包括:計(jì)劃信息、銷(xiāo)售信息、庫(kù)存信息、采購(gòu)信息、物流信息、客戶信息、供應(yīng)商信息和評(píng)價(jià)、流量信息等。
(2)核心構(gòu)件。數(shù)據(jù)倉(cāng)庫(kù)是整個(gè)系統(tǒng)的核心部分。其關(guān)鍵在于對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)和管理。數(shù)據(jù)倉(cāng)庫(kù)的組織方式與傳統(tǒng)的數(shù)據(jù)庫(kù)有所不同,它能夠決定對(duì)外部數(shù)據(jù)的表現(xiàn)形式[5]。要選擇產(chǎn)品和技術(shù)來(lái)建立數(shù)據(jù)倉(cāng)庫(kù),需要從數(shù)據(jù)倉(cāng)庫(kù)技術(shù)特點(diǎn)入手,對(duì)現(xiàn)有的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)進(jìn)行抽取、清理,并有效集成。
(3)手段方法。借助數(shù)據(jù)挖掘和聯(lián)機(jī)分析,聯(lián)機(jī)分析主要是對(duì)需要的數(shù)據(jù)進(jìn)行有效集成,按多維模型予以組織,以便進(jìn)行多角度、多層次的分析,并發(fā)現(xiàn)趨勢(shì)[6]。數(shù)據(jù)挖掘主要是面向具體的應(yīng)用,并不是簡(jiǎn)單的數(shù)據(jù)處理和操作,它能夠?yàn)槟骋粋€(gè)具體的應(yīng)用尋找可行的、合理的方案,為各級(jí)決策者提供支持,提高效益,節(jié)約成本。
(4)工具。工具主要是指前端工具,主要包括各種報(bào)表工具、查詢工具、數(shù)據(jù)分析工具、數(shù)據(jù)挖掘工具以及各種基于數(shù)據(jù)倉(cāng)庫(kù)或數(shù)據(jù)集市的應(yīng)用開(kāi)發(fā)工具[7]。其中數(shù)據(jù)分析工具主要針對(duì)OLAP服務(wù)器,報(bào)表工具、數(shù)據(jù)挖掘工具主要針對(duì)數(shù)據(jù)倉(cāng)庫(kù)。
基于數(shù)據(jù)倉(cāng)庫(kù)的系統(tǒng)結(jié)構(gòu)主要采用了自底向上的開(kāi)發(fā)模式,由數(shù)據(jù)驅(qū)動(dòng),以技術(shù)支撐,滿足應(yīng)用需求,逐漸完善的開(kāi)發(fā)過(guò)程,可根據(jù)用戶的反饋信息調(diào)整應(yīng)用需求。
數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、隨時(shí)間不斷變化的數(shù)據(jù)集合,對(duì)庫(kù)存信息、采購(gòu)信息、物流信息、客戶信息、供應(yīng)商信息、評(píng)價(jià)流量信息等業(yè)務(wù)數(shù)據(jù)進(jìn)行重組。
對(duì)于網(wǎng)絡(luò)商店數(shù)據(jù)倉(cāng)庫(kù)來(lái)講,其主要數(shù)據(jù)源有兩個(gè):一個(gè)是來(lái)源于網(wǎng)絡(luò)商店的外部,例如:物流信息、客戶信息、供應(yīng)商信息、評(píng)價(jià)流量信息,這些信息對(duì)于網(wǎng)絡(luò)商店來(lái)講一般是只讀的;另一個(gè)是來(lái)源于網(wǎng)絡(luò)商店內(nèi)部,例如:計(jì)劃信息、銷(xiāo)售信息、庫(kù)存信息、采購(gòu)信息等,這些數(shù)據(jù)來(lái)源于不同的對(duì)象,如電子商務(wù)平臺(tái)、網(wǎng)絡(luò)商店管理系統(tǒng)等。
網(wǎng)絡(luò)商店數(shù)據(jù)倉(cāng)庫(kù)的維度設(shè)計(jì),從供應(yīng)鏈的角度來(lái)看,其維度設(shè)計(jì)如下表1。
表1 維度設(shè)計(jì)表
在這些維度項(xiàng)中,可以將2個(gè)或2個(gè)以上的維護(hù)組合,分析出可供決策的信息。例如,時(shí)間維可和商品維進(jìn)行組合分析,得出某種商品的銷(xiāo)售、庫(kù)存、采購(gòu)的變化。再如,商品維、時(shí)間維和流量維組合分析,得出某種商品的流量變化等等??梢詾榫W(wǎng)絡(luò)商店管理者提供某種商品的銷(xiāo)售預(yù)測(cè)情況,提供決策支持。
粒度是數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)單元的細(xì)節(jié)程度或綜合程度的級(jí)別。它可以對(duì)數(shù)據(jù)或數(shù)據(jù)綜合所使用的時(shí)間段參數(shù)進(jìn)行記錄,決定了數(shù)據(jù)倉(cāng)庫(kù)中所存儲(chǔ)的數(shù)據(jù)在時(shí)間上的級(jí)別和詳細(xì)程度。
在進(jìn)行粒度設(shè)計(jì)時(shí)數(shù)據(jù)可以是最原始的數(shù)據(jù)(關(guān)注細(xì)節(jié)的),也可以是匯總數(shù)據(jù),例如1周的、1月的、1季度的、半年的、1年的等等。數(shù)據(jù)的粒度隨著時(shí)間跨度的增大而逐漸變粗。時(shí)間細(xì)化程度越高,粒度越小,時(shí)間細(xì)化程度越低,粒度越大。
針對(duì)網(wǎng)絡(luò)商店自身的特點(diǎn),將銷(xiāo)售分析、庫(kù)存分析、采購(gòu)分析問(wèn)題中的粒度進(jìn)行如下表2劃分。
表2 粒度設(shè)計(jì)表
多維數(shù)據(jù)模型由多維數(shù)據(jù)結(jié)構(gòu)和多維數(shù)據(jù)操作組成。多維數(shù)據(jù)模型是由星形模型、雪花模型和星座模型構(gòu)建,它是OLAP的邏輯模型。通過(guò)維度設(shè)計(jì),尋找需要觀察的特定角度,而每一個(gè)維的粒度就是維的層次數(shù)。維中的成員就代表該維上的一個(gè)確定取值。以時(shí)間維為例,其粒度有日期、周數(shù)、月份、季度、年、節(jié)假日。月份粒度上有1到12個(gè)月,季度有1到4季度。再如在商品維上粒度商品類別有新品、折扣品、清倉(cāng)品等。多維數(shù)據(jù)模型多采用多維數(shù)組的表現(xiàn)形式:(維1,維2,維3……,維n,變量)。
在基于數(shù)據(jù)倉(cāng)庫(kù)的網(wǎng)絡(luò)商店決策支持系統(tǒng)中,將主題分為三個(gè):銷(xiāo)售主題、倉(cāng)庫(kù)主題、采購(gòu)主題,其星型模型如下圖2。
在基于數(shù)據(jù)倉(cāng)庫(kù)的網(wǎng)絡(luò)商店決策支持系統(tǒng)體系結(jié)構(gòu)中前臺(tái)工具可以提供報(bào)表生成工具,借助諸如交互式窗口、聯(lián)機(jī)幫助、向?qū)浇缑娴确绞?,幫助用戶定義各種復(fù)雜的報(bào)表,實(shí)現(xiàn)多維分析、隨機(jī)查詢、統(tǒng)計(jì)分析等功能,在滿足現(xiàn)有數(shù)據(jù)源的基礎(chǔ)上,為不同決策層提供相對(duì)有價(jià)值數(shù)據(jù)的提取、轉(zhuǎn)換、展現(xiàn)[8]。通過(guò)數(shù)據(jù)分析展現(xiàn)工具對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)進(jìn)行挖掘和多維分析、匯總,并以報(bào)表、圖表、交互式界面的形式展現(xiàn)給決策者,決策者可以很直觀地看到分析的結(jié)果。針對(duì)用戶的不同對(duì)工具進(jìn)行合理選擇,可以對(duì)可變報(bào)表、固定報(bào)表進(jìn)行在線分析處理。
數(shù)據(jù)倉(cāng)庫(kù)可以有效地彌補(bǔ)傳統(tǒng)數(shù)據(jù)庫(kù)在分析型應(yīng)用上的缺陷,從歷史數(shù)據(jù)中獲取有價(jià)值的信息。利用數(shù)據(jù)挖掘技術(shù)解決網(wǎng)絡(luò)商店管理過(guò)程中有關(guān)決策支持方面的諸多問(wèn)題。
第一,商品的擺放、搭配。在這里可以選擇商品銷(xiāo)售活動(dòng)(促銷(xiāo))為維度對(duì)銷(xiāo)售主題進(jìn)行分析,將商品的擺放、搭配放在一起。也可以選擇時(shí)間作為維度對(duì)銷(xiāo)售主題進(jìn)行分析,將同一段時(shí)間內(nèi),銷(xiāo)售量相似的商品擺放、搭配在一起,并可考慮參加相同的銷(xiāo)售活動(dòng)。
第二,爆款商品的選擇。可以通過(guò)改進(jìn)的BP算法、聚類算法對(duì)同一個(gè)時(shí)間段內(nèi)的商品銷(xiāo)售量進(jìn)行分析,找出暢銷(xiāo)商品和滯銷(xiāo)商品,分析商品的發(fā)展規(guī)律,對(duì)市場(chǎng)的變化進(jìn)行分析,選擇順應(yīng)市場(chǎng)變化的商品,并對(duì)爆款商品進(jìn)行挖掘、開(kāi)發(fā)、設(shè)計(jì)、打造,同時(shí)控制滯銷(xiāo)商品。
第三,商品銷(xiāo)售活動(dòng)(促銷(xiāo))策略選擇??山柚鷽Q策樹(shù)、因果圖的方法分析購(gòu)買(mǎi)某種商品的客戶行為,根據(jù)其購(gòu)買(mǎi)行為對(duì)客戶群進(jìn)行分組、針對(duì)客戶的屬性,例如,性別、年齡等有針對(duì)性地策劃廣告和促銷(xiāo)活動(dòng)。也可針對(duì)商品在某一時(shí)間段內(nèi)的銷(xiāo)售情況或商品本身的屬性,設(shè)計(jì)促銷(xiāo)活動(dòng)。例如,對(duì)于大單客戶可設(shè)計(jì)贈(zèng)送會(huì)員卡、積分等方式,刺激這類客戶的二次甚至多次消費(fèi)。對(duì)于新客戶,可設(shè)計(jì)贈(zèng)送小禮品等方式。提高網(wǎng)店的瀏覽量和人氣。
第四,銷(xiāo)售預(yù)測(cè)??蛇x擇時(shí)間維,對(duì)商品的銷(xiāo)售情況進(jìn)行分析,爆款商品保證庫(kù)存充足,滯銷(xiāo)商品采取促銷(xiāo)活動(dòng),清空庫(kù)存。并根據(jù)市場(chǎng)需求情況進(jìn)行預(yù)測(cè),提前補(bǔ)足庫(kù)存,提前設(shè)計(jì)促銷(xiāo)活動(dòng)。
第五,庫(kù)存動(dòng)態(tài)控制。選擇時(shí)間作為庫(kù)存監(jiān)控的維度,分析庫(kù)存隨時(shí)間的變化情況。計(jì)算商品的安全庫(kù)存、最大庫(kù)存,通過(guò)庫(kù)存動(dòng)態(tài)控制保證資金的最大程度流通。
第六,采購(gòu)分析。這里采購(gòu)分析包含供應(yīng)商選擇,商品詢價(jià),成本計(jì)算等等。建立供應(yīng)商評(píng)估體系,結(jié)合時(shí)間維度變化、商品維度變化對(duì)供應(yīng)商選擇進(jìn)行支持。
在目前激烈的網(wǎng)絡(luò)商店競(jìng)爭(zhēng)環(huán)境中,建立基于數(shù)據(jù)倉(cāng)庫(kù)的決策支持系統(tǒng),對(duì)數(shù)據(jù)進(jìn)行挖掘、分析,為管理者提供快速、高效、方便、準(zhǔn)確的決策支持。通過(guò)對(duì)源數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換后裝載到數(shù)據(jù)倉(cāng)庫(kù)中去。本文對(duì)基于數(shù)據(jù)倉(cāng)庫(kù)的網(wǎng)絡(luò)商店決策支持系統(tǒng)進(jìn)行研究,構(gòu)建其體系結(jié)構(gòu)。同時(shí)對(duì)維度、粒度、多維數(shù)據(jù)模型進(jìn)行設(shè)計(jì),實(shí)現(xiàn)數(shù)據(jù)倉(cāng)庫(kù)建模。提供一個(gè)信息集成和決策的平臺(tái),實(shí)現(xiàn)對(duì)信息進(jìn)行聯(lián)機(jī)分析處理,構(gòu)建數(shù)據(jù)分析環(huán)境,將原始的經(jīng)營(yíng)數(shù)據(jù)轉(zhuǎn)化為商業(yè)決策信息,獲取競(jìng)爭(zhēng)優(yōu)勢(shì)。
[1]王柳靖,黎勇,王一川.基于內(nèi)容管理的煙草企業(yè)信息倉(cāng)庫(kù)系統(tǒng)[J].計(jì)算機(jī)工程,2010,36(23):40-43,46.
[2]張波,耿在丹,杜保強(qiáng).基于數(shù)據(jù)倉(cāng)庫(kù)的學(xué)生信息管理決策系統(tǒng)[J].實(shí)驗(yàn)室研究與探索,2009,(12):59-62.
[3]馬剛,劉天時(shí),程國(guó)建.基于數(shù)據(jù)倉(cāng)庫(kù)技術(shù)的醫(yī)院信息系統(tǒng)應(yīng)用研究[J].西安石油大學(xué)學(xué)報(bào)(自然科學(xué)),2010,(7):99-102.
[4]李潔,楊金會(huì),滕振芳.數(shù)據(jù)倉(cāng)庫(kù)及數(shù)據(jù)挖掘技術(shù)在超市中的應(yīng)用[J].吉林工程技術(shù)師范學(xué)院學(xué)報(bào),2010(2):248-250.
[5]王炳雪,陳元忠.基于模糊邏輯的多維時(shí)序軟關(guān)聯(lián)規(guī)則挖掘[J].計(jì)算機(jī)工程,2011,37(10):35-37.
[6]譚鋒奇,李洪奇,孟照旭等.數(shù)據(jù)挖掘方法在石油勘探開(kāi)發(fā)中的應(yīng)用研究[J].石油地球物理勘探,2010,(1):85-91.
[7]魏德志,洪聯(lián)系,林麗娜等.一種基于HGA和數(shù)據(jù)挖掘的AMG模型[J].計(jì)算機(jī)工程,2012,38(7):99-101.
[8]張維群.數(shù)據(jù)挖掘研究和應(yīng)用的現(xiàn)狀與前景[J].統(tǒng)計(jì)與信息論壇,2004,(01):95-96.