□高 宇 閆娟娟 孫 健
電子商務(wù)主要是借助計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)以及遠(yuǎn)程通信技術(shù)來進(jìn)行的商業(yè)活動(dòng)。電子商務(wù)是現(xiàn)代信息技術(shù)和傳統(tǒng)經(jīng)濟(jì)相互融合的重要橋梁。Web數(shù)據(jù)挖掘?qū)儆谝豁?xiàng)綜合性技術(shù),是科技發(fā)展的重要標(biāo)志,能夠有效地促進(jìn)電子商務(wù)行業(yè)的發(fā)展。
Web挖掘?qū)儆谝豁?xiàng)綜合技術(shù),主要指的是數(shù)據(jù)挖掘在Web上的應(yīng)用,它通過數(shù)據(jù)挖掘技術(shù)從和Internet相關(guān)的資源以及行為中選擇大量的、有用的模式和隱含信息,以此提高Web技術(shù)的工作效率,包括Web技術(shù)、計(jì)算機(jī)語言學(xué)、統(tǒng)計(jì)學(xué)等各方面內(nèi)容。Web數(shù)據(jù)挖掘的最終目的就是從Web的訪問記錄中選擇對用戶有利的模式,而計(jì)算機(jī)服務(wù)器中則記錄了用戶的訪問信息,借助于Web數(shù)據(jù)挖掘技術(shù)就能夠根據(jù)用戶的訪問情況和興趣來調(diào)整頁面結(jié)構(gòu),進(jìn)行有效的電子商務(wù)活動(dòng),進(jìn)而滿足廣大用戶的不同需要。Web數(shù)據(jù)挖掘技術(shù)主要分為三種類型Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘和Web使用挖掘。挖掘?qū)ο笾饕ǎ篧eb數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫、空間數(shù)據(jù)庫、時(shí)序數(shù)據(jù)庫、DNA數(shù)據(jù)庫等;挖掘方法主要分為:統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)方法以及數(shù)據(jù)庫方法等;根據(jù)開采目標(biāo)主要分為:關(guān)聯(lián)規(guī)則、分類、聚類、時(shí)間序列預(yù)測模型發(fā)現(xiàn)以及時(shí)序模式發(fā)現(xiàn)等。
(一)Web內(nèi)容挖掘。Web內(nèi)容挖掘主要是挖掘Web頁面內(nèi)容和后臺(tái)交易數(shù)據(jù)庫。按照網(wǎng)絡(luò)內(nèi)容、文檔和數(shù)據(jù)要求,從海量信息中選擇出有價(jià)值的數(shù)據(jù)信息,然后顯示出各種數(shù)據(jù)信息之間的關(guān)系,最終實(shí)現(xiàn)挖掘出網(wǎng)絡(luò)數(shù)據(jù)中或者文檔中隱藏的一些有用內(nèi)容。網(wǎng)絡(luò)容納了豐富多樣的資源信息,例如視頻、音頻、文本和圖像等類型的數(shù)據(jù)信息,依據(jù)這些數(shù)據(jù)類型,能夠把Web內(nèi)容挖掘劃分成兩種形式,媒體挖掘以及文本挖掘,目前文本挖掘被廣泛運(yùn)用,多媒體挖掘處于探索階段。
(二)Web結(jié)構(gòu)挖掘。因?yàn)閃eb頁面結(jié)構(gòu)較為豐富,有價(jià)值的信息不但隱藏在頁面的內(nèi)容當(dāng)中,也潛藏在頁面結(jié)構(gòu)當(dāng)中,因此,Web結(jié)構(gòu)挖掘是通過Web文檔之間的超鏈接結(jié)構(gòu)來分析數(shù)據(jù),選取有價(jià)值信息。Web超鏈接信息能夠把Web頁面內(nèi)容的相關(guān)性、質(zhì)量以及結(jié)構(gòu)方面的信息挖掘出來,顯示文檔之間的關(guān)系。也可以說Web結(jié)構(gòu)挖掘主要是挖掘隱藏的鏈接結(jié)構(gòu)模式,主要分為頁面鏈接之間的關(guān)系、文檔結(jié)構(gòu)等方面內(nèi)容。
(三)Web使用挖掘。Web使用挖掘技術(shù)也就是日志挖掘,該項(xiàng)挖掘被廣泛應(yīng)用于電子商務(wù)領(lǐng)域。主要是經(jīng)過挖掘用戶訪問的Web服務(wù)器的相關(guān)記錄,挖掘出用戶訪問Web頁面采用的模式、興趣點(diǎn)和訪問頻率,掌握用戶使用情況,從而挖掘出更多的潛在用戶。一般挖掘用戶使用記錄信息的途徑分為分析日志文件和搜集、分析用戶對事件的點(diǎn)擊來獲取用戶的導(dǎo)航行為。運(yùn)用Web使用挖掘技術(shù),能夠分析用戶的歷史瀏覽記錄,掌握用戶的喜好,然后搜索引擎就能夠根據(jù)喜好來篩選和擴(kuò)展用戶的搜索結(jié)果。由此可見,Web日志的數(shù)據(jù)量大、內(nèi)容豐富、種類繁多。
在電子商務(wù)管理當(dāng)中,Web服務(wù)器可以自動(dòng)收集客戶瀏覽的信息數(shù)據(jù),然后以文本的形式保存這些日志數(shù)據(jù),并對這些數(shù)據(jù)進(jìn)行分析,選擇出最有價(jià)值的信息,以此作為商家決策的重要依據(jù),進(jìn)而提高電子商務(wù)管理效率。Web數(shù)據(jù)挖掘:第一,明確數(shù)據(jù)挖掘的目標(biāo);第二,準(zhǔn)備數(shù)據(jù),準(zhǔn)備數(shù)據(jù)的時(shí)候應(yīng)該搜索所有和業(yè)務(wù)對象相關(guān)的內(nèi)部以及外部數(shù)據(jù)信息,選擇和數(shù)據(jù)挖掘應(yīng)用相適應(yīng)的數(shù)據(jù)。接著對這些數(shù)據(jù)進(jìn)行分析,來確定挖掘操作類型,把數(shù)據(jù)轉(zhuǎn)換為一個(gè)具體的分析模型,這是數(shù)據(jù)挖掘成功與否的核心環(huán)節(jié);第三,挖掘經(jīng)過轉(zhuǎn)換的數(shù)據(jù);第四,分析挖掘結(jié)果;第五,把分析到知識(shí)應(yīng)用到電子商務(wù)業(yè)務(wù)管理系統(tǒng)當(dāng)中。使用Web數(shù)據(jù)挖掘來分析用戶的訪問信息和訪問模式,根據(jù)用戶的習(xí)慣、喜好等信息對網(wǎng)站進(jìn)行優(yōu)化,進(jìn)而滿足用戶的需求,也能使商家明確市場目標(biāo),提高其在市場中的競爭力。
(一)預(yù)處理。數(shù)據(jù)預(yù)處理的目標(biāo)是為了實(shí)現(xiàn)數(shù)據(jù)挖掘的輸入。因?yàn)閃eb日志數(shù)據(jù)量巨大,種類繁多雜亂,必須對日志數(shù)據(jù)進(jìn)行準(zhǔn)確的預(yù)處理,才能保證數(shù)據(jù)質(zhì)量。預(yù)處理是有數(shù)據(jù)清洗和事務(wù)識(shí)別兩部分構(gòu)成。Web挖掘預(yù)處理可以完成識(shí)別切分訪問日志中的各字段,依據(jù)KPI統(tǒng)計(jì)的需求,自動(dòng)生成不同訪問請求過濾數(shù)據(jù)的任務(wù),進(jìn)而提高數(shù)據(jù)預(yù)處理的功能。
(二)發(fā)現(xiàn)用戶訪問模式。采用統(tǒng)計(jì)學(xué)、模式識(shí)別、數(shù)據(jù)挖掘等方面的先進(jìn)技術(shù)分析和挖掘Web日記記錄中存在的規(guī)律,找出電子商務(wù)中的潛在客戶以及市場,根據(jù)客戶需求,改進(jìn)Web服務(wù)器的系統(tǒng)功能,進(jìn)行有針對性的電子商務(wù)活動(dòng)。
(三)模式分析。Web使用挖掘中的模式分析目的是為了發(fā)現(xiàn)最有效的模式,研發(fā)出多種Web分析技術(shù)以及工具來提高模式的使用效率。
(一)數(shù)據(jù)挖掘能夠優(yōu)化企業(yè)資源。數(shù)據(jù)挖掘可以給企業(yè)提高有效的決策依據(jù),幫助企業(yè)調(diào)整發(fā)展策略,增強(qiáng)企業(yè)整體實(shí)力。企業(yè)要想實(shí)現(xiàn)較高的利潤就需要采取有效的措施來降低成本。Web數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用,可以使企業(yè)準(zhǔn)確把握所有的過程業(yè)務(wù)環(huán)節(jié),而精準(zhǔn)了解各類庫存的數(shù)據(jù),能夠使企業(yè)合理分配資源,做好預(yù)算工作。例如根據(jù)數(shù)據(jù)來確定企業(yè)的整體廣告投放量,可以有效地降低成本。因此,做好數(shù)據(jù)挖掘方面的相關(guān)問題,能夠增強(qiáng)企業(yè)的競爭力,促進(jìn)企業(yè)發(fā)展。
(二)使用數(shù)據(jù)挖掘能夠使電子商務(wù)企業(yè)處理好和客戶之間的關(guān)系。企業(yè)盈利的對象是客戶,因此,必須滿足客戶的需求,才能提高企業(yè)的服務(wù)功能,進(jìn)而提升經(jīng)濟(jì)效益。目前電子商務(wù)企業(yè)都在研究如何挖掘客戶和怎樣滿足客戶的需求,假如能夠根據(jù)客戶的消費(fèi)情況和消費(fèi)能力以及興趣等方面進(jìn)行研究,可以把客戶的合理需要顯示出來,而數(shù)據(jù)挖掘技術(shù)的用戶畫像正好可以完成此項(xiàng)任務(wù)。這種功能能夠有效地提高客戶的滿意程度,長此以往,客戶就會(huì)非常信任電子商務(wù)商家,這是數(shù)據(jù)挖掘中的數(shù)據(jù)忠誠度的體現(xiàn),能夠幫助企業(yè)提高利潤。
(三)數(shù)據(jù)挖掘技術(shù)能夠提高電子商務(wù)企業(yè)的管理水平。有效的數(shù)據(jù)能夠幫助電子商務(wù)企業(yè)全面分析企業(yè)的內(nèi)在和外在發(fā)展?fàn)顩r。然后采取有效措施來改革和完善企業(yè)自身存在的不足,使企業(yè)的管理水平和效率得以提升。
綜上所述,處于大數(shù)據(jù)時(shí)代,數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中發(fā)揮著不可替代的作用。電子商務(wù)活動(dòng)當(dāng)中存在的海量信息和數(shù)據(jù)是電子商務(wù)活動(dòng)順利開展的前提,使用Web數(shù)據(jù)挖掘技術(shù)可以挖掘出電子商務(wù)中最有價(jià)值的信息,幫助企業(yè)合理決策,明確發(fā)展方向,提高經(jīng)濟(jì)效益。因此,Web數(shù)據(jù)挖掘和電子商務(wù)的融合能夠使電子商務(wù)企業(yè)獲得有價(jià)值的商業(yè)信息以及客戶信息,這對企業(yè)的發(fā)展有著重要意義。