陳 威
(湖南環(huán)境生物職業(yè)技術學院,湖南 衡陽 421005)
高校中的市場營銷與其他營銷模式相比綜合性和應用型更強,當前社會對于市場營銷合理手段的迫切需要,使其運作能力和開拓精神逐漸受到人們的重視。這就要求高校市場營銷應該將知識復合和能力培養(yǎng)2個方面結合,使其同步發(fā)展[1]。隨著當前市場競爭越來越激烈激烈,各個高校的市場營銷專業(yè)都在不斷探索全新的營銷道路和手段,在傳統(tǒng)高校中起決定性作用的是數(shù)據(jù)庫管理系統(tǒng),隨著近幾年來高校海量數(shù)據(jù)的增長,以及高校對數(shù)據(jù)處理的需求提升,已經(jīng)無法滿足當代高校市場營銷的基本需要和發(fā)展[2]。因此,當前相關領域研究人員正不斷地進行深入研究,尋找1種能夠自動分析數(shù)據(jù)、自動分類數(shù)據(jù),并對海量數(shù)據(jù)進行存儲的方法,從這些海量數(shù)據(jù)中預測其未來的變化,并及時找出可能存在異常的事務。網(wǎng)絡數(shù)據(jù)挖掘技術從出現(xiàn)以來就備受各界研究人員的重視,并逐漸成為1種具備價值意義的工程工具[3]。在對特定的用戶進行挖掘的過程中,由于數(shù)據(jù)量十分龐大,因此采用傳統(tǒng)的方式會造成計算壓力的增加。而網(wǎng)絡數(shù)據(jù)挖掘技術是1種利用分類、聚類和關聯(lián)分析等手段對數(shù)據(jù)進行分析和處理的手段。因此,為了有效提高高校市場營銷水平,針對上述傳統(tǒng)高校市場營銷當中數(shù)據(jù)庫存在的問題,開展高校市場營銷中網(wǎng)絡數(shù)據(jù)挖掘技術的應用研究。
為了提升高校市場營銷水平,該文在傳統(tǒng)高校市場營銷的基礎上,構建高校市場營銷數(shù)據(jù)倉庫,為后續(xù)網(wǎng)絡數(shù)據(jù)挖掘技術的應用提供場所。由于傳統(tǒng)關系型數(shù)據(jù)庫當中的數(shù)據(jù)通常已經(jīng)被抽象化和加工過,因此大部分字段很難被用戶所理解[4]。針對這一問題,為了提高數(shù)據(jù)倉庫中數(shù)據(jù)的利用率,對關系型數(shù)據(jù)庫當中的用戶難以理解的字段賦予全新的含義,以此為終端用戶和復雜數(shù)據(jù)庫技術應用之間構建橋梁[5]。該文從維、測度和類,3個方面對傳統(tǒng)高校市場營銷數(shù)據(jù)庫進行優(yōu)化,從而建立高校市場營銷數(shù)據(jù)倉庫。
首先,從維的角度出發(fā),針對傳統(tǒng)高校市場營銷數(shù)據(jù)庫當中某一字段或幾個字段進行提取、處理和組合,再經(jīng)過過濾的方式,使數(shù)據(jù)庫當中的數(shù)據(jù)資源能夠更加便于被用戶觀察和分析,其表達式:維=y(字段),其中y為某一過濾或處理函數(shù),利用該表達式可以對已經(jīng)經(jīng)過處理的數(shù)據(jù)庫字段進行表達。通過對該字段進行注解或重新定義,能夠讓用戶更加容易理解。同時,根據(jù)高校市場營銷的需要,可將字段分別注解為年維、季度維等,或按照不同地區(qū)注解為國家維、地區(qū)維等。
其次,從測度的角度出發(fā),對傳統(tǒng)高校市場營銷數(shù)據(jù)庫當中的數(shù)據(jù)進行評價,通過對數(shù)據(jù)庫當中的數(shù)字型字段進行過濾和集中處理,方便用戶對其進行理解。其表達是為:測度=x(字段),其中x表示為1種針對數(shù)字型數(shù)據(jù)的過濾和聚集處理函數(shù)[6]。通過聚集處理函數(shù),還可以完成對傳統(tǒng)高校市場營銷數(shù)據(jù)庫中各類數(shù)據(jù)信息的統(tǒng)計,將每條記錄的某一相同數(shù)字型字段進行統(tǒng)計,以此求解出不同數(shù)字型字段的平均數(shù)、最大值或最小值等。
最后,從類的角度出發(fā)。對傳統(tǒng)高校市場營銷數(shù)據(jù)庫中的字段進行歸類,將表現(xiàn)為相同維或測度的字段匯聚在1個集合當中,可以對維和測度在更大的范圍內(nèi)進行描述。這一劃分方式,在實際應用中只具有管理層面上的意義,而并不具有實際用途。
將上述3個方面不同的字段內(nèi)容,按照其相應的規(guī)則進行劃分并匯總,完成對高校市場營銷數(shù)據(jù)倉庫的構建。
在完成對高校市場營銷數(shù)據(jù)倉庫的構建后,為了實現(xiàn)對高校市場營銷數(shù)據(jù)倉庫中各類數(shù)據(jù)的深度挖掘,該文引入了網(wǎng)絡數(shù)據(jù)挖掘技術,并在編程思想的基礎上,引入Apriori算法,實現(xiàn)對無線網(wǎng)絡環(huán)境中高校市場營銷數(shù)據(jù)倉庫海量數(shù)據(jù)的文本分類[7]。在分類的過程中將高校市場營銷數(shù)據(jù)倉庫中的所有字段內(nèi)容,根據(jù)不同需要,劃分為訓練集和測試集。其中,訓練集主要完成對高校市場營銷數(shù)據(jù)倉庫每一類別個數(shù)的統(tǒng)計,并對每一類別下特征出現(xiàn)的具體概率進行統(tǒng)計。測試集根據(jù)訓練集當中的具體特征進行計算,將其最大值所屬的類別作為最終結果進行分類[8]。在分類過程中,每一類別當中的特征出現(xiàn)概率計算公式如公式(1)所示。
式中:P為高校市場營銷數(shù)據(jù)倉庫中每一類別下特征出現(xiàn)的概率;λi為數(shù)據(jù)倉庫當中具有某一特征i下的數(shù)據(jù);n為高校市場營銷數(shù)據(jù)倉庫中具體特征個數(shù);W為高校市場營銷數(shù)據(jù)倉庫黃精當中的海量數(shù)據(jù)。
在引入網(wǎng)絡數(shù)據(jù)挖掘技術后,實際應用中很難達到對高校市場營銷數(shù)據(jù)倉庫中文本分類的要求[9]。因此,為了滿足分類要求,在挖掘過程中頻發(fā)出現(xiàn)某一特征下的數(shù)據(jù)時,為了避免出現(xiàn)某一類公用詞匯頻繁出現(xiàn),引入tf-idf算法,對高校市場營銷數(shù)據(jù)倉庫中某1個數(shù)據(jù)的權重進行分配,其計算公式如公式(2)所示。
式中:w為高校市場營銷數(shù)據(jù)倉庫中某一數(shù)據(jù)的權重值;為數(shù)據(jù)倉庫當中具有某一特征i下的數(shù)據(jù);N為該數(shù)據(jù)頻繁出現(xiàn)具體次數(shù);d為tf-idf計算系數(shù)。
根據(jù)公式(2)計算,得出在高校市場營銷數(shù)據(jù)倉庫中所有數(shù)據(jù)的權重分配,將其作為基礎,對高校市場營銷數(shù)據(jù)倉庫中的文本進行分類,從而提高分類結果的精度,并進一步加強網(wǎng)絡數(shù)據(jù)挖掘技術的應用價值。
通過計算,得到無線網(wǎng)絡中海量數(shù)據(jù)的權重分配,并以此為基礎,對無線網(wǎng)絡數(shù)據(jù)文本進行分類,以此能夠有效提高分類結果的準確性,同時也能夠進一步提高Apriori算法應用的實際意義。
在上述相關操作的支撐下,為了提高網(wǎng)絡數(shù)據(jù)挖掘技術的應用價值,還需要對高校市場營銷數(shù)據(jù)倉庫所在網(wǎng)絡環(huán)境當中的離群點數(shù)據(jù)進行智能過濾,從而提高數(shù)據(jù)的應用價值。在這一過程當中,離群點數(shù)據(jù)智能過濾實質上就是對冗余數(shù)據(jù)的過濾。在實際操作時,根據(jù)上述文本分類,提取多種類型的字段,進行網(wǎng)絡節(jié)點分散處理。由于在實際操作過程中,高校市場營銷數(shù)據(jù)倉庫中不同離群節(jié)點僅允許在本地數(shù)據(jù)庫當中完成相應的計算操作。因此,還需要根據(jù)數(shù)據(jù)倉庫中不同數(shù)據(jù)點所屬簇組進行分析。通過對不同簇組的核心數(shù)據(jù)值進行計算,對其結果進行評估,將評估結果作為數(shù)據(jù)離群點是否為冗余數(shù)值的評價結果。以此,綜合上述分析,得出數(shù)據(jù)離群點簇組心值的計算公式如公式(3)所示。
綜合上述計算公式(3),評價輸出的數(shù)據(jù)的最終值與全局簇中心點數(shù)值是否存在一致性。如果得出的結果一致,則說明被挖掘的數(shù)據(jù)具有一定的利用價值,不需要進行離群點數(shù)據(jù)智能過濾;反之,如果得出的結果不一致,則說明被挖掘的數(shù)據(jù)不具有利用價值,需要進行離群點數(shù)據(jù)智能過濾,以此實現(xiàn)對有利用價值數(shù)據(jù)的高效利用。
在完成該文上述論述的各項操作后,還需要確定高校市場營銷數(shù)據(jù)價值分布情況,并根據(jù)其特點進行分類。表1為以某一高校的市場營銷數(shù)據(jù)倉庫為例的R、F、A、T 4個內(nèi)容作為聚類中心的分類結果和相應的機制綜合分數(shù)。
表1 R、F、A、T對應聚類中心
表1中的數(shù)據(jù)是通過對某高校市場營銷數(shù)據(jù)倉庫當中的各項數(shù)據(jù)將其對應的權重相乘,并帶入聚類分析處理軟件當中得到的結果。對表1中的R、F、A、T對應聚類中心數(shù)據(jù)結果進行分析,高校市場營銷數(shù)據(jù)現(xiàn)階段的各項營銷行為決定了高校市場營銷數(shù)據(jù)現(xiàn)階段對高校自身發(fā)展的最終結果。為了完成對四縱不同數(shù)據(jù)特征更加細致化的描述,在現(xiàn)有數(shù)據(jù)價值分析的基礎上,從多個維度出發(fā),實現(xiàn)對其數(shù)據(jù)潛在價值的深入分析。結合RFAT理論,將F*A定義為,在當前階段高校市場營銷數(shù)據(jù)的總體價值。因此,F(xiàn)*A與高校市場營銷數(shù)據(jù)當前階段的購買頻率之間存在十分密切的聯(lián)系。因此,根據(jù)這一特征,再對F*R*T進行定義,將其作為數(shù)據(jù)潛在的增值實力。結合RFAT理論,將上述2種定義下的高校市場營銷數(shù)據(jù),根據(jù)高校市場營銷的實際需要,將其劃分為低、中、高3個不同等級的價值分布區(qū)域,其中將0~3.5的數(shù)值定義為具有低等級價值的數(shù)據(jù);將3.5~12.5的數(shù)據(jù)定義為具有中等級價值的數(shù)據(jù);將12.5~21.5的數(shù)據(jù)定義為具有高等級價值的數(shù)據(jù)。根據(jù)上述定義,仍然以上述某高校市場營銷數(shù)據(jù)倉庫中的數(shù)據(jù)為例,將其聚類后的結果進行相應的標準,并將其填寫在圖1當中相對應的位置上。
圖1中顏色越深的區(qū)域代表其所在區(qū)域內(nèi)的高校市場營銷數(shù)據(jù)價值越高,反之,顏色越淺的區(qū)域代表其所在區(qū)域內(nèi)的高校市場營銷數(shù)據(jù)價值越低。從圖1中的信息可以清晰地看出哪個區(qū)域當中的數(shù)據(jù)具有較高的營銷價值,以此展現(xiàn)高校市場營銷數(shù)據(jù)倉庫數(shù)據(jù)營銷價值和潛力,從而更加方便為高校數(shù)據(jù)類型選擇精準營銷策。在實際應用中,針對不同分布區(qū)域,高校應當提出相對應的營銷策略,從而實現(xiàn)對高校市場營銷數(shù)據(jù)倉庫中各類數(shù)據(jù)的高效利用。
圖1 高校市場營銷數(shù)據(jù)價值分布圖
為了進一步驗證該文提出的基于網(wǎng)絡數(shù)據(jù)挖掘技術的高校市場營銷方法在實際應用中的效果,將其與傳統(tǒng)營銷方法進行對比,完成如下對比實驗。
選擇某高校作為實驗環(huán)境,將其近幾年來市場營銷歷史數(shù)據(jù)作為實驗樣本,實驗樣本當中包括客戶分析、產(chǎn)品分析和市場分析等多種分析方法得出的各項數(shù)據(jù)。分別利用該文提出的基于網(wǎng)絡數(shù)據(jù)挖掘技術的高校市場營銷,和傳統(tǒng)營銷模式分別對其各項數(shù)據(jù)進行挖掘,構建高校市場營銷模型。將2種模型應用于真實的市場營銷環(huán)境當中,待完成一段時間的模型運行后,將2種模型的實驗結果進行記錄,并利用Python3.1的開發(fā)工具,通過編程的方式完成對其結果進行定量,并繪制成實驗結果對比表,見表2。
表2中P值為該文營銷方法或傳統(tǒng)營銷方法中完成數(shù)據(jù)挖掘后數(shù)據(jù)集中重要數(shù)據(jù)的占比。因此,P值越大,則說明該營銷方法當中的挖掘效果更強,反之,P值越小,則說明該營銷方法當中的挖掘效果更弱。由表2中的實驗結果可以看出,該文營銷方法P值均在95.00%以上,而傳統(tǒng)營銷方法P值均未超過70.00%,因此該文營銷方法P值明顯高于傳統(tǒng)營銷方法。通過對比實驗進一步證明,該文提出的基于網(wǎng)絡數(shù)據(jù)挖掘技術的高校市場營銷方法能夠深入挖掘海量數(shù)據(jù),并提高數(shù)據(jù)的利用率。
該文通過開展高校市場營銷中網(wǎng)絡數(shù)據(jù)挖掘技術的應用研究,提出了1種全新的高校市場營銷方法,將該方法應用于實際能夠深度挖掘海量數(shù)據(jù)。在當前數(shù)據(jù)在市場營銷中地位不斷提升的背景下,該文提出的方法能夠完成對數(shù)據(jù)信息的采集、分析、并根據(jù)分析結果提出建議。同時,該文設計的方法可根據(jù)不同領域市場營銷的實際情況進行調(diào)節(jié),不僅可以應用于高校當中,同時還可以為企業(yè)的各項決策提供幫助,因此具有更加廣泛的應用效果。