周堅,石永革,何美斌
(1.南昌大學信息工程學院,江西 南昌 330029;2.中國電信股份有限公司江西分公司,江西 南昌 330029)
隨著通信技術的迅速發(fā)展,移動和固定電話已經成為人們日常生活中不可缺少的語音通信工具。然而,其在給人們的工作、生活帶來極大便利的同時,也會給電信客戶和運營商帶來負面影響,例如電信詐騙、廣告騷擾、欠費等。目前,針對語音通信行為異??蛻簦ê喎Q異??蛻簦?,相關部門已經采取了若干措施,如針對電信詐騙實行手機實名制、針對欠費客戶的分析催繳等,但其一般都屬于事后被動處置。為此,迫切需要基于海量的語音通信數(shù)據(jù),自動分析它們之間的關聯(lián)關系,聚類分析出其中隱藏的異??蛻粜畔?,對異??蛻艏跋嚓P事件實現(xiàn)預判預警、實時提示、主動響應、快速處置。
迄今,國內針對電信客戶語音通信行為特征進行分析建模并進一步實現(xiàn)客戶聚類分析的文獻不多,典型如:參考文獻[1]采用模糊集的語義關聯(lián)度算法,可以找出具有強關聯(lián)度的客戶;參考文獻[2]應用復雜網絡理論和模糊決策樹算法,基于通話記錄開展語音通信行為異??蛻舻淖R別研究;參考文獻[3]研究如何使用決策樹分析惡意欠費客戶,應用聚類分群發(fā)現(xiàn)電信欺詐客戶。上述文獻的主要不足在于,都沒有進行深入的異常行為特征建模和客戶聚類挖掘算法的研究。參考文獻[4]基于客戶通話數(shù)據(jù)進行聚類分析,獲取具有良好特征的客戶集合,然后應用K-means算法挖掘特定的客戶,以便針對不同客戶群提供差異化服務,其主要不足在于:沒有對挖掘算法進行優(yōu)化,使得其挖掘效率和質量不夠理想,并且僅考慮了移動通信客戶。綜上所述,參考文獻[1-4]對于本文具有一定的參考價值,但它們的研究或者僅局限于行為特征分析,或者局限于客戶挖掘,并沒有結合行為特征分析建模與客戶挖掘,開展完整深入的研究及算法優(yōu)化工作,使得其在準確性、完整性、普適性等綜合性能上存在明顯不足。參考文獻[5-7]對本文具有較高的參考價值,都對聚類算法進行了改進并應用于電信客戶細分中。其中,參考文獻[5]通過改進的K-means算法對電信客戶進行了聚類分析,但其主要研究目標是降低聚類分析的時間復雜度。參考文獻[6]使用自適應差分演化算法改進K-means算法,并將其應用在電信客戶細分中,但未給出3個關鍵參數(shù)的經驗值和選取方法。參考文獻[7]通過不斷優(yōu)化新的聚類中心改進K-means算法,從而提高其在電信CRM(customer relationship management,客戶關系管理)客戶分類中的準確性。
為實現(xiàn)對語音通信行為異??蛻舻母哔|量聚類分析,本文針對固定和移動電話客戶,以AHP模型為基礎,融合DEMATEL法構建異??蛻粜袨樘卣髂P?,即 AHP-DEMATEL模型(analytic hierarchy process decision making trial and evaluation laboratory,以下簡稱A-D模型),并提出了一種基于A-D模型的K-means算法,從海量的語音通信數(shù)據(jù)中聚類分析出異常客戶。本文主要工作是:基于語音通信記錄,詳細分析客戶的通話行為特征;基于A-D模型構建語音通信異??蛻粜袨樘卣髂P停垣@取各項行為特征的權值;對K-means算法進行分析和優(yōu)化,提出基于A-D模型的異常電信客戶挖掘算法;對上述研究成果進行測試、比較、分析,驗證其有效性。
AHP一種將定性和定量分析融合的多要素決策方法,其主要思想為:針對復雜決策問題,綜合其主要影響元素、問題本質、內在關系等,通過深入分析來構造層次結構模型,從而基于很少的定量信息就可將決策者的思維過程數(shù)學化。由此,即可為求解擁有多目標、多準則、無結構等特性的復雜決策性問題,提供一種較為簡單的決策方法[8]。AHP常用于主觀賦權,其具體步驟如下。
步驟 1 構造層次結構模型。將復雜的多目標、多準則的決策問題,按照它們之間的相互關系分解成多個層次,自頂向下每一層對應一組分目標、準則直至相關指標(統(tǒng)稱元素),形成遞階層次結構模型。由此,即可通過逐層向上分析,最終確定各低層元素對于各級高層元素的重要性權值。
步驟 2 構建判斷矩陣。為盡可能減少性質不同元素相互比較的困難,提高準確度,對于每一個目標,不是將影響該目標的所有元素放在一起比較,而是兩兩相互比較后,給出描述相對重要程度的比較值。由此,對于各個目標,生成一系列的兩兩判斷矩陣A=(aij)nm,其中aij表示針對同一目標,元素 i比j的相對重要值。例如,若對于目標Y,aij=2表示元素i比元素j對Y的影響更大(即權重更高),且對應必有aji=1/2。上述重要值應由多位專家進行評價并取其加權均值。
步驟 3 驗證判斷矩陣的一致性。由于判斷矩陣的值主要取決于專家意見,難免出現(xiàn)邏輯不一致的情況(如前例中,若aij=2,而aji不是1/2),故必須對判斷矩陣進行一致性檢驗,方法為:首先計算出判斷矩陣的最大特征值λmax,利用式(1)計算出一致性檢驗的標度,然后計算隨機一致性比率其中,RI可查表得到,一般認為CR<0.1時具有滿意的一致性。
步驟4 確定權重。一般采用求和法,按式(2)將判斷矩陣的每列向量歸一化,再對行求和并歸一化。
DEMATEL(decision making trial and evaluation laboratory)即“決策實驗和評價實驗法”,是一種用于篩選復雜系統(tǒng)主要元素、簡化系統(tǒng)結構分析過程的方法論,可以充分利用專家經驗和知識處理比較復雜的系統(tǒng)問題,特別是對關系要素不太確定的系統(tǒng)更為有效[9]。實施步驟如下。
步驟 1 使用德爾斐法、頭腦風暴法或者專家訪談法確定各個元素。
步驟 2 確定各要素間的直接影響度。首先使用專家評分法建立各風險影響元素的直接影響矩陣,一般將元素之間的關系定性地分為5個等級,0分表示無影響關系,1分表示關系很弱,2分表示關系較弱,3分表示關系較強,4分表示影響關系很強。然后,使用上述評分結果建立直接影響矩陣A=(aij)nm,其中aij即上述評分值。
步驟5 獲取各要素的影響度和被影響度 利用式(3)和式(4)可以分別計算出風險元素之間的相互影響度和被影響度。其中,fi是綜合影響矩陣T中行元素之和,表示風險元素i給j帶來的直接或間接影響度,ei是綜合影響矩陣 T中列元素之和,各行對應風險元素受到其他各元素的影響值稱為被影響度。
步驟6 計算各要素的中心度。使用式(5)即可計算出各要素的中心度。
K-means算法的主要優(yōu)點:聚類速度快、效率高、適用于處理大數(shù)據(jù)集,是一種常用的無監(jiān)督學習方法。算法主要原理:隨機選出K個點用作初始聚類中心,然后計算各個樣本與初始聚類中心之間的距離,并且把樣本劃分到距離最近的聚類中心所在類;對劃分完全后的新類進行計算得到新聚類中心,如果前后兩次的初始聚類中心未發(fā)生變化,可以確定樣本調整結束,此時相應的誤差平方和函數(shù)已達到最小,聚類準則函數(shù)已經收斂;否則,若初始聚類中心發(fā)生變化,則需要繼續(xù)調整所有樣本來確定新的聚類中心,并進入下一次的迭代過程[10]。
K-means算法的主要不足:對初始中心敏感;無法處理非球形類;對孤立點數(shù)據(jù)和噪聲數(shù)據(jù)較敏感;對初始值 k的選取依賴性較大;容易陷入局部最優(yōu)解;同等看待每一個特征,難以產生高質量的聚類結果。
電信運營商提供的語音通信原始通話記錄組成客戶原始數(shù)據(jù)集,其每條記錄包括18個字段,從中析取開始時間、主叫號碼、被叫號碼、呼叫結果、通話時長等作為原始特征字段并按客戶歸并后,即可生成客戶通話數(shù)據(jù)集。
基于語音通信行為異??蛻粜袨樘卣鞯姆治?,需要對客戶通話數(shù)據(jù)集中的數(shù)據(jù)基于客戶進行以下處理后,生成客戶通話特征集,其中每一客戶的語音通信行為特征參數(shù)包括以下幾種。
· 平均呼出時間:客戶每日呼出時間點的平均值c1;
· 平均通話時長:客戶接通記錄中通話時長的平均值c2;
· 呼出次數(shù):客戶主叫次數(shù)c3;
· 呼出號碼數(shù):客戶主叫時對端號碼不重復的個數(shù)c4;
· 呼入次數(shù):客戶被叫記錄數(shù)c5;
· 呼入號碼數(shù):客戶被叫時對端號碼不重復的個數(shù)c6;
· 接通率:客戶主叫接通數(shù)與所有主叫記錄的比值c7。
以廣告客戶為例,其廣告推銷行為一般集中在白天,平均呼出時間一般分布在8:00—18:00時間段;廣告必須面向大量客戶,其呼出次數(shù)及呼出號碼數(shù)量較多;廣告推銷號碼的呼入次數(shù)和呼入號碼數(shù)量極少;由于被叫客戶的經驗、智能手機提示以及陌生主叫號碼等原因,其接通率相對較低。
如前所述,K-means是一種非常適合挖掘語音行為異??蛻舻乃惴?,但由于其同等看待所有特征,會影響聚類分析的質量。實際上,不同的語音通信行為特征對于異??蛻敉诰蜻^程的貢獻,往往存在較大的差別,如對于廣告客戶的行為特征分析,由于平均通話時長與正??蛻舻牟顒e很小,其影響應該可以忽略。為此,本文引入行為特征模型的概念,獲取不同行為特征的權重,以提高異常客戶挖掘的效率與質量。參考文獻[11]圍繞系統(tǒng)評價中的權重計算問題,提出了AHP-DEMATEL方法,通過計算初始權重和影響度,并相互融合來獲得綜合權重。實驗表明,該方法可以較為準確地計算出異??蛻敉ㄔ捫袨樘卣鞯臋嘀?。
3.2.1 基于AHP生成行為特征的主觀權重
判斷異??蛻粜枰诟餍袨樘卣鲗崿F(xiàn),其初始權重則需由領域專家生成,屬于主觀權重,而AHP是目前廣泛使用的一種主觀賦權法。
(1)構建異常客戶層次分析模型
本文討論的異??蛻舭ㄔp騙客戶、廣告客戶、欠費客戶,分別用z、g、q表示,并用y表示包括這3類客戶的異??蛻羧?。由此,可以構建異常客戶層次分析模型如下,其中用實線連接的元素表示它們之間具有關聯(lián)關系。
之后,由多位領域專家根據(jù)經驗,給出各低層元素對高層元素的影響程度相對值并對其加權平均,得到異??蛻艟C合判斷矩陣 Y、詐騙客戶判斷矩陣 Z、廣告客戶判斷矩陣 G、欠費客戶判斷矩陣Q。
(2)一致性檢驗
通過計算可得矩陣Y的CR=0.046 2<0.10,Z的CR=0.010 3<0.10,G 的 CR=0.010 3<0.10,Q 的CR=0.028 4<0.10,所有判斷矩陣均可通過一致性檢驗。
(3)計算主觀權重
通過判斷矩陣Y得到綜合分析異常客戶的初始權重向量W1為[0.408 2、0.816 5、0.408 2]。
根據(jù)判斷矩陣Z、G、Q得到單獨分析3種異??蛻舻某跏紮嘀鼐仃嘩2見表1。
圖1 層次分析結構
表1 3種異??蛻舴治龀跏紮嘀鼐仃嘩2
使用式(2)對W2做歸一化處理得到W3,再使用式(6)即得到異??蛻艟C合分析權重向量W4。
對W4歸一化處理得到綜合權重向量W5。
最后,將W3和W5組合即得到基于AHP的歸一化主觀權重矩陣WA,見表2。
表2 基于AHP的歸一化主觀權重矩陣WA
3.2.2 基于DEMATEL確定各特征之間的影響元素
AHP僅考慮了低層元素對高層元素在垂直方向上的影響,實際上同層元素之間也存在不同程度的相關性,從而影響有關權重的取值。如詐騙客戶的行為直接關聯(lián)呼出次數(shù)和呼出號碼數(shù)兩項特征,而它們又會影響到接通率和平均通話時長;顯然,此時前兩項特征的權重應予加強。為此,本文使用DEMATEL方法來進一步提高權重賦值的科學性和客觀性。
(1)根據(jù)各特征之間相互影響關系得出直接影響矩陣
采用專家問卷的形式獲取相關信息。問卷依次用0~4代表各通話行為特征間的關系強度:無影響、影響稍弱、影響弱、影響強、影響較強。然后,對收回的有效問卷進行統(tǒng)計整理,得到直接影響矩陣,并將該矩陣規(guī)范化得到規(guī)范影響矩陣G(ci×ci),見表3,其中,ci表示各特征。
表3 規(guī)范影響矩陣
(2)生成各特征之間的影響度向量
利用規(guī)范影響矩陣計算出綜合影響矩陣,并由其計算出各特征的影響度(Ri)和被影響度(Di),通過對各特征的影響度和被影響度進行計算,得出該特征的中心度(Ri+Di),見表4。
表4 中心度
將DEMATEL法分析得出的各特征的中心度利用式(2)進行歸一化處理,即可得到基于DEMATEL的權重向量 WD=[0.088,0.131,0.177,0.177,0.132,0.132,0.161]。
3.2.3 生成目標權重
將WA的各行分別與WD進行向量乘運算,再使用式(2)歸一化處理后即得到用于異常行為特征分析的目標權重,見表5。
表5 異常行為特征分析的目標權重
其中,Wy用于同時綜合挖掘異??蛻羧海琖z、Wg和 Wq分別用于詐騙客戶、廣告客戶及欠費客戶的單類型挖掘。
主要工作:從通話記錄中析取原始特征字段(開始時間、主叫號碼、被叫號碼和通話時長等);清洗其中不完整或者不一致的數(shù)據(jù);生成客戶通話特征集并使用式(7)對所有特征進行歸一化處理,得到實驗數(shù)據(jù)集X。
其中,x*、xi分別表示歸一化前后的值,xmax、xmin分別表示樣本數(shù)據(jù)中的最小、最大值。
為了有效提高語音通信行為異常客戶的聚類分析效果,以K-means算法為基礎,提出基于A-D模型的K-means算法,主要思路如下。
4.2.1 選擇初始聚類中心
聚類算法的基本原理是讓類內各數(shù)據(jù)對象的相似度最小,類間的各數(shù)據(jù)對象相似度最大,從而提高聚類結果的質量,K-means算法則由于其波動性而難以保證聚類質量[15],又由于本文研究所涉及的數(shù)據(jù)具有海量特征,故本文采用參考文獻[15]提出的方法選擇初始聚類中心,方法為:基于異??蛻襞c正常客戶相似度較小的原則,不斷從最大聚類中找出距離最遠的兩個數(shù)據(jù)對象作為新的聚類中心,從而選出K個初始聚類中心,消除隨機初始聚類中心可能存在的相似度較大問題。
4.2.2 改進歐氏距離公式
K-means算法是根據(jù)數(shù)據(jù)對象之間的距離進行聚類處理,而數(shù)據(jù)對象的距離一般采用歐氏距離公式來計算。通過K-means常用的歐氏距離公式可見,在計算兩個樣本的相似度時,K-means算法將所有特征視為同等重要[16]。然而,如前所述,不同特征對于樣本之間的差異所產生的影響一般是不同的,譬如廣告客戶關聯(lián)的6項特征中,呼出次數(shù)顯然更為重要,故在數(shù)據(jù)樣本之間適當放大呼出次數(shù)這一特征距離,有利于更精確地分類。由此,本文算法先通過A-D模型計算出各特征的最終權重,然后據(jù)此適當放大與縮小K-means距離公式樣本中各特征值之間的距離,使得權重越大的特征對聚類結果的影響越大,從而更加真實地反映實際聚類時各特征的作用。根據(jù)上述思路給出的改進距離計算式如下:其中,d為所求兩個樣本之間的距離,xin表示第i個樣本的第n個特征值,xjn表示第j個樣本的第n個特征,Wn表示第n個特征的權重。4.2.3 算法流程
本文算法的形式化描述及相關說明如下。
步驟 1對數(shù)據(jù)源進行數(shù)據(jù)處理,得到實驗數(shù)據(jù)集,并從中選出樣本集X。
步驟 2基于前述初始聚類中心選擇方法選取k個初始中心R(k)。
步驟 3生成語音通信行為異??蛻敉诰虻哪繕藱嘀兀夯贏HP法計算不同類型挖掘對象的特征權重矩陣WA;基于DEMATEL法計算各特征間的相互影響權重向量 WD;計算目標權重 Wy、Wz、Wg、Wq。
步驟4選擇工作模式(異??蛻艟C合挖掘,詐騙客戶、廣告客戶、欠費客戶單類型挖掘),并將相應權值向量代入歐氏距離公式得到d。
步驟5進行聚類分析,獲取K個聚類。
(1)實驗數(shù)據(jù)
原始數(shù)據(jù)來源于某市電信公司的實際語音通信記錄,其中包括624 199條固話通話記錄、2 611 678條手機通話記錄,對應965 281位客戶。之后,隨機選取50 000名客戶的數(shù)據(jù)形成樣本集;析取100名正??蛻艉?00名異常客戶的數(shù)據(jù)作為測試集1,其中平均涵蓋了詐騙客戶、廣告客戶和欠費客戶;另析取100名正常客戶和100名廣告客戶的數(shù)據(jù)作為測試集2。
(2)比對標準
在客戶細分分析中,K-means算法具有較好的效果,而參考文獻[7]通過不斷優(yōu)化聚類中心改進 K-means算法,并將其應用于客戶細分研究且取得一定效果。因此,選擇 K-means算法及參考文獻[7]提出的改進 K-means算法進行性能比對。
(3)評價標準
準確率(precision)和召回率(recall)是常用性能評價指標,而鑒于兩者往往相互矛盾,一般采用F值(F-measure)作為綜合評價標準,相關定義如下:
其中,TP、FP、FN依次表示正確檢測出的異??蛻舾琶矓?shù)、錯誤標識為異常的正??蛻魯?shù)、錯誤標識為正常的異常客戶概貌數(shù)。
(4)參數(shù)設置
由于 K較小時的實驗數(shù)據(jù)不太穩(wěn)定,故選K=4、5、6、7。
綜合聚類分析指同時對詐騙客戶、廣告客戶、欠費客戶3類異??蛻暨M行聚類分析。
選用樣本集和測試集1,得到聚類結果后,結合電信公司已有數(shù)據(jù)和人工抽樣檢測結果可以發(fā)現(xiàn)簇內測試集中異常客戶多于正??蛻魰r,該簇內異??蛻魯?shù)量會明顯多于正常客戶。因此本實驗根據(jù)測試集內客戶的分布,合并所有異??蛻魯?shù)大于正常客戶數(shù)的類作為異??蛻纛?,其他為正??蛻纛?。實驗結果見表6。
由表6可見,在K=5時,本文算法的綜合性能F值達到最佳值;通過對3種算法最佳性能比較,可以發(fā)現(xiàn)本文算法相對于參考文獻[7]算法性能提高4.49%,相對于K-means的提高幅度達到12.05%。此外,本文算法的準確率也明顯優(yōu)于另兩種算法。
選用樣本集和測試集2,異常類合并同上,實驗結果見表7。
由表7可見,在K值相同時,本文算法的綜合性能F值明顯優(yōu)于參考文獻[7]算法及K-means,提高幅度分別可達6.52%和7.69%。此外,本文算法的準確率同樣明顯優(yōu)于另兩種算法。
表6 異常客戶群綜合聚類結果分析
表7 廣告客戶單類型聚類結果分析
綜合比較表6和表7的數(shù)據(jù),本文算法在廣告客戶聚類分析時的性能優(yōu)于多類型異??蛻艟C合聚類分析。本文對詐騙客戶和欠費客戶進行了類似實驗分析,其結果與廣告客戶聚類分析的結果類似。
因此,單類型異??蛻艟垲惙治龅男阅軆?yōu)于多類型異常客戶綜合聚類分析,但綜合聚類分析的時間效率則明顯高于單類型聚類分析,這種情況符合客觀規(guī)律。因此,針對不同場景可以選擇合適的方案,有利于提高異??蛻艟垲惙治龅木C合效率。
本文基于語音通信記錄,分析了異常客戶的行為特征,設計并構建了A-D模型,據(jù)此提出了一種改進的K-means算法,實現(xiàn)利用海量數(shù)據(jù)對語音通信行為異常的客戶(電信詐騙客戶、廣告客戶、欠費客戶等)進行聚類分析。實證分析結果表明,本文算法用于對語音通信行為異??蛻暨M行聚類分析時的性能效果較好。
參考文獻:
[1] 劉霞.基于電信通話記錄的數(shù)據(jù)挖掘[J].計算機與現(xiàn)代化,2008(6): 36-38.LIU X.Application of fuzzy-association rule to telecom data mining[J].Computer and Modernization, 2008(6): 36-38.
[2] 王家定.基于復雜網絡理論和通話記錄的客戶行為異常識別研究[D].合肥: 中國科學技術大學, 2013.WANG J D.Research on customer behavior anomaly recognition based on complex network theory and call logging[D].Hefei: University of Science and Technology of China, 2013.
[3] 石瑛.面向電信市場營銷的數(shù)據(jù)挖掘技術研究[D].上海: 華東師范大學, 2004.SHI Y.Research on data mining technology for telecom marketing[D].Shanghai: East China Normal University, 2004.
[4] 趙凱, 蔣朝惠.基于K-means算法的電信客戶行為特征聚類分析[J].貴州大學學報:自然科學版, 2015, 32(2): 86-90.ZHAO K, JIANG C H.Analysis of telecom user behavior features clustering based on K-means algorithm[J].Journal of Guizhou University(Natural Science), 2015, 32(2): 86-90.
[5] 江哲雅.聚類挖掘在電信客戶分類中的研究與應用[D].上海: 上海交通大學, 2013.JIANG Z Y.Research and application of clustering mining in telecom customer classification[D].Shanghai: Shanghai Jiao Tong University, 2013.
[6] 關云鴻.改進 K-均值聚類算法在電信客戶分類中的應用[J].計算機仿真, 2011, 28(8): 138-140.GUAN Y H.Application of improved K-means algorithm in telecom customer segmentation[J].Computer Simulation, 2011,28(8): 138-140.
[7] ZUO G C, ZHOU R H, LI Z Q, et al.Improved K-means algorithm and its CRM in telecom customer segmentation application[J].Computer Systems & Applications, 2012, 19(11): 155-159.
[8] FAN G, ZHONG D, YAN F, et al.A hybrid fuzzy evaluation method for curtain grouting efficiency assessment based on an AHP method extended by D numbers[J].Expert Systems with Applications, 2016(44): 289-303.
[9] TZENG G H, CHIANG C H, LI C W.Evaluating intertwined effects in e-learning programs: a novel hybrid MCDM model based on factor analysis and DEMATEL[J].Expert Systems with Applications, 2007, 32(4): 1028-1044.
[10] 原福永, 張曉彩, 羅思標.基于信息熵的精確特征賦權K-means聚類算法[J].計算機應用, 2011, 31(6): 1675-1677.YUAN F Y, ZHANG X C, LUO S B.Accurate property weighted K-means clustering algorithm based on information entropy[J].Journal of Computer Applications, 2011, 31(6): 1675-1677.
[11] 瞿英, 路亞靜, 劉紫玉, 等.基于 AHP-DEMATEL法的權重計算方法研究[J].數(shù)學的實踐與認識, 2016, 46(7): 38-46.QU Y, LU Y J, LIU Z Y, et al.Research on the weight calculation method based on the AHP-DEMATEL method[J].Mathematics in Practice and Theory, 2016, 46(7): 38-46.
[12] 丁曉琴, 張德生.基于 AHP和 cRITIc綜合賦權的 K-means算法[J].計算機系統(tǒng)應用, 2016, 25(7): 182-186.DING X Y, ZHANG D S.K-means algorithm based on synthetic weighting of AHP and CRITIC[J].Computer Systems & Applications, 2016, 25(7): 182-186.
[13] 王俊鳳, 閆文.基于AHP-DEMATEL模型的黑龍江省農民專業(yè)合作社內部資金互助的影響元素分析[J].金融理論與實踐,2016(7): 86-90.WANG J F, YAN W.Analysis of the influence of mutual funds between farmer cooperatives in Heilongjiang province based on AHP-DEMATEL model[J].Financial Theory and Practice,2016(7): 86-90.
[14] HUNG S J.Activity-based divergent supply chain planning for competitive advantage in the risky global environment: a DEMATEL-ANP fuzzy goal programming approach[J].Expert Systems with Applications, 2011, 38(8): 9053-9062.
[15] 陳光平, 王文鵬, 黃俊.一種改進初始聚類中心選擇的K-means算法[J].小型微型計算機系統(tǒng), 2012, 33(6): 170-173.CHEN G P, WANG W P, HUANG J.Improved initial clustering center selection method for K-means algorithm[J].Journal of Chinese Computer Systems, 2012, 33(6): 170-173.
[16] 熊平, 顧霄.基于特征權重最優(yōu)化的 K-means 聚類算法[J].微電子學與計算機, 2014(4): 40-43.XIONG P, GU X.K-means clustering algorithm based on feature weight optimization[J].Microelectronics Computer,2014(4): 40-43.
[17] 劉春, 鄒海鋒, 向勇.大數(shù)據(jù)環(huán)境下電信數(shù)據(jù)服務能力開放研究[J].電信科學, 2014, 30(3): 156-161.LIU C, ZOU H F, XIANG Y.Research on telecom data service open ability under the environment of big data[J].Telecommunications Science, 2014, 30(3): 156-161.
[18] 韓晶, 張智江, 王健全, 等.面向統(tǒng)一運營的電信運營商大數(shù)據(jù)戰(zhàn)略[J].電信科學, 2014, 30(11): 154-158.HAN J, ZHANG Z J, WANG J Q, et al.The unified-operation-oriented big data strategy for telecom operators[J].Telecommunications Science, 2014, 30(11): 154-158.
[19] 曹旭, 曹瑞彤.基于大數(shù)據(jù)分析的網絡異常檢測方法[J].電信科學, 2014, 30(6): 152-156.CAO X, CAO R T.Network anomaly prediction method based on big data[J].Telecommunications Science, 2014, 30(6):152-156.
[20] 谷紅勛, 楊珂.基于大數(shù)據(jù)的移動用戶行為分析系統(tǒng)與應用案例[J].電信科學, 2016, 32(3): 139-146.GU H X, YANG K.Mobile user behavior analysis system and applications based on big data [J].Telecommunications Science,2016, 32(3): 139-146.