亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于K-Means算法的通信運營商區(qū)域發(fā)展效益評估

        2022-06-09 12:40:30周曉偉潘清眉謝俊秀
        關(guān)鍵詞:區(qū)域

        周曉偉潘清眉謝俊秀

        1.浙江安防職業(yè)技術(shù)學(xué)院;2.溫州商學(xué)院;3.中國電信股份有限公司溫州分公司

        通信運營商區(qū)域業(yè)績發(fā)展評估對企業(yè)進行業(yè)績考核,發(fā)展策略研究是非常關(guān)鍵的參考數(shù)據(jù)。目前,通信運行商決策層對區(qū)域效益發(fā)展的評估主要采用人工方式,由管理者決定幾個數(shù)據(jù)維度,對幾個關(guān)鍵的數(shù)據(jù)維度進行簡單的TOP10進行劃分。該劃分不能真實的反應(yīng)數(shù)據(jù)的分布情況,以致誤判區(qū)域效益,影響決策。本次采用K-Means算法對區(qū)域各個維度的經(jīng)濟數(shù)據(jù)進行聚類分析。由于各個維度的經(jīng)濟數(shù)據(jù)其經(jīng)濟價值不同,需要人為參與設(shè)定K值,同時盡可能降低人為設(shè)置K值的缺陷,本次對聚類結(jié)果進行可視化展示,實現(xiàn)多次迭代篩選最符合企業(yè)發(fā)展需要的結(jié)果,具備一定的工程意義。

        通信運營商在業(yè)務(wù)發(fā)展的管理上主要采用對區(qū)域進行劃分承包的方式,對各個包區(qū)的各項經(jīng)濟指標(biāo)進行分析,其結(jié)果作為評估各個承包區(qū)域的經(jīng)濟效益的依據(jù),該評估影響決策者指標(biāo)的下達及承包者業(yè)績,是個非常重要的評價指標(biāo)。目前分析的手段主要依靠管理者手工方式,并憑借對企業(yè)理解與歷史經(jīng)驗對數(shù)據(jù)開展分析,最后進行簡單歸類形成評價依據(jù)。由于人工無法準(zhǔn)確的把握數(shù)據(jù)的分布情況,對包區(qū)評級時會出現(xiàn)不客觀地評價,例如劃分的前3名包區(qū)可能會存在第3名包區(qū)跟前兩名相差很遠(yuǎn),但是跟第4名非常接近的情況。同時面對多維度的數(shù)據(jù),人為很難進行綜合考慮,容易出現(xiàn)不公正現(xiàn)象,例如從單一維度數(shù)據(jù)上看某些區(qū)域的經(jīng)濟指標(biāo)數(shù)據(jù)非常好,但是從其他維度觀察可以發(fā)現(xiàn)這個區(qū)域是個高質(zhì)量的區(qū)域,其自然增長率原本就高,并非承包人能力導(dǎo)致,反之有些區(qū)域是個負(fù)增長區(qū)域(如拆遷區(qū)域,其用戶數(shù)量下降),區(qū)域收入只能止損。傳統(tǒng)數(shù)據(jù)分析手段,無法公正客觀的對承包區(qū)的發(fā)展情況進行有效評估,降低企業(yè)的管理效率。

        機器學(xué)習(xí)科學(xué)中對于該業(yè)務(wù)領(lǐng)域的分析工具很多,如支持向量機的SVM算法、聚類算法、決策樹算法、神經(jīng)網(wǎng)絡(luò)算法等,但是諸多算法存在解讀性差的問題。如基于卷積神經(jīng)網(wǎng)絡(luò)算法,即便有很好的輸出效果,但是很難解析其分類思路,在企業(yè)管理中,對數(shù)據(jù)分析解讀的成本是企業(yè)管理效率的重要指標(biāo)。

        考慮到基于K均值算法簡單高效且易于解讀,本次提出基于聚類算法的區(qū)域發(fā)展效益評估,對多個維度的信息數(shù)據(jù)按照數(shù)據(jù)自然分布進行劃分,更真實反映區(qū)域經(jīng)濟效益情況。同時結(jié)合通信運營商實際生產(chǎn)需要,管理者需要參與K值的人工設(shè)定,因此使用IBM的SPSS Modeler對數(shù)據(jù)進行可視化,不斷迭代調(diào)整K值,使聚類結(jié)果更貼近考核需要,對實際生產(chǎn)具有一定的借鑒意義。

        1 算法簡介

        聚類算法是將某一維度的樣本劃分為不同相交的子集,簡稱為簇,簇內(nèi)數(shù)據(jù)可以認(rèn)為是相同類型的集合,不同的簇代表不同的數(shù)據(jù)含義。

        K-Means算法是聚類算法中比較常用的算法,其簡單快捷的特點被廣泛應(yīng)用。該算法是基于距離的聚類算法,對于給定樣本集{x1,x2,x3……xn},其中n為樣本個數(shù)。設(shè)定好K值,隨機選擇K個中心點計算樣本到中心的距離,經(jīng)過多次迭代,直到簇內(nèi)所有點距離中心最小,簇外樣本距離中心最大化,最終以簇內(nèi)方差作為聚類準(zhǔn)則函數(shù),方差越小,聚類效果越好[1]。

        K均值聚類被廣泛應(yīng)用于多種業(yè)務(wù)場合,文獻[2]將該聚類算法用于石油管道缺陷標(biāo)記,其識別率高于人工缺陷識別。文獻[3]利用K均值聚類算法對商務(wù)客戶進行細(xì)分歸類,也是一直比較常見的商業(yè)分析案例。文獻[4]利用K均值算法對圖像進行分割,應(yīng)用于機器視覺業(yè)務(wù)領(lǐng)域,對該算法進行一次較為創(chuàng)新的嘗試,并取得良好的應(yīng)用效果。文獻[5]改進了K-Means算法的聚類中心選擇策略,結(jié)合數(shù)據(jù)對象的密集度與最大近鄰半徑,選擇更加接近實際簇中心的數(shù)據(jù)點作為初始聚類中心,并運用在電力系統(tǒng)的異常檢測上。綜上所述,K均值聚類算法可以挖掘數(shù)據(jù)本身存在的分布規(guī)律,該規(guī)律可用于商業(yè)管理、異常識別、歸類分析等,是簡單高效并且易于被理解接受的分析方法。

        2 基于K-Means算法的區(qū)域發(fā)展評估方法研究

        2.1 數(shù)據(jù)預(yù)處理

        代理商承包區(qū)域的業(yè)務(wù)發(fā)展數(shù)據(jù)維度繁多,有酬金、門店補貼、創(chuàng)收、增收、環(huán)比、同比、業(yè)務(wù)發(fā)展量。由于通信運營商的產(chǎn)品種類多樣,業(yè)務(wù)發(fā)展量里面不同的產(chǎn)品對于企業(yè)的價值不同,其酬金也各不相同。因此需要將多個維度的數(shù)據(jù)按照業(yè)務(wù)規(guī)定口徑進行整合,降低數(shù)據(jù)維度。這里針對區(qū)域發(fā)展各維度數(shù)據(jù)按照一定口徑總結(jié)出區(qū)域的發(fā)展總分、收入、酬金占收入比三個維度的特征數(shù)據(jù)作為評估依據(jù)(如圖1所示),評估依據(jù)必須具有一定程度的代表性,能夠反映某個方面的綜合特性,口徑的制定一般需要管理者參與。

        圖1 數(shù)據(jù)預(yù)處理Fig. 1 Data preprocessing

        2.2 基于K-Means的區(qū)域效益評估

        (1)對特征維度的樣本集合數(shù)據(jù)發(fā)展總分M1、收入M2、酬金占收入比M3三個集合樣本M={x1,x2,x3……xn}。

        (2)人工設(shè)定K個聚類個數(shù),聚類中心{z1,z2……zk},計算樣本與聚類中心的歐式聚類:將樣本xi分配至歐式聚類最小的族內(nèi)。

        (3)按照均值重新計算簇內(nèi)中心點zi={zj1,zj2,zj3……zjn},重新執(zhí)行步驟2直到簇的均值中心點不再變化。

        2.3 根據(jù)業(yè)務(wù)需要重新設(shè)定K值

        對于K-Means算法K值設(shè)定是該算法唯一的缺陷,不少學(xué)者針對K值的設(shè)定提出了很多改進的算法。有學(xué)者通過遺傳算法優(yōu)化K值設(shè)定,采用并行計算的方式降低K值和初始聚類中心對聚類結(jié)果的影響,利用平均類內(nèi)距和類間距設(shè)計適應(yīng)度函數(shù)保證聚類結(jié)果的正確性,改進遺傳算法的遺傳算子來提高算法效率[6],也有引入CH評價指標(biāo)對K值確定進行優(yōu)化的辦法[7]。但是在實際管理工作中,管理者考慮的因素往往超過數(shù)據(jù)其本身所表達的信息,管理人員參與設(shè)定K值意愿非常高,對K值設(shè)定在管理上具有相當(dāng)重要的意義,因此本次引入SPSS Modeler對數(shù)據(jù)進行可視化展示,人工設(shè)定K值,通過可視化展示人工不停迭代,達到良好的工程應(yīng)用效果[8]。(如圖2、圖3、圖4所示),不同的K值聚類效果:

        圖2 K值為3的聚類結(jié)果Fig.2 Clustering results with K value of 3

        圖3 K值為4的聚類結(jié)果Fig.3 Clustering results with K value of 4

        圖4 K值為5的聚類結(jié)果Fig.4 Clustering results with K value of 5

        設(shè)置不同的K值,每個聚類的樣本數(shù)量也會發(fā)生變化,根據(jù)當(dāng)月考核的要求選擇不同的K值,更符合實際生產(chǎn)需要,并且數(shù)據(jù)可視化讓數(shù)據(jù)的可讀性更加友好。當(dāng)K值為3時,大量數(shù)據(jù)聚集在聚類1中,根據(jù)分布特性查看,其優(yōu)質(zhì)區(qū)域不明顯(效益優(yōu)質(zhì)區(qū)域為酬金占收入比偏低,但是包區(qū)收入偏高的區(qū)域),即使聚類效果合理也放映實際情況,但是其管理上意義不明顯。當(dāng)K值為4時,發(fā)展效益差的區(qū)域如聚類1展示,其業(yè)務(wù)特性非常明顯即酬金占比偏高、區(qū)域收入偏低,但是效益優(yōu)質(zhì)區(qū)域(酬金占比偏低、區(qū)域收入貢獻高的區(qū)域)如聚類4表現(xiàn)得并不明顯,總體效果比K值為3的分類效果有明顯的提升。最后當(dāng)K值為5時,對類劃分情況進行觀察,從數(shù)據(jù)分布特征可以觀察到,聚類1里面區(qū)域的收入處于整體樣本的下水位,但是酬金卻分布在全體樣本的上水位段,并且發(fā)展量也處于上水位段,基本可以判斷其發(fā)展質(zhì)量存在問題,該類區(qū)域可以評價為負(fù)效應(yīng)區(qū)域,并列入重點關(guān)注區(qū)域。聚類3里面區(qū)域的收入處于上水位段,但是酬金卻不高,可列為重點獎勵區(qū)域。從整體分布上,每個聚類的數(shù)據(jù)分布也比較合理,并未出現(xiàn)單一聚類超過50%分布的情況。以上數(shù)據(jù)特點人工無法通過傳統(tǒng)分析手段直接得出[9]。

        本次針對每個區(qū)域歸屬的聚類,并根據(jù)每個維度數(shù)據(jù)的分布特征,對區(qū)域發(fā)展特點打標(biāo)簽,并通過電話調(diào)查訪問所有的區(qū)域負(fù)責(zé)人,對該評價的認(rèn)可情況,結(jié)果一致認(rèn)可兩種極端情況:既得利益者只因為其本身區(qū)域優(yōu)勢帶來的福利,與低酬金回報者但其對區(qū)域貢獻占比高。其基本能夠正確評估區(qū)域發(fā)展效益問題[10]。

        3 結(jié)語

        本次基于K-Means算法對通信運營商區(qū)域承包發(fā)展效益進行劃分,利用SPSS Modeler對數(shù)據(jù)進行可視化展示,對于每個聚類的各個維度數(shù)據(jù)分布的特征進行評價打標(biāo)簽,并且根據(jù)實際管理需要,手工調(diào)整K值篩選特定數(shù)量的承包區(qū)域,進行績效考核。并且相比其他機器學(xué)習(xí)算法,K-Means算法在數(shù)據(jù)解讀上更加友好,更容易被非專業(yè)人士理解接受,降低企業(yè)的管理成本,提高企業(yè)的管理效率。實驗證明,該評估方法在管理效率上、劃分準(zhǔn)確性上以及數(shù)據(jù)可讀性上優(yōu)勢明顯,具備一定的參考意義。本次對區(qū)域經(jīng)濟效益評估,在數(shù)據(jù)維度上選取偏少,對于區(qū)域本身的特性比如拆遷區(qū)域,其區(qū)域人口短期內(nèi)處于凈流出狀態(tài)對于經(jīng)濟的影響分析未考慮,是在后續(xù)的工作中有待于提升的地方。

        引用

        [1] LI H Y,HE H Z,WEN Y G.Dynamic Particle Swarm Optimization and K-means Clustering Algorithm for Image Segmentation[J].Optik-International Journal for Light and Electron Optics,2015,126(24):4817-4822.

        [2] 王宏安,陳國明.基于K均值聚類的油氣管道漏磁缺陷標(biāo)記方法[J].科學(xué)技術(shù)與工程,2020,20(21):8643-8646.

        [3] 靖立崢,吳增源.基于改進K‐means算法的電子商務(wù)客戶細(xì)分研究[J].中國計量大學(xué)學(xué)報,2020,31(4):483-489.

        [4] 陳廷兵,敬正彪,楊濤,等.基于K-means與模板匹配的水表指針示數(shù)判讀方法[J].計算機應(yīng)用與軟件,2020,37(8):183-187.

        [5] 吳蕊,張安勤,田秀霞,等.基于改進K-means的電力數(shù)據(jù)異常檢測算法[J].華東師范大學(xué)學(xué)報(自然科學(xué)版),2020,7(4):79-87.

        [6] 黃松,邱建林.改進的遺傳K-means算法及其應(yīng)用[J].計算機工程與設(shè)計,2020,41(6):1617-1623.

        [7] 張靖,段富.優(yōu)化初始聚類中心的改進k—means算法[J].計算機工程與設(shè)計,2013,34(5):1691-1694+1699.

        [8] Jaiprakash Gupta,Jon Patrick,Simon Poon.Clinical Safety Incident Taxonomy Performance on C4.5 Decision Tree and Random Forest[J].Studies in Health Technology and Informatics,2019,266:83-88.

        [9] 賈瑞玉,宋建林.基于聚類中心優(yōu)化的k-means最佳聚類數(shù)確定方法[J].微電子學(xué)與計算機,2016,33(5):62-66+71.

        [10] 林女貴,吳元林.基于改進k-means的大數(shù)據(jù)清洗方法[J].微型電腦應(yīng)用,2021,37(11):133-136.

        猜你喜歡
        區(qū)域
        分割區(qū)域
        探尋區(qū)域創(chuàng)新的密碼
        科學(xué)(2020年5期)2020-11-26 08:19:22
        基于BM3D的復(fù)雜紋理區(qū)域圖像去噪
        軟件(2020年3期)2020-04-20 01:45:18
        小區(qū)域、大發(fā)展
        商周刊(2018年15期)2018-07-27 01:41:20
        論“戎”的活動區(qū)域
        區(qū)域發(fā)展篇
        區(qū)域經(jīng)濟
        關(guān)于四色猜想
        分區(qū)域
        公司治理與技術(shù)創(chuàng)新:分區(qū)域比較
        亚洲熟妇大图综合色区| 亚洲视频在线观看| 六月婷婷久香在线视频| 99热成人精品免费久久| 亚洲精品熟女乱色一区| 亚洲国产成人久久精品一区| 99久久99久久精品免费看蜜桃| 欧美黑人疯狂性受xxxxx喷水 | 日韩中文字幕精品免费一区| 久久精品国产亚洲av热东京热| 狠狠色噜噜狠狠狠8888米奇| 亚洲精品无码成人a片| 欧美日韩国产亚洲一区二区三区| 日韩av综合色区人妻| 亚洲一区在线观看中文字幕| 黑人巨大无码中文字幕无码| 精品无码久久久九九九AV| 美腿丝袜中文字幕在线观看| 亚洲一区二区三区内裤视| 无遮挡又爽又刺激的视频| 精品中文字幕制服中文| 亚洲中文字幕一二区精品自拍| 久久久亚洲欧洲日产国码二区| 欧美gv在线观看| 亚洲熟女av超清一区二区三区| 久久国产精品色av免费看| 亚洲国产成人一区二区精品区 | 亚洲成a∨人片在线观看无码| 亚洲无人区一码二码国产内射| 玩弄少妇人妻中文字幕| 国产成人精品一区二区视频| 在线视频一区二区亚洲| 亚洲精品视频中文字幕| 天天色影网| 中文字幕亚洲精品第1页| 三级网站亚洲三级一区| 香港三日本三级少妇三级视频| 欧美日韩精品乱国产538| 手机在线观看亚洲av| 久久国产劲爆∧v内射| 最近中文字幕完整版|