亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        移動通信用戶交際圈研究

        2019-11-12 12:01:33張治高
        電腦知識與技術(shù) 2019年25期
        關(guān)鍵詞:多元線性回歸預測模型

        張治高

        摘要:電信運營商擁有天量的通話詳單和短信詳單,用戶的通話及短信同時也伴隨著巨大的行為數(shù)據(jù)產(chǎn)生。過對電信運營商的移動通信用戶的通話及短信清單,利用多元回歸的預測模型,建立了穩(wěn)定交往模型。利用最小二乘估計的方法,通過SPSS軟件計算出模型的未知參數(shù)。計算出用戶間穩(wěn)定交往指數(shù),為運營商提高存量用戶的忠誠度,減少用戶流失提供了數(shù)據(jù)依據(jù)。

        關(guān)鍵詞:多元線性回歸; 預測模型;SPSS;交往圈

        中圖分類號:TP393? ? ? ? 文獻標識碼:A

        文章編號:1009-3044(2019)25-0305-03

        1 引言

        數(shù)據(jù)挖掘中使用的相關(guān)算法來自大量、不完整、隨機、模糊中提取有用的數(shù)據(jù)、正確、全面、未知、用戶感興趣的知識等。建立數(shù)學模型,用來決策支持的模型,提供預測性決策支持的方法、過程、工具[1]。數(shù)據(jù)挖掘通常是指通過算法從大量數(shù)據(jù)中搜索隱藏在其中的信息的過程。隨著互聯(lián)網(wǎng)時代的到來和數(shù)據(jù)大爆發(fā),數(shù)據(jù)挖掘技術(shù)普遍而且迫切地應用于各個領(lǐng)域,比如金融、電信、保險、互聯(lián)網(wǎng)等行業(yè)。它通過運用整理、分析、總結(jié)、推理等方法對大量地數(shù)據(jù)進行處理,從而對實際問題進行指導和分析,獲得相關(guān)預測結(jié)果以做出更有利的決策[2]。

        在電信行業(yè),用戶之間的互通行為,一般稱之為交往。這種交往關(guān)系不但可以發(fā)現(xiàn)用戶的交往圈范圍,還可以挖掘競爭對手,為用戶維穩(wěn)、策反營銷提供信息支持。人們總是試圖憑借一個或者若干個指標衡量兩個用戶之間的交往密切程度。那么,這個衡量交往密切程度的指標,我們統(tǒng)稱之為交往指數(shù)。早期一般通過互通(語音、短信等)次數(shù)、時長來考察交往情況,效果不理想。原因是人與人之間的相互作用在一段時間內(nèi)相對穩(wěn)定,但總是在變化;此外,單個聯(lián)系人的數(shù)量和長期的互操作性不足以表明這種交互是穩(wěn)定的。因此,要想尋找用戶的穩(wěn)定交往群體,必須要從時間、交往次數(shù)、交往方式和交往時刻分布等多個角度來綜合衡量交往的穩(wěn)定性。

        2 算法及相關(guān)軟件介紹

        2.1 多元回歸的預測模型

        回歸分析是探索變量之間的相關(guān)性和依賴性的有效方法??傮w回歸模型[3]反映了變量間關(guān)系的總體趨勢,線性總體回歸模型形式簡單、參數(shù)的估計與檢驗也相對容易,是最為常見的總體回歸模型。

        2.3 SPSS軟件介紹

        SPSS軟件是目前較為流行的統(tǒng)計分析軟件,在醫(yī)學、經(jīng)濟、教育和通信等相關(guān)領(lǐng)域的應用有分廠顯著成果,界面非常友好,能夠非常全面的滿足統(tǒng)計工作提出的各種個性化的需求。SPSS軟件包含了統(tǒng)計學眾多方面的基本內(nèi)容,且擁有非常強的圖標生成功能,有較為理想的交互界面,通過錄入的相關(guān)數(shù)據(jù),就能夠快速得出相應的統(tǒng)計結(jié)果。

        2.4 GBase數(shù)據(jù)庫介紹

        GBase 是南大通用數(shù)據(jù)技術(shù)有限公司研發(fā)的自主品牌的數(shù)據(jù)庫,目前在國內(nèi)具有較高的品牌知名度,符合國家自出創(chuàng)新戰(zhàn)略要求,是國內(nèi)第一事務處理性能的數(shù)據(jù)庫。GBase 8a 已經(jīng)廣泛運用聯(lián)通、移動、電信多個省的經(jīng)營分析、大數(shù)據(jù)平臺等關(guān)鍵業(yè)務系統(tǒng)[6]。

        3 建模過程及結(jié)果分析

        3.1 數(shù)據(jù)預處理

        通過通話詳單與短信詳單作為數(shù)據(jù)基礎進行分析,取近三個月的通話詳單及短信詳單。選取某市運營商移網(wǎng)用戶短信和通話記錄詳單,此次數(shù)據(jù)分析以201809、201810、201811三個月的通話詳單(BSS&CBSS話單)、短信詳單(BSS&CBSS短信)為模型輸入條件,共計27.8億條。

        通過通話詳單與短信詳單中有需要清理的干擾數(shù)據(jù),sp服務號碼,個人及企業(yè)廣告推銷號碼等都需要剔除,否則將影響結(jié)果的正確性。

        在GBase數(shù)據(jù)庫中借助 SQL 語句對原數(shù)據(jù)集進行預處理,主要進行了以下步驟:

        (1)服務和sp廣告推銷號碼剔除:由于這些號碼的開始位數(shù)以及長度有固定的特征,因此可以在GBase數(shù)據(jù)庫中通過長度和key value的查詢將其剔除;

        (2)個人及企業(yè)廣告推銷號碼過濾:這些號碼的絕大多數(shù)的通話行為是主叫用戶且產(chǎn)生的話務量異常巨大,與被叫用戶的聯(lián)系只是短期的。此類號碼定義為廣告推銷號碼,它們在形式上與普通客戶號碼沒有區(qū)別,不能通過簡單的數(shù)據(jù)庫條件過濾獲得,所以只能通過號碼的通話特征進行甄別過濾。

        3.2 穩(wěn)定交往模型構(gòu)建

        (1)建模方法

        用戶之間的交往越復雜,隨機性越強。在電信運營商可以獲得的數(shù)據(jù)中,主要是能夠反映用戶親密度的信息發(fā)生的聯(lián)系數(shù)量、聯(lián)系發(fā)生的時間間隔、聯(lián)系發(fā)生的時間段以及聯(lián)系發(fā)生的時間。

        顯然,擁有更多聯(lián)系的用戶之間存在更大的親密關(guān)系。隨著數(shù)量的增長,聯(lián)系的親密度在增加。線性函數(shù)可以大致地刻畫出數(shù)量對親密度的影響程度。

        分析交往圈的交往痕跡,淡化交往形式,以交往軌跡的均勻性確定交往圈的穩(wěn)定性,重點獲取過去三個月的穩(wěn)定交往圈作為話務分析的重點交往圈。建立模型:

        (2)計算月、旬、周、三天、日交往系數(shù)

        用戶的交往系數(shù),也就是用戶間聯(lián)系的可能性,根據(jù)用戶近三個月歷史通話、短信詳單,抽取3000W用戶詳單數(shù)據(jù)作為訓練樣本,取最后一天聯(lián)系結(jié)果,通過SPSS軟件,根據(jù)普通最小二乘法的參數(shù)估計方法,計算出模型中的系數(shù),根據(jù)系數(shù)即各窗口的比重,將系數(shù)依據(jù)經(jīng)驗修正,得到交往系數(shù)為a=0.4、b=0.32、c=0.16、d=0.08、e=0.04。

        3.3 計算穩(wěn)定交往指數(shù)

        利用SPSS軟件,根據(jù)穩(wěn)定交往模型計算穩(wěn)定交往值。輸出穩(wěn)定交往圈清單,如表1。

        3.4 結(jié)果分析

        由實驗結(jié)果得出用戶間的穩(wěn)定交往指數(shù)。為便于量化穩(wěn)定交往指數(shù),用戶交往指數(shù)最高值為10。提高了算法的執(zhí)行效率,為用戶交往圈的快速建立有一定指導意義,尤其是對于10億量級的數(shù)據(jù)。

        基于用戶間穩(wěn)定交往指數(shù)的計算結(jié)果,將單個用戶的穩(wěn)定交往指數(shù)結(jié)果求和,計算得出單個用戶交往圈的大小,值無上限,值越高代表用戶交往圈越穩(wěn)固廣泛。用戶的交互圈的價值與用戶的ARPU值(每個用戶平均貢獻的電信服務收入的價值)正相關(guān)。

        4 結(jié)論

        基于多元線性回歸分析原理,應用統(tǒng)計軟件SPSS對電信運營商的通話及短信詳單進行統(tǒng)計分析,建立數(shù)學模型,得出用戶間穩(wěn)定交往指數(shù)。結(jié)果表明,用戶交互圈與ARPU值之間存在正相關(guān)關(guān)系。

        綜上所述,隨著移動通信技術(shù)的發(fā)展,運營商擴展數(shù)據(jù)挖掘的應用,從數(shù)據(jù)挖掘入手,結(jié)合自身發(fā)展實際,利用數(shù)據(jù)挖掘技術(shù)進行科學的統(tǒng)計分析,為企業(yè)發(fā)展和決策提供科學的數(shù)據(jù)參考,促進企業(yè)自我發(fā)展目標的科學實現(xiàn)。

        參考文獻:

        [1] 張晴,高廣銀,賈波.數(shù)據(jù)挖掘技術(shù)在超市營銷系統(tǒng)中的應用[J].軟件工程,2016,19(05):35-38.

        [2] 張慧,徐勇.數(shù)據(jù)挖掘中SVM模型與貝葉斯模型的比較分析——基于電信客戶的流失分析[J].平頂山學報,2016,31(2):68-73.

        [3] 郭存芝,杜延軍,李春吉.計量經(jīng)濟學—理論.方法.Eviews 應用[M].科學出版社,2008.

        [4] 冷建飛,高旭,朱嘉平.多元線性回歸統(tǒng)計預測模型的應用[J].統(tǒng)計與決策,2016(07):82-85.

        [5] 鄒樂強.最小二乘法原理及其簡單應用[J].科技信息,2010(23):282-283.

        [6] 王明斌,尹紹宏.淺析從Sybase移植到GBase 8a國產(chǎn)數(shù)據(jù)庫方法[J].科技展望,2016,26(22):17.

        【通聯(lián)編輯:代影】

        猜你喜歡
        多元線性回歸預測模型
        基于組合模型的卷煙市場需求預測研究
        基于多元線性回歸分析的冬季鳥類生境選擇研究
        基于神經(jīng)網(wǎng)絡的北京市房價預測研究
        商情(2016年43期)2016-12-23 14:23:13
        我國上市商業(yè)銀行信貸資產(chǎn)證券化效應實證研究
        時代金融(2016年29期)2016-12-05 15:41:07
        中國石化J分公司油氣開發(fā)投資分析與預測模型研究
        云學習平臺大學生學業(yè)成績預測與干預研究
        基于IOWHA法的物流需求組合改善與預測模型構(gòu)建
        基于預測模型加擾動控制的最大功率點跟蹤研究
        科技視界(2016年1期)2016-03-30 13:37:45
        少妇愉情理伦片丰满丰满| 蜜臀av一区二区| 丁香五月缴情综合网| 无码一区二区三区网站| 亚洲综合网一区二区三区| 美女视频黄a视频全免费网站色| 国产午夜精品无码| 人妻少妇不满足中文字幕| 免费无码黄动漫在线观看| 久久久久欧洲AV成人无码国产 | 大桥未久av一区二区三区| 中文字幕亚洲精品无码| 乌克兰少妇xxxx做受野外| 日韩欧美国产丝袜视频| 日韩av中文字幕少妇精品| 国产午夜精品视频观看| 伊人大杳焦在线| 久久人人爽人人爽人人av东京热| 亚洲AV一二三四区四色婷婷| 少妇性l交大片免费快色| 婚外情长久的相处之道| 摸丰满大乳奶水www免费| 中文字幕日本最新乱码视频| 国产精品毛片无码久久| 中国免费av网| 日本黄色影院一区二区免费看| 东北女人啪啪对白| 伊人狠狠色丁香婷婷综合| 中文字幕无线码中文字幕| 2020最新国产激情| 清纯唯美亚洲经典中文字幕| 亚洲av一区二区三区色多多| 波多野结衣绝顶大高潮| 少妇饥渴偷公乱a级无码| 污污污污污污WWW网站免费| 男人的天堂av网站一区二区| 懂色av一区二区三区网久久| 伊人情人色综合网站| 理论片午午伦夜理片影院| 九月色婷婷免费| 中文字幕隔壁人妻欲求不满|