亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        移動通信用戶交際圈研究

        2019-11-12 12:01:33張治高
        電腦知識與技術(shù) 2019年25期
        關(guān)鍵詞:多元線性回歸預(yù)測模型

        張治高

        摘要:電信運營商擁有天量的通話詳單和短信詳單,用戶的通話及短信同時也伴隨著巨大的行為數(shù)據(jù)產(chǎn)生。過對電信運營商的移動通信用戶的通話及短信清單,利用多元回歸的預(yù)測模型,建立了穩(wěn)定交往模型。利用最小二乘估計的方法,通過SPSS軟件計算出模型的未知參數(shù)。計算出用戶間穩(wěn)定交往指數(shù),為運營商提高存量用戶的忠誠度,減少用戶流失提供了數(shù)據(jù)依據(jù)。

        關(guān)鍵詞:多元線性回歸; 預(yù)測模型;SPSS;交往圈

        中圖分類號:TP393? ? ? ? 文獻標(biāo)識碼:A

        文章編號:1009-3044(2019)25-0305-03

        1 引言

        數(shù)據(jù)挖掘中使用的相關(guān)算法來自大量、不完整、隨機、模糊中提取有用的數(shù)據(jù)、正確、全面、未知、用戶感興趣的知識等。建立數(shù)學(xué)模型,用來決策支持的模型,提供預(yù)測性決策支持的方法、過程、工具[1]。數(shù)據(jù)挖掘通常是指通過算法從大量數(shù)據(jù)中搜索隱藏在其中的信息的過程。隨著互聯(lián)網(wǎng)時代的到來和數(shù)據(jù)大爆發(fā),數(shù)據(jù)挖掘技術(shù)普遍而且迫切地應(yīng)用于各個領(lǐng)域,比如金融、電信、保險、互聯(lián)網(wǎng)等行業(yè)。它通過運用整理、分析、總結(jié)、推理等方法對大量地數(shù)據(jù)進行處理,從而對實際問題進行指導(dǎo)和分析,獲得相關(guān)預(yù)測結(jié)果以做出更有利的決策[2]。

        在電信行業(yè),用戶之間的互通行為,一般稱之為交往。這種交往關(guān)系不但可以發(fā)現(xiàn)用戶的交往圈范圍,還可以挖掘競爭對手,為用戶維穩(wěn)、策反營銷提供信息支持。人們總是試圖憑借一個或者若干個指標(biāo)衡量兩個用戶之間的交往密切程度。那么,這個衡量交往密切程度的指標(biāo),我們統(tǒng)稱之為交往指數(shù)。早期一般通過互通(語音、短信等)次數(shù)、時長來考察交往情況,效果不理想。原因是人與人之間的相互作用在一段時間內(nèi)相對穩(wěn)定,但總是在變化;此外,單個聯(lián)系人的數(shù)量和長期的互操作性不足以表明這種交互是穩(wěn)定的。因此,要想尋找用戶的穩(wěn)定交往群體,必須要從時間、交往次數(shù)、交往方式和交往時刻分布等多個角度來綜合衡量交往的穩(wěn)定性。

        2 算法及相關(guān)軟件介紹

        2.1 多元回歸的預(yù)測模型

        回歸分析是探索變量之間的相關(guān)性和依賴性的有效方法??傮w回歸模型[3]反映了變量間關(guān)系的總體趨勢,線性總體回歸模型形式簡單、參數(shù)的估計與檢驗也相對容易,是最為常見的總體回歸模型。

        2.3 SPSS軟件介紹

        SPSS軟件是目前較為流行的統(tǒng)計分析軟件,在醫(yī)學(xué)、經(jīng)濟、教育和通信等相關(guān)領(lǐng)域的應(yīng)用有分廠顯著成果,界面非常友好,能夠非常全面的滿足統(tǒng)計工作提出的各種個性化的需求。SPSS軟件包含了統(tǒng)計學(xué)眾多方面的基本內(nèi)容,且擁有非常強的圖標(biāo)生成功能,有較為理想的交互界面,通過錄入的相關(guān)數(shù)據(jù),就能夠快速得出相應(yīng)的統(tǒng)計結(jié)果。

        2.4 GBase數(shù)據(jù)庫介紹

        GBase 是南大通用數(shù)據(jù)技術(shù)有限公司研發(fā)的自主品牌的數(shù)據(jù)庫,目前在國內(nèi)具有較高的品牌知名度,符合國家自出創(chuàng)新戰(zhàn)略要求,是國內(nèi)第一事務(wù)處理性能的數(shù)據(jù)庫。GBase 8a 已經(jīng)廣泛運用聯(lián)通、移動、電信多個省的經(jīng)營分析、大數(shù)據(jù)平臺等關(guān)鍵業(yè)務(wù)系統(tǒng)[6]。

        3 建模過程及結(jié)果分析

        3.1 數(shù)據(jù)預(yù)處理

        通過通話詳單與短信詳單作為數(shù)據(jù)基礎(chǔ)進行分析,取近三個月的通話詳單及短信詳單。選取某市運營商移網(wǎng)用戶短信和通話記錄詳單,此次數(shù)據(jù)分析以201809、201810、201811三個月的通話詳單(BSS&CBSS話單)、短信詳單(BSS&CBSS短信)為模型輸入條件,共計27.8億條。

        通過通話詳單與短信詳單中有需要清理的干擾數(shù)據(jù),sp服務(wù)號碼,個人及企業(yè)廣告推銷號碼等都需要剔除,否則將影響結(jié)果的正確性。

        在GBase數(shù)據(jù)庫中借助 SQL 語句對原數(shù)據(jù)集進行預(yù)處理,主要進行了以下步驟:

        (1)服務(wù)和sp廣告推銷號碼剔除:由于這些號碼的開始位數(shù)以及長度有固定的特征,因此可以在GBase數(shù)據(jù)庫中通過長度和key value的查詢將其剔除;

        (2)個人及企業(yè)廣告推銷號碼過濾:這些號碼的絕大多數(shù)的通話行為是主叫用戶且產(chǎn)生的話務(wù)量異常巨大,與被叫用戶的聯(lián)系只是短期的。此類號碼定義為廣告推銷號碼,它們在形式上與普通客戶號碼沒有區(qū)別,不能通過簡單的數(shù)據(jù)庫條件過濾獲得,所以只能通過號碼的通話特征進行甄別過濾。

        3.2 穩(wěn)定交往模型構(gòu)建

        (1)建模方法

        用戶之間的交往越復(fù)雜,隨機性越強。在電信運營商可以獲得的數(shù)據(jù)中,主要是能夠反映用戶親密度的信息發(fā)生的聯(lián)系數(shù)量、聯(lián)系發(fā)生的時間間隔、聯(lián)系發(fā)生的時間段以及聯(lián)系發(fā)生的時間。

        顯然,擁有更多聯(lián)系的用戶之間存在更大的親密關(guān)系。隨著數(shù)量的增長,聯(lián)系的親密度在增加。線性函數(shù)可以大致地刻畫出數(shù)量對親密度的影響程度。

        分析交往圈的交往痕跡,淡化交往形式,以交往軌跡的均勻性確定交往圈的穩(wěn)定性,重點獲取過去三個月的穩(wěn)定交往圈作為話務(wù)分析的重點交往圈。建立模型:

        (2)計算月、旬、周、三天、日交往系數(shù)

        用戶的交往系數(shù),也就是用戶間聯(lián)系的可能性,根據(jù)用戶近三個月歷史通話、短信詳單,抽取3000W用戶詳單數(shù)據(jù)作為訓(xùn)練樣本,取最后一天聯(lián)系結(jié)果,通過SPSS軟件,根據(jù)普通最小二乘法的參數(shù)估計方法,計算出模型中的系數(shù),根據(jù)系數(shù)即各窗口的比重,將系數(shù)依據(jù)經(jīng)驗修正,得到交往系數(shù)為a=0.4、b=0.32、c=0.16、d=0.08、e=0.04。

        3.3 計算穩(wěn)定交往指數(shù)

        利用SPSS軟件,根據(jù)穩(wěn)定交往模型計算穩(wěn)定交往值。輸出穩(wěn)定交往圈清單,如表1。

        3.4 結(jié)果分析

        由實驗結(jié)果得出用戶間的穩(wěn)定交往指數(shù)。為便于量化穩(wěn)定交往指數(shù),用戶交往指數(shù)最高值為10。提高了算法的執(zhí)行效率,為用戶交往圈的快速建立有一定指導(dǎo)意義,尤其是對于10億量級的數(shù)據(jù)。

        基于用戶間穩(wěn)定交往指數(shù)的計算結(jié)果,將單個用戶的穩(wěn)定交往指數(shù)結(jié)果求和,計算得出單個用戶交往圈的大小,值無上限,值越高代表用戶交往圈越穩(wěn)固廣泛。用戶的交互圈的價值與用戶的ARPU值(每個用戶平均貢獻的電信服務(wù)收入的價值)正相關(guān)。

        4 結(jié)論

        基于多元線性回歸分析原理,應(yīng)用統(tǒng)計軟件SPSS對電信運營商的通話及短信詳單進行統(tǒng)計分析,建立數(shù)學(xué)模型,得出用戶間穩(wěn)定交往指數(shù)。結(jié)果表明,用戶交互圈與ARPU值之間存在正相關(guān)關(guān)系。

        綜上所述,隨著移動通信技術(shù)的發(fā)展,運營商擴展數(shù)據(jù)挖掘的應(yīng)用,從數(shù)據(jù)挖掘入手,結(jié)合自身發(fā)展實際,利用數(shù)據(jù)挖掘技術(shù)進行科學(xué)的統(tǒng)計分析,為企業(yè)發(fā)展和決策提供科學(xué)的數(shù)據(jù)參考,促進企業(yè)自我發(fā)展目標(biāo)的科學(xué)實現(xiàn)。

        參考文獻:

        [1] 張晴,高廣銀,賈波.數(shù)據(jù)挖掘技術(shù)在超市營銷系統(tǒng)中的應(yīng)用[J].軟件工程,2016,19(05):35-38.

        [2] 張慧,徐勇.數(shù)據(jù)挖掘中SVM模型與貝葉斯模型的比較分析——基于電信客戶的流失分析[J].平頂山學(xué)報,2016,31(2):68-73.

        [3] 郭存芝,杜延軍,李春吉.計量經(jīng)濟學(xué)—理論.方法.Eviews 應(yīng)用[M].科學(xué)出版社,2008.

        [4] 冷建飛,高旭,朱嘉平.多元線性回歸統(tǒng)計預(yù)測模型的應(yīng)用[J].統(tǒng)計與決策,2016(07):82-85.

        [5] 鄒樂強.最小二乘法原理及其簡單應(yīng)用[J].科技信息,2010(23):282-283.

        [6] 王明斌,尹紹宏.淺析從Sybase移植到GBase 8a國產(chǎn)數(shù)據(jù)庫方法[J].科技展望,2016,26(22):17.

        【通聯(lián)編輯:代影】

        猜你喜歡
        多元線性回歸預(yù)測模型
        基于組合模型的卷煙市場需求預(yù)測研究
        基于多元線性回歸分析的冬季鳥類生境選擇研究
        基于神經(jīng)網(wǎng)絡(luò)的北京市房價預(yù)測研究
        商情(2016年43期)2016-12-23 14:23:13
        我國上市商業(yè)銀行信貸資產(chǎn)證券化效應(yīng)實證研究
        時代金融(2016年29期)2016-12-05 15:41:07
        中國石化J分公司油氣開發(fā)投資分析與預(yù)測模型研究
        云學(xué)習(xí)平臺大學(xué)生學(xué)業(yè)成績預(yù)測與干預(yù)研究
        基于IOWHA法的物流需求組合改善與預(yù)測模型構(gòu)建
        基于預(yù)測模型加擾動控制的最大功率點跟蹤研究
        科技視界(2016年1期)2016-03-30 13:37:45
        亚洲最全av一区二区| 亚洲啪啪AⅤ一区二区三区| 麻豆成人久久精品二区三区91| 国产精品一区二区黑丝| 国产人妻久久精品二区三区老狼 | 国产在线精品一区二区三区| 亚洲一区二区三区成人网站| 日本精品一区二区三本中文| 伊人久久亚洲综合av影院| 最新国产精品拍自在线观看| 亚洲精品无码av中文字幕| 久久国产品野战| 在线高清亚洲精品二区| 最美女人体内射精一区二区| 亚洲欧美日韩中文在线制服| 亚洲区偷拍自拍29p| 亚洲熟女天堂av一区二区三区| 国产一精品一av一免费爽爽| 人妻丰满熟妇av无码处处不卡| 毛片一级精油按摩无码| 精品乱色一区二区中文字幕| 免费人妻无码不卡中文字幕系| 国产羞羞视频在线观看| 61精品人妻一区二区三区蜜桃 | 国产精品毛片无遮挡| 中文字幕亚洲无线码| 一区二区av日韩免费| 美女人妻中出日本人妻| www插插插无码视频网站| 欧美精品AⅤ在线视频| 我的美艳丝袜美腿情缘| 国产后入清纯学生妹| 久久久久国色av∨免费看| 久久精品国产一区二区涩涩 | 亚洲av无码一区二区乱子伦| 中文字幕日本人妻一区| 蜜桃视频网站在线观看一区| 亚洲国产一区二区a毛片| 无码人妻丝袜在线视频| 久久日韩精品一区二区| 亚洲国产精品综合久久网各|