亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        運(yùn)營(yíng)商異網(wǎng)寬帶用戶識(shí)別模型設(shè)計(jì)與構(gòu)建*

        2016-09-06 12:50:40張力元王純北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室北京100876東信北郵信息技術(shù)有限公司北京100191
        關(guān)鍵詞:寬帶用戶寬帶運(yùn)營(yíng)商

        張力元,王純(1 北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100876; 2 東信北郵信息技術(shù)有限公司,北京 100191)

        運(yùn)營(yíng)商異網(wǎng)寬帶用戶識(shí)別模型設(shè)計(jì)與構(gòu)建*

        張力元1,2,王純1,2
        (1 北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100876; 2 東信北郵信息技術(shù)有限公司,北京 100191)

        運(yùn)營(yíng)商光寬帶業(yè)務(wù)目前處于發(fā)展初期,在電信寬帶、聯(lián)通寬帶以及其他第三方寬帶運(yùn)營(yíng)商已經(jīng)有固定用戶群規(guī)模時(shí),運(yùn)營(yíng)商光寬帶發(fā)展的首要目標(biāo)應(yīng)集中在正在使用的客戶中,精準(zhǔn)識(shí)別出運(yùn)營(yíng)商客戶中的疑似異網(wǎng)使用用戶。目前異網(wǎng)寬帶識(shí)別采用人工判斷的方式,這種方式識(shí)別準(zhǔn)確率較低且覆蓋用戶數(shù)過少。本文通過分析挖掘辦法分析不同類型寬帶用戶的使用特征,對(duì)異網(wǎng)寬帶用戶進(jìn)行精準(zhǔn)識(shí)別,實(shí)現(xiàn)疑似異網(wǎng)寬帶用戶清單輸出,為運(yùn)營(yíng)人員開展異網(wǎng)寬帶用戶轉(zhuǎn)網(wǎng)活動(dòng)營(yíng)銷以及擴(kuò)大運(yùn)營(yíng)商寬帶市場(chǎng)占有率提供客戶數(shù)據(jù)信息支持。

        異網(wǎng)用戶;運(yùn)營(yíng)商;分析建模

        運(yùn)營(yíng)商光寬帶業(yè)務(wù)目前處于發(fā)展初期,在電信寬帶、聯(lián)通寬帶以及其他第三方寬帶運(yùn)營(yíng)商已經(jīng)有固定用戶群規(guī)模時(shí),運(yùn)營(yíng)商光寬帶發(fā)展的首要目標(biāo)應(yīng)集中在運(yùn)營(yíng)商使用客戶中,精準(zhǔn)識(shí)別出運(yùn)營(yíng)商客戶中的疑似異網(wǎng)使用用戶。

        1 設(shè)計(jì)目標(biāo)

        通過與運(yùn)營(yíng)商寬帶運(yùn)營(yíng)業(yè)務(wù)人員調(diào)研,目前異網(wǎng)寬帶識(shí)別采用人工判斷的方式,這種方式識(shí)別準(zhǔn)確率較低且覆蓋用戶數(shù)過少。因此本次模型通過分析挖掘辦法分析不同類型寬帶用戶的使用特征,對(duì)異網(wǎng)寬帶用戶進(jìn)行精準(zhǔn)識(shí)別,實(shí)現(xiàn):

        (1)疑似異網(wǎng)寬帶用戶清單輸出,為運(yùn)營(yíng)人員開展異網(wǎng)寬帶用戶轉(zhuǎn)網(wǎng)活動(dòng)營(yíng)銷以及擴(kuò)大運(yùn)營(yíng)商寬帶市場(chǎng)占有率提供客戶數(shù)據(jù)信息支持。

        (2)及時(shí)監(jiān)控運(yùn)營(yíng)商客戶中異網(wǎng)寬帶用戶的數(shù)量變化趨勢(shì),為寬帶運(yùn)營(yíng)人員調(diào)整運(yùn)營(yíng)方式提供數(shù)據(jù)支持。

        2 模型設(shè)計(jì)

        2.1業(yè)務(wù)模型設(shè)計(jì)

        如圖1所示,異網(wǎng)寬帶用戶識(shí)別模型流程由3部分構(gòu)成:A部分為異網(wǎng)寬帶用戶識(shí)別模型數(shù)據(jù)的獲?。籅部分為形成初步疑似異網(wǎng)寬帶用戶清單;C部分為形成最終異網(wǎng)寬帶用戶輸出結(jié)果及前臺(tái)展示。

        不同的用戶類型采用不同的識(shí)別算法得到輸出列表,單一的識(shí)別算法可能會(huì)過濾掉部分異網(wǎng)寬帶潛在用戶。

        圖1 業(yè)務(wù)模型設(shè)計(jì)圖

        2.2數(shù)據(jù)流設(shè)計(jì)

        根據(jù)業(yè)務(wù)模型設(shè)計(jì)得到模型各階段所需數(shù)據(jù)與所需數(shù)據(jù)流向,數(shù)據(jù)流設(shè)計(jì)如圖2所示。

        圖2 數(shù)據(jù)流設(shè)計(jì)圖

        2.3模型數(shù)據(jù)字段設(shè)計(jì)

        基于數(shù)據(jù)模型時(shí)間窗口設(shè)計(jì)原則,完整的模型訓(xùn)練數(shù)據(jù)大概需要60天的數(shù)據(jù)支撐,加上模型驗(yàn)證和模型評(píng)估,至少需要90天數(shù)據(jù)。

        通常模型構(gòu)建數(shù)據(jù)來源優(yōu)先選擇近期數(shù)據(jù),對(duì)于比較老的數(shù)據(jù),模型輸出規(guī)則作用于現(xiàn)網(wǎng)數(shù)據(jù)可能已處于模型生命周期結(jié)尾,因此不適合用來進(jìn)行模型的訓(xùn)練、驗(yàn)證、測(cè)試和評(píng)估。因此,選擇數(shù)據(jù)時(shí)選擇最近60天的數(shù)據(jù);由于本模型要求數(shù)據(jù)來源較廣且量大,涉及某全省用戶數(shù)據(jù)及全省運(yùn)營(yíng)商寬帶IP數(shù)據(jù)等信息,所以需從多個(gè)表中進(jìn)行提取,初步梳理的模型重要字段如表1所示。

        運(yùn)營(yíng)商IP信息庫、異網(wǎng)寬帶相關(guān)URL庫、異網(wǎng)相關(guān)APP庫,需數(shù)據(jù)維護(hù)人員根據(jù)運(yùn)營(yíng)商網(wǎng)關(guān)數(shù)據(jù)累計(jì)完成并錄入相關(guān)信息表。

        2.4模型詳細(xì)設(shè)計(jì)

        2.4.1模型設(shè)計(jì)詳細(xì)思路

        異網(wǎng)寬帶用戶識(shí)別模型(簡(jiǎn)稱模型)主要從網(wǎng)關(guān)接觸、流量使用特征這兩個(gè)維度分析識(shí)別某省全網(wǎng)用戶中異網(wǎng)寬帶用戶。模型整體設(shè)計(jì)思路圖如圖3所示。

        (1)數(shù)據(jù)準(zhǔn)備:梳理模型所需基本指標(biāo),并探索數(shù)據(jù)來源,同時(shí)通過對(duì)基本指標(biāo)的計(jì)算,輸出以用戶號(hào)碼為唯一標(biāo)識(shí)的模型所需寬表。

        (2)指標(biāo)篩選:表1中各指標(biāo)間存在不同的相關(guān)關(guān)系,且對(duì)分析結(jié)果影響程度也不盡相同,存在一些噪聲指標(biāo)可能對(duì)模型有效性產(chǎn)生負(fù)面影響,所以,在模型構(gòu)建前,通過指標(biāo)間的相關(guān)性分析、指標(biāo)與目標(biāo)變量的相關(guān)性分析、主成分分析篩選出對(duì)模型影響較大的指標(biāo)作為輸入。

        (3)模型構(gòu)建:

        第1步,用戶流量特征分析:通過對(duì)比分析已辦理某運(yùn)營(yíng)商寬帶用戶和未知用戶的流量使用特征,構(gòu)建決策樹、回歸等算法的數(shù)據(jù)挖掘模型來識(shí)別異網(wǎng)寬帶用戶,同時(shí)輸出識(shí)別規(guī)則或概率。

        第2步,融合用戶網(wǎng)關(guān)接觸維度分析:通過對(duì)比分析已確認(rèn)的異網(wǎng)寬帶用戶采用異網(wǎng)寬帶接觸某運(yùn)營(yíng)商自有網(wǎng)頁、客戶端與使用該運(yùn)營(yíng)商流量接觸異網(wǎng)寬帶辦理頁面或者該運(yùn)營(yíng)商用戶安裝了其他寬帶運(yùn)營(yíng)商的APP以及手機(jī)流量使用特征的相關(guān)信息數(shù)據(jù),進(jìn)行構(gòu)建決策樹、回歸等算法的數(shù)據(jù)挖掘模型來識(shí)別異網(wǎng)寬帶用戶,同時(shí)輸出識(shí)別規(guī)則或概率。

        表1 模型原始數(shù)據(jù)字段表

        圖3 模型詳細(xì)設(shè)計(jì)圖

        (4)模型驗(yàn)證:將模型輸出規(guī)則在全量用戶中運(yùn)行,輸出異網(wǎng)寬帶疑似用戶數(shù)據(jù),該數(shù)據(jù)需剔除已辦理了某運(yùn)營(yíng)商寬帶用戶及其家庭網(wǎng)成員的相關(guān)用戶,對(duì)剔除后的用戶進(jìn)行驗(yàn)證,查看命中率、覆蓋率能否達(dá)到預(yù)期標(biāo)準(zhǔn)。如未達(dá)到預(yù)期,需進(jìn)行模型優(yōu)化。

        2.4.2數(shù)據(jù)統(tǒng)計(jì)衍生

        原始數(shù)據(jù)提取后,接著需要構(gòu)建模型所需統(tǒng)計(jì)及衍生信息表(簡(jiǎn)稱寬表)。寬表的建立是模型構(gòu)建最重要的階段之一,通常需要花費(fèi)大量的時(shí)間與精力。一般情況下,實(shí)際的數(shù)據(jù)寬表構(gòu)建工作通常占據(jù)整個(gè)模型建設(shè)大量的工程時(shí)間和工作量。

        本次模型寬表構(gòu)建包含以下任務(wù)。

        (1)將某運(yùn)營(yíng)商全網(wǎng)用戶劃分為已辦理寬帶用戶、未辦理該運(yùn)營(yíng)商寬帶用戶。

        (2)通過該運(yùn)營(yíng)商IP庫信息與異網(wǎng)網(wǎng)絡(luò)訪問該運(yùn)營(yíng)商自有網(wǎng)站信息數(shù)據(jù)匹配,剔除數(shù)據(jù)中的IP為該運(yùn)營(yíng)商IP的數(shù)據(jù)。

        (3)通過異網(wǎng)寬帶相關(guān)URL庫信息與某運(yùn)營(yíng)商流量訪問異網(wǎng)寬帶網(wǎng)站信息數(shù)據(jù)匹配,篩選數(shù)據(jù)中的URL為異網(wǎng)寬帶相關(guān)URL的數(shù)據(jù)。

        (4)通過異網(wǎng)寬帶相關(guān)APP庫信息與某運(yùn)營(yíng)商流量訪問異網(wǎng)寬帶網(wǎng)站信息數(shù)據(jù)匹配,篩選數(shù)據(jù)中的APP為異網(wǎng)寬帶相關(guān)APP的數(shù)據(jù)。

        (5)合并數(shù)據(jù)集合或記錄。

        (6)選擇數(shù)據(jù)子集樣本。

        (7)匯總記錄。

        (8)排序數(shù)據(jù)以便建模。

        (9)刪除或替換空值或缺失值、數(shù)據(jù)的錯(cuò)誤檢測(cè)。

        (10)生成統(tǒng)計(jì)指標(biāo)及衍生指標(biāo)。

        (11)分為訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。

        通過以上步驟對(duì)原始數(shù)據(jù)的處理匯總來構(gòu)建寬表。根據(jù)訓(xùn)練模型需要,以用戶自然屬性為基礎(chǔ),根據(jù)用戶使用非運(yùn)營(yíng)商IP訪問運(yùn)營(yíng)商網(wǎng)站信息、安裝APP、使用流量特征等信息提取并生成衍生指標(biāo)。

        2.4.3指標(biāo)選取

        在模型的指標(biāo)選取過程中主要采用指標(biāo)相關(guān)性分析、主成分分析,選擇影響較大的指標(biāo),模型構(gòu)建時(shí)需輸入如表2所示指標(biāo)。

        表2 模型衍生指標(biāo)表

        3 模型構(gòu)建

        3.1流量使用特征對(duì)比分析

        流量特征分析維度主要過程如圖4所示。

        圖4 流量特征分析圖

        3.2網(wǎng)關(guān)接觸維度分析

        首先,根據(jù)用戶網(wǎng)關(guān)接觸類型的差異,將用戶分為3類:使用異網(wǎng)寬帶接觸某運(yùn)營(yíng)商網(wǎng)絡(luò)用戶信息、使用該運(yùn)營(yíng)商網(wǎng)絡(luò)接觸異網(wǎng)網(wǎng)絡(luò)用戶信息、手機(jī)安裝異網(wǎng)寬帶相關(guān)APP用戶信息。其次,分別對(duì)上述3類用戶數(shù)據(jù)進(jìn)行分析判斷并輸出規(guī)則。

        (1)使用異網(wǎng)寬帶接觸該運(yùn)營(yíng)商網(wǎng)絡(luò)用戶:根據(jù)該類用戶接觸運(yùn)營(yíng)商網(wǎng)站類型的不同再次劃分為PC端和移動(dòng)端兩類;通過分析樣本數(shù)據(jù)周期內(nèi)這兩類用戶的訪問次數(shù)、訪問時(shí)長(zhǎng)、使用IP數(shù)量等指標(biāo)來判斷閾值,分析用戶是否為疑似異網(wǎng)寬帶用戶。

        (2)使用該運(yùn)營(yíng)商網(wǎng)絡(luò)接觸異網(wǎng)網(wǎng)絡(luò)用戶:分析樣本數(shù)據(jù)周期內(nèi)使用運(yùn)營(yíng)商流量訪問其他寬帶運(yùn)營(yíng)商的寬帶相關(guān)頁面的用戶,分析用戶的訪問頻次、訪問時(shí)長(zhǎng)、訪問URL數(shù)量等指標(biāo)來判斷閾值,分析用戶是否為疑似異網(wǎng)寬帶用戶。

        (3)手機(jī)安裝異網(wǎng)寬帶相關(guān)APP用戶:分析樣本數(shù)據(jù)周期內(nèi)用戶手機(jī)安裝異網(wǎng)寬帶相關(guān)APP信息,分析這類用戶使用這些APP的次數(shù)、時(shí)長(zhǎng)等指標(biāo)來判斷閾值,分析用戶是否為疑似異網(wǎng)寬帶用戶。

        3.3模型評(píng)估方案設(shè)計(jì)

        模型評(píng)估是異網(wǎng)寬帶用戶識(shí)別模型的關(guān)鍵部分,一方面通過模型評(píng)估可以對(duì)模型進(jìn)行進(jìn)一步的優(yōu)化,提高模型的識(shí)別準(zhǔn)確率;另一方面,通過模型評(píng)估可以檢驗(yàn)?zāi)P蛯?shí)際效果,對(duì)維系策略的有效性進(jìn)行評(píng)價(jià)。本模型通過兩個(gè)重要指標(biāo)進(jìn)行評(píng)估。

        查準(zhǔn)率:描述模型預(yù)測(cè)準(zhǔn)確性指標(biāo)。

        查準(zhǔn)率=預(yù)測(cè)實(shí)際異網(wǎng)寬帶用戶數(shù)/預(yù)測(cè)異網(wǎng)寬帶的總用戶數(shù)×100%。

        查全率:描述模型預(yù)測(cè)結(jié)果與實(shí)際結(jié)果對(duì)比情況指標(biāo)。

        查全率=預(yù)測(cè)異網(wǎng)寬帶的用戶數(shù)/總異網(wǎng)寬帶用戶數(shù)×100%。

        3.4模型輸出

        根據(jù)需求要求模型輸出指標(biāo)如表3所示。

        表3 模型輸出指標(biāo)表

        4 結(jié)束語

        本文提出了一個(gè)基于運(yùn)營(yíng)商寬帶的異網(wǎng)寬帶用戶識(shí)別的設(shè)計(jì)與構(gòu)建方案,生成了一套模型設(shè)計(jì)、模型構(gòu)建、模型評(píng)估方案。為了提高分析結(jié)果的準(zhǔn)確性,本系統(tǒng)充分利用用戶的流量特征、網(wǎng)關(guān)特征,選取全量話單的數(shù)據(jù)字段作為模型的輸入數(shù)據(jù)字段,并以最能體現(xiàn)用戶異網(wǎng)行為的字段作為指標(biāo)統(tǒng)計(jì)字段?;谠摲桨?,運(yùn)營(yíng)商操作人員能夠從該分析系統(tǒng)獲取異網(wǎng)用戶詳單信息,包括用戶姓名、號(hào)碼、地市等,同時(shí)可以導(dǎo)出進(jìn)行統(tǒng)計(jì)查看。

        [1] 任磊.大數(shù)據(jù)可視分析綜述[J]. 軟件學(xué)報(bào),2014(9).

        [2] 張良,王純,李煒. 基于內(nèi)存數(shù)據(jù)庫的存儲(chǔ)集群的關(guān)鍵技術(shù)研究[J]. 電信工程技術(shù)與標(biāo)準(zhǔn)化, 2012(10).

        Design and construction of broadband user identification model based on operator broadband system

        ZHANG Li-yuan1,2, WANG Chun1,2
        (1 State Key Laboratory of Networking and Switching Technology, Beijing University of Posts and Telecommunications,Beijing 100876, China; 2 EBUPT Information Technology Co., Ltd., Beijing 100191, China)

        The mobile broadband business currently is in early development. In broadband telecommunications,Unicom broadband and other third-party broadband operators have fi xed the size of the user base. The goal of the development of mobile broadband optical should be focused in the use of mobile customers,accurately identify mobile customers suspected of different network users. Currently, different broadband network recognition using artificial judgment, the recognition accurate rate is low and the number of users covered is too little. This paper through the analysis of mining method analysis of the features of the use of different types of broadband users, with the accurate identification of different network broadband users, achieve suspected different network broadband users list output, for the operations staff to carry out different network broadband users turn network marketing activities and expand operator broadband market share to provide customer information support.

        different network users; operator; modeling analysis

        TN929.5

        A

        1008-5599(2016)08-0052-05

        2016-05-17

        國(guó)家973計(jì)劃項(xiàng)目(編號(hào):2013CB329102);國(guó)家自然科學(xué)基金資助項(xiàng)目(No. 61471063, 61372120, 61271019, 61101119,61121001);長(zhǎng)江學(xué)者和創(chuàng)新團(tuán)隊(duì)發(fā)展計(jì)劃資助(編號(hào):IRT1049);教育部科學(xué)技術(shù)研究重點(diǎn)(重大)項(xiàng)目資助(編號(hào):MCM20130310);北京高等學(xué)校青年英才計(jì)劃項(xiàng)目(編號(hào):YETP0473)。

        猜你喜歡
        寬帶用戶寬帶運(yùn)營(yíng)商
        裝寬帶的人
        文苑(2020年7期)2020-08-12 09:36:04
        2019年第一季度移動(dòng)用戶總數(shù)同比增長(zhǎng)2%
        我國(guó)手機(jī)上網(wǎng)用戶達(dá)11億
        青海固定寬帶高速率接入用戶占比超過95%
        論如何提高寬帶用戶感知度
        取消“漫游費(fèi)”只能等運(yùn)營(yíng)商“良心發(fā)現(xiàn)”?
        一種新穎的寬帶大功率分配器
        第一章 在腐敗火上烤的三大運(yùn)營(yíng)商
        三大運(yùn)營(yíng)商換帥不是一個(gè)簡(jiǎn)單的巧合
        三大運(yùn)營(yíng)商換帥
        国产一二三四2021精字窝| 精品免费一区二区三区在| 免费人成视频欧美| 日韩激情av不卡在线| 国产亚洲精品视频一区二区三区 | 中文字幕日本特黄aa毛片| 精品无码久久久九九九AV| 亚洲中文字幕av一区二区三区人| 日本黄网色三级三级三级| 一区二区三区中文字幕p站| 久热国产vs视频在线观看| aaaaa级少妇高潮大片免费看| 无码国产日韩精品一区二区| 日本一区不卡在线观看| 自拍偷自拍亚洲精品第按摩| 亚洲a∨无码男人的天堂| 激情久久av一区av二区av三区 | 亚洲精品一区二区国产精华液 | 国产精品无码久久久久下载| 久久精品国产亚洲av沈先生| 亚洲国产中文字幕视频| 天下第二社区在线视频| 双腿张开被9个黑人调教影片| 亚洲国产精一区二区三区性色| 亚洲第一黄色免费网站| 乱中年女人伦av三区| 色老头在线一区二区三区| 亚洲人成网站18男男| 女主播啪啪大秀免费观看| 大陆国产乱人伦| 日韩插啊免费视频在线观看| 91久久国产情侣真实对白| 亚洲天堂男人的av天堂| 精品久久久久久亚洲综合网| 在线精品国产一区二区三区| 午夜影视啪啪免费体验区入口 | 最新国产激情视频在线观看| 香港aa三级久久三级| 性饥渴艳妇性色生活片在线播放 | 国产午夜亚洲精品国产成人av| 男ji大巴进入女人的视频小说|