亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        分維度策略的異網(wǎng)寬帶用戶(hù)識(shí)別方案

        2016-12-10 08:57:32王冰瑩杭州東信北郵信息技術(shù)有限公司
        信息通信技術(shù)與政策 2016年11期
        關(guān)鍵詞:寬帶用戶(hù)寬帶辦理

        王冰瑩 杭州東信北郵信息技術(shù)有限公司

        北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室碩士研究生在讀

        王晶 杭州東信北郵信息技術(shù)有限公司

        北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室副教授

        分維度策略的異網(wǎng)寬帶用戶(hù)識(shí)別方案

        王冰瑩 杭州東信北郵信息技術(shù)有限公司

        北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室碩士研究生在讀

        王晶 杭州東信北郵信息技術(shù)有限公司

        北京郵電大學(xué)網(wǎng)絡(luò)與交換技術(shù)國(guó)家重點(diǎn)實(shí)驗(yàn)室副教授

        目前某運(yùn)營(yíng)商已有的異網(wǎng)寬帶識(shí)別模型采用用戶(hù)使用異網(wǎng)IP登陸自有網(wǎng)站這種單一維度分析的方式,識(shí)別準(zhǔn)確率較低且覆蓋用戶(hù)數(shù)過(guò)少。采用多維度分析的方式構(gòu)建模型可以提高準(zhǔn)確率和效率,但是不同維度的數(shù)據(jù)量級(jí)差異明顯,如果強(qiáng)行建立模型分析會(huì)導(dǎo)致出現(xiàn)大量的空值。針對(duì)這些問(wèn)題,本文設(shè)計(jì)了一種分維度策略的異網(wǎng)寬帶用戶(hù)識(shí)別方案,實(shí)際應(yīng)用表明,該設(shè)計(jì)行之有效。

        分維度策略;異網(wǎng)寬帶;模型

        1 引言

        通過(guò)從某省運(yùn)營(yíng)商寬帶運(yùn)營(yíng)業(yè)務(wù)人員處調(diào)研得知,目前已有的異網(wǎng)寬帶識(shí)別模型采用用戶(hù)使用異網(wǎng)IP登陸運(yùn)營(yíng)商自有網(wǎng)站這種單一維度分析的方式。這種方式?jīng)]有對(duì)照已辦理該運(yùn)營(yíng)商本網(wǎng)的寬帶用戶(hù)和其他用戶(hù)的多種行為交叉分析,導(dǎo)致識(shí)別準(zhǔn)確率較低且覆蓋用戶(hù)數(shù)過(guò)少。

        分析挖掘融合分析不同類(lèi)型寬帶用戶(hù)的多種行為特征,對(duì)多種渠道采集來(lái)的信息進(jìn)行數(shù)據(jù)分析和挖掘,構(gòu)建識(shí)別模型可以大幅度提高識(shí)別準(zhǔn)確率。提升對(duì)推薦異網(wǎng)寬帶用戶(hù)轉(zhuǎn)網(wǎng)、寬帶營(yíng)銷(xiāo)的精準(zhǔn)度,減少人力成本和提升主動(dòng)服務(wù)能力,為企業(yè)進(jìn)一步制定營(yíng)銷(xiāo)策略提供依據(jù)。

        但是,采用多維度的數(shù)據(jù)構(gòu)建異網(wǎng)寬帶識(shí)別模型涉及到的數(shù)據(jù)較廣,指標(biāo)較多,并且數(shù)據(jù)獲取時(shí)間先后跨度較大,不同維度的數(shù)據(jù)量級(jí)明顯差異,將不同維度的數(shù)據(jù)強(qiáng)行建立一個(gè)模型分析會(huì)導(dǎo)致出現(xiàn)大量的空值,影響模型的準(zhǔn)確率和模型效率。

        因此,本文采取分維度的策略進(jìn)行,模型先采用用戶(hù)手機(jī)流量使用清單數(shù)據(jù)挖掘分析出疑似辦理寬帶用戶(hù),這類(lèi)輸出覆蓋率較廣;然后,使用其余數(shù)據(jù)進(jìn)一步對(duì)這類(lèi)用戶(hù)進(jìn)行判別分析,提高模型輸出的準(zhǔn)確率。

        2 模型的整體設(shè)計(jì)

        運(yùn)營(yíng)商使用客戶(hù)的寬帶使用上分為4大類(lèi),分別是辦理本網(wǎng)寬帶的用戶(hù)、辦理異網(wǎng)(其他運(yùn)營(yíng)商)寬帶的用戶(hù)、未辦理任何寬帶(沒(méi)有辦理寬帶的需求)的用戶(hù)、未辦理任何寬帶(有辦理寬帶的需求)的用戶(hù),本文模型的設(shè)計(jì)是針對(duì)辦理異網(wǎng)寬帶的用戶(hù)。

        模型所需數(shù)據(jù)分為3大類(lèi),分別是本網(wǎng)用戶(hù)手機(jī)流量使用清單、電渠登陸日志數(shù)據(jù)、XDR媒體面手機(jī)流量去向信息數(shù)據(jù)。另外,模型還需部分輔助信息,主要包括運(yùn)營(yíng)商用戶(hù)基本信息、用戶(hù)居住地信息、已辦理本網(wǎng)寬帶成員信息、家庭網(wǎng)用戶(hù)信息、異網(wǎng)IP信息、異網(wǎng)URL信息。

        由于這3類(lèi)數(shù)據(jù)的量級(jí)差距較大,模型首先根據(jù)已辦理該運(yùn)營(yíng)商寬帶的用戶(hù)的手機(jī)流量使用特征對(duì)比分析出疑似辦理寬帶的用戶(hù),進(jìn)一步融合用戶(hù)網(wǎng)關(guān)接觸維度分析,從疑似辦理寬帶的用戶(hù)中分析挖掘出疑似異網(wǎng)寬帶用戶(hù),提高模型輸出的準(zhǔn)確率。

        因此,模型主要從用戶(hù)手機(jī)流量使用特征、網(wǎng)關(guān)接觸這兩個(gè)維度分析識(shí)別全省全網(wǎng)用戶(hù)中異網(wǎng)寬帶用戶(hù),模型整體設(shè)計(jì)思路如圖1所示。

        3 手機(jī)流量使用特征維度

        圖1 模型整體設(shè)計(jì)思路圖

        用戶(hù)手機(jī)流量使用特征通過(guò)對(duì)比已辦理寬帶的用戶(hù)的手機(jī)流量使用特征和未知用戶(hù)的手機(jī)流量使用特征,從中挖掘出疑似辦理寬帶的用戶(hù)。疑似辦理寬帶用戶(hù)包括辦理異網(wǎng)或本網(wǎng)寬帶的用戶(hù),通過(guò)K-means聚類(lèi)的方法,獲得手機(jī)流量使用用戶(hù)的自然分類(lèi)結(jié)果,并得知群體間屬性特征差異,分類(lèi)后將已辦理本網(wǎng)寬帶用戶(hù)的收斂比例最多的一類(lèi)劃分為目標(biāo)類(lèi)。

        啟東市位于長(zhǎng)江入???,與上海隔江相望,地理位置優(yōu)越。境內(nèi)地勢(shì)平坦,土壤肥沃,有機(jī)質(zhì)含量1.4%以上,速效氮90 mg/kg,速效磷4.63 mg/kg,速效鉀152 mg/kg,pH值7.8-8.2之間,土質(zhì)以輕壤為主,土層深厚。全市屬海洋性氣候,四季分明,日照充分,雨量充沛,無(wú)霜期長(zhǎng),是山藥種植的理想之地。山藥能單獨(dú)種植也可與糧、棉、油、菜作物間套夾種,十分符合全市多元多熟制耕作制度,經(jīng)濟(jì)效益高,畝產(chǎn)值可達(dá)9000元以上。

        (1)提取存量客戶(hù)最近一個(gè)月的手機(jī)流量使用相關(guān)指標(biāo)數(shù)據(jù)。

        (2)采用K-means聚類(lèi)方法將存量用戶(hù)聚成K類(lèi),K值從大到小,直到已辦理本網(wǎng)寬帶的用戶(hù)收斂為一類(lèi)。

        K-means采用歐氏距離公式分別計(jì)算該對(duì)象到K個(gè)簇內(nèi)點(diǎn)的距離,然后迭代的改善簇內(nèi)變差重新分配所有對(duì)象直到分配穩(wěn)定,根據(jù)結(jié)果簇獲取用戶(hù)所屬類(lèi)別。

        歐氏距離公式:

        其中i=(1,2,……,n)和j=(1,2,……,n)是兩個(gè)n維數(shù)據(jù)對(duì)象。

        (3)對(duì)每個(gè)類(lèi)別進(jìn)行類(lèi)別特征提取,提取類(lèi)別中心指標(biāo)值。

        (4)將各類(lèi)別特征與各階段特征進(jìn)行對(duì)比,分析各類(lèi)別用戶(hù)的手機(jī)流量使用特征,并與已辦理本網(wǎng)寬帶的用戶(hù)的流量使用特征進(jìn)行對(duì)比。

        3.1 提取相關(guān)指標(biāo)數(shù)據(jù)

        提取存量客戶(hù)最近一個(gè)月的手機(jī)流量使用相關(guān)指標(biāo)數(shù)據(jù)是非常重要的步驟,模型需計(jì)算用戶(hù)在閑/忙、白天/夜間不同時(shí)段使用手機(jī)流量的特征,因此需確定這些不同時(shí)段的劃分,本文的設(shè)計(jì)是采取根據(jù)業(yè)務(wù)人員配置的方式獲取。模型啟動(dòng)階段的初始值則使用以下方式獲取。根據(jù)2016年2月份的全網(wǎng)使用流量信息,確定模型的初始流量使用忙/閑時(shí)時(shí)段和白天/夜間時(shí)段。

        全網(wǎng)流量使用量排前10的時(shí)間段分別為:20、21、19、22、23、12、18、11、13、17,模型初始確定這些時(shí)段為忙時(shí)時(shí)段;根據(jù)某省2016年2月份的天亮/天黑時(shí)間,

        確定模型的初始白天時(shí)間為07:00—18:59。通過(guò)以上這些時(shí)段的確定,統(tǒng)計(jì)用戶(hù)在這些不同時(shí)段使用流量的不同特征,以用戶(hù)號(hào)碼為唯一標(biāo)識(shí)對(duì)用戶(hù)手機(jī)流量使用信息表進(jìn)行統(tǒng)計(jì)衍生并匯總,生成用戶(hù)手機(jī)流量使用分析表。

        由于指標(biāo)間共線(xiàn)性會(huì)影響聚類(lèi)質(zhì)量,所以需提取聚類(lèi)的字段進(jìn)行相關(guān)性分析,綜合考慮選擇業(yè)務(wù)分析意義較大,相關(guān)性較小的指標(biāo)進(jìn)入模型。根據(jù)模型設(shè)計(jì)思路,并通過(guò)對(duì)比分析各指標(biāo)之間的相關(guān)性,確定模型的最終輸入指標(biāo),采用R中的聚類(lèi)分析對(duì)模型的指標(biāo)進(jìn)行篩選,具體過(guò)程如圖2所示。

        圖2 手機(jī)流量使用特征輸入指標(biāo)

        通過(guò)以上分析,選取不同分類(lèi)內(nèi)方差和均值均有顯著性差異的指標(biāo),表1所示為模型的輸入指標(biāo)。

        表1 手機(jī)流量使用特征輸入系統(tǒng)

        3.2 疑似辦理寬帶用戶(hù)識(shí)別模型搭建

        將輸入指標(biāo)進(jìn)行預(yù)處理之后,使用某一月的用戶(hù)手機(jī)流量使用數(shù)據(jù),用K-means聚類(lèi)算法進(jìn)行建模,通過(guò)調(diào)整聚類(lèi)個(gè)數(shù)及迭代次數(shù),選擇合適的類(lèi)間差異較大的建模結(jié)果,將絕大部分的已辦理本網(wǎng)寬帶的用戶(hù)聚為一類(lèi)。模型采用R構(gòu)建,直到絕大部分的已辦理本網(wǎng)寬帶的用戶(hù)聚為了同一類(lèi),達(dá)到了模型設(shè)計(jì)的分類(lèi)要求。

        對(duì)每個(gè)類(lèi)別進(jìn)行類(lèi)別特征提取,確定最終聚類(lèi)的中心點(diǎn),對(duì)聚類(lèi)結(jié)果的各指標(biāo)的原始值計(jì)算均值進(jìn)行特征分析,最后總結(jié)各類(lèi)用戶(hù)使用手機(jī)流量特征。

        4 網(wǎng)關(guān)接觸維度

        網(wǎng)關(guān)接觸維度可以根據(jù)接觸類(lèi)型分為3類(lèi),具體如圖3所示。

        在第一步分析出的疑似辦理寬帶的用戶(hù)的基礎(chǔ)上采用異網(wǎng)寬帶接觸本網(wǎng)自有網(wǎng)頁(yè)、客戶(hù)端與使用本網(wǎng)流量接觸異網(wǎng)寬帶辦理頁(yè)面的相關(guān)信息數(shù)據(jù),進(jìn)行不同類(lèi)型用戶(hù)行為特征判別分析來(lái)識(shí)別出疑似異網(wǎng)寬帶用戶(hù)。

        (1)提取用戶(hù)流量特征分析模型識(shí)別出的疑似辦理寬帶用戶(hù)最近一個(gè)月的使用異網(wǎng)寬帶登陸某省該運(yùn)營(yíng)商自有網(wǎng)站、使用本網(wǎng)手機(jī)流量訪(fǎng)問(wèn)異網(wǎng)寬帶相關(guān)URL的相關(guān)指標(biāo)數(shù)據(jù)。

        (2)通過(guò)對(duì)疑似辦理寬帶用戶(hù)信息數(shù)據(jù)進(jìn)行統(tǒng)計(jì)衍生,生成模型輸入信息數(shù)據(jù),采用組合規(guī)則判別分析,輸出判別公式。

        (3)將判別公式作用于測(cè)試數(shù)據(jù),輸出疑似異網(wǎng)寬帶用戶(hù),并根據(jù)準(zhǔn)確率、覆蓋率進(jìn)行模型驗(yàn)證。

        4.1 提取相關(guān)指標(biāo)數(shù)據(jù)

        通過(guò)單一指標(biāo)分析,分析用戶(hù)使用異網(wǎng)IP登陸運(yùn)營(yíng)商本網(wǎng)自有網(wǎng)站和訪(fǎng)問(wèn)異網(wǎng)寬帶相關(guān)URL的特征,通過(guò)訪(fǎng)問(wèn)次數(shù)、個(gè)數(shù)等所有變量初步單一識(shí)別,并統(tǒng)計(jì)識(shí)別的覆蓋率,初步篩選出符合分析的指標(biāo)。根據(jù)單一指標(biāo)的分析結(jié)果,選取覆蓋率較高的一個(gè)指標(biāo)作為第一變量,逐步層層遞進(jìn)組合多個(gè)變量分析篩選出最終的輸入指標(biāo),指標(biāo)篩選過(guò)

        程見(jiàn)圖4。

        圖3 網(wǎng)關(guān)接觸維度類(lèi)型

        圖4 網(wǎng)關(guān)融合指標(biāo)篩選過(guò)程

        4.2 識(shí)別模型搭建

        根據(jù)第一步獲取的手機(jī)流量特征維度模型規(guī)則,作用于待識(shí)別數(shù)據(jù),識(shí)別出疑似辦理寬帶的號(hào)碼。分析這類(lèi)用戶(hù)的使用異網(wǎng)IP登陸運(yùn)營(yíng)商自有網(wǎng)站和訪(fǎng)問(wèn)異網(wǎng)寬帶相關(guān)URL的特征,通過(guò)訪(fǎng)問(wèn)次數(shù)、個(gè)數(shù)等單一變量初步識(shí)別,統(tǒng)計(jì)識(shí)別的覆蓋率,并分別獲取這兩維度的判別規(guī)則。最終根據(jù)判別分析的組合規(guī)則的層層遞進(jìn)分析用戶(hù)的行為特征,總結(jié)出符合異網(wǎng)寬帶用戶(hù)的登陸和使用手機(jī)流量的業(yè)務(wù)特征。

        5 結(jié)束語(yǔ)

        本文結(jié)合異網(wǎng)寬帶用戶(hù)識(shí)別的需求,針對(duì)多維度數(shù)據(jù)構(gòu)建識(shí)別模型數(shù)據(jù)量級(jí)差異明顯的問(wèn)題,設(shè)計(jì)了分維度策略構(gòu)建識(shí)別模型的方案。最后,不同維度的模型建立給出了不同的設(shè)計(jì)思路,以及提取相關(guān)指標(biāo)數(shù)據(jù)的方法,增加結(jié)果的準(zhǔn)確性。并且在實(shí)際應(yīng)用中,允許業(yè)務(wù)人員配置模型的相關(guān)參數(shù),如白天時(shí)段、忙時(shí)時(shí)段等。通過(guò)本文的工作,希望滿(mǎn)足運(yùn)營(yíng)商多維度方式構(gòu)建異網(wǎng)寬帶識(shí)別模型的需求,提高模型準(zhǔn)確率。

        [1]周穎,呂巍,井淼等.基于數(shù)據(jù)挖掘技術(shù)的移動(dòng)通信行業(yè)客戶(hù)細(xì)分[J].上海交通大學(xué)學(xué)報(bào),2007,41(7):1142-1145.

        [2]Jiawei Han,Micheline Kamber.數(shù)據(jù)挖掘概念與技術(shù)范明[M].孟小峰,等譯.北京:機(jī)械工業(yè)出版社,2012.

        [3]賈金柱.數(shù)據(jù)挖掘、因果推斷和變量選擇的方法和理論[D].北京大學(xué),2008.

        Afractional dimension strategy for user identification of different broadband

        WANGBingying,WANGJing

        Currently,some operators already adopt a method for user identification of different broadband.The method is a single dimensional analysis,that is,analysis the behavior of other IP landing operator’sown web sites.But the identification correct rate and user coverage rate is low.Adopting multi-dimensional analysis method formulates the model could improve its accuracy and efficiency.However,different dimensional data gap obvious.If forced to establish the model,it might cause many vacant data.Aiming at these problems,this paper designed a fractional dimension strategy plan and the practice shows its effectiveness.

        fractional dimension strategy;different broadband;model

        2016-10-25)

        猜你喜歡
        寬帶用戶(hù)寬帶辦理
        “碼”上辦理“田間一件事”
        男方拒不配合,嬰兒出生證明能辦理嗎?
        裝寬帶的人
        文苑(2020年7期)2020-08-12 09:36:04
        辦理銀行業(yè)務(wù)須謹(jǐn)慎
        公民與法治(2020年1期)2020-05-30 12:27:40
        要規(guī)范辦理不動(dòng)產(chǎn)登記
        公民與法治(2020年7期)2020-05-11 02:14:44
        2019年第一季度移動(dòng)用戶(hù)總數(shù)同比增長(zhǎng)2%
        我國(guó)手機(jī)上網(wǎng)用戶(hù)達(dá)11億
        青海固定寬帶高速率接入用戶(hù)占比超過(guò)95%
        論如何提高寬帶用戶(hù)感知度
        一種新穎的寬帶大功率分配器
        亚洲在AV极品无码天堂手机版| 女人av天堂国产在线| 国产精品国产亚洲精品看不卡 | 男同gay毛片免费可播放| 国产欧美日韩午夜在线观看| 日韩精品免费在线视频| 国产亚洲精品一区在线| 国精品人妻无码一区二区三区性色| 国产香蕉97碰碰视频va碰碰看| 成年女人在线观看毛片| 日本国产一区二区在线观看| 丰满少妇高潮惨叫久久久| 日本japanese少妇高清| 国产亚洲精品美女久久久| 真多人做人爱视频高清免费| 伊人精品在线观看| 亚洲中文字幕第二十三页| 亚洲国产一区二区三区| 无人视频在线观看免费播放影院| 日韩爱爱网站| 日本岛国视频在线观看一区二区 | 亚洲天堂免费av在线观看| 日本免费一区二区三区影院| 中文字幕久久久人妻无码| 色欲av一区二区久久精品| 国产喷白浆精品一区二区豆腐 | 综合无码一区二区三区四区五区| 中文字幕一区二区三区在线看一区| 亚洲综合精品中文字幕| 男女啪啪永久免费观看网站| 国产在线拍偷自拍偷精品| 精品精品国产一区二区性色av| 国产精品无码一区二区三区电影 | 亚洲字幕av一区二区三区四区| 伊人久久网国产伊人| 亚洲中文字幕国产综合| 亚洲最大水蜜桃在线观看| 精品日韩欧美一区二区在线播放| 偷拍网日本一区二区三区| 中文字幕综合一区二区| 亚洲av网一区二区三区|