劉萍
【摘要】隨著手機(jī)技術(shù)的發(fā)展,手機(jī)已經(jīng)成為大多數(shù)人不可或缺的一部分,但是對于手機(jī)資費的關(guān)注還較少,本文對手機(jī)運營商客戶相關(guān)數(shù)據(jù)進(jìn)行分析,首先利用聚類分析對數(shù)據(jù)進(jìn)行分類處理,再基于此對相關(guān)性較大的指標(biāo)進(jìn)行逐步回歸分析,最終找出了通話費的主要影響指標(biāo)為WLAN、主叫次數(shù)、漫游費。
【關(guān)鍵詞】聚類分析;逐步回歸;影響因素
一、引言
手機(jī)資費在通訊發(fā)達(dá)的今天己經(jīng)成為人人關(guān)心的一個話題,了解自己的個人通訊開銷的具體情況與資費高低的主要指標(biāo)是很重要的。但是,大部分用戶并沒有了解到自己的話費使用情況,很容易導(dǎo)致資費浪費或者分配不合理的情況。因此本文將根據(jù)聚類分析以及逐步回歸,基于手機(jī)資費數(shù)據(jù)研究話費的影響因素,為個人資費業(yè)務(wù)選擇、話費控制提供參考。
二、方法介紹
本文首先利用聚類分析觀察數(shù)據(jù)各個指標(biāo)關(guān)系;然后利用多元回歸進(jìn)行分析?;趯哟蔚木垲愃惴ㄓ址Q為樹聚類算法。該方法使用數(shù)據(jù)的聯(lián)接規(guī)則,通過層次式架構(gòu)方式反復(fù)將數(shù)據(jù)進(jìn)行分裂或聚合,以形成一個層次序列的聚類問題的解。由于并不是所有解釋變量都能夠?qū)σ蜃兞坑酗@著的影響,因此在多元回歸的過程當(dāng)中,需要挑選對因變量影響較大的自變量,這就需要求出所有可能的2m-1個回歸方程進(jìn)行比較,進(jìn)而確定最終的回歸方程,在解決該問題的各個方法中,逐步回歸最受推崇。
(三)多重共線性檢驗
對最終的模型方程進(jìn)行多重共線性檢驗,檢驗得到的VIF值為48.65,說明存在較小的多重共線性,若此時為了消除多重共線性進(jìn)行變量的刪減,可能會影響各個自變量與因變量的真實關(guān)系,因此不作處理,方程(3)即為最終方程。
四、總結(jié)
本文運用運營商數(shù)據(jù)進(jìn)行聚類、回歸分析。經(jīng)過各項檢驗,最終得到了最為符合實際的線性回歸方程作為最優(yōu)方程。由最終方程(3):WLAN對通話費影響最大,且是呈負(fù)相關(guān)的,主叫次數(shù)、漫游費對通話費的影響較大,且是呈正相關(guān)的。由此手機(jī)用戶可以根據(jù)自己的實際消費情況進(jìn)行套餐傾斜,以此來降低通話費用;對運營商而言,也可以據(jù)此制定合適的消費套餐,進(jìn)而更準(zhǔn)確的滿足手機(jī)用戶的需求,加大自身的品牌競爭力。