亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的移動用戶出行軌跡預(yù)測

        2019-06-27 00:22:30劉麗嫻樊學(xué)寶
        移動通信 2019年5期
        關(guān)鍵詞:貝葉斯網(wǎng)絡(luò)關(guān)聯(lián)規(guī)則

        劉麗嫻 樊學(xué)寶

        【摘? 要】為了解決移動用戶出行軌跡預(yù)測的問題,首先利用用戶出行軌跡數(shù)據(jù)進(jìn)行語義化建模,然后根據(jù)語義位置和訪問概率對用戶群進(jìn)行分類,再次,利用關(guān)聯(lián)規(guī)則挖掘不同群體的頻繁模式,最后,結(jié)合實(shí)時出行數(shù)據(jù)動態(tài)更新貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)移動用戶出行軌跡的實(shí)時預(yù)測。經(jīng)過實(shí)驗(yàn)表明,該算法能夠在一定程度上反映用戶出行的目的和偏好,并具有很好的擴(kuò)展性。

        【關(guān)鍵詞】語義化建模;關(guān)聯(lián)規(guī)則;貝葉斯網(wǎng)絡(luò);軌跡預(yù)測

        中圖分類號:TN915.0

        文獻(xiàn)標(biāo)志碼:A? ? ? ? 文章編號:1006-1010(2019)05-0092-05

        1? ?引言

        移動用戶行為具有很強(qiáng)的時空規(guī)律性,用戶群體間的移動行為具有很高的相似性[1]?;诘乩砦恢玫姆?wù)與推薦已經(jīng)成為當(dāng)前的研究的熱點(diǎn),如:喬巖磊等人[2]利用高斯混合模型擬合連續(xù)時間下地點(diǎn)之間的轉(zhuǎn)移概率推測用戶的位置,但沒有對不同群體用戶的語義位置特點(diǎn)進(jìn)行區(qū)別性對待,不能有效反應(yīng)不同群體用戶的出行特征。廖文芳[3]根據(jù)移動用戶的出行位置信息進(jìn)行社交平臺的設(shè)計(jì),但并沒有考慮到利用用戶在不同位置的逗留時長來反映用戶在特定位置的停留偏好。姚迪等人[4]將用戶時空軌跡數(shù)據(jù)轉(zhuǎn)換成特定的語義信息,以此推測用戶的偏好和需求,但沒有區(qū)分不同群體用戶的停留時長和偏好。邱運(yùn)芬等人[5]提出一種語義和概率的人群分類方法,根據(jù)語義位置分配情況獲取用戶對語義空間的訪問向量,采用聚類的方法對用戶進(jìn)行人群的劃分,結(jié)果表明,同類用戶在語義位置空間的訪問概率向量相似。研究者[3-8]從不同的角度研究地理位置的服務(wù)和推薦,包括用戶的位置推測、用戶出行群體特點(diǎn),但并沒有綜合采用不同語義位置的停留偏好和停留時長來反映不同群體的出行偏好,同時,研究者并沒有根據(jù)個體用戶的實(shí)時出行軌跡來預(yù)測個體的未來軌跡。

        因此,本文在借鑒相關(guān)研究的基礎(chǔ)上,針對傳統(tǒng)用戶預(yù)測沒有考慮到用戶群體分類的問題,提出一種基于移動軌跡的用戶位置預(yù)測方法:在用戶軌跡語義化的基礎(chǔ)上,結(jié)合語義位置的概率向量采用聚類的方法對人群進(jìn)行劃分;在此基礎(chǔ)上,采用關(guān)聯(lián)規(guī)則挖掘不同群體的頻繁模式;最后,結(jié)合實(shí)時出行數(shù)據(jù)動態(tài)更新貝葉斯網(wǎng)絡(luò)實(shí)現(xiàn)移動用戶出行軌跡的實(shí)時預(yù)測。

        2? ?出行軌跡的相關(guān)研究

        2.1? 移動用戶出行的時空序列模型

        移動用戶出行的時空序列模型,是基于移動用戶的時空數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘的模型,通過對用戶移動周期規(guī)律和相關(guān)參數(shù)的估計(jì),能夠獲得移動用戶在不同時間下位置概率分布的信息[6-7],以此挖掘用戶的行為模式與時間的關(guān)系。

        假設(shè)移動用戶的出行時空序列為:Tri={(L1, t1), (L2, t2), …, (Li, ti), …, (Ln, tn)},其中,(Li, ti)表示用戶在某個時間內(nèi)出現(xiàn)在基站位置,那么,用戶在不同時間的位置概率分布可表示為:

        公式(1)表示,在特定的時間段內(nèi),用戶在不同位置下的分布概率,相比于位置數(shù)據(jù),移動用戶出行的時空序列模型更能體現(xiàn)用戶的出行偏好以及出行規(guī)律。

        2.2? 移動用戶語義位置模型

        在獲取移動用戶出行的時空序列后,能夠根據(jù)用戶在某一個位置的逗留時間,獲取用戶停留點(diǎn)。但是僅僅以地理軌跡的停留點(diǎn)來分析用戶的出行規(guī)律似乎意義不大,因此,不少學(xué)者采用語義軌跡來反映用戶的活動行為模式,通過語義位置對地理位置進(jìn)行功能性的描述,推測用戶在不同時間的不同行為特征以及其周邊的環(huán)境信息,這些信息能夠有效表征用戶的語義位置。移動用戶停留點(diǎn)的語義位置軌跡可用圖1表示:

        2.3? 移動模式挖掘模型

        移動用戶的行為具有群體的特征,移動用戶出行的頻繁模式,在一定程度上反映了移動用戶出行行為具有一定的相似性[8]。在獲取移動用戶一段時間的語義位置軌跡的基礎(chǔ)上,通過關(guān)聯(lián)規(guī)則的相關(guān)算法就能挖掘用戶在一段時間的出行規(guī)律。某一個用戶在一段時間的語義位置軌跡如表1、表2所示。

        從表1、表2可知,<家,公司,餐館,公園>是一種用戶的語義位置軌跡模式,可以預(yù)測到用戶在一周內(nèi)去家、公司、餐館、公園的頻率為1/7,也就是一周中用戶有一天會先去公司、然后去餐館、公園。

        2.4? 軌跡預(yù)測模型

        移動用戶的出行位置是不斷變換的,如果將用戶在移動過程中經(jīng)過的語義位置軌跡視為一個個的狀態(tài),那么可以通過狀態(tài)更新的方式對用戶的位置進(jìn)行預(yù)測。語義位置軌跡是從地理位置提取高層的信息,使用語義位置軌跡能夠更好預(yù)測用戶的軌跡。而相似用戶的語義位置軌跡,更能夠解決位置預(yù)測中“新地點(diǎn)”的問題,當(dāng)一個用戶達(dá)到一個新的地點(diǎn),無法通過自己的歷史軌跡數(shù)據(jù)進(jìn)行預(yù)測時,此時可以使用與之相似的用戶軌跡數(shù)據(jù)進(jìn)行預(yù)測。

        3? ?基于動態(tài)貝葉斯網(wǎng)絡(luò)動態(tài)更新的用戶出行軌跡

        本文提出一種基于動態(tài)貝葉斯網(wǎng)絡(luò)的用戶出行軌跡預(yù)測方法,其步驟如下:

        (1)提取移動用戶的歷史位置并對進(jìn)行語義位置的挖掘;

        (2)采用Apriori算法挖掘語義頻繁模式;

        (3)基于用戶的語義頻繁模式和語義位置概率進(jìn)行用戶分群;

        (4)利用群體初始語義位置偏好生成初始的貝葉斯網(wǎng)絡(luò);

        (5)利用個體用戶的實(shí)時語義位置動態(tài)更新貝葉斯網(wǎng)絡(luò),實(shí)現(xiàn)個體的軌跡預(yù)測。

        3.1? 移動用戶的語義位置軌跡挖掘

        如表3所示,本文通過提取某個城市3G/4G的10萬用戶的出行數(shù)據(jù),提取的字段包括:用戶ID、小區(qū)編號、發(fā)生業(yè)務(wù)的時間戳。

        語義位置是對地理環(huán)境的定性描述,在獲取用戶的小區(qū)編號的基礎(chǔ)上,采用反向的地理編碼服務(wù)(百度等提供的編碼接口)將基站位置轉(zhuǎn)化為地址信息,再利用POI數(shù)據(jù)庫獲取當(dāng)前基站的語義位置。語義位置示例如表4所示:

        3.2? 移動用戶語義頻繁模式挖掘

        在挖掘用戶語義位置的基礎(chǔ)上,需要從大量的語義位置數(shù)據(jù)庫中找到滿足給定一定條件(滿足最小支持度和最小置信度)的用戶出行頻繁模式。其步驟為:

        (1)找出所有的頻繁項(xiàng)目集;

        (2)給定最小的支持度和置信度,找出滿足特定規(guī)則的頻繁項(xiàng)集。

        本文考慮到移動用戶出行數(shù)據(jù)的特點(diǎn),采用Apriori算法提取用戶的語義標(biāo)簽數(shù)據(jù)集。其結(jié)果如表5所示:

        3.3? 基于語義位置和概率的用戶分群

        相似用戶的語義位置軌跡能夠更好預(yù)測用戶的出行軌跡,因此,在獲取每一個用戶的語義頻繁模式的基礎(chǔ)上,結(jié)合用戶在每一個語義位置上出現(xiàn)的概率進(jìn)行分群。假設(shè)語義位置集為{l1, l2, l3, …, ln},某一個用戶在每一個語義位置上出現(xiàn)的概率向量為{p1, p2, p3, …, pn},且p1+p2+p3+…+pn=1。通過采用k-means算法對全體用戶的概率向量進(jìn)行聚類,得到基于語義位置和概率的用戶分群結(jié)果。

        3.4? 采用貝葉斯網(wǎng)絡(luò)動態(tài)預(yù)測用戶出行軌跡

        貝葉斯網(wǎng)絡(luò)是基于概率推理的圖形化網(wǎng)絡(luò)[9],在獲取群體的移動用戶歷史出行數(shù)據(jù)基礎(chǔ)上,網(wǎng)絡(luò)就會推斷同一群體移動用戶出行偏好,當(dāng)實(shí)時輸入移動用戶的實(shí)時位置時,貝葉斯網(wǎng)絡(luò)的概率就會動態(tài)調(diào)整。某用戶群體初始語義位置偏好的貝葉斯網(wǎng)絡(luò)如圖2所示:

        當(dāng)移動用戶產(chǎn)生新的移動軌跡時,貝葉斯網(wǎng)絡(luò)的概率會自動更新,運(yùn)營商會根據(jù)當(dāng)前用戶的移動軌跡和逗留時長(如果逗留時長超過設(shè)定的閾值,則把將貝葉斯網(wǎng)絡(luò)的概率實(shí)施動態(tài)更新;否則不作更新)進(jìn)行實(shí)時的動態(tài)更新,預(yù)測移動用戶去往某一個語義位置的概率。

        從實(shí)驗(yàn)數(shù)據(jù)得到,用戶在語義位置的平均逗留時長閾值為53分鐘,也就是說,用戶在某一個語義位置的逗留時長超過53分鐘時,初始語義位置偏好的貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)將被激活實(shí)現(xiàn)用戶實(shí)時語義位置的預(yù)測。其實(shí)驗(yàn)結(jié)果與用戶真實(shí)的逗留偏好比較吻合,隨著用戶實(shí)時軌跡數(shù)據(jù)的增加,運(yùn)營商對移動用戶的出行軌跡預(yù)測將會更加的準(zhǔn)確,運(yùn)營商可以為不同的用戶提供更加個性化的地理位置服務(wù),提高位置服務(wù)提供商的效率和利潤。

        4? ?結(jié)束語

        本文提出一種融合語義位置數(shù)據(jù)的位置預(yù)測,結(jié)合了用戶的出行行為和周邊的環(huán)境位置來表征用戶的語義位置;利用用戶語義位置的相似性實(shí)現(xiàn)用戶的分群,利用分群的出行數(shù)據(jù)構(gòu)造貝葉斯網(wǎng)絡(luò);最后利用移動用戶的實(shí)時出行語義位置動態(tài)更新貝葉斯網(wǎng)絡(luò)并實(shí)現(xiàn)移動用戶出行軌跡的預(yù)測。相比傳統(tǒng)的地理位置的預(yù)測,本文提出的語義軌跡更能反映用戶的活動行為模式,能夠更好推測用戶在不同時間的各種行為模式,更有效表征用戶的行為。

        參考文獻(xiàn):

        [1] 崔家祥. 基于移動通信數(shù)據(jù)的用戶移動行為分析與位置預(yù)測[D]. 北京: 北京郵電大學(xué), 2018.

        [2] 喬巖磊,杜永萍,趙東玥. 基于高斯分析的馬爾可夫位置預(yù)測方法[J]. 計(jì)算機(jī)技術(shù)與發(fā)展, 2018,28(1): 41-44.

        [3] 廖文芳. 基于位置的移動社交網(wǎng)絡(luò)平臺的設(shè)計(jì)[J]. 山東工業(yè)技術(shù), 2018(11): 139.

        [4] 姚迪,張超,黃建輝,等. 時空數(shù)據(jù)語義理解:技術(shù)與應(yīng)用[J]. 軟件學(xué)報, 2018,29(7): 196-223.

        [5] 邱運(yùn)芬,張暉,李波,等. 一種基于語義位置和概率的人群分類方法[J]. 數(shù)據(jù)采集與處理, 2018,149(3): 154-162.

        [6] 連德富,張富錚,王英子,等. 移動數(shù)據(jù)挖掘[M]. 北京: 機(jī)械工業(yè)出版社, 2017.

        [7] 錢琨. 基于蜂窩信令數(shù)據(jù)的移動軌跡清洗和預(yù)測方法研究與實(shí)現(xiàn)[D]. 成都: 西南交通大學(xué), 2016.

        [8] 陳少權(quán). 基于改進(jìn)LCSS的移動用戶軌跡相似性查詢算法研究[J]. 移動通信, 2017,41(6): 77-82.

        [9] 張小可,沈文明,杜翠鳳. 貝葉斯網(wǎng)絡(luò)在用戶畫像構(gòu)建中的研究[J]. 移動通信, 2016,40(22): 22-26.

        [10] 付莉莉. 融合語義信息的位置預(yù)測技術(shù)研究[D]. 北京: 北京郵電大學(xué), 2013.

        猜你喜歡
        貝葉斯網(wǎng)絡(luò)關(guān)聯(lián)規(guī)則
        基于分布式貝葉斯網(wǎng)絡(luò)的多故障診斷方法研究
        無人機(jī)數(shù)據(jù)鏈測試與評估研究
        科技資訊(2016年25期)2016-12-27 16:22:32
        基于貝葉斯網(wǎng)絡(luò)的流域內(nèi)水文事件豐枯遭遇研究
        基于Apriori算法的高校學(xué)生成績數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘分析
        基于關(guān)聯(lián)規(guī)則和時間閾值算法的5G基站部署研究
        移動通信(2016年20期)2016-12-10 09:09:04
        關(guān)聯(lián)規(guī)則,數(shù)據(jù)分析的一把利器
        數(shù)據(jù)挖掘在高校課堂教學(xué)質(zhì)量評價體系中的應(yīng)用
        基于興趣預(yù)測和熱點(diǎn)分析的聯(lián)合推薦算法研究 
        關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進(jìn)
        中國市場(2016年36期)2016-10-19 04:10:44
        基于關(guān)聯(lián)規(guī)則的計(jì)算機(jī)入侵檢測方法
        亚洲人成无码区在线观看| 亚洲一区二区三区成人在线| 三级网址在线| 日本国产在线一区二区| 亚洲男同免费视频网站| 欧美性生交活xxxxxdddd| 人禽伦免费交视频播放| 亚洲无码a∨在线视频| 一区二区亚洲精美视频| 亚洲亚色中文字幕剧情| 亚洲色爱免费观看视频| 国产一区a| av资源吧首页在线观看| 亚洲国产精品高清一区| 精品无码人妻一区二区三区不卡| 嫖妓丰满肥熟妇在线精品| 国产一及毛片| 日本熟女人妻一区二区三区| 久久在一区二区三区视频免费观看| 亚洲国产成人片在线观看| 亚洲综合欧美日本另类激情| 玩弄放荡人妻一区二区三区| 黄污在线观看一区二区三区三州| 欧美黑人xxxx又粗又长| 98在线视频噜噜噜国产| 亚洲在中文字幕乱码熟女| 精品久久久久久综合日本| 欧美亚洲日本国产综合在线| 午夜福利视频男同女同| 国产一区二区视频免费| 无码av专区丝袜专区| 国产美女自慰在线观看| 日韩爱爱网站| av免费一区在线播放| 在线观看午夜视频一区二区| 国产亚洲精品aaaaaaa片 | 人妻夜夜爽天天爽三区麻豆av| 亚洲欧美乱综合图片区小说区 | 国产91精品自拍视频| 日本一区二区视频免费在线看| 精品国产一区二区三区av片 |