亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于稀疏軌跡聚類的旅游目的地位置預(yù)測方法

        2021-08-12 00:37:12
        關(guān)鍵詞:目的地軌跡聚類

        劉 涵

        (亳州職業(yè)技術(shù)學(xué)院 管理學(xué)系,安徽 亳州 236800)

        經(jīng)濟全球化背景下,國家經(jīng)濟、社會發(fā)展以及人們的生活水平都在逐步提升,越來越多的人在工作之余更加注重精神享受。因此,近年來國內(nèi)外旅游業(yè)迅速發(fā)展。在社會經(jīng)濟、交通、科技信息及環(huán)保理念的飛速發(fā)展下,可供選擇的旅游景點越來越多,越來越多的人選擇自駕游或與好友結(jié)伴旅游。為了更好地發(fā)展旅游經(jīng)濟,提升偏遠地區(qū)經(jīng)濟水平,相關(guān)學(xué)者對旅游目的地位置預(yù)測進行了研究。溫惠英等提出,在生成對抗網(wǎng)絡(luò)中構(gòu)建一個推薦模型,來預(yù)測某一階段人們偏好的旅游目的地[1];張志遠等提出,面對移動對象的不確定性軌跡,在傳統(tǒng)預(yù)測模型的基礎(chǔ)上,引用社會特征分析行人注意力,構(gòu)建行人軌跡預(yù)測模型[2]。通過對這兩個預(yù)測模型進行使用測試,發(fā)現(xiàn)傳統(tǒng)預(yù)測模型由于對旅游線路的聚類性能不佳,預(yù)測結(jié)果準(zhǔn)確率不理想。

        為解決上述問題,該文提出基于稀疏軌跡聚類的旅游目的地位置預(yù)測方法。當(dāng)前,人們選擇的出行時段、出行方式以及移動軌跡向著多樣化發(fā)展,這些軌跡稱為稀疏軌跡。稀疏軌跡聚類預(yù)測方法能夠通過識別時空軌跡重復(fù)數(shù)據(jù)實現(xiàn)重復(fù)數(shù)據(jù)濾除,通過稀疏軌跡聚類可補全旅游目的地的預(yù)測軌跡,在迭代網(wǎng)絡(luò)及預(yù)測軌跡的基礎(chǔ)上實現(xiàn)旅游目的地位置預(yù)測,為旅游業(yè)的發(fā)展提供幫助。

        一、旅游目的地位置預(yù)測方法

        采集旅游者的空間走動軌跡時,需要剔除重復(fù)性數(shù)據(jù),計算特征點到其余各點距離,將得到的特征點和不屬于重復(fù)數(shù)據(jù)集合的點重新排序,實現(xiàn)對重復(fù)數(shù)據(jù)的識別與消除。對軌跡數(shù)據(jù)聚簇分類,并利用稀疏軌跡聚類算法,實現(xiàn)對稀疏數(shù)據(jù)的補全,采用多種熵估計方法,通過迭代網(wǎng)格對上述路徑進行數(shù)據(jù)集合無用數(shù)據(jù)消除,實現(xiàn)基于稀疏軌跡聚類的旅游目的地位置預(yù)測。

        (一)識別與消除時空軌跡重復(fù)數(shù)據(jù)

        旅游者作為不斷變化的移動對象,在采集他們的空間運動軌跡時會出現(xiàn)重復(fù)性數(shù)據(jù)。如旅游對象A去D1地點后,直接向D2點移動,然后再去D3和D4等地。但旅游對象由于自身喜好或其他問題,可能會返回到前幾個已經(jīng)去過的位置。因此,采集到的空間軌跡會存在重復(fù),需要剔除這些重復(fù)性數(shù)據(jù)[3]。

        將帶有時間標(biāo)識的空間位置序列定義為旅游對象的時空軌跡,P(sj)={p1(sj),p2(sj),…,pn(sj)}為軌跡采樣點,其中pi(sj)∈pn(sj)表示其中的任意一個采樣點;n表示采樣點數(shù)量;sj代表移動對象標(biāo)識,存在S={s1,s2,…,sJ},其中sj∈S表示移動對象集合中的任意一個;j∈J表示移動對象數(shù)量。利用經(jīng)緯度、時間戳和移動對象標(biāo)識來描述移動對象采樣點,即存在:

        pi(sj)=〈(xi,yi),ti,sj〉

        (1)

        公式中(xi,yi)表示軌跡點位置分量;ti表示時間戳[4]。將具有相同位置信息和相同時間信息的關(guān)于sj的軌跡點定義為重復(fù)數(shù)據(jù),即該數(shù)據(jù)時間戳與經(jīng)緯坐標(biāo)完全一致,將此類數(shù)據(jù)合并處理。而在某一連續(xù)時間內(nèi),若關(guān)于sj存在多個軌跡點,且這些點若集中于特定的小范圍區(qū)域內(nèi),則認(rèn)為這些數(shù)據(jù)為隱含重復(fù)數(shù)據(jù)。當(dāng)某一類移動對象sj的軌跡點集合為

        P(sj)={pa(sj),pa+1(sj),…,pb(sj)}

        (2)

        公式中i∈[a,b]。若存在dis(pa,pi)≤2β,dis(pa,pb+1)>2β且tb-ta<βt時,則該集合為重復(fù)點集,則該集合P′(sj)∈P(sj)。其中:dis(*)表示距離函數(shù),β表示軌跡方向參數(shù)。重復(fù)點集篩選如圖1所示。

        圖1 重復(fù)點集合篩選示意

        在重復(fù)點集合P′(sj)中,選擇其中一個可以作為代表的軌跡點,即特征點,該點的基本信息獲取結(jié)果為

        zk(sj)=〈(xk,yk),ta,tb,sj〉

        (3)

        公式中ta表示重復(fù)點集合的初始時間,tb表示結(jié)束時間,(xk,tk)表示特征點的坐標(biāo)。特征點提取如圖2所示。

        圖2 特征提取示意

        通過公式(3)可得到特征點到其余各點的距離,將得到的特征點及不屬于重復(fù)數(shù)據(jù)集合的點重新排序,得到關(guān)于sj的新軌跡點序列,實現(xiàn)對重復(fù)性數(shù)據(jù)的識別與消除[5]。

        (二)基于稀疏軌跡聚類補全稀疏數(shù)據(jù)

        由于移動對象的移動數(shù)據(jù)具有稀疏性特征,在消除重復(fù)性數(shù)據(jù)后會存在數(shù)據(jù)缺失問題,進而影響最終的預(yù)測結(jié)果。因此,基于稀疏軌跡聚類算法可補全稀疏數(shù)據(jù),提升數(shù)據(jù)質(zhì)量。不同的旅游者在游玩的過程中會在一個固定的城區(qū)內(nèi)形成歷史軌跡點,而這些軌跡會受到移動對象性格、喜好以及偏愛的影響,具有一定的波動性。因此,基于上述假設(shè)聚類軌跡數(shù)據(jù)。稀疏軌跡聚類算法對稀疏數(shù)據(jù)的補全如圖3所示[6]。

        圖3 稀疏軌跡補全示意

        將聚簇內(nèi)元素的眾數(shù),作為聚簇結(jié)果的代表值,進行初始化、距離計算樣本聚簇和結(jié)果評估。在上一節(jié)處理完畢的數(shù)據(jù)集合中,隨機選擇個軌跡聚類中心,分別為c1,c2,c3,…,cn,其中ci表示向量,其長度為L,則ci=[p1,p2,…,pi,…,pl],代表若干個移動軌跡。根據(jù)圖3中的標(biāo)注可知,軌跡集合有G={G1,G2,…,Gi,…,Gn},該集合中的軌跡Gi={p1,p2,…,pi,…,Pl}。利用稀疏軌跡聚類算法計算中心軌跡與樣本軌跡之間的距離,公式為

        Dist〈Gi,Gj〉=max{f(Gi,Gj),f(Gj,Gi)}

        (4)

        (5)

        將樣本Gj劃分到距離最小的聚簇中,令同一組的軌跡距離盡可能縮小,不同組的軌跡盡可能擴大。樣本劃分完畢后,計算各組軌跡間的均方差和,利用下列公式評價聚類效果:

        (6)

        根據(jù)上述4個步驟實現(xiàn)對軌跡數(shù)據(jù)的聚簇分類,并利用稀疏軌跡聚類算法實現(xiàn)對稀疏數(shù)據(jù)的補全[7]。

        (三)多種熵估計預(yù)測旅游目的地位置

        在前文的基礎(chǔ)上,通過稀疏數(shù)據(jù)的補全獲取了旅游目的地預(yù)測位置的數(shù)據(jù)集合,此時集合中存在大量的冗余路徑,不能作為最終的旅游目的地位置預(yù)測軌跡。為此,采用多種熵估計方法,通過迭代網(wǎng)格對上述路徑進行數(shù)據(jù)集合,消除無用數(shù)據(jù),得到準(zhǔn)確的旅游目的地位置預(yù)測數(shù)據(jù)集合,有效解決旅游線路重復(fù)及旅游目的地位置預(yù)測效果不理想等問題。具體應(yīng)用過程如下:

        采用多種熵估計方法,預(yù)測旅游目的地位置。首先生成一個基于迭代網(wǎng)格和時間的軌跡序列,平均劃分每一天,并保證其時間段不重疊,即得到的時間段集合為T={t1,t2,…,tn},其中與時間段信息相關(guān)的原始軌跡為:

        (7)

        公式中,tra表示軌跡,tu表示時間節(jié)點,lonu表示經(jīng)度值,latu表示緯度值,u∈n,表示個數(shù)。將tra中的所有節(jié)點映射到網(wǎng)格點和時間段上,生成帶有時間標(biāo)簽的軌跡序列:

        (8)

        公式中,eu表示tu時段的軌跡在網(wǎng)格中的節(jié)點位置[8]。采用多種軌跡熵值預(yù)測旅游目的地位置,引入位置熵表示游客對某一旅游地點的喜愛程度。該值的計算公式為:

        (9)

        公式中,Nm,s表示旅游對象s訪問旅游位置m時的次數(shù),Nm表示所有用戶訪問旅游位置m時的次數(shù)。熵值越低說明可預(yù)測性就越強,反之則越低。時間熵可以描述某一時間段內(nèi)游客在某區(qū)域內(nèi)的活躍程度,則時間的熵值為:

        (10)

        公式中,Mt,s表示旅游對象s在t時間段內(nèi)訪問的旅游位置總數(shù)量,Mt表示所有用戶在同一時間段內(nèi)訪問的旅游位置總數(shù)量。生成軌跡序列后,利用一階馬爾可夫鏈量化軌跡規(guī)律[9-10]。馬爾可夫鏈狀態(tài)與每個網(wǎng)格中的軌跡對應(yīng),而軌跡從一個網(wǎng)格移動到另一個網(wǎng)格時,則為馬爾可夫鏈的狀態(tài)轉(zhuǎn)換。根據(jù)已經(jīng)給定的所有軌跡tra構(gòu)造轉(zhuǎn)移概率矩陣Z,生成馬爾可夫鏈F(tra),以此計算狀態(tài)之間的轉(zhuǎn)移熵,進而分析軌跡規(guī)律。用軌跡轉(zhuǎn)移熵矩陣H表示所有狀態(tài)之間的隨機性:

        Hi,j=H(Zi,j)=-∑i,jλZi,jlogZi,j

        (11)

        公式中,λ表示軌跡馬爾可夫鏈F(tra)的平穩(wěn)分布。已知轉(zhuǎn)移概率矩陣Z,則用軌跡空間中網(wǎng)格i與j之間的移動數(shù)據(jù)除以所有網(wǎng)格之間的移動數(shù)目,得到網(wǎng)格i與j之間的轉(zhuǎn)移概率:

        (12)

        公式中,Q表示網(wǎng)格,Len(tra)表示對馬爾可夫鏈的量化結(jié)果。根據(jù)上述內(nèi)容,通過多種熵估計結(jié)果,預(yù)測旅游目的地位置。二階馬爾可夫生成的用戶軌跡預(yù)測模型見表1。

        表1 用戶軌跡預(yù)測模型

        利用表1所示的預(yù)測模型預(yù)測旅游目的地位置軌跡。預(yù)測結(jié)果為

        (13)

        公式中qi、qn、tj分別為給出的網(wǎng)格和時間段集合中的任意數(shù)值。通過以上過程實現(xiàn)基于稀疏軌跡聚類的旅游目的地位置預(yù)測。

        二、實驗研究

        通過對比實驗比較基于稀疏軌跡聚類的位置預(yù)測方法與傳統(tǒng)位置預(yù)測方法之間的差異性。

        (一)算法性能測試

        模擬設(shè)置若干個旅游目的地位置和旅游軌跡,通過實驗對比方法和稀疏軌跡聚類算法,以各個時段的劃分作為聚類標(biāo)準(zhǔn),計算各個時段內(nèi)的軌跡之間的距離平方差,圖4為不同聚類值下求得的最小SSE值。

        圖4 不同K值下SSE值變化曲線

        根據(jù)圖4顯示的曲線變化可知,當(dāng)初始選擇聚簇分組數(shù)為8時,SSE的取值結(jié)果最小,對應(yīng)的聚類效果也最好。因此,該算法可將聚簇分組數(shù)設(shè)置為8,補全聚類前后的軌跡數(shù)量、軌跡點個數(shù)和單軌跡平均軌跡點個數(shù)的變化情況(圖5)。

        圖5 聚類前后軌跡數(shù)據(jù)質(zhì)量對比

        從圖5可以看出,通過重復(fù)性數(shù)據(jù)識別664 718個重復(fù)軌跡點之后,預(yù)測方法進行重復(fù)數(shù)據(jù)刪除操作,得到8 364 012個有效軌跡點數(shù),同時獲得799 935條軌跡。然后利用稀疏軌跡聚類算法補全缺失數(shù)據(jù),使有效軌跡點數(shù)增加了873 552個,軌跡增加了335 454條。可見該聚類算法提升了歷史數(shù)據(jù)質(zhì)量。

        (二)對比測試

        將提出的預(yù)測方法作為實驗組測試對象,將兩個傳統(tǒng)預(yù)測模型分別作為對照1組測試對象和對照2組測試對象,模擬一條旅游軌跡(圖6)。

        圖6 軌跡預(yù)測標(biāo)準(zhǔn)

        以圖6中的軌跡為最終目標(biāo),圖7為3個測試組的旅游目的地軌跡預(yù)測結(jié)果。

        (a) 實驗組測試結(jié)果

        根據(jù)圖中曲線走勢可知,實驗組的預(yù)測軌跡與圖6所示的標(biāo)準(zhǔn)軌跡之間的偏離值更小,而兩個對照組的預(yù)測軌跡與標(biāo)準(zhǔn)軌跡之間的偏離值更大。進一步計算預(yù)測軌跡與標(biāo)準(zhǔn)軌跡之間的偏離值,結(jié)果如表2所示。

        表2 平均偏離值計算結(jié)果

        根據(jù)表中的計算結(jié)果可知,實驗組的5組偏離數(shù)值均在200 m左右,對照組的5組偏離數(shù)值在500~800 m之間。經(jīng)計算,5次測試下實驗組的平均偏離值為222.12 m,對照組的平均偏離值分別為570.07 m和678.776 m??梢娞岢龅念A(yù)測方法效果更佳。

        綜上,該文提出的旅游目的地位置預(yù)測方法充分發(fā)揮了稀疏聚類算法的計算特征,實現(xiàn)了對復(fù)雜空間數(shù)據(jù)和時間數(shù)據(jù)的特征分析與挖掘。該方法利用稀疏軌跡聚類算法補全缺失數(shù)據(jù),使有效軌跡點數(shù)增加了873 552個,軌跡增加了335 454條,說明該方法的聚類效果較好。5次測試下,該方法的平均偏離值為222.12 m,說明此方法能夠提升旅游目的地位置預(yù)測效果。未來研究將繼續(xù)降低預(yù)測軌跡與標(biāo)準(zhǔn)軌跡之間的平均偏離值,以期得到更好的旅游軌跡預(yù)測結(jié)果。

        猜你喜歡
        目的地軌跡聚類
        向目的地進發(fā)
        小主人報(2022年7期)2022-08-16 06:59:30
        迷宮彎彎繞
        軌跡
        軌跡
        軌跡
        動物可笑堂
        基于DBSACN聚類算法的XML文檔聚類
        電子測試(2017年15期)2017-12-18 07:19:27
        進化的軌跡(一)——進化,無盡的適應(yīng)
        中國三峽(2017年2期)2017-06-09 08:15:29
        目的地
        基于改進的遺傳算法的模糊聚類算法
        沐浴偷拍一区二区视频| 国产国拍亚洲精品永久不卡| 国产 无码 日韩| 精品久久人妻av中文字幕| 国产69精品久久久久app下载| 亚洲欧美日韩精品久久亚洲区| 久久精品国产亚洲一区二区| 天堂av国产一区二区熟女人妻| 日本亲近相奷中文字幕| 国产精品美女久久久久| 亚洲精品天堂av免费看| 日本在线一区二区三区视频| 亚洲中文字幕无码爆乳app| 日日碰狠狠躁久久躁| 精品一二区| 色视频不卡一区二区三区| 亚洲精品蜜夜内射| 日本黄页网站免费大全| 少妇一级aa一区二区三区片| 91精品国产综合久久久蜜| 国产精品18久久久| 久久精品免费一区二区喷潮| 国产精品专区一区二区av免费看| 国产日韩厂亚洲字幕中文| 国产裸拍裸体视频在线观看| 久久频精品99香蕉国产| 午夜一区二区三区福利视频| 又大又粗欧美黑人aaaaa片| 久久久精品人妻一区亚美研究所| 亚洲一区二区三区中文视频| 9久久婷婷国产综合精品性色 | 色播亚洲视频在线观看| 国产精品亚洲欧美天海翼| 蜜桃av福利精品小视频| 免费a级毛片无码免费视频首页| 亚洲国产av导航第一福利网| 亚洲一区二区精品久久岳| 国产在线观看视频一区二区三区| 国产精品 人妻互换| 亚洲欧洲久久久精品| 午夜免费观看一区二区三区|