亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于知識圖譜的個性化甘肅旅游線路推薦方法研究

        2021-09-06 12:15:42潘祿生
        電子制作 2021年17期
        關(guān)鍵詞:旅游信息

        潘祿生

        (甘肅畜牧工程職業(yè)技術(shù)學院智能與信息學院,甘肅武威,733006)

        0 引言

        隨著互聯(lián)網(wǎng)技術(shù)滲透到生活的各個方面,信息過載導致有效數(shù)據(jù)被淹沒在海量信息中,降低了信息利用率[1]。推薦系統(tǒng)就是為了解決這種問題應(yīng)運而生,但隨著互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)數(shù)據(jù)呈現(xiàn)出隨意化,個性化等特點,傳統(tǒng)推薦系統(tǒng)面臨著數(shù)據(jù)稀疏的問題[2]。以旅游信息為例,不同人對相同景點的評價差異較大,且與游客的年齡,性別,興趣愛好等各種因素息息相關(guān),這就導致了旅游信息的離散化程度非常高。如何根據(jù)現(xiàn)有知識信息實現(xiàn)旅游信息的個性化推薦,對提升甘肅省旅游產(chǎn)業(yè)的發(fā)展具有重大意義。

        在旅游網(wǎng)站中,旅游線路信息包括大量的景點信息,如地點,門票,酒店,交通線路,旅游線路特色等。針對傳統(tǒng)推薦算法對離散數(shù)據(jù)推薦不準確的問題,提出了基于知識圖譜的旅游線路推薦方法。

        1 旅游線路領(lǐng)域知識圖譜構(gòu)建

        ■1.1 旅游線路領(lǐng)域知識圖譜構(gòu)建總體流程

        個性化推薦方法的優(yōu)劣取決于旅游線路領(lǐng)域知識圖譜的完善程度,然而由于旅游線路信息分布于各旅游信息網(wǎng)站中,因此需要對旅游網(wǎng)站信息采集,而采集到的數(shù)據(jù)是否滿足旅游路線知識圖譜構(gòu)建的需求,需要采用大數(shù)據(jù)技術(shù)進行分析,然后與已有的數(shù)據(jù)進行相似度計算,滿足閾值的數(shù)據(jù)才可以作為有效數(shù)據(jù)存儲數(shù)據(jù)庫中。旅游線路領(lǐng)域知識圖譜構(gòu)建總體流程如圖1所示。

        圖1 旅游線路領(lǐng)域知識圖譜構(gòu)建流程

        在旅游線路領(lǐng)域知識圖譜的構(gòu)建過程中,數(shù)據(jù)采集負責從旅行網(wǎng)站,點評網(wǎng)站,百科網(wǎng)站等采集相應(yīng)的景點實體信息,通過在爬取數(shù)據(jù)過程中進行預(yù)處理,去除噪音數(shù)據(jù),然后通過數(shù)據(jù)的類型,如結(jié)構(gòu)化數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)進行存儲。在數(shù)據(jù)抽取階段,將采集到數(shù)據(jù)按照數(shù)據(jù)抽取模型,抽取構(gòu)建領(lǐng)域知識圖譜所需的實體數(shù)據(jù)、屬性數(shù)據(jù)和關(guān)系數(shù)據(jù)。在知識融合階段通過同義詞庫將抽取的實體,屬性和關(guān)系數(shù)據(jù)進行數(shù)據(jù)融合,包括實體歧義的消除,屬性歧義的消除以及同義關(guān)系的合并等[3]。最后利用這些數(shù)據(jù)構(gòu)建實體/屬性/屬性值三元組,從而構(gòu)建旅游線路領(lǐng)域知識圖譜。由于旅游線路信息本就離散且稀疏,因此高效的知識融合方案直接決定了旅游領(lǐng)域知識圖譜的完整性。領(lǐng)域知識圖譜的知識融合首先需要對實體,屬性和屬性值等知識結(jié)構(gòu)主體進行擴充,以擴大領(lǐng)域知識圖譜的使用范圍,其次是對各知識結(jié)構(gòu)主體值的融合,以提高知識圖譜的準確度。

        ■1.2 屬性知識擴充方法

        1.2.1 屬性知識擴充流程

        知識主體擴充是指通過信息采集技術(shù)持續(xù)將滿足領(lǐng)域知識圖譜構(gòu)建所需信息納入知識圖譜的過程。知識圖譜中實體用三元組<實體E,屬性A,屬性值V>表示,關(guān)系用三元組<實體E1,關(guān)系R,實體E2>表示。知識主體擴充包括實體擴充,屬性擴充和關(guān)系擴充。本文主要研究知識圖譜的屬性擴充,針對旅游線路的特點,整理出10個典型的屬性,屬性名和說明如表1所示。

        表1 旅游線路實體屬性名

        為了實現(xiàn)知識圖譜的覆蓋范圍,提高知識圖譜的準確性,需要對屬性知識進行擴充。所謂的屬性知識擴充方法指對給定實體的屬性和屬性值進行擴充的過程。為了提高準確度,本文采用了基于模式匹配和詞義的混合屬性知識擴充方法,知識擴充方法的基本流程如圖2所示。

        圖2 混合屬性知識擴充方法基本流程

        在信息抽取和語料預(yù)處理階段,從攜程旅行網(wǎng)和馬蜂窩網(wǎng)站上抽取關(guān)于甘肅旅游領(lǐng)域的124個旅游景點實體的列表,對列表中的旅游景點,提取<實體,屬性,屬性值>三元組數(shù)據(jù)。語料的預(yù)處理包括對字符串的處理和自然語言處理,包括分詞,詞性標注等?;谀J狡ヅ涞闹饕蝿?wù)是將抽取結(jié)果與給定模式的字符串作為候選屬性值,然后基于同義詞詞匯[4]進行擴展。對于不同候選屬性的詞性列表,將候選屬性值標記出來,并對這些屬性值進行人工標注。在模式匹配階段使用WEKA分析工具[5]中的分類器對部分符合屬性值特征屬性和不符合屬性值特征屬性的候選集進行訓練,并使用多分類器投票的集成式分類方式來預(yù)測結(jié)果。在基于詞義的屬性知識擴充方法中,屬性來源包括基本屬性及其同義詞,百科網(wǎng)站的infobox[6]的屬性名,屬性值以及模式匹配的屬性值。在基于詞義的屬性知識擴充方法中需要對每個詞根據(jù)來源賦予權(quán)重。在數(shù)據(jù)采集之后對候選語句中詞匯的屬性權(quán)重進行計算,計算方法就是將所有的屬性權(quán)重相加,然后計算該語句中詞匯的平均權(quán)重,然后決定該語句是否進入候選語句。

        1.2.2 屬性知識擴充方法

        (1)基于同義詞的屬性知識擴充方法

        在旅游領(lǐng)域知識圖譜構(gòu)建過程中,基于模式匹配的屬性知識擴充方法主要依靠人工構(gòu)建模式和自動構(gòu)建模式兩種方法實現(xiàn)模式匹配,而主要以人工構(gòu)建模式為主,這種方式較為適合固定模式下屬性知識的構(gòu)建。一個模式如“<月牙泉>位于<甘肅省敦煌市西南5公里鳴沙山北麓>”表示景區(qū)的位置信息,“<莫高窟>是<世界上現(xiàn)存規(guī)模最大、內(nèi)容最豐富的佛教藝術(shù)地>”表示景區(qū)的特色等,利用類似的模式可以獲得知識主體的屬性信息。同時為了增加模式匹配的適用性,可以對知識主體(景點)和知識屬性(地理位置,最大特色等)之間表示關(guān)系的同義模式進行擴展,如“位于”和“坐落于”,“地處”等。為此,本文對表1中提取的10個屬性構(gòu)建了總計187條原始模式,同時使用同義詞擴展了873條擴展模式,且每個模式都有知識主體,知識屬性和知識關(guān)系三項構(gòu)成。具體方法流程如圖3所示。

        圖3 基于同義詞的屬性知識擴充方法

        (2)基于模式匹配的屬性知識擴充方法

        對于旅游信息網(wǎng)站和百科類網(wǎng)站的獲取的語料信息,需要將其抽取為<實體,屬性,屬性值>的三元組,在進行實體屬性抽取之前需要對同義或者連續(xù)實體屬性進行合并,合并完成之后就可以使用基于模式匹配的屬性知識[7]擴充方法,其具體過程如圖4所示。

        圖4 基于模式匹配的屬性知識擴充方法

        在使用模式匹配的方法后,最終獲取甘肅旅游線路信息的三元組24435條,經(jīng)過篩選,其中22187條三元組可以用于甘肅旅游領(lǐng)域知識圖譜的構(gòu)建工作。

        2 基于知識圖譜的用戶旅游線路建模

        由于甘肅旅游資源非常豐富,且從區(qū)域到類別都非常廣泛,一般來說,甘肅旅游可以按距離分為短程,中程,遠程旅游,按時間可以分為一日,二日,三日或多日旅游,按旅游線路的性質(zhì)可分為觀光游和專題游等。而不同的人群根據(jù)個人時間,經(jīng)濟能力,旅游性質(zhì)等適合不同的旅游線路,比如在周末適合三人親子游,假期情侶適合多日旅游等。為了滿足個性化旅游線路推薦,需要根據(jù)用戶的類型和興趣,依靠旅游領(lǐng)域知識圖譜構(gòu)建多條旅游線路供用戶選擇。

        在規(guī)劃旅游線路過程中,除了景點的建議旅游時間外,景點與景點之間的距離也是必須考慮的問題,交通時間的計算時間如下:

        圖5 基于知識圖譜的用戶旅游線路總體流程

        對于speed來說,不同的距離使用不同的交通工具,通常以步行,公交,駕車三擋速度為基準。在規(guī)劃線路過程時,可以采用Dijkstra算法來規(guī)劃各景點之間的路線。

        對于旅游線路的綜合體驗評分來說,旅游線路的體驗評分包括兩類:各景點的加分和交通路徑上的減分,一般來說,景點的加分以旅游景點的綜合評分為參考,交通路徑上的減分以交通時間為基準,時間越長,減分越多,旅游線路的綜合評分可用如下公式計算。

        其中α和β分別表示旅游線路和交通時間的均衡參數(shù)。把所有推薦的旅游線路按照分數(shù)高低排名,并返回給用戶之后,用戶就可以根據(jù)個人的需求進行篩選。

        3 實驗結(jié)果與分析

        本實驗使用neo4j工具[8]構(gòu)建甘肅旅游領(lǐng)域知識圖譜,從攜程,馬蜂窩,百度百科,大眾點評等網(wǎng)站總共抽取22187條<主體,屬性,屬性值>三元組構(gòu)建甘肅旅游知識圖譜,以甘肅旅游領(lǐng)域知識圖譜如圖6所示。

        圖6 甘肅旅游線路目的地圖譜模型(張掖局部)

        為了表示該方法的效果,本文以敦煌出發(fā),家庭2日游為例,推薦的結(jié)果如表2所示。

        表2 實驗結(jié)果

        從推薦結(jié)果可看出來,對于家庭旅游而言,該個性化旅游推薦方案主要以游和玩兩個特點,且不同的線路適合不同的家庭類型,如線路1景點較多,線路較長,適合家庭三代人旅游,而線路2景點較少,且交通方便,適合于家庭中有較大年紀的老人旅游,而線路3更偏向于父母攜帶孩子旅游,而線路4更符合年輕家庭旅游。

        4 結(jié)束語

        針對傳統(tǒng)旅游推薦面臨的準確度不高,旅游線路單調(diào)的問題,提出了基于知識圖譜的個性化旅游線路推薦方法。通過使用屬性知識擴充方法增加知識獲取的廣度,提升旅游領(lǐng)域知識圖譜的覆蓋面和準確度,然后將用戶旅游時間,旅游類型需求,計算各旅游景點的評分和景點的距離計算評分,獲得合適的旅游線路,將旅游線路進行排序推薦給用戶,實現(xiàn)旅游線路個性化推薦。

        猜你喜歡
        旅游信息
        我們一起“云旅游”
        少兒科技(2022年4期)2022-04-14 23:48:10
        小A去旅游
        好孩子畫報(2018年7期)2018-10-11 11:28:06
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        旅游
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        旅游的最后一天
        出國旅游的42個表達
        海外英語(2013年8期)2013-11-22 09:16:04
        信息
        健康信息
        祝您健康(1987年3期)1987-12-30 09:52:32
        健康信息(九則)
        祝您健康(1987年2期)1987-12-30 09:52:28
        丝袜美腿福利一区二区| 人妻少妇人人丰满视频网站| 日韩一二三四区免费观看| 伊人加勒比在线观看视频| 国产综合在线观看| 国产精品丝袜黑色高跟鞋| 国产经典免费视频在线观看| 久久精品一区二区熟女| 人妻少妇出轨中文字幕| 国产精品免费久久久久影院| 国产美女精品AⅤ在线老女人| 亚洲天堂av一区二区三区不卡 | 婷婷亚洲综合五月天小说| 99免费视频精品| 男女性行为免费视频网站| 亚洲中文字幕久久精品无码a | 国产一区二区三区蜜桃av| 亚洲三级视频一区二区三区| 色 综合 欧美 亚洲 国产| 精品少妇大屁股白浆无码| 日韩视频午夜在线观看| 亚洲国产日韩a在线乱码| 久久老子午夜精品无码怎么打| 狠狠狠狠狠综合视频| 日本中文字幕有码在线播放| 精品国产精品国产偷麻豆| 国产精品第一二三区久久蜜芽 | 97激情在线视频五月天视频| 精品卡一卡二乱码新区| 亚洲精品无播放器在线播放| 午夜爽毛片| 在教室轮流澡到高潮h免费视| 久久99国产精一区二区三区| 无码一级视频在线| av网站韩日在线观看免费| 亚洲av男人电影天堂热app| 藏春阁福利视频| 国产一区,二区,三区免费视频| 国产精品美女久久久网站三级| 国模欢欢炮交啪啪150| 久久免费精品国产72精品剧情|