亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Apriori改進算法的旅游個性化推薦

        2018-01-26 07:32:14徐宏陳焰支艷利張金鵬
        微型電腦應(yīng)用 2018年1期
        關(guān)鍵詞:旅游用戶

        徐宏, 陳焰*, 支艷利, 張金鵬

        (1.昆明理工大學(xué) 信息工程與自動化學(xué)院, 昆明 650504;2. 云南財經(jīng)大學(xué) 信息管理中心, 昆明 650221)

        0 引言

        隨著互聯(lián)網(wǎng)的普及發(fā)展以及電子商務(wù)網(wǎng)站的興起,利用網(wǎng)絡(luò)進行在線信息的搜索已經(jīng)成為旅游者在旅游前獲取信息的主要渠道,但是嚴(yán)重的信息過載使得旅游者常常淹沒于大量的信息搜索和產(chǎn)品選擇當(dāng)中。旅游個性化推薦系統(tǒng)正是解決這一問題的有效方法,其不僅能為旅游者搜索到符合其需求和偏好的旅游信息,做出旅游決策,也能減少旅游企業(yè)的成本,幫助企業(yè)盈利[1]。但是旅游推薦系統(tǒng)具有相對于其他推薦項目的特殊性。從四個方面分析,第一,用戶的旅游數(shù)據(jù)信息更復(fù)雜;第二,用戶在網(wǎng)站進行搜索時,很難準(zhǔn)確表達自己的需求;第三,開發(fā)者很難獲取用戶的旅游偏好信息[2];第四,用戶的旅游數(shù)據(jù)更稀疏。Ricci,et[3]也指出,相對于書、電影等低復(fù)雜度的推薦系統(tǒng),保險、金融、旅游等是最為復(fù)雜的推薦項目。從四大著名的外文數(shù)據(jù)庫ProQuest、ScienceDirect、Ingenta、Springer中進行相關(guān)搜索發(fā)現(xiàn),由于旅游推薦系統(tǒng)的特殊性與重要性,旅游個性化推薦正在成為學(xué)術(shù)界和產(chǎn)業(yè)界研究的熱點。

        本文通過對國內(nèi)外推薦系統(tǒng)在旅游領(lǐng)域的應(yīng)用文獻整理,總結(jié)了旅游推薦系統(tǒng)相對應(yīng)其他推薦產(chǎn)品的特殊性;分析了傳統(tǒng)旅游推薦系統(tǒng)的一般框架;并針對傳統(tǒng)推薦方法在面對這些特殊性時存在的缺陷,提出了一種基MC-Apriori算法的旅游個性化推薦模型,該方法通過MC-Apriori算法對用戶搜索和閱覽的歷史關(guān)鍵詞進行頻繁集挖掘并向用戶推薦符合其興趣傾向的旅游信息,通過利用收集的康輝旅行社的語料數(shù)據(jù)測試,證明了本文的推薦方法比傳統(tǒng)推薦系統(tǒng)更具有使用價值,并且在此基礎(chǔ)上,論證了MC-Apriori算法不僅減少了每次掃描全部數(shù)據(jù)所需要的開銷,而且提高了效率。

        1 傳統(tǒng)旅游推薦系統(tǒng)

        旅游推薦的內(nèi)容包括游、娛、購、食、住、行六方面的旅游產(chǎn)品。若向用戶推薦準(zhǔn)確、多樣和個性化的旅游產(chǎn)品,需要通過四方面的數(shù)據(jù)信息:用戶需求、用戶偏好、約束條件及旅游資源庫。用戶需求是用戶對當(dāng)前旅游產(chǎn)品的要求,屬主觀條件,如:用戶對住宿條件等要求。用戶偏好可以通過分析該用戶的歷史旅游數(shù)據(jù),如用戶對旅游產(chǎn)品的評論內(nèi)容[4]。約束條件值是指影響用戶決策的一些外部客觀條件,如用戶的性別或收入[5]。旅游資源庫是旅游領(lǐng)域中的包含屬性值[6]的旅游產(chǎn)品,它是分析、產(chǎn)生推薦系統(tǒng)的重要數(shù)據(jù)之一,如推薦景點可采集景點名稱和類別、門票、評分等信息。

        在推薦時,有時還要考慮多個產(chǎn)品之間復(fù)雜的時空關(guān)系[7],因此相比其他產(chǎn)品,旅游數(shù)據(jù)更復(fù)雜,用戶更難準(zhǔn)確表述自己的需求。而對于開發(fā)者來說,很難獲取用戶旅游偏好信息。而受時間和消費支出等約束條件,用戶一年之內(nèi)實際旅游過的景點屈指可數(shù),用戶之間共同旅游的景點更是很少,所以旅游數(shù)據(jù)更稀疏。而如何挖掘用戶的隱藏信息變得更重要。

        通過對當(dāng)前推薦系統(tǒng)在旅游領(lǐng)域的應(yīng)用文獻分析,總結(jié)出了旅游推薦系統(tǒng)的一個通用框架。其主要包含4個步驟:旅游產(chǎn)品建模、用戶建模、推薦計算,產(chǎn)品展示。通常的推薦方法有基于內(nèi)容的推薦[8],基于協(xié)同過濾的推薦[9],基于知識的推薦[10]和基于社會媒體的推薦[11],并且時間復(fù)雜性大于O(m2×n)。如Majid等[12]根據(jù)構(gòu)建的景點庫,建立了用戶知識偏好矩陣,通過基于協(xié)同過濾的方法實現(xiàn)了個性化推薦。而推薦算法的使用存在一些弊端,基于內(nèi)容的方法推薦的信息范圍過于狹窄;對于協(xié)同過濾方法,如用戶評分?jǐn)?shù)據(jù)少,產(chǎn)生數(shù)據(jù)稀疏性問題;而基于知識的推薦需要挖掘難以獲取的領(lǐng)域知識和推理技術(shù);基于社會媒體的技術(shù)是將用戶的社會關(guān)系和其他社會媒體數(shù)據(jù)運用到旅游推薦當(dāng)中,但是獲取社會信任關(guān)系還是當(dāng)前社會推薦需要解決的問題。相對于其他三種方法,基于協(xié)同推薦的方法使用更普遍,本文將此方法和改進的算法進行對比。

        根據(jù)上述分析,本文提出一種新的面向旅游用戶的個性化搜索推薦模型。因為用戶需求、產(chǎn)品偏好,以及約束條件可以在用戶閱覽的旅游信息中反映,所以通過TextRank方法對用戶搜索和閱覽的歷史關(guān)鍵詞進行頻繁集挖掘,生成用戶傾向性詞典;然后根據(jù)用戶當(dāng)前搜索關(guān)鍵詞,利用MC-Apriori算法關(guān)聯(lián)挖掘用戶傾向性詞典,從而向用戶推薦滿足其當(dāng)前興趣傾向的旅游信息。該模型在保障推薦結(jié)果準(zhǔn)確、多樣和個性的基礎(chǔ)上,還解決了旅游個性化推薦面臨的特殊問題,提高了效率。

        2 相關(guān)知識

        2.1 TextRank算法抽取文本關(guān)鍵詞

        TextRank[13]是比較常用的文本關(guān)鍵詞抽取方法,該方法實質(zhì)是一種基于圖的排序算法。同一文本中大多數(shù)詞語都是為表達同一主題,詞語與詞語之間也存在一定的語義關(guān)系,將詞語看做圖中的頂點,頂點之間通過有向邊反映它們之間的關(guān)系?;趫D的排序算法的基本理論,在具有語義關(guān)系的詞語之間建立連線構(gòu)建TextRank模型,根據(jù)詞語之間的相互“投票”遞歸計算詞語的值,而每個詞語值的大小取決于其詞語投票分?jǐn)?shù)和投票詞自身的值大小,值較大的詞語視為重要詞語。其中不和任何詞語有連線的詞語為孤立點。本文通過TextRank方法對用戶搜索內(nèi)容和閱覽文本信息進行關(guān)鍵詞挖掘。遞歸計算公式如式(1)。

        其中,d為阻尼系數(shù),代表從圖中某一特定點指向其他任意點的概率,WS(Vi)為頂點Vj即詞j的得分,Link(Vi)為與點Vi有連線的點的集合。

        2.2 利用word2vec查找語義相似詞語

        Word2vec[14]是Google于2013年開源的一款將詞語表征為實數(shù)值向量的高效工具,其利用深度學(xué)習(xí)(Deep Learning)的思想,通過訓(xùn)練,把文本內(nèi)容的處理簡化為K維向量空間中的向量運算,而向量空間上的相似度可以用來表示文本語義上的相似度。Word2vec已經(jīng)被廣泛的應(yīng)用于很多NLP(Nature Language Processing)相關(guān)的工作中,如情感分析、詞性分析和聚類等。

        鑒于此,本文采用word2vec將用戶傾向性詞典中的每個關(guān)鍵詞生成一個200維的向量,然后通過向量與向量之間的余弦距離來計算詞語之間的相似度,計算公式如式(2)。

        (2)

        其中,公式2中ei是語料句子中第i個詞,fj是目標(biāo)句子中第j個詞,第i個詞和第j個詞之間的相似度用Sim(ei,fj)表示,分子表示ei與fj的200維向量的乘積,當(dāng)cos相似度大于0.6時,表示兩個詞相似。

        word2vec查找語義相似詞語的具體操作如下:

        (1)配置word2vec工具;

        (2)挖掘康輝旅行社的文本語料;

        (3)使用NLPIR2013工具(http://ictclas.nlpir.org/)?對每個語料進行分詞;

        (4)將分好的語料進行訓(xùn)練。

        (5)得到模型文件。文件中存儲著文檔中的詞語和其對應(yīng)的向量。

        (6)利用公式2計算,比較詞語的相似性,若cos大于0.6時,表示兩個詞相似,否則不相似。

        2.3 Apriori算法及矩陣聚類改進算法

        2.3.1 Apriori算法

        Apriori算法[15]是一種挖掘布爾型關(guān)聯(lián)規(guī)則頻繁集項的算法,在數(shù)據(jù)挖掘中具有里程碑的作用。它的結(jié)構(gòu)簡單,沒有復(fù)雜的推導(dǎo),易于理解。項集(Itemset)簡單地說就是項的集合,包含k個項的集合稱為k-項集,譬如3-項集{l1,l2,l3}。一個項集的支持度(Support Count)為該項集出現(xiàn)頻度,即整個數(shù)據(jù)集中包含該項集的記錄個數(shù)。若某項集出現(xiàn)的頻度大于一定的頻度閾值則成為頻繁項集。頻繁k-項集集合計作Lk,其頻度記support_count(Lk)。通過逐層搜索迭代的方法來完成頻繁項集的挖掘工作。即利用k-項集探察(k+1)-項集,來窮盡數(shù)據(jù)集中所有頻繁項集,直到不能再找到任何頻繁k-項集。最后在所有的頻繁集中找出強規(guī)則,即產(chǎn)生用戶感興趣的關(guān)聯(lián)規(guī)則。

        但隨著挖掘數(shù)據(jù)庫的不斷增大,應(yīng)用Apriori算法時每次迭代產(chǎn)生候選項目集以及統(tǒng)計其支持度非常耗時。為了提高效率,Apriori算法的一系列改進算法主要在以下方面進行優(yōu)化:1)減少掃描數(shù)據(jù)庫的次數(shù);2)減少生成候選項目及的數(shù)目。

        Apriori算法的流程圖,如圖1所示。

        圖1 Apriori算法流程圖

        2.3.2 MC-Apriori 算法

        針對旅游數(shù)據(jù)稀疏、復(fù)雜且龐大的特點,以及Apriori算法的不足,提出了一種MC-Apriori算法,該算法以減少掃描數(shù)據(jù)庫的次數(shù)和數(shù)據(jù)庫規(guī)模為目的,只需掃描數(shù)據(jù)庫一次,生成聚類矩陣來代替原來的事務(wù)數(shù)據(jù)庫,在生成頻繁項集時,也只需對部分聚類矩陣進行相應(yīng)運算,因而可以大大提高算法的運算效率,最后在生成的所有頻繁項集中去挖掘包含用戶當(dāng)前搜索關(guān)鍵詞的最大項集。

        定義1:每個項Ij的向量定義為:

        定義2:2-項集{IiIj}的向量定義為:

        定義3:k-項集{I1I2…Ik}的支持度計數(shù)為:

        定義4 項集I的矩陣D:

        項集I轉(zhuǎn)換為D’的表示如下:

        為提高Apriori算法在旅游推薦系統(tǒng)中的效率,將相似的事務(wù)在數(shù)據(jù)庫中進行標(biāo)記(本文中稱“相似記錄個數(shù)”記為(α1,α2,…,p)-1,p為矩陣的行數(shù),根據(jù)該事務(wù)在D中對于的某行加上出現(xiàn)的“相似記錄個數(shù)”。從而獲得數(shù)據(jù)的矩陣D″:

        將D″中的值與D矩陣進行比較,若D中的項為0,則將D″相同位置也標(biāo)記為0,否則,不改變。最后獲得D矩陣。

        算法過程如下:

        ②通過Lk-1與自己自然連接產(chǎn)生候選k-項集的集合Ck。當(dāng)k=2時,對于候選項集合C2,直接根據(jù)定義2算出個各項集的支持度計數(shù),然后轉(zhuǎn)③。

        ③分別取候選k-項集Ck中的每個項集與L2中的元素進行比較,如果不在L2中,則該候選項集是非頻繁的,將其從Ck中刪除從而達到初步剪枝。因為候選k-項集Ck的集合中每個項集的長度為k,所以不必考慮小于k的聚類矩陣。先在聚類矩陣MC(k)中利用列向量間的*運算求出Ck中每個候選項集對應(yīng)的列向量,再通過列元素求和來計算器支持度計數(shù)。如果大于等于min_sup,則將該候選k-項集放到頻繁k-項集Lk中,否則繼續(xù)在聚類矩陣MC(k+1)中統(tǒng)計此項集的支持度計數(shù),并將其累加到前次的計數(shù)中,直到大于或等于min_sup,或者到達了最后聚類矩陣MC(n)而終止。

        ④循環(huán)②③步,直到候選集Ck為空而停止。得到所有的頻繁項集。

        ⑤若最大頻繁集中的項數(shù)個數(shù)小于當(dāng)前搜索關(guān)鍵詞KEY的個數(shù),則向用戶推薦以“KEY為關(guān)鍵詞的文本”;否則遍歷所有頻集,找出以KEY為真子集且頻度最大的項集,向用戶推薦以該頻繁集為關(guān)鍵詞的旅游信息,否則,若遍歷結(jié)果為空時,則向用戶推薦以“KEY為關(guān)鍵詞的文本”。

        根據(jù)以上思想,基于MC-Apriori算法推薦的偽代碼描述如下:

        輸入:用戶當(dāng)前搜索關(guān)鍵詞集KEY={k1,k2,…,kq}(q為關(guān)鍵詞的個數(shù));用戶傾向性詞典I;最小支持度閾值min_sup。

        輸出: L: 推薦給用戶的關(guān)鍵詞集GEN_KEY。

        方法:

        1)D=Cluster_Matrix_Create(I,min_sup);

        //Cluster_Matrix_Create(k)此為生成聚類矩陣算法。

        2)for(k=2;Lk-1≠;k++){

        Ck=Candidate_Itemset_Gen(Lk-1);

        Lk=Large_Itemset_Gen(Ck);}

        3)if q≥p(p為最大頻繁集項數(shù)) then GEN_KEY=“以KEY為關(guān)鍵詞的文本”。

        4)temp_L=max_key_frequent(Lk);//遍歷所有頻繁集Lk。q

        End

        改進的Apriori算法結(jié)構(gòu)圖如圖2所示。

        圖2 改進的Apriori算法結(jié)構(gòu)圖

        目前,基于Apriori的改進算法層出不窮,此算法不僅可以滿足對用戶傾向性詞典的挖掘,而且可以很友好的處理龐大,稀疏復(fù)雜的旅游領(lǐng)域數(shù)據(jù),本算法的時間復(fù)雜度為O(n)~O(n2)。

        3 基于MC-Apriori算法的旅游個性化推薦模型

        在旅游網(wǎng)站中的搜索時,用戶輸入的關(guān)鍵詞往往會比較集中,且和當(dāng)前主題相關(guān);考慮用戶的個性習(xí)慣,輸入的關(guān)鍵詞分布應(yīng)該不會太廣泛。針對用戶特定的行為習(xí)慣,利用MC-Apriori可以比較容易準(zhǔn)確地搜索出用戶傾向性詞典中達到一定頻度閾值的關(guān)鍵詞頻繁集。

        本文引入了用戶的閱覽文本內(nèi)容,在用戶模糊交互且旅游數(shù)據(jù)龐大、復(fù)雜、稀疏的情況下,用戶閱覽文本內(nèi)容可以反映出用戶當(dāng)前的興趣傾向,并且確保推薦內(nèi)容的準(zhǔn)確、多樣;且每個用戶會產(chǎn)生個自的用戶傾向性詞典,則保證了推薦信息的個性化。同時利用MC-Apriori算法,不僅可以減少工作量,而且提高了運算效率?;贛C-Apriori算法的旅游個性化推薦模型,如圖3所示。

        圖3 基于MC-Apriori算法的旅游個性化推薦模型

        如圖3所示,首先借助TextRank算法對用戶的搜索關(guān)鍵詞進行挖掘并按時間排序,存儲在用戶個性化詞典中;同理利用TextRank算法挖掘用戶搜索后瀏覽文本內(nèi)容的前1/8個旅游領(lǐng)域的關(guān)鍵詞;將此內(nèi)容關(guān)鍵詞集和用戶個性化詞典進行合并且按時間排序,通過word2vec工具比較每兩行記錄,將語義相似且ID小的記錄刪除并標(biāo)記,存儲在容量固定的用戶傾向性詞典中;最后通過MC-Apriori算法對用戶傾向性詞典進行挖掘,得到推薦信息。

        3.1 用戶傾向性詞典模塊設(shè)計

        本文提出的旅游推薦模型,關(guān)鍵是對用戶的傾向性詞典進行挖掘分析并記錄。如圖4所示,模型中為每用戶建立一個用戶個性化詞典、內(nèi)容關(guān)鍵詞集和用戶傾向性詞典數(shù)據(jù)模塊,各模塊中的記錄按照用戶的搜索時間升序排列,ID越大表示用戶搜索的時間越靠近當(dāng)前,并且定義用戶傾向性詞典的容量為用戶個性化詞典和內(nèi)容關(guān)鍵詞集容量的和,固定的容量不僅可以使記錄都是用戶近期感興趣的信息,而且也節(jié)約了存儲空間,提高了MC-Apriori運算效率。當(dāng)用戶進行搜索查看時,將挖掘的關(guān)鍵詞記錄到對應(yīng)的表中,隨著記錄不斷增加,當(dāng)記錄達到一定的容量,按照LRU(最近最久未使用)算法存儲記錄。此外,通過word2vec工具對比用戶傾向性詞典中每兩行記錄,將語義相似且ID小的記錄刪除并在“相似記錄個數(shù)”中加1。

        圖4 用戶存儲模塊結(jié)構(gòu)

        3.2 評測指標(biāo)

        推薦系統(tǒng)效果評估是一個困難的問題,常見的評估指標(biāo)可以分為準(zhǔn)確度、多樣性、新穎性和覆蓋率四大類。針對旅游領(lǐng)域的特殊性和復(fù)雜性,根據(jù)傳統(tǒng)的推薦系統(tǒng)性能評測指標(biāo),本文采用以下指標(biāo)對算法性能評估。

        1)綜合評價指標(biāo)(F-Measure)

        2)效率

        4 實驗舉例

        將本算法在對收集的康輝旅行社的語料數(shù)據(jù)上測試。對于某一個用戶,當(dāng)前用戶傾向性詞典表,如表1所示。

        表1 用戶傾向性詞典表

        如表1所示,該用戶到目前為止搜索和閱覽文本總數(shù)為13次,設(shè)置用戶傾向性詞典的容量為120條記錄,其中I1到I10分別代表昆明、景點、黑龍?zhí)丁⒚坊?、門票、道館、泉眼、公園、保險、團購這10個關(guān)鍵詞,當(dāng)前與ID=5的記錄{I1,l3,I4,I7,I8}語義相似的個數(shù)為1,與ID的記錄{I1,l3,I4,I8}語義相似的個數(shù)為3,用戶當(dāng)前搜索關(guān)鍵詞(ID=9)為{I1,I4}。

        當(dāng)前用戶在搜索框中輸入關(guān)鍵詞{昆明,梅花}時,首先將搜索關(guān)鍵詞經(jīng)過word2vec更新用戶傾向性詞典表,然后采用MC-Apriori算法進行頻繁項集的挖掘,令min_sup為2。過程如下:

        1)掃描事務(wù)數(shù)據(jù)庫一次,獲得項集I的矩陣D。生成聚類矩陣CM(k),k為2,3,4,5,10,16。

        CM(5)=(1011010100)

        CM(10)=(2022002200)

        CM(16)=(4044000400)

        同法可計算出:I3,I4,I5,I6,I7,I8,I9,I10與2相比的大小,所以生成頻繁1-項集L1={I1,I3,I4,I5,I8},由此可直接排除I2,I6,I7,I9,I10。

        2)L1=與自己自然連接產(chǎn)生候選2-項集的集合

        C2={I1I3,I1I4,I1I5,I1I8,I3I4,I3I5,I3I8,I4I5,I4I8,I5I8}。在CM(2)中,因為

        3)L2與自己自然連接產(chǎn)生候選3-項集的集合C3={I1I3I4,I1I3I5,I1I3I8,I1I4I5,I1I4I8,I1I5I8,I3I4I5,I3I4I8,I3I5I8},由于{I4I5,I5I8}是非頻繁2-項集,所以{I1I4I5,I1I5I8,I3I4I5,I3I5I8}從C3中刪除,因此只需考{I1I3I4,I1I3I5,I1I3I8,I1I4I8,I3I4I8}的支持度計數(shù)。由于k=3>2,所以只需從聚類矩陣MC(3)考慮,

        1+0+1=2≥2

        同理,可以計算其他候選集的支持度,得到的頻繁3-項集L3={I1I3I4,I1I3I5,I1I3I8,I1I4I8,I3I4I8}。

        4)L3與自己自然連接產(chǎn)生候選4-項集的集合C4={I1I3I4I5,I1I3I4I8,I1I3I5I8},由于{I4I5,I5I8}是非頻繁2-項集,所以將{I1I3I4I5,I1I3I5I8},從C4中刪除,實現(xiàn)剪枝,同3),計算出{I1I3I4I8}的支持度,得L4={I1I3I4I8},算法終止,找出了所有的頻繁項集。

        5) 因為最大項集的項數(shù)為4≥2(2為當(dāng)前搜索關(guān)鍵詞的個數(shù)),則在所有頻繁項集中找出以{昆明,梅花}為真子集的項數(shù)最大的頻繁集,即{昆明、黑龍?zhí)丁⒚坊?、公園}。

        6)向用戶推薦以該頻繁集為關(guān)鍵詞的旅游信息。

        MC-Apriori算法、Apriori算法以及協(xié)同過濾算法在收集的康輝旅行社的語料數(shù)據(jù)中多次試驗所花費時間的平均值如表2所示。

        表2 不同方法在多次試驗下的所需時間評均值 /毫秒

        MC-Apriori算法以及協(xié)同過濾算法隨著語料的遞增F值大小變化,如圖5所示。

        圖5 二種算法隨著語料的遞增F值大小變化

        從表2中可以觀察得到,測試中MC-Apriori算法所需的平均時間小于Apriori算法與基于協(xié)同過濾的算法。圖5中,隨著語料的增加,F(xiàn)值增大,且MC-Apriori的F值大于于協(xié)同過濾的算法。當(dāng)語料增加到一定程度上,F(xiàn)值趨于穩(wěn)定。

        MC-Apriori算法在第一次對數(shù)據(jù)庫掃描的同時根據(jù)事務(wù)中項的和生成不同的聚類矩陣,只需對部分聚類矩陣計算就可以產(chǎn)生頻繁項集,減少了每次掃描全部數(shù)據(jù)庫所需要的開銷,提高了算法的效率。因為旅游數(shù)據(jù)復(fù)雜,基于協(xié)同過濾算法的推薦模型中很難準(zhǔn)確描述這些數(shù)據(jù),而用戶的閱覽信息可以很好的反映用戶的旅游需求和對旅游產(chǎn)品的偏好,以及約束條件,所以本文提出的模型提高了準(zhǔn)確率。且MC-Apriori算法時間復(fù)雜度為O(n)~O(n2),基于協(xié)同過濾算法為O(m2*n),Apriori算法為O(m*n2),所以效率也提高了。通過對收集的康輝旅行社的語料數(shù)據(jù)測試,F(xiàn)值提升了5%。

        5 總結(jié)

        本文針對個性化推薦在旅游領(lǐng)域面臨的特殊問題,提出了一種通過矩陣聚類的Apriori改進的方法,該算法只需對數(shù)據(jù)庫掃描一次并生成一系列不同的聚類矩陣,而只需要對部分聚類矩陣計算就可以產(chǎn)生頻繁項集。引入用戶的閱覽內(nèi)容,不僅反映用戶當(dāng)前的興趣傾向,且保證推薦內(nèi)容的準(zhǔn)確、多樣及個性,同時利用改進Apriori算法提高了搜索效率,減少了工作量。通過對收集的康輝旅行社的語料數(shù)據(jù)大量測試,論證了本文提出的旅游推薦模型相比較傳統(tǒng)的推薦模型具有一定的應(yīng)用價值。為了更好的推薦結(jié)果,推薦算法有待進一步研究。

        [1] 喬向杰,張凌云.近十年國外旅游推薦系統(tǒng)的應(yīng)用研究[J].旅游學(xué)刊.2014(08).

        [2] JANNACH D,ZANKER M, FUCHS M.Constraint-based recommendation in tourism:a multi-perspective case study[J]. Journal of Information Technology and Tourism, 2009, 11(2):139- 155.

        [3] Ricci F, Rokach L, Shapira B.Introduction to recommender systems handbook[A].//:Recommender Systems Handbook[M]. New York: Springer, 2011:1-35.

        [4] 張晗,潘正運,張燕玲.旅游服務(wù)智能推薦系統(tǒng)的研究與設(shè)計[J].微計算機信息, 2006,22(5-3):170-171.

        [5] FENZA G, FISCHETTI E, FURNO D, et al. A hybrid context aware system for tourist guidance based on collaborative filtering[A].FENZA G.The IEEE International Conference on Fuzzy Systems[C].New Jersey: IEEE Press, 2004:259-262.

        [6] 文益民,史一帆,蔡國永,繆裕青,龍剛.個性化旅游推薦研究綜述[A].2015中國旅游科學(xué)年會論文集[C]. 2015.

        [7] GE Y, LIU Q, XIONG H, et al. Cost-aware travel tour recommendation[A].GE Y.ACM SIGKDD Conference[C]. New York: ACM Press, 2011:983-991.

        [8] RICCI F. Travel recommender systems[J].IEEE Intelligent systems, 2002:55-57.

        [9] JIANG K, WANG P, YU N H. ContextRank:personalized tourism recommendation by exploiting context information of geotagged web photos[A]. The 6th International Conference on Image and Graphics[C]. New Jersey: IEEE Press, 2011: 931-937.

        [10] 王顯飛,陳梅,李小天.基于約束的旅游推薦系統(tǒng)的研究與設(shè)計[J]. 計算機技術(shù)與發(fā)展,2012:141-145.

        [11] BUSTOS F, LOPEZ J, JULIAN V, et al. STRS: Social network based recommender system for tourism Enhanced with trust[A]. BUSTOS F. Distributed Computing and Artificial Intelligence[C]. Berlin: Springer, 2008: 71-79.

        [12] MAJID A, CHEN L, CHEN G, et al.A context-aware personalized travel recommendation system based on geotagged socialmedia datamining[J].International Journal of Geographical Information Science. 2012,27(4): 662-684.

        [13] 楊潔,季鐸,蔡東風(fēng),代翠.基于TextRank的多文檔關(guān)鍵詞抽取技術(shù)[A]. 第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C]. 2008.

        [14] 羅杰.王慶林.李原基于word2vec與語義相似度的領(lǐng)域詞語聚類[C]. 2014.

        [15] TANG J, HU X, LIU H. Social recommendation:a review[J]. Social Network Analysis and Mining, 2013,3(4): 1113-1133.

        猜你喜歡
        旅游用戶
        我們一起“云旅游”
        少兒科技(2022年4期)2022-04-14 23:48:10
        小A去旅游
        好孩子畫報(2018年7期)2018-10-11 11:28:06
        旅游
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        Camera360:拍出5億用戶
        100萬用戶
        如何獲取一億海外用戶
        旅游的最后一天
        日韩av一区二区不卡| 欧美日韩成人在线| 日本亚洲色大成网站www久久| 日本高清aⅴ毛片免费| 欧美 亚洲 国产 日韩 综AⅤ | 国产精品18久久久白浆| 日韩人妻无码精品久久| 国产视频毛片| 亚洲av网站首页在线观看| 久久91精品国产91久久跳舞| 加勒比久久综合久久伊人爱| 亚洲综合激情另类小说区| 精品无码人妻一区二区三区| 欧洲综合色| 亚洲天堂av社区久久| 日本一区二区视频在线| 国产日产欧产精品精品| 欧美日韩在线免费看| 亚洲AV秘 无码一区二区三区| 美女一区二区三区在线视频| 国产午夜亚洲精品国产成人av| 国产av无码专区亚洲av蜜芽| 国产又爽又黄的激情精品视频| 精品日本韩国一区二区三区| 男女啪啪视频高清视频| 又色又爽又黄的视频软件app| 朝鲜女子内射杂交bbw| 国产成人精品三上悠亚久久| 亚洲精品在线97中文字幕| 风情韵味人妻hd| 人妻去按摩店被黑人按中出| 色播中文字幕在线视频| 亚洲日本中文字幕乱码| 亚洲天堂一区av在线| 久久露脸国产精品| 国产精品11p| 亚洲大片一区二区三区四区| 亚洲国产人成综合网站| 亚洲中文字幕无码av| 精品国产看高清国产毛片| 日本精品久久中文字幕|