亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多源異構(gòu)數(shù)據(jù)融合的智能商業(yè)選址推薦算法

        2019-08-12 02:35:01翟書穎郝少陽(yáng)楊琪李茹李波郭斌
        現(xiàn)代電子技術(shù) 2019年14期
        關(guān)鍵詞:商業(yè)智能推薦系統(tǒng)隨機(jī)森林

        翟書穎 郝少陽(yáng) 楊琪 李茹 李波 郭斌

        關(guān)鍵詞: 智慧城市; 推薦系統(tǒng); 商業(yè)智能; 多源城市數(shù)據(jù); 隨機(jī)森林; 數(shù)據(jù)融合

        中圖分類號(hào): TN919?34; TP391 ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2019)14?0182?05

        Intelligent commercial site selection recommendation algorithm

        fusing multi?source heterogeneous data

        ZHAI Shuying1, HAO Shaoyang2, YANG Qi2, LI Ru1, LI Bo1, GUO Bin1

        (1. Northwestern Polytechnical University Mingde College, Xian 710114, China;

        2. School of Computer Science, Northwestern Polytechnical University, Xian 710129, China)

        Abstract: With rapid development of social media and location?based network services, the intelligent recommendation based on the user?generated mass data has thus become a hot research hotspot. However, the existing studies mainly focus on online item recommendation, and there are few studies that utilize multi?dimensional heterogeneous data in the physical environments for recommendation. The multi?source urban data such as users′ check?in data, housing price data, and various POI data in social media are used in this paper to extract multi?sided commercial features and spatial features on the basis of data preprocessing under background of urban commercial site selection. The commercial site selection recommendation method based on the random forest is proposed. The multi?source urban data in Beijing city are adopted to build the model to assess the experimental results with the ranking evaluation indicator NDCG. The experiment results indicate that the proposed method has better performance.

        Keywords: smart city; recommendation system; business intelligence; multi?source urban data; random forest; data fusion

        0 ?引 ?言

        近年來,我國(guó)連鎖企業(yè)利用其較低的人力成本、價(jià)格優(yōu)勢(shì),連鎖經(jīng)營(yíng)受到了消費(fèi)者的認(rèn)可。適合的店鋪選址會(huì)極大程度地提高連鎖店收益。傳統(tǒng)的連鎖店選址需要抽取專門的人力,提前發(fā)放調(diào)查問卷大規(guī)模調(diào)研考察居民的需求、區(qū)域人流量、交通狀況、周邊環(huán)境等,這一方式存在很多缺陷。隨著智能移動(dòng)設(shè)備的廣泛普及,各種移動(dòng)社交網(wǎng)絡(luò)快速發(fā)展,并逐漸融入人們的日常生活中。移動(dòng)社交網(wǎng)絡(luò)不僅連接物理和虛擬兩個(gè)社會(huì)空間,融合人們線上、線下體驗(yàn),形成混合社交空間,還為社會(huì)感知計(jì)算提供了更加方便快捷的途徑。LBSN作為移動(dòng)社交網(wǎng)絡(luò)快速發(fā)展的代表,它利用帶有GPS的智能終端記錄某個(gè)時(shí)間點(diǎn)某地的信息,還可以通過簽到跟蹤和共享人的位置信息[1]。這些信息具有空間性、時(shí)間性和社會(huì)化的特點(diǎn)。典型的基于位置的社交網(wǎng)站,如國(guó)內(nèi)的新浪微博,人們可以使用智能手機(jī)、平板電腦等移動(dòng)設(shè)備對(duì)當(dāng)前訪問的興趣點(diǎn)簽到,并與好友分享自己的簽到信息和體驗(yàn),產(chǎn)生對(duì)應(yīng)時(shí)間和地點(diǎn)的信息。本文提出一種利用多源城市數(shù)據(jù)解決連鎖商店選址難題的智能推薦系統(tǒng),通過來自于攜程網(wǎng)的酒店數(shù)據(jù)、鏈家網(wǎng)的房?jī)r(jià)數(shù)據(jù)以及高德地圖的POI等數(shù)據(jù)開展實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本文方法可以高質(zhì)量地解決連鎖店的選址問題,且相對(duì)于單一數(shù)據(jù)源,使用多源城市數(shù)據(jù)的推薦系統(tǒng)具有更高的穩(wěn)定性和推薦質(zhì)量。

        1 ?相關(guān)工作

        1.1 ?多源城市數(shù)據(jù)融合

        利用多源城市數(shù)據(jù)融合進(jìn)行數(shù)據(jù)挖掘有如下特點(diǎn)[2]:

        1) 多源城市數(shù)據(jù)相對(duì)于單一源的數(shù)據(jù),它的目的不是將一個(gè)企業(yè)或組織的所有數(shù)據(jù)集中在一起并標(biāo)準(zhǔn)化而產(chǎn)生唯一的真相。它是以產(chǎn)生決策智能為目標(biāo)將多種數(shù)據(jù)源中的相關(guān)數(shù)據(jù)提取、融合、梳理整合成一個(gè)分析數(shù)據(jù)集,提取什么類型的相關(guān)數(shù)據(jù)成為研究的重要問題。

        2) 多源城市數(shù)據(jù)融合可能包含若干種不同的數(shù)據(jù)形式,所處理的數(shù)據(jù)包含各個(gè)范圍內(nèi)的數(shù)據(jù)信息。由于不同的數(shù)據(jù)形式與結(jié)構(gòu)上的差異,處理的方法、標(biāo)準(zhǔn)就有所差異,因此要提出一種能面向多源城市數(shù)據(jù)的數(shù)據(jù)融合方法。

        1.2 ?商業(yè)選址推薦

        目前已有的選址推薦工作從結(jié)果方面分為以下兩類。

        1) 推薦開店的位置[3?7]。這類工作往往是給定選址的類型,向用戶推薦一些適合選址的位置。這些工作首先從大量數(shù)據(jù)中提取出與選址有關(guān)的幾類特征,例如:多樣性、人流量、互補(bǔ)性、交通便利性等,對(duì)已有目標(biāo)店鋪的訓(xùn)練數(shù)據(jù)進(jìn)行聚類,通過衡量候選地與各簇的相似性,完成選址推薦工作。

        2) 推薦開店的類型[7?8]。給定選址的位置,向用戶推薦適合開店的類型。對(duì)于采用分類的方法[8],采用SVD進(jìn)行張量分解,完成店鋪類型的推薦。本文與上述工作的數(shù)據(jù)源、研究方法有所不同,選址面向特定的連鎖店,其綜合來源于新浪微博的簽到數(shù)據(jù)、鏈家網(wǎng)的房?jī)r(jià)數(shù)據(jù)和高德地圖POI信息等多源城市數(shù)據(jù),并提取出影響店鋪選址的多個(gè)特征,使用多個(gè)特征建立模型,最后利用NDCG對(duì)各個(gè)模型的預(yù)測(cè)得分做評(píng)估。

        2 ?連鎖商店選址模型

        2.1 ?數(shù)據(jù)采集

        實(shí)驗(yàn)采集了酒店數(shù)據(jù)、房?jī)r(jià)數(shù)據(jù)、微博簽到數(shù)據(jù)以及POI數(shù)據(jù)。

        2.1.1 ?酒店數(shù)據(jù)

        酒店數(shù)據(jù)來自于攜程網(wǎng),它擁有大規(guī)模的用戶群,在團(tuán)購(gòu)網(wǎng)站中頁(yè)面呈現(xiàn)方式具有一定的代表性。獲取到酒店的相關(guān)信息和顧客評(píng)論、評(píng)論數(shù)量,表1為酒店數(shù)據(jù)示例。

        2.1.2 ?房?jī)r(jià)數(shù)據(jù)

        房?jī)r(jià)信息來自于鏈家網(wǎng),通過收集網(wǎng)站上的商品房房?jī)r(jià)以及地理位置等信息,反映出該地區(qū)的商鋪房?jī)r(jià)大概的范圍。

        2.1.3 ?微博簽到數(shù)據(jù)

        新浪微博目前月活躍用戶達(dá)到3.4億。用戶可以在新浪微博上對(duì)地點(diǎn)進(jìn)行簽到,公開他們的地理位置,在簽到地留下評(píng)論信息。本文利用收集到的簽到數(shù)據(jù)的位置及簽到數(shù)量信息,分析區(qū)域的人流量。表2為采集到的簽到數(shù)據(jù)示例。

        2.1.4 ?POI數(shù)據(jù)

        POI信息來自于高德地圖。1個(gè)POI至少包含 4個(gè)方面的信息:位置、名稱、類別、屬性,主要用途是對(duì)部件或者事件的地址進(jìn)行描述,能較大程度地增強(qiáng)對(duì)部件或者事件位置的描述能力,提高地理定位的精度和速度。

        2.2 ?特征提取

        從初始的14項(xiàng)POI信息和微博簽到數(shù)據(jù)、房?jī)r(jià)數(shù)據(jù)提取出相應(yīng)信息,結(jié)合選址的相關(guān)因素,將數(shù)據(jù)的維度減少到較小的數(shù)字。在下面的工作中,本文將初始數(shù)據(jù)歸納為兩種特征:地理特征和商業(yè)特征。

        2.2.1 ?地理特征

        從區(qū)域的多樣性、人流量、交通便捷性等方面刻畫區(qū)域的地理特征。將多樣性定義為區(qū)域的空間異質(zhì)性,則區(qū)域p的多樣性可以表示為:

        [Divp=-t∈ΓNtp,rNp,r·log Ntp,rNp,r] (1)

        式中:[Np,r]表示目標(biāo)地點(diǎn)附近所有設(shè)施的數(shù)量;[Ntp,rt∈Γ]表示該區(qū)域內(nèi)類型為r的設(shè)施的數(shù)量;[Γ]為該塊內(nèi)設(shè)施數(shù)量的集合。

        人流量能夠反映該地區(qū)的受歡迎程度,人流量越多,顧客偏向去該地購(gòu)物的動(dòng)機(jī)越高,用戶在該地的消費(fèi)率就越高。將人流量定義為:

        [Hump=c∈ΩNumt(p,c)] (2)

        式中:[Ω={c1,c2,…,cq}]為所有區(qū)域內(nèi)簽到數(shù)據(jù)的集合;[ Numt(p,c)(t∈Γ)]代表該塊內(nèi)的一條簽到數(shù)據(jù)。

        交通便捷性成為評(píng)價(jià)商圈品質(zhì)的重要指標(biāo),用F={f1,f2,f3}(公交車、地鐵、停車場(chǎng))來定義交通便捷性。通過高德地圖API直接獲取這一數(shù)據(jù),地點(diǎn)p內(nèi)的站點(diǎn)數(shù)量記為[num(p,fi)],交通便捷性可以定義為:

        [Trap=fi∈Fnum(p,fi)] ? (3)

        2.2.2 ?商業(yè)特征

        通過研究地點(diǎn)p的同一商鋪的吸引力、區(qū)域內(nèi)的競(jìng)爭(zhēng)性、互補(bǔ)性和消費(fèi)水平刻畫一個(gè)區(qū)域的商業(yè)特征。

        將一個(gè)區(qū)域的吸引力定義為同類型酒店的數(shù)量:

        [Attp=bi∈Fnum(bi,p)] (4)

        同一區(qū)域內(nèi)相同類型商鋪的數(shù)量反映了該區(qū)域內(nèi)的競(jìng)爭(zhēng)性[9?10]。同類商鋪越多,對(duì)客戶的吸引力越分散,會(huì)對(duì)商鋪選址造成負(fù)面因素。競(jìng)爭(zhēng)性關(guān)系可確定為:

        [Comp=Nt(p,r)N(p,r)] (5)

        式中:[N(p,r)]代表目標(biāo)地點(diǎn)附近所有商鋪的數(shù)量;[Nt(p,r)(t∈Γ)]代表類型為r的鄰近商鋪的數(shù)量。

        同一區(qū)域內(nèi)不同類型商鋪之間通過合作可以達(dá)到雙贏的效果。給定一個(gè)類型為t的商鋪,它與其他類型的商鋪之間的互補(bǔ)性關(guān)系為:

        [ρt→t′=Nset(t,t′)NT(NT-1)2] ? ?(6)

        式中:[T]代表所有設(shè)施類型的集合;[Nset(t,t′)]代表[t,t′]同時(shí)出現(xiàn)在同一區(qū)域的數(shù)量;[NT(NT-1)2]代表所有設(shè)施類型的組合數(shù)量。

        基于上述公式,可以算出一塊區(qū)域的互補(bǔ)性:

        [Cpp=t∈Tlogρt→t′·Nt′p,l-1np∈PNT′p,l] (7)

        式中:[NT′p,l]為地點(diǎn)P附近類型為[t′]的設(shè)施數(shù)量;n為總的區(qū)域設(shè)施數(shù)量。

        房?jī)r(jià)可以代表一個(gè)區(qū)域的消費(fèi)水平,反映該區(qū)域的商鋪需求程度。將地點(diǎn)P的消費(fèi)水平定義如下:

        [ConsumP=hi∈Hnumhi,Pw] (8)

        式中:H={h1,h2,…,hw}定義為地點(diǎn)P附近所有商品房房?jī)r(jià)的總和;w為該區(qū)域內(nèi)房?jī)r(jià)不為0的商品房總數(shù)。

        2.3 ?模型建立

        針對(duì)一個(gè)特定的企業(yè),有一組候選店鋪,本文將其位置P定義為[P={p1,p2,…,pj}]。如何建議最優(yōu)的前k位店鋪位置,使得新店可以吸引更多的客戶并帶來最大的盈利能力是關(guān)鍵。

        對(duì)于每個(gè)商店,本文以其劃定的矩形區(qū)域定義為其交易區(qū)域并評(píng)估其屬性,基于從地區(qū)Pi收集的數(shù)據(jù),可以計(jì)算得到各個(gè)特征定義為[F={f1,f2,…,fk}],根據(jù)選址模型進(jìn)而得到該地區(qū)的得分向量記為Gi。推薦最優(yōu)的前k位店鋪位置相當(dāng)于對(duì)候選地址的得分進(jìn)行排序。得分使用從攜程網(wǎng)上爬取的酒店評(píng)論數(shù)量,它可以從一定程度上反映出特定企業(yè)的客流量和經(jīng)濟(jì)效益。

        得分問題可以定義為給定特征向量[Fi={fi1,fi2,…,fik}],對(duì)應(yīng)每一組得分向量Gi,需要求出得分向量G與特征矩陣F之間的關(guān)系,從而根據(jù)新來的特征向量Ft來預(yù)測(cè)它的得分Gt。本文使用線性回歸模型、支持向量機(jī)模型、隨機(jī)森林模型,給定一個(gè)評(píng)分?jǐn)?shù)據(jù)集、特征數(shù)據(jù)集和選址區(qū)域塊號(hào)作為輸入,根據(jù)預(yù)先訓(xùn)練好的回歸模型,將測(cè)試集的特征放入該模型計(jì)算預(yù)測(cè)得分。

        2.3.1 ?線性回歸模型

        線性回歸模型為:

        [Y=β0+β1X1+β2X3+…+βmXm+e] ? ? ? (9)

        式中:因變量Y可以近似地表示為自變量[X1,X2,…,Xm]的線性函數(shù);[β0]為常數(shù)項(xiàng);[β1,β2,…,βm]為偏回歸系數(shù),表示在其他自變量保持不變時(shí),[Xi]增加或減少一個(gè)單位時(shí)Y的平均變化量;e是去除m個(gè)自變量對(duì)Y影響后的隨機(jī)誤差(殘差)。線性歸回模型的優(yōu)化目標(biāo)是使得所有訓(xùn)練樣本的預(yù)測(cè)誤差平方和達(dá)到最小。線性預(yù)測(cè)函數(shù)的參數(shù)即回歸系數(shù)可通過最小二乘法來求解。線性回歸模型求解步驟如圖1所示。

        2.3.2 ?支持向量機(jī)模型

        SVM(Support Vector Machine for Regression) [11?12]方法是20世紀(jì)90年代初Vapnik等人根據(jù)統(tǒng)計(jì)學(xué)習(xí)理論提出的一種新的機(jī)器學(xué)習(xí)方法。它以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為理論基礎(chǔ),通過適當(dāng)?shù)剡x擇函數(shù)子集及該子集中的判別函數(shù),使學(xué)習(xí)機(jī)器的實(shí)際風(fēng)險(xiǎn)達(dá)到最小,保證了通過有限訓(xùn)練樣本得到的小誤差分類器,對(duì)獨(dú)立測(cè)試集的測(cè)試誤差仍然較小。

        2.3.3 ?隨機(jī)森林模型

        Random Forests(RF)算法是基于決策樹的算法[13]。為了實(shí)現(xiàn)這一策略,需要構(gòu)建許多決策樹,每棵樹都要做一個(gè)有效地預(yù)測(cè)目標(biāo)的工作,使它與其余的樹有所不同。為了確保每棵樹不同,降低關(guān)聯(lián)性,RF采用兩個(gè)隨機(jī)采樣過程:一是在訓(xùn)練每棵樹時(shí),對(duì)訓(xùn)練集進(jìn)行n次有放回地隨機(jī)采樣,使得每棵樹的訓(xùn)練集不同;二是從樣本的P個(gè)特征中隨機(jī)采樣p個(gè)特征(p[?]P)作為每棵樹的訓(xùn)練集的樣本特征。

        3 ?實(shí) ?驗(yàn)

        3.1 ?實(shí)驗(yàn)數(shù)據(jù)

        實(shí)驗(yàn)輸入特征集使用提取出來的商業(yè)特征和地理特征兩類特征,這些數(shù)據(jù)均經(jīng)過max?min標(biāo)準(zhǔn)化處理。實(shí)驗(yàn)的目標(biāo)是使用上述的模型(SVR,LR,F(xiàn)R)建立輸入特征與目標(biāo)變量之間的函數(shù)關(guān)系。通過預(yù)處理階段的數(shù)據(jù)清洗工作,刪去了POI數(shù)據(jù)中酒店數(shù)目為0的塊,最后得到了北京地區(qū)區(qū)域總共有364塊。實(shí)驗(yàn)數(shù)據(jù)如表3所示。

        以處理好的0.5 km×0.5 km的正方形區(qū)域作為處理單位。在實(shí)驗(yàn)環(huán)節(jié),選取所有同類型連鎖酒店(如家、七天、漢庭)的塊作為實(shí)驗(yàn)樣例,隨機(jī)提取其中90%的數(shù)據(jù)集作為訓(xùn)練集進(jìn)行訓(xùn)練,剩下的10%為測(cè)試集進(jìn)行測(cè)試。然后用訓(xùn)練好的模型預(yù)測(cè)測(cè)試集上塊的評(píng)分,并對(duì)預(yù)測(cè)出來的結(jié)果進(jìn)行排序,與原用的順序進(jìn)行比較,計(jì)算NDCG@10。為了保證實(shí)驗(yàn)結(jié)果的科學(xué)性,重復(fù)1 000次上述方法。

        針對(duì)每個(gè)問題,首先采用不同的模型進(jìn)行實(shí)驗(yàn),找到實(shí)驗(yàn)結(jié)果最好的模型,然后用該方法去評(píng)價(jià)多種不同的基準(zhǔn)數(shù)據(jù)。實(shí)驗(yàn)結(jié)果顯示,多源城市數(shù)據(jù)融合能夠很好地預(yù)測(cè)連鎖店選址,并且所提取出的相關(guān)特征可以有效地說明商鋪選址的相關(guān)考慮因素。

        3.2 ?實(shí)驗(yàn)結(jié)果

        3.2.1 ?基礎(chǔ)方法

        本文使用NDCG作為評(píng)價(jià)指標(biāo),得到的實(shí)驗(yàn)結(jié)果如圖2所示??梢钥闯?,5種方法中,鄰接塊推薦效果最差,這是由于在刪除評(píng)分?jǐn)?shù)量為0的區(qū)域后,數(shù)據(jù)量整體比較少,很多塊的預(yù)測(cè)塊沒有對(duì)應(yīng)的鄰接塊,或者是鄰接塊的數(shù)目較少,導(dǎo)致計(jì)算出來的結(jié)果非常差。使用相似特征進(jìn)行推薦的方法NDCG平均可以達(dá)到0.7左右,說明這種方法具有一定的可行性,也反映出提取出的特征與連鎖店選址之間有很大關(guān)系。

        采用不同特征放入線性回歸模型中訓(xùn)練得到的NDCG普遍高于基于相似塊的方法。其中,漢庭的推薦質(zhì)量非常高,NDCG可以達(dá)到0.9以上,這是因?yàn)楦鶕?jù)特征與評(píng)分值的相關(guān)性分析可以看出,漢庭的評(píng)分值與本文提取的特征有較高的相關(guān)性,而且大部分特征與評(píng)分之間相關(guān)性非常明顯。在進(jìn)行線性回歸時(shí),這部分特征的權(quán)重占比較高,而如家與七天的特征與評(píng)分之間相關(guān)性相對(duì)較低,然而相關(guān)性之間的差距不大,因此也呈現(xiàn)出較高的推薦質(zhì)量。漢庭使用多個(gè)特征的NDCG值明顯高于單一特征,而七天使用多個(gè)特征進(jìn)行選址評(píng)估的NDCG相對(duì)于單一特征呈現(xiàn)略微下降的趨勢(shì)。這是因?yàn)槿哂嗵卣鲗?duì)評(píng)分造成了負(fù)面影響,商業(yè)特征中的人流量和吸引力幾乎與評(píng)分?jǐn)?shù)據(jù)不相關(guān),而這部分?jǐn)?shù)據(jù)也參與到訓(xùn)練過程中。

        3.2.2 ?模型比較

        針對(duì)如家、漢庭、七天等酒店,使用商業(yè)特征和地理特征對(duì)其建模,建模方法選取LR,SVR以及RF。在三家酒店中,漢庭的NDCG值最高,這是由于漢庭的評(píng)分值與本文提取的特征有較高的相關(guān)性,而且大部分特征與評(píng)分之間相關(guān)性非常明顯。而七天因?yàn)樘卣髋c評(píng)分之間相關(guān)性不強(qiáng),而且有兩類吸引力和人流量特征幾乎與評(píng)分不相關(guān),因此推薦質(zhì)量較差。不同模型的比較如圖3所示,在三種模型中,RF模型的推薦質(zhì)量最高,這是因?yàn)镽F相對(duì)于其他兩種模型,它能夠處理很高維度的數(shù)據(jù),并且不用做特征選擇,對(duì)于不平衡的數(shù)據(jù)集來說,它可以平衡誤差。LR方法表現(xiàn)出較強(qiáng)的穩(wěn)定性,這是因?yàn)榛貧w分析可以準(zhǔn)確地計(jì)量各個(gè)因素之間的相關(guān)程度與回歸擬合程度的高低,不相關(guān)或相關(guān)性不高的特征對(duì)于評(píng)分影響較小。

        4 ?結(jié) ?論

        本文提出一種多源城市數(shù)據(jù)解決連鎖商店的選址系統(tǒng)。利用LBS進(jìn)行地理信息和POI采集,使用社交媒體收集簽到數(shù)據(jù)和酒店的詳情,使用各類特征以及所有特征建模,采用連鎖企業(yè)的評(píng)分?jǐn)?shù)量作為評(píng)分值進(jìn)行監(jiān)督回歸,研究特征和商鋪選址之間的關(guān)系。使用線性回歸模型、支持矢量機(jī)模型和隨機(jī)森林模型,經(jīng)過一系列實(shí)驗(yàn)與分析,可以得出以下結(jié)論:監(jiān)督回歸方法可以高質(zhì)量地解決連鎖店選址問題;在LR,SVR,F(xiàn)R三種機(jī)器學(xué)習(xí)方法中,F(xiàn)R方法的推薦質(zhì)量最好;影響不同企業(yè)選址推薦的特征不盡相同,利用多源城市數(shù)據(jù)與單一數(shù)據(jù)源相比,具有較高的穩(wěn)定性和推薦質(zhì)量。

        參考文獻(xiàn)

        [1] 屈弘揚(yáng),於志文,田苗,等.基于 LBSN 的商業(yè)選址推薦系統(tǒng)的研究與實(shí)現(xiàn)[J].計(jì)算機(jī)科學(xué),2015,42(9):33?36.

        QU Hongyang, YU Zhiwen, TIAN Miao. Research and implementation of business location recommendation system based on LBSN [J]. Computer Science, 2015, 42(9): 33?36.

        [2] 張義,陳虞君,杜博文,等.智慧城市多模式數(shù)據(jù)融合模型[J]. 北京航空航天大學(xué)學(xué)報(bào),2016,42(12):2683?2690.

        ZHANG Yi, CHEN Yujun, DU Bowen. Intelligent city multi?mode data fusion model [J]. Journal of Beijing University of Aeronautics and Astronautics, 2016, 42(12): 2683?2690.

        [3] KARAMSHUK D, NOULAS A, SCELLATO S, et al. Geo?spotting: mining online location?based services for optimal retail store placement [C]// Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. [S.l.]: ACM, 2013: 793?801.

        [4] LI Y, ZHENG Y, JI S, et al. Location selection for ambulance stations: a data?driven approach [C]// Proceedings of the 23rd SIGSPATIAL International Conference on Advances in Geographic Information Systems. [S.l.]: ACM, 2015: 85?91.

        [5] FU Y, GE Y, ZHENG Y, et al. Sparse real estate ranking with online user reviews and offline moving behaviors [C]// Proceedings of 2014 IEEE International Conference on Data Mining (ICDM). [S.l.]: IEEE, 2014: 120?129.

        [6] JENSEN P. Network?based predictions of retail store commercial categories and optimal locations [J]. Physical review E, 2006, 74(3): 035101.

        [7] LI J, GUO B, WANG Z, et al. Where to place the next outlet? harnessing cross?space urban data for multi?scale chain store recommendation [C]// Proceedings of the 2016 ACM International Joint Conference on Pervasive and Ubiquitous Computing: Adjunct. [S.l.]: ACM, 2016: 149?152.

        [8] WANG Y, WANG L, LI Y, et al. A theoretical analysis of NDCG ranking measures [C]// Proceedings of the 26th Annual Conference on Learning Theory (COLT 2013). 2013: 8?13.

        [9] SU?REZ?VEGA R, SANTOS?PE?ATE D R, DORTA?GONZ?LEZ P. Location models and GIS tools for retail site location [J]. Applied geography, 2012, 35(1/2): 12?22.

        [10] SU?REZ?VEGA R, SANTOS?PE?ATE D R, DORTA?GONZ?LEZ P, et al. A multi?criteria GIS based procedure to solve a network competitive location problem [J]. Applied geography, 2011, 31(1): 282?291.

        [11] 瓦普尼克.統(tǒng)計(jì)學(xué)習(xí)理論的本質(zhì)[M].北京:清華大學(xué)出版社,2000.

        VAPNIK V N. The essence of Statistical Learning Theory [M]. Beijing: Tsinghua University Press, 2000.

        [12] 張學(xué)工.關(guān)于統(tǒng)計(jì)學(xué)習(xí)理論與向量機(jī)[J].自動(dòng)化學(xué)報(bào),2000, 26(1):32?42.

        ZHANG Xuegong. On statistical learning theory and vector machine [J]. Journal of automation, 2000, 26(1): 32?42.

        [13] 方匡南,吳見彬,朱建平,等.隨機(jī)森林方法研究綜述[J]. 統(tǒng)計(jì)與信息論壇,2011,26(3):32?38.

        FANG Kuangnan, WU Jianbin, ZHU Jianping, et al. Review of research on stochastic forest methods [J]. Statistics and information forum, 2011, 26(3): 32?38.

        猜你喜歡
        商業(yè)智能推薦系統(tǒng)隨機(jī)森林
        什么是商業(yè)智能?它的定義和解決方案
        隨機(jī)森林在棉蚜蟲害等級(jí)預(yù)測(cè)中的應(yīng)用
        基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
        軟件(2016年7期)2017-02-07 15:54:01
        基于用戶偏好的信任網(wǎng)絡(luò)隨機(jī)游走推薦模型
        關(guān)于實(shí)時(shí)商業(yè)智能的文獻(xiàn)綜述
        拱壩變形監(jiān)測(cè)預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
        基于個(gè)性化的協(xié)同過濾圖書推薦算法研究
        個(gè)性化推薦系統(tǒng)關(guān)鍵算法探討
        淺談Mahout在個(gè)性化推薦系統(tǒng)中的應(yīng)用
        基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
        国产乱子伦精品免费无码专区 | 日韩一区二区三区熟女| 亚洲熟女精品中文字幕| 久久综合国产乱子伦精品免费| 在线视频你懂的国产福利| 国产福利一区二区三区视频在线看| 亚洲av乱码一区二区三区人人| 高潮抽搐潮喷毛片在线播放| 亚洲国产精品特色大片观看完整版| 亚洲三级在线播放| 亚洲女同性恋第二区av| 狠狠摸狠狠澡| 97精品人妻一区二区三区香蕉| 无码一区久久久久久久绯色AV| 亚洲中文字幕一区高清在线| 欧美激情视频一区二区三区免费 | 中文字幕被公侵犯的丰满人妻| 91在线视频在线视频| a级毛片免费观看在线| 亚洲AV无码一区二区三区ba| 日本大片在线一区二区三区| 人妻少妇中文字幕在线| 日本爽快片18禁免费看| 中文AV怡红院| 日本av一级视频在线观看| 亚洲欧洲成人精品香蕉网| 国产欧美精品区一区二区三区| 亚洲AV日韩AV高潮喷潮无码| 日本成人午夜一区二区三区| 亚洲妇女自偷自偷图片| 国产高级黄区18勿进一区二区| 亚洲视频精品一区二区三区| 文字幕精品一区二区三区老狼 | 毛片免费全部无码播放| 亚洲av伊人久久综合性色| 国产亚洲av成人噜噜噜他| 337p西西人体大胆瓣开下部| 国产精品欧美久久久久老妞| 亚洲二区精品婷婷久久精品| 国产精品毛片va一区二区三区 | 日韩中文字幕无码av|