亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于組合模型的農業(yè)信息情景感知推薦系統研究

        2017-11-15 11:13:20李慧閆琰
        江蘇農業(yè)科學 2017年17期

        李慧+閆琰

        摘要:在大數據環(huán)境下,農戶在互聯網中獲取指導農業(yè)生產的信息更加困難,隨著“一帶一路”國家發(fā)展戰(zhàn)略的全面展開,廣大農民對農業(yè)信息服務的需求有增無減。針對傳統推薦系統不能反映用戶興趣遷移、推薦精度不高等問題,提出來基于組合模型的農業(yè)信息推薦系統,提高農業(yè)信息推薦的自適應性和準確性。系統結合云計算技術提出一種基于Hadoop+Nutch的全網農業(yè)信息數據倉庫構建方法,通過納入時間權重、情景變更和興趣遷移的優(yōu)化向量空間模型構建了自適應性的用戶興趣模型,以及借助組合神經網絡提高推薦精度提出了組合推薦算法。最后通過評價召回率、準確率等指標表明,基于組合模型的推薦系統可大幅提高推薦準確性和魯棒性。

        關鍵詞:農業(yè)信息大數據;推薦系統;自適應興趣模型;組合推薦算法

        中圖分類號: C931.6;S126文獻標志碼: A文章編號:1002-1302(2017)17-0209-06

        通信作者:閆琰,博士,主要從事農業(yè)經濟理論與政策研究。E-mail:yanyannewgirl@163.com。隨著全球農業(yè)市場化、國際化進程加快,農業(yè)信息市場流通環(huán)節(jié)增多、信息海量且分散凌亂,農業(yè)信息更多以非結構化數據的形式出現。海量的農業(yè)信息呈現出大數據的特征:數據量大(volume)、處理速度快(velocity)、數據類型多(variety)、價值大(value)、精確性高(veracity)[1]。目前,我國已建成的農業(yè)類網站超過4萬個,2015年中央一號文件更是強調要“支持電商、物流、商貿、金融等企業(yè)參與涉農電子商務平臺建設”。然而我國當前農業(yè)信息服務開展的困境是農戶很難在農業(yè)信息大數據中獲取需要的信息。因此,亟需可以對農業(yè)大數據進行整合分類后根據農戶興趣進行推薦的信息服務體系,以解決農民信息技術能力有限和大數據之間的矛盾。但是我國農村地域廣闊、農業(yè)信息時效性敏感、農業(yè)信息分類繁雜,農戶興趣隨著時間和情景的改變也會遷移,因此傳統的推薦系統已經不能滿足農戶對海量農業(yè)信息的特殊需求。本研究針對上述問題,首先通過云計算技術構建了基于Hadoop+Nutch的全網農業(yè)信息整合和分類數據倉庫[2],充分考慮時間權重、情景變更和興趣遷移等因素后,優(yōu)化向量空間模型,構建了自適應性的用戶興趣模型,最后提出了1種借助組合神經網絡提高推薦精度的組合推薦算法,并通過召回率和準確率評價了系統推薦性能。

        1基于組合模型的農業(yè)信息情景感知推薦系統設計

        基于組合模型的農業(yè)信息推薦系統由4個子系統構成:全網農業(yè)信息整合和分類子系統、情景自適應實時用戶興趣模型、組合神經網絡推薦優(yōu)化子系統以及推薦內容可視化子系統。首先,系統通過全網農業(yè)信息整合和分類子系統獲取全網農業(yè)信息并對海量的數據進行整合和分類,通過特征提取技術建立特征索引,然后通過自適應用戶興趣模型子系統對用戶的興趣進行建模,再通過組合神經網絡推薦優(yōu)化子系統將用戶感興趣的內容進行個性化推薦,同時根據用戶反饋訓練神經網絡以提高系統推薦的準確性,最后將推薦的內容在推薦內容可視化子系統友好地展示給用戶。本系統的優(yōu)點在于不僅能為目標農戶提供檢索信息的功能,同時可以將與其檢索內容相關的內容一并推送給目標農戶。農戶提交請求后,系統將輸入轉化成特征向量,通過特征的權重連接輸出和輸入。系統通過組合推薦算法將最終輸出計算值大于預設閾值的頁面推送給目標農戶。系統技術路線見圖1。

        1.1全網農業(yè)信息整合和分類子系統

        全網農業(yè)信息整合和分類子系統的主要作用是為整個體系提供信息源,通過整合和分類為推薦服務奠定基礎。面對數量龐大,數據結構多元化的全網農業(yè)信息,全網農業(yè)信息整合和分類子系統采用分布式搜索引擎Nutch完成對繁雜信息的聚合,依托云計算平臺Hadoop完成對海量數據的存儲與處理[3]。

        1.1.1分布式農業(yè)信息獲取對農業(yè)大數據進行聚合檢索采用分布式搜索引擎的開源搜索引擎Nutch的優(yōu)點是利用其開源性,可查看并改進其源代碼,有利于在此基礎上進行系統二次開發(fā)和整合。具體的實現過程如下:首先,對當前有代表性的農業(yè)權威網站(如收購商類、政府官方農業(yè)信息類網站以及農業(yè)技術類網站等)進行歸納整理,生成1個源URL文件作為開啟搜索任務的種子。然后,將Nutch搜索引擎分布式地部署到Hadoop云計算架構中,啟動各個節(jié)點虛擬機的Nutch進程開啟分布式農業(yè)信息抓取任務。同時,對獲取的農業(yè)信息進行結構化分析,分類獲取HTML源里的有用信息。最后根據各個頁面按照主題和關鍵詞聚類,創(chuàng)建時空邏輯關聯,通過HDFS分布式存儲建立農業(yè)信息分類數據倉庫。

        1.1.2農業(yè)歸檔信息預處理與特征提取對數據倉庫中的農業(yè)信息網頁需要進行預處理和特征提取,以構建結構化數據。該部分主要工作有過濾重復鏈接、HTML解析、中文分

        詞+過濾停用詞+詞性標注、基于Text Rank算法構建關鍵詞圖、通過轉移概率矩陣確定詞權、按照詞權排序并生成關鍵詞序列。

        1.1.2.1過濾掉重復鏈接該步驟的目的是為了清除抓取頁面的外鏈和鏡像,其作用是確保每個網頁源只有一個,將重復的連接刪除以減少系統資源的消耗。

        1.1.2.2HTML解析為了獲取抓取網頁鏈接地址、title、content等網頁詳細信息,系統采用HTML解析模塊來實現上述功能,為對文本特征提取準備源數據,在系統中具體是通過改寫并調用HTMLparser類來實現HTML內容解析工作。

        1.1.2.3中文分詞通過對比各個中文分詞軟件的特點后,本系統采用中國科學院開發(fā)的ICTCLAS中文分詞系統,該系統是基于隱馬爾科夫模型算法開發(fā)而來,具有很強的中文識別區(qū)分能力。在分詞的同時,需要過濾停用詞和詞性標注。將HTML轉化為文本(記為txt)之后,將文本txt作為輸入,按照標點將txt劃分為不同的語句Seni,即txt={Sen1,Sen2,…,Senn},最后對每一個語句Seni,進行中文分詞+過濾停用詞+詞性標注得到詞語Wodi,j集合,即Seni={Wodi,1,Wodi,2,…,Wodi,m}。endprint

        1.1.2.4基于Text Rank算法[4]構建關鍵詞圖將Seni={Wodi,1,Wodi,2,…,Wodi,m}作為候選關鍵詞集,并建立候選關鍵詞圖G=(V,E),V是由Wodi,j組成的節(jié)點集合,EV×V,通過共現關系構造兩點之間的邊。給定權重指數wij代表 G=(V,E)中的結點vi指向結點vj的權重。vi∈V,用IS(vi)表示所有指向點vi的點集,用OS(vi)代表所有vi所指向的點集??赏ㄟ^如下公式計算vi的分值S(vi)[5]:

        S(vi)=(1-d)+d×∑vi∈IS(vi)wji∑vk∈OS(vk)wjkS(vj)。

        式中:d為[0,1]之間的阻尼系數(常取0.85),表示從G特定點v指向其他任意點的概率。

        關鍵詞圖中用點與點之間的線段長度代表轉移概率,用結點v到指向的結點vi的實線代表它們之間的轉移概率,用結點vi指向結點v的虛線代表vi跳轉至v的轉移概率。點與點之間轉移概率可以通過權重衡量,而權重與指向詞語v的詞語數量和其頻度有關。用wtc(vi,vj)代表vi的覆蓋影響力轉移到vj的權重,wtf(vi,vj)代表vi的頻度影響力轉移到vj的權重。令|V|=n,則所有詞的初始分值為S0={1n,1n,…,1n}。

        詞語之間的影響力轉移矩陣WT為

        WT=w11w12…w1n

        w21w22…w21

        wn1wn2…wnn。

        式中:權重wij代表第j個詞語的影響力轉移到第i個詞語的權重,其計算方式為

        wji=c×wtc(vi,vj)+f×wtf(vi,vj)。

        式中:c代表覆蓋影響力占整體影響力比重的權重,f表示頻度影響力占整體影響力的權重,c+f=1。

        再經過迭代公式迭代至收斂時可得到所有詞語的分數,其中迭代公式為

        Si=d×WT×Si-1+(1-d)×S0。

        得到第i個網頁的特征向量:Pi=(Wodi,1,Resi,1>,,…,)。其中Resij表示詞語Wodi,j的最后得分。最后根據候選關鍵詞得分進行降序排列,選取Top-N個詞語作為該網頁的特征向量。

        1.2情景自適應實時用戶興趣模型子系統

        1.2.1向量空間模型本研究采用向量空間模型(vector space model,VSM)來表征用戶興趣,將用戶的特征項通過向量的方式來表征,其表征方式為Uvsm={(t1,w1),(t2,w2),…,(tn,wn)},其中ti為其中的一個特征項,wi為該特征項的賦值權重。通過比較2個用戶特征向量可定量地衡量其相似度,通常較為簡易高效的向量相似度量化方式是計算向量余弦夾角[6],即:

        SM(Ui,Uj)=∑nk=1(Wk,Ui×Wk,Uj)∑nk=1w2k,Ui×∑nk=1w2k,Uj。

        式中:wk,Ui代表特征項tk占的權重。權重的確定可通過 TF-IDF[7] 方式獲取也可以根據Text Rank算法獲取。

        1.2.2用戶興趣模型用戶的興趣可從3個層面獲取,分別是農戶主動提供的興趣關鍵詞信息(自定義標簽興趣)、農戶網頁瀏覽行為(瀏覽行為興趣)以及當無法獲取任何用戶興趣信息時人工給定的興趣。其中農戶主動提供的關鍵詞可用于全網農業(yè)信息數據倉庫獲取階段,增強搜索的目的性與準確性。

        用戶的瀏覽行為表現為點擊特定網頁的頻率、停留時間和特殊動作(如打印、保存等),通過挖掘瀏覽器端的瀏覽日志可以獲取用戶的瀏覽行為從而得出用戶興趣。用IT(p)表示用戶對網頁p的興趣程度,來量化用戶的瀏覽行為。其中,Save(p)為保存網頁p,Print(p)為打印網頁p,Click(p)為點擊網頁p,Stay(p)表示在網頁p的停留時間。

        功能函數F表示各個行為對瀏覽量化產生的影響,具體的:

        IT(p)=w1[Save(p)or Print(p)]+w2Click(p)maxa∈K{Click(a)}+w3Stay(p)/Size(p)maxa∈K{Stay(a)/Size(a)}。

        式中:w1為衡量保存和打印行為的權重,只要用戶發(fā)送打印或者保存行為則Save(p)or Print(p)=1,否則為0;w2為衡量用戶點擊行為的權重,用戶點擊行為表示為點擊網頁p的頻率占用戶點擊最多的網頁次數之比;w3為衡量用戶瀏覽時間的權重,用戶瀏覽網頁p的時間與網頁p大小之也存在一定關系。其中,3個權重通過熵值法來確定:首先,將用戶的每條瀏覽記錄中的3種行為(編號0,1,2)的次數表征成1個n×3 的矩陣R=(rijn×3),rij表示第i條件記錄中發(fā)生j種行為的次數。然后,通過rij′=max(rij-rij)maxi(rij)-mini(rij)對所有數值進行標準化。接著,通過Hj=-1ln3∑irij′∑irij′ln(rij′∑irij′),j=1,2,3且rij′∑irij′=0時令rij′∑irij′ln(rij′∑irij′)=0,來計算各個行為的熵值。最后,通過wj=1-Hj3-∑iHj,j=1,2,3來確定各個權重。

        人工給定興趣時,通過本系統默認提供的主題信息有收購商信息(包括超市、農批市場、加工商等)、政策指導與行情預測信息、良種信息、種植信息等。為保證統計結果的客觀性,采用調研大量農戶的選擇習慣,通過共現原則,挑選出一批有代表性的網頁,通過農業(yè)歸檔信息預處理與特征提取的方式進行特征提取,作為默認的用戶興趣模型。

        1.2.3實時情景自適應用戶興趣模型用戶的興趣模型與用戶所處的情景息息相關,通常影響用戶興趣遷移的情景有時間情景(如不同月份、季節(jié)與節(jié)氣)、地理情景(所處的不同行政區(qū)劃和省份)以及作物分類情景(如不同的作物品種)。時間情景可通過瀏覽日志的時間來確定,地理情景和作物分類情景可通過用戶的輸入確定(通過移動端的定位功能可獲得準確地理情景)[8]。

        綜合以上3種情景,對現有的用戶興趣模型進行優(yōu)化。(1)時間優(yōu)化。隨著時間的推移,用戶對特定項目的興趣度會有衰退,因此,本研究將時間權重與遺忘因子引入用戶興趣中,將用戶興趣模型更新為IT(p)′=θ-log2h(Dp)θ-log2h(Ds)×IT(p)。其中Dp為用戶瀏覽網頁p的時間跨度,Ds為用戶使用推薦系統的時間跨度,K=e-log2h(t-T)為遺忘因子[9],h為遺忘半衰期(一般取7 d)。通過有用戶的瀏覽記錄,利用進行時間優(yōu)化的IT(p)對用戶瀏覽歷史進行排序,從中選取Top-m個網頁,并進行分詞和特征提取,通過wbj=∑mk=1IT(k)′SM(j,k)來衡量用戶對頁面k的基于瀏覽習慣的興趣度。(2)情景優(yōu)化。用戶的興趣與用戶所處的情景緊密相關,農戶的興趣也隨著不同的情景(如時間情景、地點情景、作物分類情景)而發(fā)生變化。用戶的興趣模型都應與同期特定的情景信息一起存檔,構建情景-興趣數據庫。在向用戶推薦新的項目時先通過情景識別將當前情景與歷史情景-興趣數據進行對比,計算情景相似度并納入興趣相似度計算中。每個情景可通過Context(T)=(Cit,C2t,…,Cnt)來表示,其中Cit表示t時期的特定情景屬性,歷史存檔的情景信息可表示為Context{H}=(Context(T1),Context(T2),…,Context(TN))。情景的相似度可同過如下公式計算:Similarity(Context(T),Context{H})=Count(Cit)+Count(C2t)+…+Count(Cnt)nN來計算,其中Count(Cit)為第i個情景屬性在歷史數據庫中出現的次數。情景模式中各個情景項的權重計算方式為

        wcj=Similarity(Context(T),Context{H})×mM。

        式中:m為情景項出現的次數。本研究將時間情景屬性分為T1、T2、T3、T4 4種,地理情景分為L1、L2、L3、L4、L5 5種,作物分類情景分為B1、B2、…、B12這12種,因此在推薦時將農戶的情景表示為21維的向量C。

        綜上所述,農戶情景自適應實時用戶興趣度模型可表示為wTj=αwzj+βwbj+γwcj。其中,wzj為用戶自定義的特征值權重,wbj為瀏覽行為的特征值權重,wcj為情景特征值權重,α、β、γ為權重系數,且權重系數滿足α+β+γ=1,經過多次方針試驗可得到合理的權重系數值。

        1.3組合神經網絡推薦優(yōu)化子系統

        組合神經網絡推薦優(yōu)化子系統分為2個階段進行,第1個階段是通過樸素推薦方法向用戶推薦信息,第2個階段是通過組合神經網絡結合用戶的反饋進行推薦算法的訓練,以期得到更好的推薦結果。

        1.3.1樸素推薦階段采集農戶的情境信息,利用wzj=SM(j,V),其中j為候選推薦頁面,V為用戶對自定義的興趣標簽賦的權重向量,進行頁面的初始推薦,當農戶的有一定的瀏覽記錄時,利用IT(p)′計算已瀏覽網頁的興趣度并排序,選取Top-m個頁面,結合情境信息,通過wTj計算候選推薦頁面的興趣度,將所有候選推薦頁面排序,選取Top-N個網頁推薦給農戶。算法見表1。

        1.3.2組合神經網絡推薦優(yōu)化階段在經過樸素推薦之后,利用用戶的反饋信息訓練組合神經網絡,組合推薦網絡由BP[10]算法以及SOM[11]算法組成,訓練樣本是用戶對推薦結果的反饋和評價。對于有反饋的任一頁面p,通過分詞和特表1樸素推薦算法

        輸入:目標農戶u,農戶的情境數據和自定義標簽數據,農戶u訪問過的農業(yè)信息資源集合Su。輸出:目標農戶u的Top-N篇推薦文檔集合。(1)采集農戶情境信息,形成向量U,采集農戶瀏覽資源集合Su。如果集合Su非空集,轉入(3)。(2)利用wbj計算農戶情境與待推薦網頁的相似度,得到初始推薦,轉入(6)。(3)利用Web客戶端日志挖掘和服務器端日志挖掘,獲取批量客戶的瀏覽行為,并進行標準化處理,借助熵權法,得到目標農戶u的行為權值。(4)讀取目標農戶u訪問的每個資源i∈Su的行為數據,利用IT(p)′得到基于行為的最近鄰居集合C。(5)標準化處理集合C中每一篇文檔的興趣度值,代入wTj計算得出待推薦網頁與農戶情境和瀏覽行為相匹配的相似度。(6)將排序靠前的N篇文檔推薦給農戶。

        征提取可獲得其特征向量t(p)及其用戶的評分s(p)。頁面的特征向量和用戶反饋的評分構成了樣本Sample(p)=[t(i),s(i)],通過全部樣本可構建一個可供訓練和測試的樣本集。BP神經網絡的輸入因子應為產品的特征向量,輸出因子為用戶對產品的偏好(評分)。對于待推薦產品,在提取其產品特征后,將產品特征向量作為輸入。首先將頁面特征向量作為BP神經網絡輸入,用戶反饋的信息作為BP神經輸出,通過前4個預測第5個頁面的推薦結果,依次執(zhí)行,直至所有項目都有預測值,并將BP神經網絡的預測值作為SOM網絡的輸出對SOM網絡繼續(xù)訓練,以期獲得高準確性的組合神經網絡推薦算法。算法的實現如圖2所示。

        第1部分的BP神經網絡由3個層次構成,即輸入層、中間層和輸出層,輸入層用來Input頁面的特征數據,中間層為農戶對這些產品特征的喜好程度數據,輸出層輸出評分值。因此BP神經網絡結構構建如下:第1層為Input層,輸入變量是網頁頁面的特征向量,輸入層神經元數量應該與網頁頁面的特征向量維數一致;第3層為Output層,是為用戶對該網頁的評分,設定神經元個數為1;隱含層每個節(jié)點被用來代表農戶對某個特征值的喜好程度,設置隱含層神經元數量與網頁頁面特征向量維數一致。

        在BP神經網絡中,第k層中的第j個節(jié)點的總輸入為Ikj則有Ikj=∑i Wjik,k-1Ojk-1;Okj=f(Ikj);

        引入層與層之間的誤差Ekj,權值的調整為

        Δwki=-ηEwki;δki=EI=EOf′(Ikj)。endprint

        所以對于輸出層單元有ΔWmjk+1,k=-ηδmk+1Ojk和δmk+1=(Ojk+1-dm)f′(Ikj),對于中間層單元有ΔWmjk+1,k=-ηδmkOjk-1;δki=EI=EOf′(Ikj)。

        本研究中的輸出函數為f(x)=1/(1+e-x),于是有f′(Imk+1)=Omk+1(1-Omk+1);f′(Imk+1)=Ojk(1-Ojk)。

        為了使結果更加精確,須要在權重調整中加入一個動量因子α,則有ΔW(t+1)=-η-ηδmkOjk-1+αΔW(t)。

        α取值一般在0.7~1.0。通過基于經驗來訓練BP神經網絡網絡就可使之擁有映射INPUT AND OUTPUT的能力[11]。

        第2部分的實現是通過SOM算法來實現,SOM算法結構是由全互連方式連接輸入層和輸出層組成,SOM算法的特點是通過權值連接所有INPUT節(jié)點到所有OUTPUT節(jié)點。假如INPUT樣本為X=[X1,X2,…,Xn]T,OUTPUT神經元i與INPUT神經元連接的權值為Wij=[Wi1,Wi2,…,Win]T,則神經元i的OUTPUT為Oi=∑nj=1 WijXj=WTiX。SOM算法規(guī)定:Ok=max(Oi)。則權值表達式化為

        Wij(t+1)=Wij(t)+η(xi-xb)Oi(t)。

        式中:xi為輸出節(jié)點的輸入向量,xb為輸出節(jié)點的閾值向量,O為輸入節(jié)點的輸出向量,η為學習系數,且0<η<1,(t)=η(0)(1-t/T),t表示當前迭代的次數,T為整個迭代的次數。

        組合神經網絡在線訓練的算法見表2。

        2試驗結果及分析

        2.1云環(huán)境試驗環(huán)境的構建

        在構建云計算試驗環(huán)境時采用Hadoop 0.2版本,由于Hadoop在運行時需要JDK支持,因此選用jdk1.6.0_24。

        2.2試驗數據及設計

        首先,需要為系統的源信息的抓取提供種子站點,為了滿足種子站點選取的統計規(guī)律性,大量選取相關農業(yè)信息類網站,然后統一歸納總結,最終得到1份種子站點的列表。種子站點主要包括收購商類、農業(yè)信息政府官方網站類以及農業(yè)信息技術與種子信息類網站。然后,啟動虛擬機軟件并且啟動Nutch,以便實現抓取任務。然后輸入源信息抓取指令“bin/nutch crawl url.txt -dir crawtest -depth 3-threads 4>&crawl.log”,系統便開始了抓取過程。指令中,url.txt存放的是種子站點,同時還存儲在數據庫中,以便后續(xù)更新;depth 3表示爬行深度為3層;threads 4表示啟動4個線程同時抓取;crawl.log中記錄抓取日志信息,日志記錄系統運行狀態(tài)。

        然后,要構建測試文本庫。測試文本的選取規(guī)則與構建農戶興趣模型時的規(guī)則類似。相關部分還是以供應信息、需求信息、政策指導與行情預測、良種信息、種植技術等幾個主題為中心,不相關部分則是排除這些主題的其他主題,如財經、教育、體育及娛樂等等;兩部分各為100篇測試文本。同時選取50名農戶測試者,通過代理系統,自動獲取測試對象6個月的瀏覽行為和對評價的反饋。最后獲取了50名測試對象在這6個月的47 819條有效瀏覽記錄和2 300條反饋評價信息。將記錄分為訓練集和測試集,選取最后1月的數據作為測試集,前5個月的數據作為訓練集。利用分詞系統采用ICTCLAS,通過情景自適應實時用戶興趣模型子系統構建用戶興趣模型,通過樸素推薦向用戶推薦網頁,再通過組合神經網絡推薦算法根據用戶反饋提升推薦精度。

        2.3評價指標

        通過召回率和準確率來評價推薦的效果,參照表3通過

        2.4結果分析

        首先,根據用戶的瀏覽行為記通過熵值法確定了用戶瀏覽行為的3個權重系數,w1(保存和瀏覽行為的權重系數)為0.43,w2(點擊行為的權重系數)為0.22,w3(停留時間的權重系數)為0.35。然后通過改變Top-N中的N取值,以步長為5從10取值到30,同時改變權重因子α、β、γ,選取有代表性的5組來測試推薦系統,通過3個評價指標來驗證不同N和權重因子對推薦結果的影響。試驗結果如圖3所示。

        試驗證明,隨著N的增加,推薦精度和準確性都有所提高。通過使用基于自適應的情景感知用戶興趣模型,推薦在召回率和準確性上都有很大改善,同時隨著β、γ取值的增高,推薦召回率和準確性都有所提升,說明推薦結果受到用戶瀏覽行為和情景的影響。

        最后將2 300條用戶反饋評價記錄分成2個部分,前 2 000 個作為訓練樣本,后300個當作測試樣本。通過測試推薦結果召回率和準確率隨著神經網絡閾值變化的結果如表4所示。

        從表4可知,在實驗室小數據量的測試環(huán)境下,當閾值范圍在0.012附近時,查全率可以達到77.5%,查準率可以達到78.3%,達到了系統有效性的實用范圍。

        3結束語

        為了改變傳統的農戶信息獲取方式,滿足農戶對農業(yè)信息產銷信息的個性化需求,本研究提出了1種在云計算環(huán)境下基于Hadoop和Nutch技術,使用混合推薦算法設計并實現了針對農業(yè)信息產銷信息領域的個性化農業(yè)產銷信息推薦系統,并根據農戶個性化需求構建了農戶興趣模型,該系統能根據不同的農戶需求推薦個性化的信息,最后對農業(yè)信息個性化推薦系統進行了測試,分析系統的查全率與查準率指標,以及利用云計算將會給推薦系統性能帶來的影響。未來工作包括進一步設計和完善云環(huán)境下個性化農業(yè)信息產銷信息推薦系統,研究與應用相關的數據獲取與預處理技術,以及結合云

        參考文獻:

        [1]孟小峰,慈祥. 大數據管理:概念、技術與挑戰(zhàn)[J]. 計算機研究與發(fā)展,2013,50(1):146-169.

        [2]謝桂蘭,羅省賢. 基于Hadoop MapReduce模型的應用研究[J]. 微型機與應用,2010,29(8):4-7.endprint

        [3]邵秀麗,劉彬,張濤. 基于Nutch的垂直搜索引擎的設計和實現[J]. 計算機工程與設計,2011,32(2):539-542,548.

        [4]Mihalcea R,Tarau P. TextRank: bring order into texts[J]. IEEE Trans on Knowledge and Data Engineering,2007,19(3):355-369.

        [5]夏天. 詞語位置加權TextRank的關鍵詞抽取研究[J]. 現代圖書情報技術,2013,29(9):30-34.

        [6]趙華茗. 分布式環(huán)境下的文檔相似度研究與實現[J]. 現代圖書情報技術,2011,27(增刊1):14-20.

        [7]路永和,李焰鋒. 改進TF-IDF算法的文本特征項權值計算方法[J]. 圖書情報工作,2013,57(3):90-95.

        [8]Lee S K,Cho Y H,Kim S H. Collaborative filtering with ordinal scale-based implicit ratings for mobile music recommendations[J]. Information Sciences,2010,180(11):2142-2155.

        [9]于洪,李轉運. 基于遺忘曲線的協同過濾推薦算法[J]. 南京大學學報(自然科學版),2010,46(5):520-527.

        [10]張月琴,劉翔,孫先洋. 一種改進的BP神經網絡算法與應用[J]. 計算機技術與發(fā)展,2012,22(8):163-166.

        [11]楊黎剛,蘇宏業(yè),張英,等. 基于SOM聚類的數據挖掘方法及其應用研究[J]. 計算機工程與科學,2007,29(8):133-136.

        [12]張巖,郭松,趙國海. 基于Hadoop的云計算試驗平臺搭建研究[J]. 沈陽師范大學學報(自然科學版),2013,31(1):85-89.

        [13]Egghe L. The measures precision,recall,fallout and miss as a function of the number of retrieved documents and their mutual interrelations [J]. Information Processing and Management,2008,44(2):856-876.趙宏才,趙曉杰,張興波,等. 基于專家系統的黃瓜園區(qū)無線智能監(jiān)控系統研究[J]. 江蘇農業(yè)科學,2017,45(17):215-218.

        doi:10.15889/j.issn.1002-1302.2017.17.057endprint

        成人午夜视频一区二区无码| 在线观看的网站| 国产精品毛片完整版视频| 精品久久综合亚洲伊人| 国产91在线|亚洲| 日韩一二三四区在线观看| 亚洲成a人片在线观看无码专区| 国产97色在线 | 日韩| AV无码中文字幕不卡一二三区| 小草手机视频在线观看| 国产亚洲精品av久久| 中文www新版资源在线| 欧美日韩国产专区| 国产内射视频免费观看| 人妻少妇中文字幕在线观看| 极品av麻豆国产在线观看| 亞洲綜合一區二區三區無碼| 中文字幕一区二区三区喷水| 亚洲精品中文字幕免费专区| 亚洲精品乱码久久久久久蜜桃不卡 | 色偷偷88888欧美精品久久久 | 久久这黄色精品免费久| 亚洲av网一区二区三区| 欧美人妻日韩精品| 99久久人妻无码精品系列蜜桃 | 人妻蜜桃日产一本久道综合在线 | 野花社区视频在线观看| 国产精品白浆视频免费观看| 一区二区三区国产精品| 久久婷婷综合缴情亚洲狠狠| 精品国产乱码久久久久久影片| 久久精品无码一区二区2020| 在线小黄片视频免费播放| 日日摸夜夜添夜夜添高潮喷水| a级国产乱理论片在线观看| 久久久久人妻精品一区5555| 日本免费看片一区二区三区| 亚洲va无码va在线va天堂| 手机在线精品视频| 最全精品自拍视频在线| 日韩国产人妻一区二区三区|