亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        面向科技資源需求的推薦方法研究

        2017-05-24 14:48:17李海威林珠黃皓璇鄭偉鴻
        現(xiàn)代計算機 2017年11期
        關(guān)鍵詞:大廳協(xié)同文本

        李海威,林珠,黃皓璇,鄭偉鴻

        (1.廣東省科技基礎(chǔ)條件平臺中心,廣東省高性能計算重點實驗室,廣州 510033;2.廣東工業(yè)大學(xué)自動化學(xué)院,廣州 510046)

        面向科技資源需求的推薦方法研究

        李海威1,林珠1,黃皓璇2,鄭偉鴻1

        (1.廣東省科技基礎(chǔ)條件平臺中心,廣東省高性能計算重點實驗室,廣州 510033;2.廣東工業(yè)大學(xué)自動化學(xué)院,廣州 510046)

        圍繞科技資源需求大廳的功能,提出協(xié)同過濾與內(nèi)容相結(jié)合的推薦方法,采用向量相似度計算和聚類的進行需求匹配,能夠適應(yīng)科技資源推薦過程中數(shù)據(jù)量巨大、數(shù)據(jù)稀疏、多樣化等特點,為待解決需求者推薦合適的資源。

        科技資源;需求大廳;協(xié)同過濾;向量空間模型;推薦系統(tǒng)

        0 引言

        近年來,廣東省“統(tǒng)一部署、突出重點,整合資源、開放共享,市場導(dǎo)向、創(chuàng)新體制,政府主導(dǎo)、多方聯(lián)動”的原則,通過省市共建、科研機構(gòu)聯(lián)合共建、科研機構(gòu)與高校共建等多種建設(shè)模式,充分整合各類科技資源,建設(shè)一批科技資源創(chuàng)新服務(wù)平臺和公共科技信息服務(wù)平臺(以下簡稱“資源平臺”),以提升全省科技服務(wù)能力。

        資源平臺的建設(shè)為科技資源的提供商和使用方提供了資源銜接平臺,在平臺中使用合適的推薦算法能夠有效促進資源的優(yōu)化配置,促進使用方快速尋找心儀的資源,推進資源平臺建設(shè)。該平臺需求大廳的推薦對象為科技工作者、中小微企業(yè)等進行科技活動的用戶,這些用戶希望通過平臺獲取相關(guān)的科技資源,以協(xié)助自己完成相關(guān)的科研工作。推薦內(nèi)容為這些用戶所需的各類資源,如在平臺尋找進行科技活動所需的科學(xué)儀器、某特地領(lǐng)域所需要的科技文獻、進行實驗的種質(zhì)資源等。現(xiàn)階段針對科技資源的利用情況,政府部門、科技工作者均認同建設(shè)資源平臺的重要性,專家學(xué)者也將電商、O2O模式引入資源平臺,在平臺中運用各種推薦算法,以幫助使用方快速尋找資源,促進資源的高效運用。

        由于科技資源存在種類繁多、數(shù)據(jù)稀疏、熱點資源不夠集中的情況,使用傳統(tǒng)的推薦算法未必合適,因此,本文試圖將基于協(xié)同過濾與基于內(nèi)容的推薦算法相結(jié)合,從而尋找更適合科技資源需求大廳的推薦算法。

        1 科技資源需求大廳

        面對全省眾多的科技資源,以開放服務(wù)為主要目的,將科技資源應(yīng)用于科技創(chuàng)新活動中,推動科技資源“信息連起來,資源用起來”,達到科技資源深度挖掘、綜合集成、有效利用的效果,形成了從標準規(guī)范制定、數(shù)據(jù)整合加工、數(shù)據(jù)挖掘到開放服務(wù)的一套完整的科技資源共享服務(wù)體系結(jié)構(gòu)。需建設(shè)科技資源服務(wù)平臺(以下簡稱“平臺”)進行科技創(chuàng)新服務(wù),通過平臺為中小微企業(yè)科技創(chuàng)新活動提供資源與技術(shù)服務(wù),為科技工作者、科研院校等的科研工作提供基礎(chǔ)支撐,為政府科技資源配置提供數(shù)據(jù)支撐,為社會民生發(fā)展提供科技資源專題化服務(wù)。平臺推動科技資源的開放共享與運行服務(wù),形成資源與利益共享的一個信息化平臺。

        為進一步促進資源的優(yōu)化配置,為資源使用方提供更便利的提供渠道,平臺專設(shè)需求大廳模塊?!靶枨蟠髲d”功能主要為資源的提供方和使用方進行對接服務(wù),在平臺中除資源的檢索和展示外,另開設(shè)“需求大廳”頁面,主要包括如下功能:

        ●需求發(fā)布:使用方直接在平臺進行資源需求的發(fā)布,發(fā)布內(nèi)容包括:標題、內(nèi)容、附件、聯(lián)系人、聯(lián)系電話等。

        ●需求大廳:用于展示發(fā)布后的需求。

        ●成功案例:用于展示成功對接后的信息。

        ●對接申請:提供商可對自己感興趣的資源進行對接申請,填寫供方信息,包括:標題、內(nèi)容、聯(lián)系人、聯(lián)系電話等。

        ●需求對接:使用方根據(jù)對接申請的情況,對各申請對接的提供商進行比較,選擇其中一個進行需求對接,對接成功后,將進入成功案例列表。

        2 電商網(wǎng)站常用推薦方法

        需求大廳與其他電子商務(wù)網(wǎng)站的推薦方法具有類似之處,它們均根據(jù)提供商和需求方發(fā)布的歷史數(shù)據(jù)進行挖掘用戶的行為習(xí)慣,從而為用戶推薦更合適的商品或資源。傳統(tǒng)電商網(wǎng)站通常采用基于協(xié)同過濾的算法[1]或基于內(nèi)容的算法進行推薦[2]。

        2.1 基于關(guān)聯(lián)規(guī)則的推薦方法

        基于關(guān)聯(lián)規(guī)則的推薦方法常常被應(yīng)用于電子商務(wù)系統(tǒng)中,利用用戶點擊率或者購買訂單等歷史記錄來查找存在于商品之間的關(guān)聯(lián)性,并找出正確的促銷商品組合,根據(jù)這些組合為用戶生成推薦[3]。該方法實際運用了數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則算法,從大量的歷史數(shù)據(jù)中分析出數(shù)據(jù)項之間相互聯(lián)系的知識,常采用Apriori算法或其改進算法產(chǎn)生Top-N推薦列表,從而進行離線推薦。

        2.2 基于協(xié)同過濾的推薦方法

        協(xié)同過濾方法主要是指根據(jù)用戶在網(wǎng)站中的綜合協(xié)同信息形成總體規(guī)則來預(yù)測單個用戶的興趣[4]?;趨f(xié)同過濾的推薦方法基于如下思想:如果用戶周圍的朋友選擇了某類商品,那么默認他也會優(yōu)先考慮購買該類商品;如果用戶對某類商品特別喜歡,那么,用戶選擇與該類商品具有很高相似度的商品的概率比較大。

        協(xié)同過濾方法一般分為基于用戶的協(xié)同過濾算法和基于項目的協(xié)同過濾算法[5],User-based協(xié)同過濾關(guān)鍵在于尋找目標用戶的K近鄰,首先根據(jù)用戶信息和歷史數(shù)據(jù)進行用戶之間相似度計算,根據(jù)目標用戶與其他用戶之間的相似度而形成目標用戶的K近鄰,然后再根據(jù)這些近鄰的用戶的行為記錄產(chǎn)生推薦結(jié)果。但隨著用戶數(shù)據(jù)的不斷增加,User-based協(xié)同過濾的用戶相似度計算難度也不斷增加。因此產(chǎn)生了基于項目的協(xié)同過濾方法[6],該方法通過用戶的行為歷史記錄進行物品之間的相似度計算,首先對物品之間的相似度進行計算,然后再根據(jù)歷史信息中用戶購買記錄與物品的相似度計算,然后再推薦相似度較高的物品給目標用戶。

        2.3 基于內(nèi)容的推薦方法

        無論是基于關(guān)聯(lián)規(guī)則的推薦算法,還是協(xié)同過濾推薦方法,均需采用過去發(fā)生的交易、評價等信息,但對于電商網(wǎng)站,很多產(chǎn)品有時候用戶并沒有留下評價信息或未曾購買過,對于這種情況,往往需要采用基于內(nèi)容的推薦算法[7]。

        基于內(nèi)容的推薦主要應(yīng)用于文本信息領(lǐng)域,通常采用鄰近函數(shù)、分類等技術(shù)對項目的總體文本進行分析或聚類,然后再基于用戶的特征或記錄產(chǎn)生推薦[8]。基于內(nèi)容的推薦基于如下思想:用戶往往會對內(nèi)容相似的產(chǎn)品感興趣。基于內(nèi)容的推薦采用產(chǎn)品本身的內(nèi)容特征信息進行推薦,如根據(jù)產(chǎn)品名稱、類型、用途等基本信息作為推薦的依據(jù),也可以從這些基本信息中延伸出產(chǎn)品的風(fēng)格、主題等抽象信息進行推薦??梢钥吹?,只要是真實存在的產(chǎn)品,都可以按照一定的標準維度來篩選出產(chǎn)品的內(nèi)容,也就是說基于內(nèi)容的推薦的適用面是很廣的。

        現(xiàn)階段推薦系統(tǒng)往往采用多種方法的結(jié)合,使推薦更加精準,如王明文等作者提出雙向聚類迭代的協(xié)同過濾推薦算法實現(xiàn)基于協(xié)同過濾和基于內(nèi)容的結(jié)合[9]。

        3 需求大廳推薦方法

        3.1 科技資源數(shù)據(jù)特征

        隨著科技創(chuàng)新工作的開展,科技資源在科技活動中的重要性日益呈現(xiàn),伴隨著全省對科技資源的重視和整合力度的提升,科技資源數(shù)據(jù)極速增長,呈現(xiàn)數(shù)據(jù)量巨大、數(shù)據(jù)稀疏、多樣化等特點。科技資源種類繁多,包括大型儀器、種質(zhì)資源、實驗動物等多種科技資源,每類資源所在領(lǐng)域不同,有些數(shù)據(jù)需求較小,導(dǎo)致數(shù)據(jù)稀疏;數(shù)據(jù)類型多樣,除資源的名稱、內(nèi)容、型號、領(lǐng)域等結(jié)構(gòu)數(shù)據(jù)之外,還具有圖片、地理位置信息等非結(jié)構(gòu)化數(shù)據(jù);每個用戶感興趣的科技領(lǐng)域不一樣,導(dǎo)致熱點資源不夠集中,呈現(xiàn)多樣化。

        對于不同的科技資源,其在平臺需求大廳發(fā)生的行為主要概況為主要有四類數(shù)據(jù)集,分別是待解決需求的文本、已解決需求的文本、用戶特征的文本、提供商特征的文本。其中,用戶特征的文本主要對每個發(fā)生過購買行為的用戶(將購買過資源的用戶視為具備一定的解決需求的能力),抽取他所有購買過的資源的文本描述,將這些文本合并為該用戶的特征文檔;提供商特征文本主要從平臺數(shù)據(jù)庫中抽取每個提供商旗下所有發(fā)布并上架的資源的文本描述,將這些文本合并為該提供商的特征文檔。

        3.2 需求大廳推薦方法

        科技資源需求大廳推薦重點在于為使用方推薦合適的科技資源,同時,為使用方推薦相似的成功案例,以幫助使用方快速找到解決方案。根據(jù)科技資源需求大廳的業(yè)務(wù)特點,采用協(xié)同過濾與內(nèi)容相結(jié)合的推薦方法,采用向量相似度計算和聚類方法進行需求匹配,該方法融合基于協(xié)同過濾方法與基于內(nèi)容推薦方法的優(yōu)點,解決數(shù)據(jù)稀疏性,增加推薦結(jié)果的準確率和覆蓋率。

        該推薦算法結(jié)合了協(xié)同過濾方法和基于內(nèi)容的推薦方法,首先,其采用了User-based協(xié)同過濾方法,對用戶特征向量進行相似度計算,對待解決需求的用戶推薦與其相似的用戶曾經(jīng)購買的資源,將這些資源存于用戶-資源表1;然后,對待解決需求與提供商特征向量進行基于項目的協(xié)同過濾方法,通過相似度計算,形成資源-資源表2;然后,再通過基于內(nèi)容的推薦方法,采用Canopy+K-Means算法,對需求進行聚類,將相似需求劃為同一簇,為待解決的需求推薦其同簇中被用于解決需求的資源,形成需求-資源表3;最后,對3個表進行整合,為需求優(yōu)先推薦重復(fù)度高的資源,然后再推薦單表中存在的資源。

        在該推薦方法中,聚類主要采用Canopy+K-Means算法,K-Means算法需人為確定簇的數(shù)量K值,并且初始簇心是隨機選擇確定的,因此,在對數(shù)據(jù)不了解的情況下,很難給定合理的K值。因此,引入Canopy算法,首先通過Canopy算法進行聚類,以確定簇數(shù)以及初始簇心的,接著通過K-Means算法進行迭代運算,收斂出最后的聚類結(jié)果[10]。

        圖1

        科技資源需求大廳推薦如圖1所示具體步驟如下:

        step1:進行數(shù)據(jù)抓取及數(shù)據(jù)清洗,構(gòu)建待解決需求的文本、已解決需求的文本、用戶特征的文本、提供商特征的文本,形成文本集合。

        step2:對文本集合的所有文檔,進行中文分詞、去停用詞處理。

        step3:使用向量空間模型(VSM)向量化文本文檔,構(gòu)建文檔-詞語矩陣,并利用TF-IDF(詞頻-逆文檔頻率)方法計算權(quán)重。

        step4:將向量存儲于哈希表Map〈String,Vector>中,其中key為文檔名,value為向量。

        step5:使用余弦距離測度,計算提供商向量與待解決需求按相關(guān)性高低進行匹配,結(jié)果形成用戶-資源表1。

        step6:使用余弦距離測度,計算q用戶特征向量與待解決需求用戶向量的相關(guān)性,推薦相關(guān)性較高的用戶其購買過的資源給待解決需求用戶,結(jié)果形成資源-資源表2。

        step7:針對發(fā)布了需求的用戶,對需求文檔集合,使用Canopy+K-Means算法進行聚類,根據(jù)最終的結(jié)果簇進行推送,幫助用戶發(fā)現(xiàn)與其相似的需求是如何被解決的,結(jié)果形成需求-資源表3。

        step8:對3個表進行整合,為需求優(yōu)先推薦重復(fù)度高的資源,然后再推薦單表中存在的資源。

        3.3 算法實現(xiàn)

        主要算法實現(xiàn)如下:

        輸入:變量con為文本集合(待解決需求的文本、已解決需求的文本、用戶特征的文本、提供商特征的文本);

        輸出:變量rc為推薦資源

        3.4 算法效果

        該推薦算法應(yīng)用在廣東省科技創(chuàng)新服務(wù)平臺和公共科技信息服務(wù)平臺,在平臺首頁右側(cè),開設(shè)專欄“猜您喜歡”,展示該推薦系統(tǒng)計算出的TOP5資源。為驗證該算法的優(yōu)勢,平臺首先采用協(xié)同過濾算法、基于內(nèi)容的推薦算法進行推薦,在分別收集了1000次的平臺首頁登陸后,再使用本文中的算法進行推薦。對于三種算法收集的1000次訪問數(shù)據(jù)中,通過URL跳轉(zhuǎn)記錄統(tǒng)計進入“猜您喜歡”的次數(shù),得出實驗結(jié)果如表1所示。

        表1 各種算法訪問次數(shù)比較

        實驗表明,文中所采用的結(jié)合基于協(xié)同過濾和基于內(nèi)容的推薦方法的推薦方法,融合兩者的優(yōu)點,解決數(shù)據(jù)稀疏性,增加推薦結(jié)果的準確率和覆蓋率,訪問效果與傳統(tǒng)算法相比具有一定的優(yōu)勢。

        4 結(jié)語

        本文首先介紹了科技資源共享服務(wù)平臺建設(shè)的必要性和意義,闡述了科技資源需求大廳的主要功能,然后介紹了現(xiàn)階段電商網(wǎng)站常用的推薦方法,在基于協(xié)同過濾和基于內(nèi)容的推薦方法基礎(chǔ)上,提出了結(jié)合協(xié)同過濾和內(nèi)容的需求大廳推薦方法。該方法能夠適應(yīng)科技資源數(shù)據(jù)特征,不僅使用了余弦距離測度,同時也采用了Canopy+K-Means算法進行聚類,從待解決需求與提供商向量、待解決需求與用戶特征向量、待解決需求與已解決需求等多方面進行需求大廳推薦。

        [1]Kim H N,Ji A T,Ha I,et al.Collaborative Filtering Based on Collaborative Tagging for Enhancing the Quality of Recommendation[J].Electronic Commerce Research and Application,2010(9):73-83.

        [2]牟春苗.O2O電子商務(wù)模式中推薦方法的研究[D].東北石油大學(xué),2014.

        [3]Brzozowski M J,Romero D M.Who Should I Follow?Recomendiing People in Directed Social Networks.CSCW'11.Hangzhou,China, 2011:1-10.

        [4]何鵬.Roster——一種開發(fā)者潛在同行推薦方法[J].計算機學(xué)報.2014(37):859-872.

        [5]劉永康.個性化推薦技術(shù)的發(fā)展[J].電子世界.2015(24):61-62.

        [6]韋素云,業(yè)寧,吉根林,等.基于項目類別和興趣度的協(xié)同過濾推薦算法[J].南京大學(xué)學(xué)報:自然科學(xué)版,2013,49(2):142-149.

        [7]LIANG C,LENG Y.Collaborative Filtering Based on Information-Theoretic Co-Clustering[J].International Journal of Systems Science,2014,45(3):589-597.

        [8]田耕.基于關(guān)系和內(nèi)容的推薦算法研究[D].北京交通大學(xué),2015.

        [9]王明文,陶紅亮,熊小勇.雙向聚類迭代的協(xié)同過濾推薦算法[J].中文信息學(xué)報,2008,22(4):61-65.

        [10]趙慶.基于Hadoop平臺下的Canopy+K-Means高效算法[J].電子科技,2014,27(2):29-31.

        Research on the Recommendation Method for the Demand Hall of Scientific and Technological Resources

        LI Hai-wei1,LIN Zhu1,HUANG Hao-xian2,ZHENG Wei-hong1

        (1.Guangdong Science&Technology Infrastructure Center;Guangdong Province Key Laboratory of HPC,Guangzhou 510033;
        2.Guangdong University of Technology Automation Subject,Guangzhou510046)

        With the surging importance of scientific and technological resources appears in scientific and technological activities,increasing areas are making efforts to establish shared service platform to promote cooperation between source users and providers.As to the function of scientific and technological resources’demand hall,puts forward a recommendation method of integrating collaborative filtering and contents.It matches demands by vector quantity similarity calculation and clustering,recommending resources to demanders from whatever huge,sparse or diversified data.

        Science and Technology Resources;Demand hall;Collaborative Filtering;VSM;Recommendation System

        1007-1423(2017)11-0060-05

        10.3969/j.issn.1007-1423.2017.11.012

        李海威(1979-),男,廣東興寧人,高級工程師,本科,研究方向為計算機科學(xué)與技術(shù)

        林珠(1983-),女,廣東梅州人,高級工程師,碩士,研究方向為數(shù)據(jù)挖掘和人工智能、信息系統(tǒng)

        黃皓璇(1991-),男,廣東汕頭人,助理工程師,碩士,研究方向為數(shù)據(jù)挖掘與人工智能

        鄭偉鴻(1989-),男,廣東潮州饒平人,工程師,雙學(xué)士,研究方向為虛擬化技術(shù)、軟件研發(fā)

        2017-01-17

        2017-03-15

        廣東省科技基礎(chǔ)條件平臺公共服務(wù)能力提升研究及資源網(wǎng)絡(luò)建設(shè)(No.2014A080804007)、科技資源數(shù)據(jù)分析與開放共享服務(wù)平臺建設(shè)(No.2014B070706004)

        猜你喜歡
        大廳協(xié)同文本
        蜀道難:車與路的協(xié)同進化
        在808DA上文本顯示的改善
        “四化”協(xié)同才有出路
        汽車觀察(2019年2期)2019-03-15 06:00:50
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        三醫(yī)聯(lián)動 協(xié)同創(chuàng)新
        跟蹤導(dǎo)練(四)4
        網(wǎng)上辦事大廳解決方案
        候機大廳
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學(xué)隱喻
        協(xié)同進化
        生物進化(2014年2期)2014-04-16 04:36:26
        国产白浆精品一区二区三区| 无码av免费一区二区三区试看| 亚洲人成精品久久久久| 久久精品99久久香蕉国产色戒| 欧美亚洲国产精品久久高清| 亚洲日本在线va中文字幕| 亚洲女同高清精品一区二区99| 国产综合开心激情五月| 国产国产人免费人成免费视频| 国产精品免费看久久久8| 亚洲AV无码成人网站久久精品| AV中文字幕在线视| 久久久熟女一区二区三区| 男人和女人做爽爽视频| 永久免费av无码网站性色av| 色婷婷精品综合久久狠狠| 日韩中文字幕在线丰满| 欲香欲色天天综合和网| 高潮毛片无遮挡高清免费| 国产福利小视频91| 亚洲精品在线视频一区二区| 亚洲人成色7777在线观看| 色综合一本| 蜜桃色av一区二区三区麻豆| 日韩 亚洲 制服 欧美 综合 | 国产精品久久久久久亚洲av| 五月天婷婷综合网| 一本久久伊人热热精品中文| 黄片大全视频在线播放| 品色永久免费| 天天射色综合| 人妻少妇艳情视频中文字幕| 国产亚洲2021成人乱码| 精品国产高清一区二区广区 | 狠狠色丁香婷婷久久综合| 蜜臀aⅴ国产精品久久久国产老师 国产精品久久婷婷六月丁香 | 亚洲A∨日韩Av最新在线| 东北老熟女被弄的嗷嗷叫高潮| 日本久久久久亚洲中字幕| 巨熟乳波霸若妻在线播放| av亚洲在线一区二区|