亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        機器學(xué)習(xí)在推薦系統(tǒng)中的應(yīng)用

        2019-05-24 14:13:16姜娜黃吉亞顧慶傳楊海燕
        電腦知識與技術(shù) 2019年11期
        關(guān)鍵詞:推薦系統(tǒng)機器學(xué)習(xí)應(yīng)用

        姜娜 黃吉亞 顧慶傳 楊海燕

        摘要:我國科技技術(shù)在社會經(jīng)濟建設(shè)的背景下有了較快的發(fā)展,其中機器學(xué)習(xí)是我國目前較為流行的一種技術(shù),并且應(yīng)用在較多的領(lǐng)域中,比如生物、信息以及交通等,特別是經(jīng)濟以及金融領(lǐng)域,有較高的應(yīng)用效果。此外,在經(jīng)濟以及金融領(lǐng)域中應(yīng)用機器學(xué)習(xí)的過程中,需要對不同算法中的優(yōu)點與缺點進行實施有效的分析,并能在此基礎(chǔ)上對目前整個環(huán)境進行有效的了解,通過機器學(xué)習(xí)進行用戶推薦系統(tǒng)的構(gòu)建,以此對不同算法的適應(yīng)情況進行深入的了解。

        關(guān)鍵詞:機器學(xué)習(xí);推薦系統(tǒng);應(yīng)用

        中圖分類號:TP391 文獻標識碼:A

        文章編號:1009-3044(2019)11-0196-02

        前言

        我國信息化技術(shù)的發(fā)展,使較多數(shù)據(jù)得到有效的存儲,同時科技技術(shù)在應(yīng)用過程中也出現(xiàn)了較多的數(shù)據(jù),在一定程度上很難得到有效的利用。因此,需要對一些數(shù)據(jù)進行有效的挖掘,較多數(shù)據(jù)挖掘技術(shù)在不同領(lǐng)域中應(yīng)用,其中機器學(xué)習(xí)技術(shù)的應(yīng)用范圍比較廣泛,由此能夠看出,機器具有強大的學(xué)習(xí)能力,能夠在推薦系統(tǒng)中進行有效的應(yīng)用。

        1 機器學(xué)習(xí)的過程

        1.1 數(shù)據(jù)獲取

        機器學(xué)習(xí)在運行過程中,首先是采取有效的途徑進行數(shù)據(jù)的獲取,由此可以看出,機器學(xué)習(xí)需要建立在數(shù)據(jù)的基礎(chǔ)之上,其中獲取數(shù)據(jù)是機器學(xué)習(xí)運行過程中最為簡單的步驟,主要是因數(shù)據(jù)的產(chǎn)生渠道較多,并且產(chǎn)生的數(shù)據(jù)量也相對較多,比如醫(yī)院就診記錄、超市購買記錄以及電腦運行數(shù)據(jù)等,這些數(shù)據(jù)信息在較大程度上是機器學(xué)習(xí)的基礎(chǔ)。

        1.2 清洗數(shù)據(jù)

        由于數(shù)據(jù)無規(guī)則性,人們在獲取的過程中也有較大的無規(guī)則性,在此過程中有較多數(shù)據(jù)沒有可利用價值,反之還會對系統(tǒng)運行造成一定的不利影響,所以在對此進行分析過程中應(yīng)當首先對此無用信息進行有效清理,這在較大程度上能夠有效提高分析結(jié)果正確率[1]。此外,在對數(shù)據(jù)處理的過程中有三個不同的方面:距離度量、抽樣以及降維。

        在協(xié)同過濾推薦系統(tǒng)中采用KNN分類,一般情況下取決于距離度量方法,使用頻率最高的距離度量方法有皮爾遜相關(guān)系數(shù)、歐幾里得距離以及Jaccard系數(shù)等。此外,抽樣技術(shù)主要是對數(shù)據(jù)進行有效的挖掘,從大數(shù)據(jù)集中選擇相關(guān)數(shù)據(jù)子集的一種技術(shù),并且在最終的解釋步驟也起到了較為重要的作用,其中無取代抽樣是使用頻率最為高的抽樣方法,若對物品選擇確定之后,物品會被取走,但是執(zhí)行取代抽樣也是允許的,換句話說就是物品就算被選擇也無需從整體中去除。降維主要是對一些點的去除,一般情況下是對密集度不高并且對結(jié)果影響較小的點實施有效的去除,并在此基礎(chǔ)上進行維度的有效降低,以此在最大程度上避免維度災(zāi)難。

        1.3 模型構(gòu)建以及數(shù)據(jù)分析

        在機器學(xué)習(xí)的過程中,對數(shù)據(jù)的分析是整個過程中難度最大,并且最核心的環(huán)節(jié),的整個機器學(xué)習(xí)中最為核心的內(nèi)容。此外,在對數(shù)據(jù)分析過程中,所采用的方法相對較多,不同的方法在使用的過程中會產(chǎn)生不同作用,這就需要在使用過程中根據(jù)實際情況進行針對性分析,推薦系統(tǒng)在應(yīng)用的過程中主要采用了以下幾種方法[2]:1)最近鄰算法。最近鄰算法主要是根據(jù)存儲蓄念記錄對樣本標簽類別進行有效的預(yù)測,此種分類器主要是對訓(xùn)練集進行有效的存儲,在此過程中想要進行有效的分類,需要將訓(xùn)練集與新記錄進行有效的匹配。此種方法與其他方法相比相對較為簡單,主要是因最近鄰算法不需要進行模型的構(gòu)建,具有較高準性;2)人工神經(jīng)網(wǎng)絡(luò)。人工神經(jīng)網(wǎng)絡(luò)算法在一定程度上是對生物網(wǎng)絡(luò)進行了有效的模擬,主要是有內(nèi)連接點與帶權(quán)鏈構(gòu)成,這在較大程度上是模式匹配算法,一般情況下是對回歸與分類問題進行有效的解決。人工神經(jīng)網(wǎng)絡(luò)主要是機器在學(xué)習(xí)過程中的一個分支,算法相對比較多,其中最為重要的是一個組成部分就是深度學(xué)習(xí)。人工神經(jīng)網(wǎng)絡(luò)在應(yīng)用的過程中最大的優(yōu)勢在于能夠?qū)Ψ蔷€性分類任務(wù)進行有效的處理,并在此基礎(chǔ)上進行并行處理,使其在一些網(wǎng)絡(luò)受損過程中進行實時性操作。但是,人工神經(jīng)網(wǎng)絡(luò)系統(tǒng)對一些問題很難提供理想的網(wǎng)絡(luò)拓撲。

        2 推薦系統(tǒng)

        2.1 系統(tǒng)架構(gòu)

        目前,推薦系統(tǒng)主要由有關(guān)物品檢索、物品排序以及用戶體特征提取構(gòu)成。其中物品檢所以主要是根據(jù)用戶特點,能夠在最短時間內(nèi)尋找用戶感興趣的物品,一般情況下此模塊主要通過信息檢索對物品實施檢索,以此快速找到用戶感興趣的物品。排序模塊主要是根據(jù)機器學(xué)習(xí)算法,并在此基礎(chǔ)上對相關(guān)指標實施有效的完善,以此在最大程度上得到有效的模型,比如點擊率模型能夠通過候選物品特點以及用戶特點,可有效預(yù)算處用戶對物品預(yù)估點擊率,再將候選物品根據(jù)點擊率實施合理的排序,主要是根據(jù)預(yù)估點擊率實施有效的排序,同時在排序過程中還需要對結(jié)果多樣性以及新穎性進行全面、科學(xué)的考慮。永特特點提取模塊能夠?qū)τ脩粜袨檫M行有效的記錄,并在此基礎(chǔ)上與相關(guān)信息構(gòu)成用戶特點,這在較大程度上能夠?qū)τ脩襞d趣進行有效的描述。

        2.2 用戶特點獲取與聚類算法

        以此圖書網(wǎng)站作為講解的例子,用戶根據(jù)自己的需求登錄網(wǎng)站,推薦系統(tǒng)在最短時間內(nèi)會對該用戶特點進行有效的提取,系統(tǒng)會給用戶推薦一些與用戶興趣相關(guān)的圖書。其中用戶特點主要表現(xiàn)在以下幾點:1)購書過程中的登錄身份;2)用戶年齡以及性別;3)用戶在登錄網(wǎng)站后瀏覽過的網(wǎng)頁;4)用戶在網(wǎng)站中使用的相關(guān)詞匯;5)用戶在圖書網(wǎng)站中的一些其他活動,比如評論、收藏等。

        在所有的用戶特點中,性別與年齡維度相對較低,其他特點相對較高,若將此直接作為特點會在一定程度上產(chǎn)生一些問題,比如稀疏性問題,其中最為重要的問題就是導(dǎo)致檢索模塊運算量相對增加,這在較大程度上使系統(tǒng)中的一些功能降低[3]。檢索模塊在運行的過程中需要提高其運行效率,推薦系統(tǒng)通過一些措施進行有效的降維,其中降維主要是機器學(xué)習(xí)過程中無監(jiān)督學(xué)習(xí)狀態(tài),最為有效的降維方法就是將用戶實施有效聚類,比如根據(jù)用戶歷史記錄將其進行分類。

        2.3 物品檢索

        系統(tǒng)尋找到用戶興趣特點后,推薦系統(tǒng)會根據(jù)相關(guān)信息找打用戶物品,推薦系統(tǒng)在進行物品檢索的過程中主要是通過導(dǎo)牌索引技術(shù)來來完成, 此模塊主要的工作是通過倒排索引進行檢索,推薦系統(tǒng)中最為主要的索引就是“物品--物品”索引。此外,推薦系統(tǒng)在進行問題探究過程中主要是對物品之間相關(guān)度進行有效的計算,同時一些物品推薦系統(tǒng)一般情況下是在用戶欣賞物品的過程中,系統(tǒng)根據(jù)用戶興趣提供與之相關(guān)的物品[4]。目前,主流物品相關(guān)度具體算法主要有內(nèi)容方面算法以及行為方面算法,其中協(xié)同過濾算法主要構(gòu)成就是行為物品相關(guān)度算法,這在較大程度上與機器學(xué)習(xí)行業(yè)的關(guān)聯(lián)性準則有較大的關(guān)聯(lián)性。

        3 點擊率預(yù)估以及兩類分類問題

        在得到用戶候選物品后,需要對候選物品進行有效的排序,雖然通過物品檢索模塊能夠獲得用戶特別以及物品相關(guān)度,但是不能只通過相關(guān)度排序主要是因特點不同得到的相關(guān)度有較大的差異性,兩者之間不能進行有效的對比。此外,需要一個有效并且統(tǒng)一指標對用戶檢索物品的有效實施有效的計算工作,以此達到對物品有效排序的目的,其中該統(tǒng)一的指標需要滿足不同的條件才能發(fā)揮其有效性,主要表現(xiàn)在以下兩個方面[5]:1)能夠?qū)C器學(xué)習(xí)方法與算法進行全面的優(yōu)化;2)在使用的過程中對推薦系統(tǒng)相關(guān)網(wǎng)站的使用目標。除此之外,點擊率也需要滿足不同的條件:1)網(wǎng)站在運行過程中點擊率是能夠有效提高運行時長,這在較大程度上也是網(wǎng)站運行一個較為重要的目標;2)點擊率預(yù)算在網(wǎng)站運行中尤為重要,可以將其轉(zhuǎn)變?yōu)橹皟深惙诸悊栴},這在較大程度上是最為主要的問題,由此可以看出,點擊率預(yù)估模塊主要是對物品點擊率進行實時性有效計算,再將物品根據(jù)點擊率高低進行有效排序,并在此基礎(chǔ)上進行輸出工作。

        在點擊率預(yù)估模塊中需要將不同單一問題轉(zhuǎn)變成兩類分類問題,這就需要進行兩類分類問題數(shù)據(jù)集的全面構(gòu)建,其中數(shù)據(jù)集主要是有特征與類標組成[6]。此外,兩類分類器最具代表的就是神經(jīng)網(wǎng)絡(luò)、支持向量機以及邏輯回歸等,在進行點擊率預(yù)估過程中分類器起到了關(guān)鍵性作用,需要滿足以下條件:1)在較大范圍數(shù)據(jù)集中進行分類器模型的有效訓(xùn)練;2)需要對樣本的正、負類進行全面了解,并在此基礎(chǔ)上還需要對樣本正樣本幾率進行有效的認識,以此對點擊率實施預(yù)估;3)能夠?qū)c擊率畸形實時性更新并增量;4)能夠滿足在線預(yù)估要求;5)能夠進行預(yù)估點擊率信用度的全面提供;6)能夠進行預(yù)估結(jié)果的相關(guān)解釋。目前,一種較為準備的分類算法就是邏輯回歸算法,能夠有效對以上幾點同時滿足,其中此種算法在較大程度上是一種線性模型,可對在線預(yù)測行性能進行有效的提高,并保持不變,目前對于模型訓(xùn)練有一定的并行化方法,能夠在數(shù)據(jù)集中進行有效的使用。

        4 結(jié)語

        綜上所述,在機器學(xué)習(xí)的較多算法當中,在推薦系統(tǒng)中均有較高的應(yīng)用效果。推薦系統(tǒng)在設(shè)計過程中,應(yīng)當具有產(chǎn)品轉(zhuǎn)化的功能,在產(chǎn)品需求轉(zhuǎn)化為機器學(xué)習(xí)問題能力,能夠在較大程度上對機器學(xué)習(xí)研究方向以及不同算法進行有效的掌握,并且在此基礎(chǔ)上把不同算法在不同領(lǐng)域中有針對性的應(yīng)用效果,能夠在較大程度上提高系統(tǒng)效果,只有這樣才能使系統(tǒng)設(shè)計達到一個相對較高的水平,以此能夠有效提升機器學(xué)習(xí)效率。

        參考文獻:

        [1] 劉忠寶. 機器學(xué)習(xí)方法在個性化推薦系統(tǒng)中的應(yīng)用[J].情報探索,2016(4):80-82.

        [2] 周齊. 基于機器學(xué)習(xí)的推薦系統(tǒng)[J]. 電子技術(shù)與軟件工程,2016(24):173.

        [3] 齊帥彬, 胡晨駿, 胡孔法,等. 基于機器學(xué)習(xí)及中醫(yī)理論的推薦系統(tǒng)研究與思考[J]. 江蘇科技信息, 2017(10):37-38.

        [4] 盧軍, 張?zhí)旆? 基于隱式用戶行為的推薦系統(tǒng)研究[J].湖北工程學(xué)院學(xué)報,2016(3):22-27.

        [5] 王磊. 基于機器學(xué)習(xí)技術(shù)的LTE網(wǎng)絡(luò)智能優(yōu)化系統(tǒng)設(shè)計[J].電信工程技術(shù)與標準化,2018(1):39-42.

        [6] 喬雨, 李玲娟. 融合用戶相似度與評分信息的協(xié)同過濾算法[J].南京郵電大學(xué)學(xué)報:自然科學(xué)版, 2017(3):100-105.

        【通聯(lián)編輯:唐一東】

        猜你喜歡
        推薦系統(tǒng)機器學(xué)習(xí)應(yīng)用
        基于用戶偏好的信任網(wǎng)絡(luò)隨機游走推薦模型
        基于個性化的協(xié)同過濾圖書推薦算法研究
        個性化推薦系統(tǒng)關(guān)鍵算法探討
        基于機器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測分析
        時代金融(2016年27期)2016-11-25 17:51:36
        淺談Mahout在個性化推薦系統(tǒng)中的應(yīng)用
        前綴字母為特征在維吾爾語文本情感分類中的研究
        基于支持向量機的金融數(shù)據(jù)分析研究
        GM(1,1)白化微分優(yōu)化方程預(yù)測模型建模過程應(yīng)用分析
        科技視界(2016年20期)2016-09-29 12:03:12
        煤礦井下坑道鉆機人機工程學(xué)應(yīng)用分析
        科技視界(2016年20期)2016-09-29 11:47:01
        欧美成人一区二区三区| 亚洲国产高清一区av| 亚洲精品在线一区二区| 亚洲精品国产电影| 国内精品视频在线播放不卡 | 国家一级内射高清视频| 亚洲视频在线一区二区| 忘忧草社区www日本高清| 久久精品人妻一区二区三区| 亚洲色四在线视频观看| 久久久精品人妻一区二区三区免费 | 国产精品三级国产精品高| 国产tv不卡免费在线观看| 国产精品办公室沙发| 300部国产真实乱| 99精品视频69v精品视频免费| 日韩伦理av一区二区三区| 99人中文字幕亚洲区三| 国内成+人 亚洲+欧美+综合在线| 少妇人妻偷人精品一区二区| 国产经典免费视频在线观看 | 欧美婷婷六月丁香综合色| 久久精品国产亚洲AV高清wy| 最新天堂一区二区三区| 风情韵味人妻hd| 老熟妻内射精品一区| 国产精品98福利小视频| 亚洲狠狠久久五月婷婷| 亚洲国产成人精品无码区在线播放| 初女破初的视频| 欧美日韩免费一区中文字幕| 最新日本免费一区二区三区| 日韩女优av一区二区| 国产亚洲真人做受在线观看| 国产成人免费a在线视频| 色婷婷精品国产一区二区三区| av在线免费观看网站免费| 欧美放荡的少妇| 国产国语对白一区二区三区| 精品女同一区二区三区亚洲| 在线麻豆精东9制片厂av影现网 |