亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于k-means算法實(shí)現(xiàn)商品的聚類研究

        2020-06-22 13:23:17張一帆胡佳浩李依橋
        關(guān)鍵詞:means算法機(jī)器學(xué)習(xí)

        張一帆 胡佳浩 李依橋

        摘要:商品的數(shù)量非常大,需要按照一定的標(biāo)準(zhǔn)分為k類,如何把眾多數(shù)據(jù)對(duì)象,分為合適k類商品,成為數(shù)據(jù)分析中的一個(gè)研究問題。本文主要闡述了該模型的具體實(shí)現(xiàn)過程,主要包括數(shù)據(jù)采集、數(shù)據(jù)歸一化處理、構(gòu)造算法模型、評(píng)估算法模型。通過采用實(shí)例數(shù)據(jù)集進(jìn)行模型的訓(xùn)練和測(cè)試,實(shí)驗(yàn)結(jié)果表明:該模型能較準(zhǔn)確的進(jìn)行商品對(duì)象的分類,測(cè)試誤差較小。

        關(guān)鍵詞:機(jī)器學(xué)習(xí);k-means算法;Python

        中圖分類號(hào):TP311.13? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1007-9416(2020)04-0000-00

        0引言

        如今網(wǎng)站的快速發(fā)展,人們的生活和工作都離不開網(wǎng)絡(luò)。人們的生活節(jié)奏也在逐漸加快,工作越來(lái)越忙了。網(wǎng)購(gòu)網(wǎng)站吸納了眾多的群眾的參與,積累了大量的用戶資源。而且我國(guó)廣大的女性群體為網(wǎng)購(gòu)網(wǎng)站提供了良好的用戶基礎(chǔ)[1]。一個(gè)好的網(wǎng)購(gòu)網(wǎng)站可以帶運(yùn)輸?shù)榷喾N產(chǎn)業(yè)的發(fā)展,但是目前的網(wǎng)購(gòu)網(wǎng)站對(duì)用戶的數(shù)據(jù)處理有時(shí)候不夠準(zhǔn)確,商品分類標(biāo)準(zhǔn)不夠準(zhǔn)確。通過對(duì)網(wǎng)站數(shù)據(jù)進(jìn)行分析,采用k-means算法較好的完成商品配對(duì),為網(wǎng)站用戶提供較好的服務(wù)。

        1 K-means算法

        K均值(K-Means)算法是無(wú)監(jiān)督的聚類方法,實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單,聚類效果也比較好,因此應(yīng)用很廣泛。K-Means算法針對(duì)不同應(yīng)用場(chǎng)景,有不同方面的改進(jìn)。我們從最傳統(tǒng)的K-Means算法講起,然后在此基礎(chǔ)上介紹初始化質(zhì)心優(yōu)化K-Means++算法,距離計(jì)算優(yōu)化Elkan K-Means算法和大樣本情況下Mini Batch K-Means算法[2]。

        我們給定一個(gè)數(shù)據(jù)集D,以及要?jiǎng)澐值拇財(cái)?shù)k,就能通過該算法將數(shù)據(jù)集劃分為k個(gè)簇。一般來(lái)說(shuō),每個(gè)數(shù)據(jù)項(xiàng)只能屬于其中一個(gè)簇。具體方法可以這樣描述:

        (1)假設(shè)數(shù)據(jù)集在一個(gè)m維的歐式空間中,我們初始時(shí),可隨機(jī)選擇k個(gè)數(shù)據(jù)項(xiàng)作為這kk個(gè)簇的形心Ci,i∈{1,2,…k},每個(gè)簇心代表的其實(shí)是一個(gè)簇,也就是一組數(shù)據(jù)項(xiàng)構(gòu)成的集合。然后對(duì)所有的n個(gè)數(shù)據(jù)項(xiàng),計(jì)算這些數(shù)據(jù)項(xiàng)與Ci的距離(一般情況下,在歐式空間中,數(shù)據(jù)項(xiàng)之間的距離用歐式距離表示)。比如對(duì)于數(shù)據(jù)項(xiàng)Dj,j∈{1,…n},它與其中的一個(gè)簇心Ci最近,則將Dj歸類為簇Ci[3]。

        (2)通過上面這一步,我們就初步將DD劃分為k個(gè)類了?,F(xiàn)在重新計(jì)算這k個(gè)類的形心。方法是計(jì)算類中所有數(shù)據(jù)項(xiàng)的各個(gè)維度的均值。這樣,構(gòu)成一個(gè)新的形心,并且更新這個(gè)類的形心。每個(gè)類都這樣計(jì)算一次,更新形心。

        (3)對(duì)上一步計(jì)算得到的新的形心,重復(fù)進(jìn)行第(1),(2)步的工作,直到各個(gè)類的形心不再變化為止[4]。

        2分類實(shí)現(xiàn)

        本次使用的樣本數(shù)據(jù)一共有300行,對(duì)它們進(jìn)行數(shù)據(jù)分類。分類過程具體實(shí)現(xiàn)分為四個(gè)步驟,分別是采樣數(shù)據(jù)、樣本數(shù)據(jù)可視化、數(shù)據(jù)分類,顯示分類視圖。

        2.1獲取數(shù)據(jù)

        我們獲取300個(gè)樣本數(shù)據(jù),同時(shí)做成表格,代碼如下:

        import pandas as pda

        import numpy as npy

        import matplotlib.pylab as pyl

        import pymysql

        conn=pymysql.connect(host="127.0.0.1",user="root",passwd="root",db="tb")

        sql="select price,comment from goods limit 300"

        dataf=pda.read_sql(sql,conn)

        x=dataf.iloc[:,:].as_matrix()

        2.2模型分類

        我們讓300個(gè)樣本數(shù)據(jù)劃分為不同的類別,該部分的核心代碼如下所示:

        from sklearn.cluster import KMeans

        kms=KMeans(n_clusters=2)

        y=kms.fit_predict(x)

        print(y)

        for i in range(0,len(y)):

        if(y[i]==0):? ? ? ? pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"*r")

        elif(y[i]==1):? ? ? ? pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"sy")

        elif(y[i]==2): pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"*k")

        pyl.show()

        2.3分類結(jié)果

        對(duì)于我們的測(cè)試數(shù)據(jù)的分類結(jié)果,我們首先標(biāo)每類數(shù)據(jù),黃色方塊代表第一類,黑色五角代表第二類,紅色五角代表第三類。為了更直觀的的理解樣本數(shù)據(jù),數(shù)據(jù)采用Matplotlib庫(kù)進(jìn)行繪圖分析,如圖1所示。

        3結(jié)語(yǔ)

        本文通過采用k-means算法對(duì)商品數(shù)據(jù)進(jìn)行分析,采用Python數(shù)據(jù)可視化庫(kù)中的函數(shù)和Matplotlib庫(kù)完成對(duì)數(shù)據(jù)的分類。通過測(cè)試結(jié)果,分類結(jié)果達(dá)到了相對(duì)的平均,基本能夠滿足我們的要求。

        參考文獻(xiàn)

        [1]魏建東.K-means初始化算法研究[D].南京:南京理工大學(xué),2015.

        [2]宋建林.K-means聚類算法的改進(jìn)研究[D].合肥:安徽大學(xué),2016.

        [3]李衛(wèi)平.對(duì)k-means聚類算法的改進(jìn)研究[J].中國(guó)西部科技,2010(24):49-50.

        [4]劉越.K-means聚類算法的改進(jìn)[D].桂林:廣西師范大學(xué),2016.

        收稿日期:2020-03-15

        基金項(xiàng)目:2019年省級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目:ID3算法在網(wǎng)絡(luò)購(gòu)物滿意度預(yù)測(cè)研究中的應(yīng)用(S201910722012)。

        作者簡(jiǎn)介:張一帆,男,陜西渭南人,本科,研究方向:軟件工程。

        Research on Commodity Clustering Based on Kmeans Algorithm

        ZHANG Yi-fan, HU Jia-hao, LI Yi-qiao

        (Computer College of Xianyang Normal University, Xianyang Shaanxi 712000)

        Abstract:The quantity of commodities is very large, which needs to be divided into k categories according to certain standards. How to divide a large number of data objects into appropriate K categories of commodities has become a research problem in data analysis. This paper mainly describes the specific implementation process of the model, including data collection, data normalization, algorithm model construction, evaluation algorithm model. Through the training and testing of the model with the case data set, the experimental results show that the model can classify the commodity objects accurately, and the test error is small.

        Keywords: machine learning;k-means algorithm;Python

        猜你喜歡
        means算法機(jī)器學(xué)習(xí)
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
        前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        基于K—Means聚類算法入侵檢測(cè)系統(tǒng)研究
        基于Weka的Apriori算法在原油產(chǎn)量預(yù)測(cè)中的應(yīng)用
        基于HSI顏色空間的小麥粉精度自動(dòng)識(shí)別研究
        基于聚類的Web日志挖掘
        无码人妻久久一区二区三区免费 | 长腿校花无力呻吟娇喘的视频| 337p日本欧洲亚洲大胆色噜噜| 激情乱码一区二区三区| 老熟女老女人国产老太| 中国女人内谢69xxxx免费视频| 欧洲在线一区| 在线视频一区二区观看| 午夜福利影院成人影院| a级毛片无码久久精品免费 | 国产亚洲女在线线精品| 国产三级精品三级在专区中文 | 国产精品第1页在线观看| 日本成人三级视频网站| 美丽的小蜜桃在线观看| 首页 综合国产 亚洲 丝袜| 久久久伊人影院| 国产精品二区三区在线观看| 国产成人a级毛片| 欧美性狂猛xxxxx深喉| 无码区a∨视频体验区30秒 | 亚洲一区二区三区毛片| 亚洲av色影在线| 国产欧美亚洲精品a| 9丨精品国产高清自在线看| 久久精品亚洲国产av网站| aⅴ精品无码无卡在线观看| 国产成人国产在线观看入口| 精品蜜桃av一区二区三区| 久久精品中文字幕女同免费| 日本公妇在线观看中文版| 精品一区二区三区四区少妇 | 国产高清一区二区三区四区色| 亚洲成av人片在线观看ww| 免费精品美女久久久久久久久久| 国产女人av一级一区二区三区 | 日本道免费精品一区二区| 免费在线国产不卡视频| 亚洲精品v欧洲精品v日韩精品| 精品国产高清自在线99| 亚洲国产av精品一区二|