亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于k-means算法實(shí)現(xiàn)商品的聚類研究

        2020-06-22 13:23:17張一帆胡佳浩李依橋
        關(guān)鍵詞:means算法機(jī)器學(xué)習(xí)

        張一帆 胡佳浩 李依橋

        摘要:商品的數(shù)量非常大,需要按照一定的標(biāo)準(zhǔn)分為k類,如何把眾多數(shù)據(jù)對(duì)象,分為合適k類商品,成為數(shù)據(jù)分析中的一個(gè)研究問題。本文主要闡述了該模型的具體實(shí)現(xiàn)過程,主要包括數(shù)據(jù)采集、數(shù)據(jù)歸一化處理、構(gòu)造算法模型、評(píng)估算法模型。通過采用實(shí)例數(shù)據(jù)集進(jìn)行模型的訓(xùn)練和測(cè)試,實(shí)驗(yàn)結(jié)果表明:該模型能較準(zhǔn)確的進(jìn)行商品對(duì)象的分類,測(cè)試誤差較小。

        關(guān)鍵詞:機(jī)器學(xué)習(xí);k-means算法;Python

        中圖分類號(hào):TP311.13? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1007-9416(2020)04-0000-00

        0引言

        如今網(wǎng)站的快速發(fā)展,人們的生活和工作都離不開網(wǎng)絡(luò)。人們的生活節(jié)奏也在逐漸加快,工作越來(lái)越忙了。網(wǎng)購(gòu)網(wǎng)站吸納了眾多的群眾的參與,積累了大量的用戶資源。而且我國(guó)廣大的女性群體為網(wǎng)購(gòu)網(wǎng)站提供了良好的用戶基礎(chǔ)[1]。一個(gè)好的網(wǎng)購(gòu)網(wǎng)站可以帶運(yùn)輸?shù)榷喾N產(chǎn)業(yè)的發(fā)展,但是目前的網(wǎng)購(gòu)網(wǎng)站對(duì)用戶的數(shù)據(jù)處理有時(shí)候不夠準(zhǔn)確,商品分類標(biāo)準(zhǔn)不夠準(zhǔn)確。通過對(duì)網(wǎng)站數(shù)據(jù)進(jìn)行分析,采用k-means算法較好的完成商品配對(duì),為網(wǎng)站用戶提供較好的服務(wù)。

        1 K-means算法

        K均值(K-Means)算法是無(wú)監(jiān)督的聚類方法,實(shí)現(xiàn)起來(lái)比較簡(jiǎn)單,聚類效果也比較好,因此應(yīng)用很廣泛。K-Means算法針對(duì)不同應(yīng)用場(chǎng)景,有不同方面的改進(jìn)。我們從最傳統(tǒng)的K-Means算法講起,然后在此基礎(chǔ)上介紹初始化質(zhì)心優(yōu)化K-Means++算法,距離計(jì)算優(yōu)化Elkan K-Means算法和大樣本情況下Mini Batch K-Means算法[2]。

        我們給定一個(gè)數(shù)據(jù)集D,以及要?jiǎng)澐值拇財(cái)?shù)k,就能通過該算法將數(shù)據(jù)集劃分為k個(gè)簇。一般來(lái)說(shuō),每個(gè)數(shù)據(jù)項(xiàng)只能屬于其中一個(gè)簇。具體方法可以這樣描述:

        (1)假設(shè)數(shù)據(jù)集在一個(gè)m維的歐式空間中,我們初始時(shí),可隨機(jī)選擇k個(gè)數(shù)據(jù)項(xiàng)作為這kk個(gè)簇的形心Ci,i∈{1,2,…k},每個(gè)簇心代表的其實(shí)是一個(gè)簇,也就是一組數(shù)據(jù)項(xiàng)構(gòu)成的集合。然后對(duì)所有的n個(gè)數(shù)據(jù)項(xiàng),計(jì)算這些數(shù)據(jù)項(xiàng)與Ci的距離(一般情況下,在歐式空間中,數(shù)據(jù)項(xiàng)之間的距離用歐式距離表示)。比如對(duì)于數(shù)據(jù)項(xiàng)Dj,j∈{1,…n},它與其中的一個(gè)簇心Ci最近,則將Dj歸類為簇Ci[3]。

        (2)通過上面這一步,我們就初步將DD劃分為k個(gè)類了?,F(xiàn)在重新計(jì)算這k個(gè)類的形心。方法是計(jì)算類中所有數(shù)據(jù)項(xiàng)的各個(gè)維度的均值。這樣,構(gòu)成一個(gè)新的形心,并且更新這個(gè)類的形心。每個(gè)類都這樣計(jì)算一次,更新形心。

        (3)對(duì)上一步計(jì)算得到的新的形心,重復(fù)進(jìn)行第(1),(2)步的工作,直到各個(gè)類的形心不再變化為止[4]。

        2分類實(shí)現(xiàn)

        本次使用的樣本數(shù)據(jù)一共有300行,對(duì)它們進(jìn)行數(shù)據(jù)分類。分類過程具體實(shí)現(xiàn)分為四個(gè)步驟,分別是采樣數(shù)據(jù)、樣本數(shù)據(jù)可視化、數(shù)據(jù)分類,顯示分類視圖。

        2.1獲取數(shù)據(jù)

        我們獲取300個(gè)樣本數(shù)據(jù),同時(shí)做成表格,代碼如下:

        import pandas as pda

        import numpy as npy

        import matplotlib.pylab as pyl

        import pymysql

        conn=pymysql.connect(host="127.0.0.1",user="root",passwd="root",db="tb")

        sql="select price,comment from goods limit 300"

        dataf=pda.read_sql(sql,conn)

        x=dataf.iloc[:,:].as_matrix()

        2.2模型分類

        我們讓300個(gè)樣本數(shù)據(jù)劃分為不同的類別,該部分的核心代碼如下所示:

        from sklearn.cluster import KMeans

        kms=KMeans(n_clusters=2)

        y=kms.fit_predict(x)

        print(y)

        for i in range(0,len(y)):

        if(y[i]==0):? ? ? ? pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"*r")

        elif(y[i]==1):? ? ? ? pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"sy")

        elif(y[i]==2): pyl.plot(dataf.iloc[i:i+1,0:1].as_matrix(),dataf.iloc[i:i+1,1:2].as_matrix(),"*k")

        pyl.show()

        2.3分類結(jié)果

        對(duì)于我們的測(cè)試數(shù)據(jù)的分類結(jié)果,我們首先標(biāo)每類數(shù)據(jù),黃色方塊代表第一類,黑色五角代表第二類,紅色五角代表第三類。為了更直觀的的理解樣本數(shù)據(jù),數(shù)據(jù)采用Matplotlib庫(kù)進(jìn)行繪圖分析,如圖1所示。

        3結(jié)語(yǔ)

        本文通過采用k-means算法對(duì)商品數(shù)據(jù)進(jìn)行分析,采用Python數(shù)據(jù)可視化庫(kù)中的函數(shù)和Matplotlib庫(kù)完成對(duì)數(shù)據(jù)的分類。通過測(cè)試結(jié)果,分類結(jié)果達(dá)到了相對(duì)的平均,基本能夠滿足我們的要求。

        參考文獻(xiàn)

        [1]魏建東.K-means初始化算法研究[D].南京:南京理工大學(xué),2015.

        [2]宋建林.K-means聚類算法的改進(jìn)研究[D].合肥:安徽大學(xué),2016.

        [3]李衛(wèi)平.對(duì)k-means聚類算法的改進(jìn)研究[J].中國(guó)西部科技,2010(24):49-50.

        [4]劉越.K-means聚類算法的改進(jìn)[D].桂林:廣西師范大學(xué),2016.

        收稿日期:2020-03-15

        基金項(xiàng)目:2019年省級(jí)大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目:ID3算法在網(wǎng)絡(luò)購(gòu)物滿意度預(yù)測(cè)研究中的應(yīng)用(S201910722012)。

        作者簡(jiǎn)介:張一帆,男,陜西渭南人,本科,研究方向:軟件工程。

        Research on Commodity Clustering Based on Kmeans Algorithm

        ZHANG Yi-fan, HU Jia-hao, LI Yi-qiao

        (Computer College of Xianyang Normal University, Xianyang Shaanxi 712000)

        Abstract:The quantity of commodities is very large, which needs to be divided into k categories according to certain standards. How to divide a large number of data objects into appropriate K categories of commodities has become a research problem in data analysis. This paper mainly describes the specific implementation process of the model, including data collection, data normalization, algorithm model construction, evaluation algorithm model. Through the training and testing of the model with the case data set, the experimental results show that the model can classify the commodity objects accurately, and the test error is small.

        Keywords: machine learning;k-means algorithm;Python

        猜你喜歡
        means算法機(jī)器學(xué)習(xí)
        基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
        基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
        前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
        基于支持向量機(jī)的金融數(shù)據(jù)分析研究
        基于K—Means聚類算法入侵檢測(cè)系統(tǒng)研究
        基于Weka的Apriori算法在原油產(chǎn)量預(yù)測(cè)中的應(yīng)用
        基于HSI顏色空間的小麥粉精度自動(dòng)識(shí)別研究
        基于聚類的Web日志挖掘
        亚洲无线码1区| 九九精品国产亚洲av日韩 | 日本熟女人妻一区二区| 一区二区三区日韩毛片| 亚洲成人av在线第一页| 影音先锋女人aa鲁色资源| 综合网自拍| 魔鬼身材极品女神在线| 亚洲成人福利在线视频| 人妻少妇精品无码专区动漫| 东北无码熟妇人妻AV在线| 在线免费观看亚洲天堂av| 少妇免费av一区二区三区久久 | 欧美性猛交xxxx乱大交3| 国产精品区一区二区三在线播放| 黄片亚洲精品在线观看| 午夜无码一区二区三区在线观看| 久久无码人妻精品一区二区三区| 亚洲欧美在线视频| 蜜桃成熟时日本一区二区| 中文字幕亚洲精品无码| 日韩精品无码区免费专区 | 中国人妻与老外黑人| 欧美日韩成人在线| 国内精品熟女一区二区| av天堂精品久久综合网| 风间由美性色一区二区三区| 亚洲天天综合色制服丝袜在线| 国产在线视频网友自拍| 亚洲精品www久久久久久| 色丁香久久| 国产无套粉嫩白浆内精| 久久久亚洲av波多野结衣| 亚洲欧美日韩综合久久| 亚洲精品综合在线影院| 一区二区黄色在线观看| a级毛片成人网站免费看 | 精品久久久久久中文字幕大豆网| 午夜av内射一区二区三区红桃视 | 蜜桃av福利精品小视频| 国产午夜av秒播在线观看|