唐義杰
(安徽工商職業(yè)學(xué)院 會計學(xué)院,安徽 合肥 231131)
近幾年隨著我國經(jīng)濟(jì)發(fā)展和人們對于高質(zhì)量生活的要求,健康飲食觀念逐漸影響人們的選購行為,對于營養(yǎng)豐富的水產(chǎn)品的消費(fèi)也逐漸增加。水產(chǎn)品作為居民消費(fèi)的主要膳食之一,其消費(fèi)和生產(chǎn)主要還是在沿海省份。目前對蝦養(yǎng)殖尤其是淡水養(yǎng)殖遍布全國,早在2003年我國產(chǎn)量就已是世界第一,但因各地自然條件不同,產(chǎn)量分布比較集中,東南部沿海地區(qū)的廣東、廣西、海南、江蘇、浙江、福建、山東等7省份為主要生產(chǎn)基地,內(nèi)陸地區(qū)逐漸開始養(yǎng)殖。在此背景下,國內(nèi)外很多學(xué)者都做了大量實證研究。高金田等人利用面板數(shù)據(jù)對我國水產(chǎn)品市場的消費(fèi)需求和供給進(jìn)行了預(yù)測,結(jié)果顯示水產(chǎn)品作為一種生活必需品,未來其消費(fèi)市場會進(jìn)一步增長。蔡孟沿等人選取了三座具有代表性的城市根據(jù)調(diào)查數(shù)據(jù)分析了2007—2012年三地區(qū)的消費(fèi)變化。利用描述性統(tǒng)計方法分析了三地區(qū)的消費(fèi)差異,并解釋了變化的原因。上述研究都是基于時間序列數(shù)據(jù),重點(diǎn)在于分析水產(chǎn)品消費(fèi)發(fā)展變化過程及解釋原因。劉瑞新等人將水產(chǎn)品安全問題引入了研究中,同樣根據(jù)調(diào)查數(shù)據(jù),分析了江蘇省揚(yáng)州市居民選購水產(chǎn)品時主要考慮安全性和鮮活度。杜卓君以青島市為例,利用調(diào)查數(shù)據(jù)分析了水產(chǎn)品銷售和消費(fèi)情況后,認(rèn)為水產(chǎn)品市場需要培養(yǎng)市場認(rèn)知、強(qiáng)化渠道管理、保證產(chǎn)品質(zhì)量和提供多元化產(chǎn)品形式。梅新芝以購買行為理論作為基礎(chǔ),通過Logistic回歸模型對對蝦消費(fèi)行為數(shù)據(jù)做了細(xì)致的分析,結(jié)果表明消費(fèi)者的個體特征、對產(chǎn)品的了解程度、購買場所及購買頻率和購買目的都會對消費(fèi)者的購買行為產(chǎn)生顯著影響。
以上對我國水產(chǎn)品消費(fèi)市場的研究分析,主要是運(yùn)用了描述性統(tǒng)計和回歸等方法;主要調(diào)查對象是沿海主要城市,少有研究內(nèi)陸省份水產(chǎn)品消費(fèi)市場。文章主要針對東部新一線城市合肥的水產(chǎn)品消費(fèi)市場,選定對蝦這一特定消費(fèi)品種,利用設(shè)計好的調(diào)查問卷,分別走訪了合肥市內(nèi)4個市轄區(qū)的主要街道和小區(qū),針對合肥市民進(jìn)行了抽樣調(diào)查。主要目的是分析消費(fèi)者選購冷凍蝦制品和鮮蝦的行為特征和影響因素,利用R軟件通過決策樹模型分析了一些顯性的影響因素。針對不可觀測的潛在影響因素,文章通過因子分析結(jié)合聚類分析的方法,找出了5個潛在的影響因子,根據(jù)因子得分利用K-means算法將消費(fèi)者大致分成了5個類別,并結(jié)合實際消費(fèi)行為分析了這5類消費(fèi)者的不同特征。對了解合肥市水產(chǎn)品消費(fèi)者行為特點(diǎn),進(jìn)一步推動合肥市水產(chǎn)品市場可持續(xù)發(fā)展具有重要意義。
本次調(diào)查共收集了500份問卷,剔除填寫不完整樣本后還剩349份調(diào)查問卷,回收率69.8%。
其中一個因變量選購種類,自變量圍繞被調(diào)查者設(shè)計了基本信息、消費(fèi)習(xí)慣和消費(fèi)評價三個變量類型,共計19個自變量,如表1所示。
調(diào)查樣本數(shù)據(jù)分布情況如圖1、圖2所示。可以看到本次主要調(diào)查的是30~40歲的青壯年人群,其中城鎮(zhèn)人群各收入層級樣本量差別不明顯,農(nóng)村戶籍的人口中,較低收入人群占比較大。
表1 模型中變量定義
圖1 樣本數(shù)據(jù)年齡性別分布
圖2 樣本數(shù)據(jù)月收入戶籍分布
合肥市市場上銷售的水產(chǎn)品眾多,這里主要研究合肥市居民在選購對蝦時,選購鮮蝦或冷凍蝦的主要決策依據(jù)。對于消費(fèi)者購買行為決策的分析主要選擇機(jī)器學(xué)習(xí)中的CART決策樹算法。決策樹模型是基于樹結(jié)構(gòu)進(jìn)行決策的,一般一棵樹由根節(jié)點(diǎn)、狀態(tài)節(jié)點(diǎn)和若干葉子節(jié)點(diǎn)構(gòu)成。CART決策樹是使用基尼指數(shù)計算純度進(jìn)而劃分屬性的。首先根據(jù)目標(biāo)變量“購買種類”的不同取值,分別在不同類別中按照比例抽取調(diào)查數(shù)據(jù)的75%作為訓(xùn)練集數(shù)據(jù),剩下的25%作為測試集數(shù)據(jù)。為了便于解釋,決策樹的深度設(shè)置為4,然后在訓(xùn)練集中訓(xùn)練出模型后應(yīng)用于測試集中。分別檢查訓(xùn)練集的預(yù)測錯誤率為19.847%,測試集的預(yù)測錯誤率為16.092%,說明決策樹模型分類效果比較優(yōu)秀。決策樹分析結(jié)果如圖3所示。
由決策樹分析結(jié)果可以得出下列規(guī)則:①不常在外就餐的人群中,收入較低的女性在大型超市或者網(wǎng)上,一般購買冷凍蝦,在海鮮市場或者農(nóng)貿(mào)市場,一般購買鮮蝦;②不常在外就餐的人群中,收入較低的男性,一般購買鮮蝦;③不常在外就餐的人群中,收入較高者,一般購買鮮蝦;④經(jīng)常在外就餐的人群中,對于價格變化敏感者,在大型超市,一般買冷凍蝦,在其他市場買鮮蝦;⑤經(jīng)常在外就餐的人群中,對于價格變化不敏感者,一般購買鮮蝦。
圖3 決策樹分析結(jié)果
綜合以上規(guī)則,消費(fèi)頻率、月收入、性別、購買場所和購買意愿這幾個變量對消費(fèi)者選購行為具有重要影響。決策樹的一級決策根節(jié)點(diǎn)變量是消費(fèi)頻率,可見當(dāng)前消費(fèi)者的消費(fèi)行為仍受到消費(fèi)習(xí)慣的影響,消費(fèi)對蝦的頻率直接影響消費(fèi)者的購買行為。二級狀態(tài)節(jié)點(diǎn)變量分別是消費(fèi)者的月收入和購買意愿,可見當(dāng)前對蝦產(chǎn)品對于合肥市居民而言還是可選產(chǎn)品,購買需要綜合考慮收入和價格等因素。三級狀態(tài)節(jié)點(diǎn)變量是性別和購買場所,在選購商品中男性更易購買鮮蝦,女性則需要考慮其他因素且很容易選擇冷凍蝦制品。而作為內(nèi)陸城市——合肥,海鮮水產(chǎn)的購買行為與購買的場所直接相關(guān),大型超市由于完備的冷鏈物流和保鮮技術(shù),冷凍蝦制品更受青睞,而其他海鮮市場人們更加傾向選擇鮮蝦。
就決策樹最終的效果而言,模型最終將調(diào)查數(shù)據(jù)分成了七個組別。通過比較分類結(jié)果可知,分類最好的是第一、四、六、七組,占總體樣本的64%;分類不是特別好的是第二、三、五組,占總體樣本的36%??梢姏Q策樹模型輸出的規(guī)則可以適用比較多的樣本數(shù)據(jù)。就決策樹最終分類的類別而言,決策樹分析的結(jié)果中選擇購買鮮蝦【類別2】的規(guī)則數(shù)量有5條,選擇購買冷凍蝦制品的規(guī)則數(shù)量有2條,說明消費(fèi)者在同等條件下選擇購買鮮蝦的可能性更大。就決策樹最終分類結(jié)果的決策狀態(tài)節(jié)點(diǎn)個數(shù)而言,購買鮮蝦的平均狀態(tài)節(jié)點(diǎn)數(shù)為2.5個,購買鮮蝦的平均狀態(tài)節(jié)點(diǎn)數(shù)為1.8個,說明消費(fèi)者在選購時購買鮮蝦的平均思考時間更短,更容易作出決策。綜合而言,合肥市居民更偏好購買鮮蝦產(chǎn)品。
為了研究其他影響消費(fèi)者購買偏好的潛在因子,這里選擇因子分析方法對調(diào)查數(shù)據(jù)進(jìn)行分析。因子分析是一種數(shù)據(jù)簡化技術(shù),可以用少數(shù)幾個假想變量表示原始數(shù)據(jù)基本的數(shù)據(jù)結(jié)構(gòu)。這幾個假想變量能夠反映原來眾多變量的主要信息,原始的變量是可觀測的顯性變量,而假想變量是不可觀測的潛在變量,稱為因子。通過圖4,可以看到這里選擇4個或5個因子對數(shù)據(jù)進(jìn)行降維是比較合適的。還可以看出,第1個特征值較大,第2個特征值次之,減小幅度很大,形成一個“陡峭的山坡”,第4個特征值以后都很小,圖形趨于平緩,因此選擇5個公因子作為變量的降維結(jié)果。
圖4 因子分析碎石圖
這里的因子分析法選擇回歸方法計算因子得分,選擇公因子數(shù)量為5,默認(rèn)使用方差最大化對因子得分進(jìn)行旋轉(zhuǎn)。經(jīng)過計算,得到5個公因子在所有19個變量上的因子載荷矩陣,如表2所示。
表2 因子載荷矩陣
通過因子分析,可以得到5個通過變量無法觀測到的潛在影響因子,通過因子載荷可以將這5個因子分別命名為認(rèn)知因子、行為因子、基本因子、習(xí)慣因子、愛好因子。進(jìn)一步還可以根據(jù)各因子載荷和方差貢獻(xiàn)率計算所有樣本的因子得分。根據(jù)因子得分的結(jié)果,使用K-means聚類分析方法將因子得分矩陣數(shù)據(jù)大致聚類成了5個類別,如圖5所示。
通過觀察這5個類別分別在五個因子上的得分情況,其中類1人群在認(rèn)知因子上最大,在基本因子上最??;類2人群在基本因子上最大,在行為、愛好因子上最?。活?人群在行為因子上最大,在愛好因子上最??;類4人群在基本、習(xí)慣、愛好因子上最大;類5人群在認(rèn)知、行為因子上最小。這里定義最大或最小得分的因子為優(yōu)勢因子,其他因子為劣勢因子。結(jié)果如表3所示。
圖5 聚類分析各類別中心蜘蛛網(wǎng)
表3 消費(fèi)人群特征描述
由上述消費(fèi)人群特征描述表可以看出,第一類人群的類中心在認(rèn)知因子上得分較高,說明這類人對蝦制品有較清楚的認(rèn)識,實際消費(fèi)中對生鮮產(chǎn)品有明確的要求。但基礎(chǔ)因子得分較低,說明此類人群一般收入較低或月收入不高,此類用戶需要保持關(guān)注。第二類人群的類中心在基本因子上得分較高,說明其基本條件較好,有著較高收入和較好的教育背景。但其行為、愛好因子得分不高,說明此類人群沒有養(yǎng)成消費(fèi)蝦制品的習(xí)慣和愛好,需要重點(diǎn)挽留。第三類人群的類中心在行為因子上得分較高,說明此類人群精通挑選和網(wǎng)購。但其在愛好因子上得分偏低,說明此類人群還沒有形成消費(fèi)蝦制品的愛好,消費(fèi)頻率不高,需要重點(diǎn)發(fā)展。第四類人群的類中心在基本、愛好和習(xí)慣因子上得分都較高,說明這類人挑選蝦制品時更看重自己的愛好和購買習(xí)慣,需要繼續(xù)保持對此類消費(fèi)者的關(guān)注。第五類人群的類中心在認(rèn)知、習(xí)慣、行為因子上得分是最低的,說明此類消費(fèi)者基本沒有意識到蝦制品的營養(yǎng)價值,所以在日常消費(fèi)中幾乎不消費(fèi)蝦制品。但是愛好因子得分較高,說明此類用戶基本使用蝦類即食產(chǎn)品,對鮮蝦和冷凍蝦幾乎不選購。
最后,通過繪制分組堆積柱形圖對比五類人群在不同選購人群中的分布情況,如圖6所示。可以明顯看出,就選購冷凍蝦和鮮蝦兩種不同的選購行為而言,選購冷凍蝦的人群更有特點(diǎn)。在選購冷凍蝦的人群中,第一類的人群占有較大比重,其他四類人群占比不顯著,說明購買凍蝦的人群對對蝦有更清楚的認(rèn)知,更清楚自己的實際需求,低收入消費(fèi)者占有較大比重,可能是相對于鮮蝦,凍蝦更具價格優(yōu)勢。而購買鮮蝦的人群中第一類人群占比也是最大的,但第二、三、四類人群占比顯著高于選購冷凍蝦的人群,說明選購鮮蝦的人群大多有吃鮮蝦的習(xí)慣、愛好,或是精通網(wǎng)購挑選的人群。
圖6 不同購買選擇分組堆積柱形
文章根據(jù)調(diào)查數(shù)據(jù),首先運(yùn)用機(jī)器學(xué)習(xí)算法——決策樹模型,計算得出了兩類選購人群的不同選購規(guī)則。其一,同等條件下,合肥市居民更偏愛購買鮮蝦。選購冷凍蝦制品的消費(fèi)者需要思考更多的因素,購買鮮蝦制品的消費(fèi)者反而更容易做出選購決策。上述結(jié)果和合肥市居民的消費(fèi)習(xí)慣有很大關(guān)系,人們普遍更喜歡消費(fèi)新鮮蝦。其二,文章研究發(fā)現(xiàn)消費(fèi)頻率、月收入、性別、購買場所和購買意愿五個變量對消費(fèi)者選購行為起到了重要影響。消費(fèi)頻率直接影響人們的選購行為,可見培養(yǎng)用戶消費(fèi)習(xí)慣的重要性。另外收入和購買意愿也對選購產(chǎn)生了較大影響,這與合肥市居民的家庭收入關(guān)系較大。其次運(yùn)用探索性因子分析找到了5個潛在的影響因子,分別是認(rèn)知因子、行為因子、基本因子、習(xí)慣因子、愛好因子。最后根據(jù)因子得分?jǐn)?shù)據(jù)運(yùn)用聚類算法,大致將總體分成了5個類別。得出結(jié)論:挑選鮮蝦的消費(fèi)者中構(gòu)成更加多樣化,五類消費(fèi)者相對于冷凍蝦更喜歡鮮蝦。選購冷凍蝦制品的消費(fèi)者多是因為其價格更具優(yōu)勢。購買鮮蝦的消費(fèi)者占相當(dāng)大比重,是需要重點(diǎn)發(fā)展和重點(diǎn)挽留的人群。所以,合肥市場的鮮蝦仍然需要加大宣傳力度和宣傳手段。