求文星,李 超
(安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030)
隨著人工智能技術(shù)的發(fā)展,以現(xiàn)代化工業(yè)為主要依托的機器人技術(shù)越來越多地應用于軍事國防、科教文娛等領域,形成獨立學科,一個智能機器人改變制造模式和生活模式的時代已經(jīng)到來。人工智能對各行各業(yè)都有重要應用,學者對于智能機器人的發(fā)展前景普遍持樂觀態(tài)度,認為其發(fā)展方向多維且潛力巨大。楊娟、陳小紅[1]等認為,智能機器人市場需求持續(xù)增加,機器人與信息技術(shù)深度融合,向模塊化、智能化和系統(tǒng)化方向發(fā)展;石征、吳難[2]等認為,機器人性能將不斷提高,控制系統(tǒng)不斷完善,傳感器融合技術(shù)不斷成熟,向著仿生性方向發(fā)展。
本文通過對智能機器人國內(nèi)、安徽省發(fā)展現(xiàn)狀以及相關研究的梳理[3~5],以供給和需求作為切口,通過實地問卷調(diào)查和網(wǎng)上數(shù)據(jù)爬取,采用機器學習的方法,進行線上線下家用智能機器人消費研究。具體而言,線下主要針對安徽省蚌埠市區(qū)居民,調(diào)查其對家用智能機器人消費意愿和需求類型;線上主要針對大型網(wǎng)購平臺京東商城的消費數(shù)據(jù),分析現(xiàn)階段家用智能機器人熱銷類型及體驗評價,為相關企業(yè)、研發(fā)部門有關家用智能機器人的種類研發(fā)、功能探索提供一定借鑒,打造更好的智能家居生活服務,以滿足人民日益增長的中高端消費和個性化消費等消費升級需求。
1.調(diào)查對象
問卷調(diào)查主要針對蚌埠市區(qū)(不包括三縣)四個區(qū)12個鄉(xiāng)、鎮(zhèn)、街道市民,采用區(qū)域分層取樣與多階段抽樣中的三階段抽樣相結(jié)合的抽樣方法,根據(jù)預調(diào)研有效問卷回收率90%,并結(jié)合實際的調(diào)查情況和團隊的人力物力資本,以及理論計算所得的樣本容量410份,考慮問卷損壞、無效等人為因素,確定最終問卷量為450份。在調(diào)查過程中已進行人為篩選,主動挑選對家用智能機器人感興趣的人群進行訪問。
網(wǎng)購數(shù)據(jù)主要是從最大的網(wǎng)購平臺之一——京東商城,以“家用智能機器人”為關鍵詞爬取相關商品信息,共4 082個產(chǎn)品,228 960條評論。
2.調(diào)查方法
此次調(diào)查主要采取線上線下相結(jié)合的方式,并根據(jù)各階段不同目標運用四種調(diào)研方法。具體調(diào)查方法如下:(1)文案調(diào)研。為了解當代最新家用智能機器人類型、功能[6~18],在中國知網(wǎng)、維普等中、外文檢索庫中,搜索與之相關的文獻,進行研讀總結(jié),得出研究框架并設計問卷。(2)預調(diào)研法。為減小誤差和保證問卷具有較好的信度和效度,采取街頭攔截面訪。結(jié)合調(diào)查中出現(xiàn)的問題、受訪者建議對問卷進行修改完善,以確定最終問卷。(3)實地調(diào)研。為保證研究的真實有效性,調(diào)查主要采取實地訪談。按各區(qū)域樣本量的分配,在公共場所隨機攔截志愿者做訪問。(4)數(shù)據(jù)爬蟲。為了解全國消費者對家用智能機器人的消費需求,綜合考慮各種因素,選取了較具代表性的京東網(wǎng)購平臺,爬取相關數(shù)據(jù),進行整理分析、歸納總結(jié),作為對實地調(diào)研的重要補充。
3.數(shù)據(jù)整理
采用機器學習方法“決策樹”填補缺失值,并利用信度檢驗和效度檢驗來檢測問卷設計的合理性。通過相關統(tǒng)計軟件的計算,克朗巴哈系數(shù)為0.920,KMO值為0.716,Bartlett檢驗的p值為0.000<0.05,說明此次調(diào)查問卷信度較好,具有結(jié)構(gòu)效度。
1.樣本概況
表1樣本基本情況分布表
受訪對象中女性稍多于男性,女性通常在家居配置方面擁有更多的決策權(quán),因此側(cè)重于考慮女性的意見;主要的年齡群體為21-30歲,該群體將會是家用智能機器人消費的主力軍;婚姻情況中,大部分家庭構(gòu)成較為龐大,對家居服務有更多元化的需求;調(diào)查對象整體學歷水平較高,符合社會現(xiàn)階段及未來的發(fā)展趨勢;關于職業(yè),就業(yè)者和即將就業(yè)的學生達90%;居住狀況中,大部分屬于大家庭生活。由此可見受訪群體都比較貼合本次調(diào)研的要求。
2.消費意愿
圖1 線下購買意愿圖
此次調(diào)查中(如圖1),僅有28.04%的受訪群體表明有購買意愿。由于調(diào)查設于經(jīng)濟水平較低的蚌埠市,群眾對家用智能機器人的消費潛力有待挖掘,此意愿分布亦符合實際情況。為進行各省市家用智能機器人潛在消費能力推廣探索,以調(diào)查中的個人屬性、家庭屬性和了解情況三個大類9項細化指標作為自變量,消費意愿作為因變量,構(gòu)造預測模型。采用logistic回歸、決策樹、隨機森林和支持向量機以及混合模型等機器學習方法進行模型構(gòu)造,擇其最優(yōu),并篩選影響顯著的因素?;旌夏P褪侵妇C合決策樹、隨機森林和支持向量機三個模型,以少數(shù)服從多數(shù)的規(guī)則來確定預測結(jié)果。
五類模型預測準確率見表2:
表2 預測準確率結(jié)果表
所有模型中,隨機森林模型的預測效果是最好。同時,探究對隨機森林模型預測效果影響最大的因素。
圖2 消費意愿的隨機森林模型影響因素
影響因素分析圖中分別顯示了mean decrease accuracy和mean decrease gini兩個指標值。mean decrease accuracy是直接測量每種特征對模型預測準確率的影響,指標值越大,影響越大。mean decrease gini是基于節(jié)點不純度降低的特征選擇,該值越大表示該變量的重要性越大。從消費意愿的隨機森林模型中,可知,“性別”的兩指標值均最大,說明“性別”是所有變量中最重要的,同時也是對預測準確性影響最大的?!皯艏钡膍ean decrease accuracy指標值最小,即“戶籍”對模型預測準確性影響最?。弧奥殬I(yè)”的mean decrease gini值最小,即重要性程度最低。
3.需求類型
圖3 線上線下需求類型對比條形圖
對比線上線下的需求類型(如圖3),線上主要消費類型為兒童陪伴型;線下主要需求類型為家政服務型,其他類型占比相對均衡。線下數(shù)據(jù)主要表現(xiàn)了受訪對象想要購買的機器人類型;而線上數(shù)據(jù)則表明,在實際購買時,消費群體往往選擇購買兒童陪伴型機器人,對比可得,大眾群體往往更愿意為孩子花錢。
以相同的細化指標作為自變量,對需求類型(選擇哪一類型機器人)分別構(gòu)造五類預測模型。預測準確率見表3:
表3 預測準確率結(jié)果表
隨機森林模型的預測效果最好,進行影響因素分析。由于文章篇幅有限,整理六類家用智能機器人隨機森林模型的關鍵因素(見表4)。兒童陪伴型和教學輔導型,“婚姻狀況”因素對預測效果影響較大,重要程度最高,“收入”的影響程度較低,“戶籍”的重要性最低。老人陪伴與看護型和殘助型均是“居住狀況”因素影響最大,重要性較高,其中老人看護型模型是“戶籍”影響程度最低,最不重要,而殘助型則是“了解程度”影響最小,最不重要。住宅安全與監(jiān)視型和家政服務型,“年齡”影響最大,較重要,“戶籍”影響最小,最不重要。
表4隨機森林模型關鍵因素表
4.體驗評論
對于網(wǎng)購數(shù)據(jù)的體驗評價,采用文本分析。關于網(wǎng)購評價的詞頻共現(xiàn)(見表5),與“機器人”關聯(lián)最緊密的詞匯為“智能”“學習”“功能”;與“質(zhì)量”“功能”“服務”“物流”聯(lián)系最緊密的詞匯均為積極詞匯,網(wǎng)購群體大部分認為現(xiàn)階段消費的智能機器人質(zhì)量較好,功能強大、齊全,客服熱情周到,物流比較快、很給力。
表5 評論詞頻共現(xiàn)表
圖4 評論詞云圖
對所有的消費評論進行刪除停用詞、提取關鍵詞、繪制詞云圖(如圖4),發(fā)現(xiàn)好評居多,均為積極評價詞,還有一些“愛不釋手”“齊全”“豐富”等體驗評價,都體現(xiàn)了家長和孩子對兒童陪伴型智能機器人非常滿意。
5.未來展望
采用主題建模和情感分析對問卷中未來展望的主觀題進行文本挖掘。對于問卷中“對智能機器人未來十年的發(fā)展看法”的主題建模,概括得出如下三個主題(見表6):一是人類社會在不久將來是智能時代,機器人的使用會更常見;二是人們對科技的發(fā)展有一定的需求;三是人也將越來越懶。
表6 未來展望主題詞
圖5 理由詞頻條形圖
情感分析中(如圖5),頻數(shù)最大的十個詞匯中,“不夠”“難題”“未知”三個消極詞均出現(xiàn)兩次,“成熟”“成為”“發(fā)達”“發(fā)展”“進步”“希望”和“迅速”七個積極詞匯,“發(fā)展”出現(xiàn)六次,“發(fā)達”和“進步”出現(xiàn)四次,其余均出現(xiàn)兩次。無論從積極詞、消極詞占比,還是從兩類詞出現(xiàn)次數(shù),都表明受訪對象對家用智能機器人未來發(fā)展持積極的態(tài)度。
本次市場調(diào)查分線上線下兩部分,線下以蚌埠市區(qū)居民為調(diào)查對象,從消費需求的角度探索了關于家用智能機器人的消費意愿、需求類型和未來展望,線上以智能機器人網(wǎng)購數(shù)據(jù)為分析內(nèi)容,從供給市場角度探索了現(xiàn)階段的智能機器人市場、熱銷機器人類型、產(chǎn)品體驗評價等?;诒疚姆治?,提出幾點相應的建議:
第一,現(xiàn)階段實地調(diào)查中最愿意購買的是家政服務型機器人,而網(wǎng)購數(shù)據(jù)顯示購買最多的是兒童智能陪伴型機器人。目前智能機器人市場總需求大但有效需求不足,由于現(xiàn)有產(chǎn)品智能化程度不夠,功能類型單調(diào),人機交互體驗效果不佳,企業(yè)研發(fā)部門急需突破技術(shù)瓶頸,可以針對以上的技術(shù)瓶頸采取些許有效措施。
第二,所有機器學習方法構(gòu)建的預測模型中,隨機森林模型的預測效果最好。可進一步將預測效果最好的隨機森林模型推廣應用于全國各省市,預測全國各地的各類家用智能機器人的有效需求,為企業(yè)市場部門提供一定的參考,進一步擴大市場。
第三,企業(yè)銷售部門可參考隨機森林模型的重要影響因素,從用戶需求個性化、創(chuàng)新化、多樣化等特點出發(fā),加強對智能機器人行業(yè)的知識學習,加大市場調(diào)研的深度與廣度,提高產(chǎn)品與需求之間的匹配度,深刻把握市場動向,推陳出新。
第四,人們對智能機器人未來發(fā)展大多持積極看好的態(tài)度,認為存在較大的市場需求。政府部門應當高度重視智能機器人產(chǎn)業(yè)的發(fā)展,根據(jù)設定的戰(zhàn)略目標制定相關政策,提供有效的市場監(jiān)管和安全保障,加大對相關產(chǎn)業(yè)的投資和扶持力度,完善與新興企業(yè)間的溝通機制,打造開放高效的協(xié)同體系。