劉寶順,陳越
基于評論文本的產(chǎn)品意象參數(shù)化評價方法
劉寶順,陳越
(河北工業(yè)大學,天津 300132)
將評論文本挖掘方法與設計調(diào)研的多樣化需求相匹配,將文本挖掘結(jié)果與設計方案的參數(shù)化分析與評價相結(jié)合。通過網(wǎng)絡爬蟲獲取購物網(wǎng)站中的產(chǎn)品評論文本,明確調(diào)研目標,使用意象詞匯進行描述,采用關鍵詞提取與詞匯相似度計算方法,計算產(chǎn)品在調(diào)研目標上的意象傾向,并進行參數(shù)化表示。分類提取產(chǎn)品的特征參數(shù),使用BP神經(jīng)網(wǎng)絡構建產(chǎn)品特征參數(shù)與意象參數(shù)間的映射關系,形成產(chǎn)品評論模型,將產(chǎn)品特征參數(shù)輸入映射關系中,得到調(diào)研目標上的意象參數(shù),實現(xiàn)產(chǎn)品意象的參數(shù)化挖掘與評價。以手機為例進行驗證,所得意象參數(shù)預測值與真實值之間的差異均值分別為0.016 0、-0.014 6、-0.013 7,評價模型較為有效。所提方法能夠從評論文本中有效地提取意象傾向,并表示為調(diào)研目標上的傾向參數(shù),加強了產(chǎn)品評論文本挖掘與設計調(diào)研之間的關系,提高了文本挖掘結(jié)果的可理解性。
產(chǎn)品評論;文本挖掘;設計調(diào)研;感性工學;BP神經(jīng)網(wǎng)絡
隨著互聯(lián)網(wǎng)浪潮的來臨,網(wǎng)絡購物也日益普及,目前已成為消費者選購商品的重要手段。在網(wǎng)絡購物過程中,相應產(chǎn)品的已有評論是影響消費者購物決策的重要因素,因此,分析在線商城中消費者的評論文本,以此對產(chǎn)品進行改進,可以提高產(chǎn)品銷量。
文本挖掘是數(shù)據(jù)挖掘領域的一個重要分支,指從大量的文本集合或語料庫中抽取具有潛在實用價值的模型或知識。文本挖掘具有多學科融合的特點,涵蓋信息技術、文本分析、統(tǒng)計學、數(shù)據(jù)可視化等多個方面[1]。
文本挖掘作為一種文本分析技術,被廣泛應用于情感分析、自動摘要、對話系統(tǒng)等場景中,也有學者將文本挖掘方法應用于產(chǎn)品評論文本的分析挖掘中,如郝玫等[2]結(jié)合中文句法關系以及特征與觀點的匹配關系,使用產(chǎn)品特征樹來分析同類產(chǎn)品的觀點差異;金吉瓊等[3]通過主題模型對消費者評論文本的主題進行分類,分析了國內(nèi)消費者對電子煙的關注點;趙志濱等[4]使用細粒度情感分析方法,分析了消費者評論文本中各個維度的情感傾向,以及消費者對產(chǎn)品整體的情感傾向。這些研究表明,文本挖掘能夠有效提取產(chǎn)品評論文本中所包含的產(chǎn)品體驗信息。
現(xiàn)有的產(chǎn)品評論文本挖掘方法大多是對評論文本進行分析,難以滿足設計調(diào)研的多樣化需求。同時,文本挖掘的結(jié)果主要通過詞匯的形式進行表達,難以進一步參與設計方案的參數(shù)化分析與評價。
感性工學起源于日本,指將較為模糊的感性需求及意象轉(zhuǎn)化為細節(jié)設計的形態(tài)要素[5]。感性工學專家系統(tǒng)又被稱為KE模型,其核心是產(chǎn)品特征與意象之間的關聯(lián)關系,并以此實現(xiàn)感性意象與產(chǎn)品特征之間的轉(zhuǎn)換[6],從而將消費者對現(xiàn)有產(chǎn)品的體驗信息融入新產(chǎn)品的設計中。
目前,感性工學被廣泛應用于產(chǎn)品的分析與設計指導,如王天賦等[7]采用語義差異分析法和Likert心理量表分析法,從造型、色彩、材質(zhì)、功能和體驗5個方面進行了感性意象分析,推導出了汽車內(nèi)飾設計需求與形態(tài)的關聯(lián)關系;付成杰等[8]分析了目前的鏡框造型要素,調(diào)研了使用者對鏡框的感性認知,采用了因子分析等方法篩選了符合意象的感性詞匯,最后運用灰關聯(lián)分析法,得到了造型與產(chǎn)品意象的關聯(lián)程度;趙艷云等[9]以表帶材質(zhì)為例進行了調(diào)查分析,以感性工學為理論依據(jù),量化了用戶對材質(zhì)的感性認知,構建了材質(zhì)意象的決策模型,并驗證了方法的有效性。這些研究表明,感性工學能夠有效分析用戶感性意象與設計要素之間的關系。
基于感性工學方法,通過分析產(chǎn)品體驗信息與產(chǎn)品設計要素間的映射關系,形成KE模型,對新生成的產(chǎn)品進行評價,從而將消費者的評價數(shù)據(jù)應用于產(chǎn)品后續(xù)的設計參考。
現(xiàn)有產(chǎn)品評論文本挖掘方法難以滿足設計調(diào)研的多樣化需求,文本挖掘結(jié)果難以進一步參與設計方案的參數(shù)化分析與評價。針對上述問題,基于感性工學理論,結(jié)合關鍵詞提取、BP神經(jīng)網(wǎng)絡等方法,提出了基于評論文本的產(chǎn)品意象參數(shù)化挖掘與評價方法,主要步驟為產(chǎn)品評論文本獲取、目標驅(qū)動的產(chǎn)品意象參數(shù)化挖掘、產(chǎn)品特征參數(shù)提取、基于BP神經(jīng)網(wǎng)絡的KE模型構建、基于KE模型的產(chǎn)品評論。方法流程見圖1。
圖1 方法流程
產(chǎn)品評論文本主要分散于各個購物網(wǎng)站的相關產(chǎn)品頁面中,需要對其進行收集與匯總。網(wǎng)絡爬蟲是一種方便高效的網(wǎng)頁信息獲取工具。網(wǎng)絡爬蟲按設定的規(guī)則抓取特定的網(wǎng)頁,再通過對網(wǎng)頁內(nèi)容的解析和提取來獲取文本信息[10],是目前常用的信息收集方式,因此,可通過爬蟲工具來獲取網(wǎng)絡購物網(wǎng)站中的評論文本。在得到相關產(chǎn)品的評論文本與產(chǎn)品信息后,對其進行整理與保存,以便后續(xù)進行分析。
為了保證產(chǎn)品評論文本挖掘的準確性,需要對獲取到的產(chǎn)品評論文本進行預處理。由于部分購物網(wǎng)站會對參與產(chǎn)品評論的用戶進行獎勵,所以部分消費者為了快速獲取相關獎勵會選擇復制他人的評論,導致獲取到的文本會出現(xiàn)大量的重復文本。為了保證評論文本的唯一性,減小重復評論造成的影響,需要對文本進行去重處理。隨后,對文本進行分詞處理,以便后續(xù)進行文本關鍵詞的提取。
首先,確定設計調(diào)研目標詞匯,將其作為產(chǎn)品評論文本挖掘與參數(shù)化表達的基準。設計調(diào)研目標一般由多個意象詞匯組合而成,若假設調(diào)研目標為,包含個感性意象,則設計調(diào)研目標:
形容詞通常被用于表達人的主觀感受,在產(chǎn)品評論文本中主要用來表示用戶對產(chǎn)品的態(tài)度。通過提取評論文本中形容詞性的關鍵詞,并將其作為用戶對產(chǎn)品的意象詞匯,相應的關鍵詞權重即意象詞匯的傾向,能夠反映消費者對產(chǎn)品的意象傾向。
TF-IDF由Salton[11]于1988年提出,是目前較為常用的無監(jiān)督文本提取方法。TF為詞頻,表示該詞條在文檔中的出現(xiàn)頻率。IDF是逆向文件頻率,表示該詞條在其他文檔中的區(qū)分能力[12]。通過TF與IDF的乘積運算,能有效得到詞條在文檔間的區(qū)分效果?;赥F-IDF算法,提取到的樣本感性意象詞匯:
最后,結(jié)合樣本意象關鍵詞權重參數(shù),對各個目標意象詞匯與樣本意象關鍵詞之間的相似度進行匯總,樣本感性意象表示如下:
如式(4)所示,產(chǎn)品評論文本意象挖掘結(jié)果被表示為設計調(diào)研目標上的傾向參數(shù),以此為基礎,能夠?qū)崿F(xiàn)以設計調(diào)研目標為基礎的產(chǎn)品意象參數(shù)化挖掘。
產(chǎn)品的色彩、形態(tài)、硬件配置等元素的提取方法,可按照是否由人工主觀判斷,劃分為基于人工的方式和基于參數(shù)化的方式[6]。人工提取方式包括形態(tài)分析法、類目層次法等,旨在通過研究員的主觀判斷,將產(chǎn)品元素進行拆解和編號,該類方式除產(chǎn)品形態(tài)外,還可對產(chǎn)品配置和服務等特征進行分析,適用范圍較廣?;趨?shù)化的方式包括參數(shù)模型法、曲線控制法等,通過對產(chǎn)品的特征進行描繪,得到連續(xù)型參數(shù),該類方式多用于分析產(chǎn)品的外觀細節(jié)。
基于參數(shù)化的提取方式要求產(chǎn)品特征較為統(tǒng)一,且無法提取配置類產(chǎn)品的特征參數(shù),因此,此次研究采用基于人工的處理方式。類目層次法對產(chǎn)品進行編號時,容易因?qū)蛹夑P系導致編號位數(shù)增長,在構建關聯(lián)關系時,容易對部分數(shù)值敏感型算法的構建精度產(chǎn)生不利影響。為了擴大產(chǎn)品特征參數(shù)提取的適用范圍,同時避免對后續(xù)關聯(lián)關系的構建產(chǎn)生不利影響,使用形態(tài)分析法獲取產(chǎn)品特征參數(shù),對各個類別的特征進行人工分類編號,得到的產(chǎn)品特征參數(shù):
神經(jīng)網(wǎng)絡是一種機器學習模型,通過將感知器進行相互連接,形成一種類似人腦神經(jīng)元連接方式的網(wǎng)絡結(jié)構,常用于處理分類問題,以及輸入與輸出變量之間的關系問題等[13]。BP神經(jīng)網(wǎng)絡是指使用反向傳播算法(Back Propagation,BP)進行誤差校正以實現(xiàn)網(wǎng)絡訓練的神經(jīng)網(wǎng)絡,是目前使用范圍較廣的神經(jīng)網(wǎng)絡之一。
由于神經(jīng)網(wǎng)絡能夠自動學習數(shù)據(jù)中的知識與信息,并能夠利用神經(jīng)元之間的連接強度儲存所學到的信息,所以能夠自動逼近任何非線性函數(shù)[14],在產(chǎn)品設計研究中有著廣泛的應用,如Guo等[15]使用BP神經(jīng)網(wǎng)絡,分析了感性意象參數(shù)與求職網(wǎng)站設計要素之間的映射關系。BP神經(jīng)網(wǎng)絡通過輸入的數(shù)據(jù),可以自動學習數(shù)據(jù)間非線性相關關系的特點,能夠有效處理產(chǎn)品設計與感性工學專家系統(tǒng)的映射關系[16]。
BP神經(jīng)網(wǎng)絡一般包含輸入層、隱含層、輸出層,其中輸入層的神經(jīng)元數(shù)量一般與自變量的數(shù)量相等,輸出層的神經(jīng)元數(shù)量與因變量的數(shù)量相等,隱含層的數(shù)量:
BP神經(jīng)網(wǎng)絡一般通過梯度下降算法進行訓練:
在得到設計特征參數(shù)與產(chǎn)品意象參數(shù)的映射關系(前向式KE模型)后,可進行新產(chǎn)品的感性意象評價。首先,結(jié)合已有的各類產(chǎn)品特征中的編號依據(jù),對新產(chǎn)品的產(chǎn)品特征進行分類編號,得到新產(chǎn)品的產(chǎn)品特征參數(shù)。隨后,將得到的產(chǎn)品特征參數(shù)輸入KE模型中,輸出感性意象參數(shù)。
將計算得到的感性意象參數(shù)直接用于評價的效果不佳,需要與已有的樣本數(shù)值對比進行分析。為方便直觀地理解輸出的感性意象參數(shù),使用歸一化法進行數(shù)據(jù)處理,將數(shù)據(jù)統(tǒng)一映射到0~1,并將有量綱的數(shù)據(jù)轉(zhuǎn)化為無量綱的純數(shù)值[17]。歸一化的處理方式能保持原始數(shù)據(jù)排序不變,同時方便解讀及評價,因此,歸一化法常用于比較和評價指標處理。得到歸一化的數(shù)據(jù)處理結(jié)果后,可從數(shù)值直觀地感受到用戶的情感傾向:歸一值越接近1,代表消費者對應感性意象下的評價表現(xiàn)越好;歸一值越接近0,代表消費者對應感性意象下的評價表現(xiàn)越差。歸一化表達式:
通過代入產(chǎn)品特征參數(shù)來預測市場評價,能快速預測新產(chǎn)品的市場評價,從而確定新產(chǎn)品的宣傳方式和定價策略。另外,研究員可結(jié)合公司戰(zhàn)略設定產(chǎn)品評價傾向的目標,并不斷調(diào)整輸入的產(chǎn)品特征參數(shù),直至達到預定的產(chǎn)品評價目標。
手機是一種在生活中被廣泛使用的電子產(chǎn)品,同時也是網(wǎng)絡購物中的重要商品,有關的產(chǎn)品評論文本較為豐富,因此,此次研究選取手機作為驗證對象。為了避免不同品牌的印象造成的意象差異,因此,僅選定華為手機作為研究對象。首先,使用網(wǎng)絡爬蟲從京東商城中獲取40款近期尚在銷售的手機的評論文本,并將爬取到的數(shù)據(jù)進行分類保存。隨后,從互聯(lián)網(wǎng)上查找并保存所獲取到的手機的配置信息,結(jié)合配置信息對手機進行編號,將同一名稱、不同配置的手機視為不同的樣本,共計75個樣本。對各個樣本的評論文本進行預處理,刪除其中的重復文本,并使用Jieba工具包對其進行分詞處理。
在進行產(chǎn)品意象參數(shù)計算時,需要首先確定調(diào)研目標。選定手機中較為重要的3個感性意象作為調(diào)研目標,分別為“流暢”“清晰”“漂亮”。隨后,結(jié)合各個樣本編號所表示的機型,選取對應的評論文本,然后,使用TF-IDF算法提取各個樣本的關鍵詞。設定每個樣本評論文本中提取的關鍵詞數(shù)量為5,關鍵詞提取的部分結(jié)果見表1。
表1 關鍵詞提取結(jié)果(部分)
Tab.1 Key words extraction results (partial)
為了計算產(chǎn)品意象詞匯與調(diào)研目標詞匯之間的相似度,需要構建能夠表達部分語義關系的文本詞向量模型。對預處理后的文本進行匯總,使用word2vec工具構建詞向量模型,設定維度為50。以詞向量模型為基礎,對感性意象詞匯與調(diào)研目標詞匯進行參數(shù)化表示,通過式(3)計算感性意象關鍵詞與調(diào)研目標詞匯之間的相關度,通過式(4)計算相應樣本的感性意象參數(shù),所得到的感性意象參數(shù)見圖2。
圖2 感性意象參數(shù)分布
通過互聯(lián)網(wǎng)獲取75個樣本的配置信息,結(jié)合京東商城中手機的部分分類方式,對樣本的產(chǎn)品特征進行分類,見表2。得到的產(chǎn)品特征參數(shù)部分結(jié)果見表3。
由于實例中參與分析的產(chǎn)品特征有處理器、運行內(nèi)存、存儲容量、后置相機像素、前置相機類型、屏幕分辨率(短邊)、屏幕尺寸等7類,所以設定輸入層的神經(jīng)元數(shù)量為7。由于調(diào)研目標中的目標意象詞匯有3個,所以設定輸出層的神經(jīng)元數(shù)量為3。隨后,基于式(6)設定隱含層的神經(jīng)元數(shù)量為8,相應的BP神經(jīng)網(wǎng)絡模型結(jié)構見圖3。
結(jié)合輸入和輸出的數(shù)據(jù)特點及其取值范圍,通過多次優(yōu)選,設定輸入層、隱含層、輸出層的激活函數(shù)分別為tanh、tanh、relu,損失函數(shù):
在樣本中進行隨機抽樣,將總樣本的20%(15個)作為驗證集,剩余的樣本(60個)作為訓練集。使用訓練集樣本來訓練BP神經(jīng)網(wǎng)絡,由于神經(jīng)元數(shù)量較少,所以訓練次數(shù)也相應減少,設定訓練次數(shù)為200,損失函數(shù)值隨訓練次數(shù)的變化見圖4。
隨后,對所得BP神經(jīng)網(wǎng)絡的有效性進行驗證。將驗證樣本作為新的設計方案,將其產(chǎn)品特征參數(shù)依次輸入訓練完成的BP神經(jīng)網(wǎng)絡中,隨后,將輸出的各個調(diào)研目標意象詞匯上的預測參數(shù)與相應樣本的真實值進行對比,見圖5。經(jīng)過驗證得到預測值與真實值之間差異的均值分別為0.016 0、–0.014 6、–0.013 7。
表2 產(chǎn)品特征編號
Tab.2 Product feature number
表3 產(chǎn)品特征提取結(jié)果(部分)
Tab.3 Extraction results of product feature parameters (partial)
圖3 BP神經(jīng)網(wǎng)絡模型結(jié)構
圖4 損失函數(shù)值隨訓練次數(shù)變化情況
圖5 評價模型有效性驗證結(jié)果
根據(jù)圖5所示結(jié)果,結(jié)合預測值與真實值之間差異的均值大小,可以看出在3個調(diào)研目標意象上的預測值與真實值較為相近,評價模型能夠較為有效地對輸入的產(chǎn)品配置組合進行評價。
最后以測試樣本6為例,輸入產(chǎn)品特征參數(shù)后,在流暢、清晰、漂亮3個調(diào)研目標上的傾向參數(shù)值分別為0.276 5、0.363 3、0.328 7。對得到的數(shù)據(jù)與訓練樣本的參數(shù)值進行歸一化處理,通過式(8)得到的結(jié)果分別為0.462 6,0.632 2,0.735 9,可知該樣本在調(diào)研目標上的表現(xiàn)情況為:在流暢方面該樣本表現(xiàn)較差;在清晰方面該樣本表現(xiàn)一般;在漂亮方面該樣本表現(xiàn)較好。
若數(shù)值表現(xiàn)不符合新產(chǎn)品的戰(zhàn)略規(guī)劃,可設定產(chǎn)品評價的傾向目標,隨后逐步調(diào)整設計參數(shù),并輸入模型生成相應的意象參數(shù),不斷循環(huán)直至達到設計目標,完成新的方案設計。
網(wǎng)絡購物的普及產(chǎn)生了大量的產(chǎn)品評論文本,為產(chǎn)品評價提供了新的數(shù)據(jù)基礎。針對現(xiàn)有產(chǎn)品評論文本挖掘方法難以匹配設計調(diào)研的多樣化需求、文本挖掘結(jié)果難以進一步參與設計方案的參數(shù)化分析與評價等問題,提出了基于評論文本的產(chǎn)品意象參數(shù)化挖掘與評價方法。通過網(wǎng)絡爬蟲等方法獲取互聯(lián)網(wǎng)中的產(chǎn)品評論文本數(shù)據(jù),確定調(diào)研目標,通過關鍵詞提取與詞語相似度計算,對調(diào)研目標的產(chǎn)品意象進行參數(shù)化表示。分類提取產(chǎn)品配置參數(shù),使用BP神經(jīng)網(wǎng)絡構建產(chǎn)品評價模型,通過輸入產(chǎn)品配置來輸出產(chǎn)品在調(diào)研目標上的感性意象參數(shù),實現(xiàn)了產(chǎn)品意象的參數(shù)化挖掘與評價,以手機為例驗證該方法的有效性。該方法能夠從調(diào)研目標的角度對產(chǎn)品進行參數(shù)化評價,從而增強設計調(diào)研目標與產(chǎn)品評論文本挖掘間的聯(lián)系,使產(chǎn)品評論文本挖掘的有用性更高。同時,產(chǎn)品評論數(shù)據(jù)挖掘結(jié)果通過設計調(diào)研目標進行參數(shù)化表達,提高了文本挖掘結(jié)果的可理解性。此外,基于評論文本的感性意象參數(shù)化模型,能夠輔助設計方案的評價以及新設計的指導。
目前主要使用基礎的TF-IDF算法進行關鍵詞提取,主要針對產(chǎn)品整體來提取意象詞匯,在未來的研究中,需要對意象關鍵詞的提取方法進行深入研究,實現(xiàn)更細致的感性意象分析。此外,文中對所提方法在設計方案的優(yōu)選與迭代方面的研究尚不深入,有待后續(xù)進一步改進。
[1] 梅馨, 邢桂芬. 文本挖掘技術綜述[J].江蘇大學學報(自然科學版), 2003(5): 72-76.
MEI Xin, XING Gui-fen. On Technology of Document Mining[J]. Journal of Jiangsu University(Natural Science Edition), 2003(5): 72-76.
[2] 郝玫, 馬建峰. 在線評論中基于動態(tài)窗口提取特征觀點對的產(chǎn)品推薦模型[J]. 系統(tǒng)工程理論與實踐, 2018, 38(9): 2363-2375.
HAO Mei, MA Jian-feng. Product Recommendation Model Based on Dynamic Windows for Feature Opinion Pair Extraction in Online Reviews[J]. Systems Engineering-Theory & Practice, 2018, 38(9): 2363-2375.
[3] 金吉瓊, 劉鴻, 鄭賽晶. 基于在線評論文本挖掘技術的電子煙市場消費熱點分析[J]. 煙草科技, 2019, 52(12): 106-114.
JIN Ji-qiong, LIU Hong, ZHENG Sai-jing. Analysis of Consumption Hotspots of Electronic Cigarette Market Based on Online Comment Text Mining Technology[J]. Tobacco Science & Technology, 2019, 52(12): 106-114.
[4] 趙志濱, 劉歡, 姚蘭, 等. 中文產(chǎn)品評論的維度挖掘及情感分析技術研究[J]. 計算機科學與探索, 2018, 12(3): 341-349.
ZHAO Zhi-bin, LIU Huan, YAO Lan, et al. Research on Dimension Mining and Sentiment Analysis for Chinese Product Comments[J]. Journal of Frontiers of Computer Science and Technology, 2018, 12(3): 341-349.
[5] 譚傲楠, 李洪海. 產(chǎn)品情感化設計研究文獻綜述[J]. 設計, 2016(1): 74-75.
TAN Ao-nan, LI Hong-mei. A Summary of Product Emotional Design Researches[J]. Design, 2016(1): 74-75.
[6] 林麗, 張云鹍. 感性工學中的參數(shù)化設計方法關鍵技術研究現(xiàn)狀與展望[J]. 圖學學報, 2019, 40(5): 936-944.
LIN-Li, ZHANG Yun-kun. Key Technologies in Parametric Design Methods in Kansei Engineering: State of Art and Progress[J]. Journal of Graphics, 2019, 40(5): 936-944.
[7] 王天賦, 徐子豪. 基于感性工學的汽車駕駛空間內(nèi)飾優(yōu)化設計[J]. 包裝工程, 2020, 41(24): 98-103.
WANG Tian-fu, XU Zi-hao. Optimal Interior Design of Car Driving Space Based on Perceptual Engineering[J]. Packaging Engineering, 2020, 41(24): 98-103.
[8] 付成杰, 畢延剛, 沈?qū)W會. 基于感性工學的框架眼鏡造型意象研究[J]. 包裝工程, 2020, 41(2): 269-275.
FU Cheng-jie, BI Yan-gang, SHEN Xue-hui. The Shape Image of Frame Glasses Based on Kansei Engineering[J]. Packaging Engineering, 2020, 41(2): 269-275.
[9] 趙艷云, 邊放, 李巨韜. 基于感性工學的產(chǎn)品材質(zhì)意象研究[J]. 機械設計, 2015, 32(8): 117-121.
ZHAO Yan-yun, BIAN Fang, LI Ju-tao. Image Research of Product Material Based on Kansei Engineering[J]. Journal of Machine Design, 2015, 32(8): 117-121.
[10] 李德源. 電商在線評論的文本情感傾向性分析[D]. 長春: 吉林大學, 2019.
LI De-yuan. Emotional Inclination Analysis of E-com-merceOnline Commentary[D]. Changchun: Jilin University, 2019.
[11] SALTON G, BUCKLEY C. Term-weighting Approaches in Automatic Text Retrieval[J]. Pergamon, 1988, 24(5): .
[12] 黃承慧, 印鑒, 侯昉. 一種結(jié)合詞項語義信息和TF-IDF方法的文本相似度量方法[J]. 計算機學報, 2011, 34(5): 856-864.
HUANG Cheng-hui, YIN Jian, HOU Fang. A Text Similarity Measurement Combining Word Semantic Information with TF-IDF Method[J]. Chinese Journal of Computers, 2011, 34(5): 856-864.
[13] SU J N, JIANG P Y, LI H Q. Research on Kansei Image- driven Method of Product Styling Design[J]. International Journal of Product Development, 2009, 7(1): 113-126.
[14] PALIWAL M, KUMAR U A. Review: Neural Networks and Statistical Techniques: A Review of Applications[J]. Expert Systems with Applications, 2009, 36(1): 2-17.
[15] GUO F, LIU W L, CAO Y, et al. Optimization Design of a Webpage Based on Kansei Engineering[J]. Human Factors And Ergonomics In Manufacturing & Service Industries, 2016, 26(1): 110-126.
[16] 李永鋒, 朱麗萍. 基于神經(jīng)網(wǎng)絡的產(chǎn)品意象造型設計研究[J]. 包裝工程, 2009, 30(7): 88-90.
LI Yong-feng, ZHU Li-ping. Research on Product Image Form Design Based on Neural Network[J]. Packaging Engineering, 2009, 30(7): 88-90.
[17] 宋勇, 蔡志平. 大數(shù)據(jù)環(huán)境下基于信息論的入侵檢測數(shù)據(jù)歸一化方法[J]. 武漢大學學報(理學版), 2018, 64(2): 121-126.
SONG Yong, CAI Zhi-ping. Normalized Method of Intrusion Detection Data Based on Information Theory in Big Data Environment[J]. Journal of Wuhan University (Natural Science Edition), 2018, 64(2): 121-126.
Parametric Evaluation Method of Product Image Based on Review Text
LIU Bao-shun, CHEN Yue
(Hebei University of Technology, Tianjin 300132, China)
The paper aims to match the product review text mining method with the diversified demands of design research and to combine the text mining results with the parametric analysis and evaluation of design schemes. Product evaluation on the network shopping website is retrieved by crawlers. The research objectives are defined and described with imagery words. Keywords extraction and word similarity calculation method are used to calculate the image orientation of product on the research target, and are parameterized. Feature parameters are extracted by classification, and the mapping relationship between feature parameters and image parameters is constructed by BP neural network to form a product review model. The product feature parameters are input into the mapping relation to obtain the image parameters of the research objective, and realize the parametric mining and evaluation of product image. Taking mobile phone as an example, the mean differences between the predicted value and the real value of the image parameter output by the evaluation model are 0.0160, –0.0146 and –0.0137 respectivel, indicating that the evaluation model is effective.The method can effectively extract the image tendency from the evaluation text and express it as the tendency parameter on the research target, strengthen the relationship between product evaluation text mining and design research, and improve the intelligibility of text mining results.
product evaluation; text mining; design research; Kansei Engineering; BP neural network
TB472
A
1001-3563(2022)12-0142-07
10.19554/j.cnki.1001-3563.2022.12.016
2022–01–10
劉寶順(1982—),男,博士,教授,主要研究方向為設計藝術學。
責任編輯:馬夢遙