司光耀, 王 凱, 李文強, 李 彥, 牟 亮
(四川大學 制造科學與工程學院, 四川 成都 610065)
基于大數(shù)據(jù)和粗糙集的產品需求分析方法研究
司光耀, 王 凱, 李文強, 李 彥, 牟 亮
(四川大學 制造科學與工程學院, 四川 成都 610065)
隨著產品互聯(lián)網(wǎng)時代的到來,針對傳統(tǒng)產品設計需求的獲取方法單一、實時性差、主觀性過強等問題,提出了一種基于大數(shù)據(jù)分析和粗糙集理論的產品需求分析方法.采用網(wǎng)路爬蟲技術,實時獲取存在于多種信息載體中的大體量用戶需求;利用大數(shù)據(jù)分析工具和粗糙集獲取不同語義層次的用戶需求類型的權重,并通過質量功能配置(quality function deployment, QFD)質量屋將用戶需求轉換為相應的工程設計參數(shù),從而為準確獲取反映用戶需求的產品設計方向提供依據(jù).以三星手機Galaxy S6 Edge為例,通過對該款手機在微博和京東商城的產品用戶評論等數(shù)據(jù)進行大數(shù)據(jù)分析,并結合粗糙集理論的用戶需求計算方法,驗證了提出方法的有效性.
互聯(lián)網(wǎng); 需求分析; 大數(shù)據(jù); 粗糙集; QFD
隨著互聯(lián)網(wǎng)時代和經濟全球化的到來,用戶需求變化迅速,產品創(chuàng)新設計已成為企業(yè)提高市場競爭力的最有效手段.其中需求分析是產品創(chuàng)新設計的前提和基礎,其實施的時效性和準確性對產品創(chuàng)新設計意義重大.需求分析過程包含2個重要方面:用戶需求獲取和需求權重計算.
傳統(tǒng)用戶需求獲取方式由于獲取手段的落后,具有主觀導向性強、缺乏個體性、成本較高等弊端,已越來越難以滿足現(xiàn)代產品設計的需求.近年來,伴隨信息技術的發(fā)展,基于數(shù)據(jù)倉庫的用戶需求獲取方法得到了廣泛應用[1-3].數(shù)據(jù)倉庫是基于數(shù)學及統(tǒng)計學的嚴謹邏輯思維,并以“科學判斷有效行為”為目標的技術系統(tǒng).這種方法相對于傳統(tǒng)方式有了顯著的改進,但也存在以下問題:1)數(shù)據(jù)倉庫需要提前對原始數(shù)據(jù)進行嚴格的處理、篩選;2)工作人員需要隨時守候在工作崗位上,工作繁瑣,實效性差;3)數(shù)據(jù)倉庫分析需要昂貴的硬件,經濟性差.
在用戶需求權重確定方面,目前常用的方法主要包括主觀賦權法與客觀賦權法[4].主觀賦權法的缺點在于耗時較多且具有一定的盲目性,而客觀賦權法是在充分利用原始數(shù)據(jù)基礎上計算權重,具有較好的客觀性.粗糙集[5]理論作為客觀賦權法的一種,其通過已知信息庫的上下近似集合來描述,不需要提供先驗信息,更具客觀性.
因此,本文基于用戶需求分析在產品創(chuàng)新設計過程中的重要作用,以及目前在用戶需求獲取和權重確定方面存在的主觀性強和難于客觀計算等問題,將大數(shù)據(jù)分析技術[6]與粗糙集理論相結合,通過大數(shù)據(jù)處理使用戶需求獲取更加高效和準確,通過粗糙集理論使權重計算更具客觀性,形成一種基于大數(shù)據(jù)分析和粗糙集理論的產品需求分析方法,方法框架如圖1所示.
圖1 基于大數(shù)據(jù)分析和粗糙集理論的產品需求分析方法Fig.1 Product requirement analysis method based on Big Data and rough set
該方法包括2個主要階段:一是基于大數(shù)據(jù)的用戶需求獲取與處理,對多種數(shù)據(jù)源采用相應的爬取手段獲得所需原始數(shù)據(jù),再通過大數(shù)據(jù)處理獲取用戶需求;二是基于粗糙集的用戶需求指標計算,通過粗糙集理論計算出用戶需求權重,再利用QFD質量屋將其轉化為產品設計參數(shù),從而為產品創(chuàng)新設計提供準確方向.
大數(shù)據(jù)集是指具有如下特點的數(shù)據(jù)集合[7]:數(shù)據(jù)體量特別大,一般在10 TB,很多企業(yè)的實際操作量已經達到了PB級;數(shù)據(jù)類別特別多,既包括了結構化數(shù)據(jù),也包含半結構化和非結構化數(shù)據(jù);數(shù)據(jù)處理速度特別快,在數(shù)據(jù)量很大的情況下,還需做到對數(shù)據(jù)的實時處理;數(shù)據(jù)真實性特別高,一般這樣的數(shù)據(jù)集無法用傳統(tǒng)數(shù)據(jù)庫工具對其內容進行獲取、管理和處理.本文基于大數(shù)據(jù)獲取與處理技術,結合需求相似性,提出了一種基于大數(shù)據(jù)的用戶需求獲取與整理方法,如圖2所示.
圖2 基于大數(shù)據(jù)的用戶需求獲取與整理方法Fig.2 User requirements acquisition and processing method based on Big Data
該方法包含2個主要階段:一是基于大數(shù)據(jù)的用戶需求獲取,根據(jù)數(shù)據(jù)源的不同,采用相應的工具和手段爬取用戶需求數(shù)據(jù),并保存為CSV文件;二是基于大數(shù)據(jù)的用戶需求處理,將爬取到的用戶需求數(shù)據(jù)上載到大數(shù)據(jù)軟件中,經過字段篩選和需求整理,最后形成規(guī)范的用戶需求.
1.1 基于大數(shù)據(jù)的用戶需求獲取
為了保證分析結果的可靠性,獲取無干擾條件下的用戶需求,是保證需求分析準確性的前提.目前,越來越多的產品用戶會通過網(wǎng)絡表達自己對產品的看法,其中絕大多數(shù)產品評論是自發(fā)的、無目的性的需求表達,所以可以認為網(wǎng)絡上的用戶評論是產品用戶在無干擾條件下作出的可靠數(shù)據(jù).想要爬取網(wǎng)絡上的用戶評論數(shù)據(jù),可以采用各種搜索引擎,如:微博搜索、網(wǎng)頁搜索、博客空間等.為了保證數(shù)據(jù)源的多樣性,本文同時采用網(wǎng)頁搜索爬取商務網(wǎng)站數(shù)據(jù)和微博搜索爬取社交網(wǎng)站數(shù)據(jù).網(wǎng)頁搜索可以通過工具編輯爬蟲程序爬取網(wǎng)頁數(shù)據(jù),例如Python(一種面向對象、解釋型計算機程序設計語言)腳本解釋器.通過引入程序中需要使用的模塊,找到需要爬取數(shù)據(jù)網(wǎng)址的URL(uniform resourcel locator, 統(tǒng)一資源定位器),進行數(shù)據(jù)爬取.微博搜索可以應用微博分析工具,進入產品的官方微博,對有關話題進行可視化分析,就可以得到用戶信息、評論、評價星級等數(shù)據(jù).將微博可視化分析工具爬取下來的用戶數(shù)據(jù)保存為一個CSV文件,就獲得了數(shù)據(jù)源.
1.2 基于大數(shù)據(jù)的用戶需求處理
針對爬取到的大量數(shù)據(jù)集合,需要對其進行預處理并形成規(guī)范數(shù)據(jù),大數(shù)據(jù)預處理工具包括Hadoop[8],Splunk[9]和Hpcc等,本文選擇Splunk軟件對獲取的原始大數(shù)據(jù)進行數(shù)據(jù)預處理.具體處理過程如下:
1)建立大數(shù)據(jù)索引屬性.將爬取到的CSV文件上載到Splunk中:通過建立索引屬性,用建立的索引屬性指示爬取到CSV數(shù)據(jù)文件,上載CSV文件就可以顯示出來.Splunk通過分析上載文件,選擇一些在事件中頻繁出現(xiàn)的字段作為Splunk所謂的感興趣字段.
2)提取有用字段并進行分類.由于用戶的評價信息是模糊的自然語言,Splunk給出的字段未必有用,例如:快遞、服務態(tài)度等,這些字段與產品自身的技術特征無關,所以對用戶需求分析來說為無用字段,經過篩選或自主定義后,獲取有用字段.在保留的有用字段中,提取具有相同意思的字段,將其劃分為一類,例如在字段中出現(xiàn)了“熱”和“燙”兩個不同字段,但其實質表示的都是電池發(fā)熱問題,所以這2種字段所包含的評論都可以歸類為“電池散熱不好”.根據(jù)這種方法,將模糊的用戶評論進行需求陳述,轉換為簡潔直白的用戶需求,如表1所示,將一款手機的顧客陳述轉換為用戶對產品功能的需求陳述.
表1 某手機用戶評論與需求陳述的轉換
Table 1 Transformation of user comments and requirement statements for a certain mobile phone
用戶評論需求陳述沒太多期待,就那個屏幕就覺得丑了屏幕外觀有待改進感覺屏幕好容易碎屏幕強度不夠
3)組合有用字段并計算關注度.為了更加直觀地表示經過需求陳述后的用戶需求所包含評論的條數(shù),可以將字段進行組合,例如上述的“熱”和“燙”字段組合為一個新字段“電池散熱不好”.通過分析這些組合后的字段所包含評價的條數(shù)(或其所占總條數(shù)的百分比)以及用戶評論中所體現(xiàn)的滿意程度,可以判定用戶對產品的哪些方面比較關注和感興趣,以及該產品在這些方面的性能表現(xiàn).基于處理過的用戶需求,要將其轉化為設計問題并安排優(yōu)先次序,確定各用戶需求的指標權重是重要環(huán)節(jié).
粗糙集理論是一種數(shù)據(jù)分析處理理論,由于其充分利用了原始數(shù)據(jù),其處理結果具有較好的客觀性.本文根據(jù)粗糙集理論的特性,對用戶需求進行賦權計算,并通過QFD質量屋將用戶需求轉換為確定的設計問題,獲得最佳的產品創(chuàng)新方向,如圖3所示.
圖3 基于粗糙集的用戶需求指標權重計算過程Fig.3 Weight calculation process of user’s requirement index based on rough set
該過程主要分為3個步驟:一是根據(jù)粗糙集理論和大數(shù)據(jù)分析后的用戶數(shù)據(jù),列出用戶滿意度決策表,計算出用戶需求權重;二是通過QFD質量屋進行需求和技術特征之間的轉換,列出技術特征與需求之間的關系矩陣;三是將關系矩陣與需求權重相結合,計算出技術特征權重,進而明確產品創(chuàng)新方向.
2.1 基于粗糙集的用戶需求權重計算
基于粗糙集[10]的權重計算:首先確定m項顧客需求Ci(i=1,2,…,m), 選擇n位顧客Uj(j=1,2,…,n),對每位顧客的需求進行重要度評價,將結果分為很重要、重要、不重要三個等級,以分值來表示,分別記為5,3,1.針對相同的一批顧客對產品的滿意度D進行評價,滿意度的評價方式同重要度評價一樣,也采用等級評價的方式,把結果分為很滿意、滿意、不滿意三個等級,分別記為3,2,1.用顧客需求C代表決策表的條件屬性集C,顧客滿意度D代表決策屬性集D,則可以構建用戶滿意度決策表,根據(jù)決策屬性表,將條件屬性集C導出等價類為IND(C),將決策屬性集D導出等價類為IND(D),其中IND表示二元不可區(qū)分.則可將條件屬性集C劃分為m1項,即IND(C)={C1,C2,…,Cm1};將決策屬性集劃分為m2項,即IND(D)={D1,D2,…,Dm2}.
則定義粗糙集中D的C正域為
POSC(D)=IND(C)∩IND(D),
(1)
定義D對C的依賴程度為
(2)
其中|POSC(D)|和|U|表示其集合中所含元素的個數(shù).rC(D)度量了將條件屬性集C劃入決策屬性集D的數(shù)量,其值越大表明D對C的依賴程度越高.為了計算條件屬性集中需求Ci的重要度,可以從條件屬性集中去掉Ci,計算出的依賴程度記為rC-Ci(D),將其與rC(D)的差值記為依賴程度的變化幅度,若變化幅度大,則說明Ci的重要度高,反之則小.
可定義Ci∈C關于D的重要性為
(3)
則Ci的權重為
(4)
2.2 基于QFD質量屋的需求轉換
QFD是以市場為導向,以用戶需求為產品開發(fā)依據(jù)的一種多層次演繹分析方法,也是聯(lián)系用戶需求與技術特征結構的工具.首先構建質量屋的基本構架,再輸入用戶需求信息,通過分析評價得到輸出信息,實現(xiàn)需求的轉化.產品創(chuàng)新階段的質量屋如圖4所示.
圖4 產品創(chuàng)新階段的質量屋Fig.4 The quality house of product innovation stage
通過質量屋,將用戶需求(A)對應得出相應的工程特性(B).為表示各個工程特性項與各個市場用戶需求項之間錯綜復雜的關系(D),以數(shù)值來定量表示:記強相關為9,表示要滿足該項用戶需求必須具備此項工程特性;記一般相關為3,表示要滿足該項用戶需求可以采用不同的工程特性;記弱相關為1,表示該項用戶需求與此項工程特性的關系很弱.
2.3 技術特征權重計算
通過加權求和計算技術特征絕對權重
(6)
進而可以計算技術特征相對權重
(7)
2.4 結果分析
以Galaxy S6 Edge手機為例,展示本文提出的產品需求分析方法的具體實施過程.
3.1 基于大數(shù)據(jù)的用戶需求獲取與整理
分別應用Python以網(wǎng)頁搜索的方式爬取京東商城的S6用戶評論數(shù)據(jù),以微博可視化分析爬取微博用戶關于S6的評論.以微博用戶數(shù)據(jù)為例,其分析過程如下:
首先將數(shù)據(jù)載入Splunk.
1)將采集到的CSV文件上載到Splunk中.
2)建立索引為GalaxyEdge.
3)在搜索欄輸入index=“GalaxyEdge”,則可出現(xiàn)上載的數(shù)據(jù).
將文件成功導入Splunk后進入Splunk搜索應用(search & reporting),可以看到該應用程序的左側欄處顯示的默認字段和一些附加字段,即Splunk所謂的感興趣的字段.通過特定的索引,出現(xiàn)在50%或超過50%的事件中,會被定義為字段.在所有字段中尋找一些可以用來作需求分析的字段,如:text表示用戶評論,comments_count表示微博的評論數(shù),id表示微博的id,clientip表示發(fā)送微博作者的ip地址.單擊“text”字段,在彈出的對話框中會顯示其中的分類字段值,這里的值是一些對應的微博評論.如圖5,Splunk默認顯示排名前10的值.在字段值中可以看出最多的評論是“轉發(fā)微博”,有1 700多條,可見大部分人在關于話題#S6 Edge真的來了#中并未發(fā)表自己的看法,而僅僅是轉發(fā)該微博供他人閱讀.由于“轉發(fā)微博”這個字段與分析用戶需求無關,但該字段值的數(shù)量又很多,可利用Splunk手動選擇將包含該字段的事件刪除,命令如下:
index="GalaxyEage" text!="轉發(fā)微博"
圖5 表示S6手機用戶評論的“text”字段的值Fig.5 Value of the field “text” representing the user comment of S6 mobile phone
首先,代表用戶評論的字段是text,它包括的是一條條評論及字符串,希望在評論中抓取與產品設計相關的要素,如:屏幕、分辨率、攝像頭、耗電量、散熱、系統(tǒng)流暢度、手感等.
使用makemv命令,其作用是提取一個字段,默認空格為分隔符并把該字段分解為多值字段.
Splunk把所有東西都看作事件,使用mvexpand命令把多值字段的每個值轉變?yōu)橐粋€單獨的事件.但這樣做對分析來說沒有意義,因為它僅僅是把一條條的評論拆成一個個字符.接著使用match函數(shù),例如:match(text,“屏幕”),該函數(shù)會在text字段中匹配出所有包含字符串“屏幕”的評論.挖掘要素的命令可整合為如下一段完整的命令:
index="GalaxyEdge" sourcetype="csv" | makemv text | mvexpand text |
eval hashtags=mvfilter(match(text,"屏幕+")) | stats count by hashtags
這里使用eval命令的作用是計算表達式的值并將其存儲在一個新字段里.將提取的數(shù)據(jù)裝入hashtags中,并統(tǒng)計該字段.
統(tǒng)計的部分結果如圖6,如果想看到有多少關于“屏幕”的評論,需要將以上一條命令的結果作為輸入,并加入命令:
addcoltotals labelfield=Total label=ALLcomment
addcoltotals命令允許生成一個包含匯總信息的新事件Total,這個事件用以計算已有事件的總數(shù).標簽名由用戶自己賦值,這里將其賦值為ALLcomment.
最后得到關于“屏幕”的評論為28條.提取出其中對產品設計有幫助的評斷,并通過需求陳述將這些模糊的用戶語言轉換為簡明的用戶需求.將各項用戶需求用儀表盤的形式表示,如圖7所示,每種顏色(灰度)對應一條用戶評論,評論數(shù)目越多,則表盤的顏色(灰度)越多,說明用戶對此項需求的關注度越高.
圖7 用戶參數(shù)儀表盤表示的某手機用戶需求Fig.7 The user needs of a certain mobile phone expressed by user parameters of the instrument panel
為了保證數(shù)據(jù)源的多樣性,同樣爬取京東商城關于三星手機Galaxy S6 Edge的用戶評論情況,共獲得11 580條用戶評論,經統(tǒng)計,可得出12項用戶需求,如表2所示.
表2 S6手機各項用戶需求評價數(shù)目統(tǒng)計
Table 2 Statistics of the comment number of each user demand about S6 mobile phone
用戶需求微博用戶需求評價數(shù)目/條京東用戶需求評論數(shù)目/條1.手機外形美觀673302.強度高26283.功能多334.價格適宜524025.信息安全28386.電池耐用1115777.按鍵做工良好19408.攝像功能好49589.手感舒適112310.老年人專用6211.使用安全5812.系統(tǒng)流暢851340
選擇出評價數(shù)目較多的前5項(數(shù)目越多表示用戶越重視,分析價值越高),如表3所示.
表3 5項評價數(shù)目較多的用戶需求
3.2 基于粗糙集的需求權重計算
本文的數(shù)據(jù)源有2個:京東用戶評論和微博用戶評論,因兩者的數(shù)據(jù)量不同,應分別計算兩者的需求權重,并進行賦權.以微博用戶評論為例進行計算.
經統(tǒng)計,對所選5項用戶需求提出評價的用戶數(shù)目為297人(微博用戶評價數(shù)目的總條數(shù)為364條,這是因為部分用戶同時對5項需求中的多項進行了評價),其中總的好評數(shù)為143條,中評數(shù)為89條,差評數(shù)為65條,可以發(fā)現(xiàn)這個比例與京東網(wǎng)站的評價比例極為不符,這是因為數(shù)據(jù)是處理過的,減少了商家通過某些商業(yè)手段得到的無效評價的影響,也摒除了用戶對快遞、服務等非產品本身工程特性的評價.
為了使計算簡潔,將其簡化為20名顧客的產品顧客滿意度決策表,如表4所示.以手機外形美觀為例,該需求的評價總數(shù)目為67條,其中好評有49條,中評有15條,差評有2條,按照比例縮減為好評14人,中評5人,差評1人.以好評為例,縮減方式為:選擇3到4人為一組,按照時間順序排列(按照時間順序組合用戶是因為用戶對產品的觀點可能受到同時期其他產品或環(huán)境等因素的影響,評價時間越接近的用戶受到這些因素的影響越小,組合也就更有說服力).計算之前爬取到的用戶評價星級的均值,將數(shù)值1~2.5定位為重要,2.6~4.5定位為一般,4.6~5定位為不重要,根據(jù)2.1節(jié)中重要度分級方式,分別記為5,3,1,并將好評記為3,中評記為2,差評記為1,按比例分配,滿意度為3的有9人,為2的有6人,為1的有5人.
表4 顧客滿意度決策表
以需求C1為例,根據(jù)公式(3)、(4)計算其需求權重:
同理,求得京東用戶需求權重為:q′1=0.193,q′2=0.244,q′3=0.083,q′4=0.184,q′5=0.297.
微博評論條數(shù)為1 700條,京東用戶評論條數(shù)為11 580條,依據(jù)各需求占2種數(shù)據(jù)源評論條數(shù)的百分比進行賦權,各項需求權重為:
q″2=0.221,q″3=0.111,q″4=0.230,q″5=0.275.
3.3 基于QFD質量屋的技術特征權重計算
進行需求轉換,將用戶需求轉換為對應的工程特性,但這種對應關系并非一一映射,而是多相關性映射關系.微博評論者的某個需求可能對應若干的工程特征要求,同樣的某個特征要求可能滿足多個微博評論者提出的需求.由此構成局部的Galaxy S6 Edge產品規(guī)劃質量屋,構建質量屋如圖8所示.
圖8 S6手機創(chuàng)新階段質量屋Fig.8 Innovation stage quality house of S6 mobile phone
在生成的質量功能屋中,不可避免地會發(fā)生各種沖突:工程特征間的技術沖突、質量和成本的沖突、各個用戶需求的沖突和功能間的沖突.這些沖突需要設計師規(guī)劃解決.當然,憑借質量功能屋,可以完成從用戶需求到相應功能指標的轉換,轉換時參考客戶基準評價從而確定更有價值的技術特征創(chuàng)新方向.具體步驟如下:
步驟1:根據(jù)質量屋列出用戶需求與技術特征的關系矩陣.
步驟2:計算各項設計特征的絕對權重wj.
步驟3:計算各項技術特征的相對權重Mj.
根據(jù)計算結果,技術特征權重由大到小依次是系統(tǒng)設計、電池設計、成本控制、外形設計、內置攝像頭性能,這5個技術特征中系統(tǒng)設計、電池設計、成本控制權重明顯高于其他兩項,說明這3項沒有達到用戶預期,急需改進.內置攝像頭性能和外形設計權重偏低,說明S6的這2項在同類產品中有一定的優(yōu)勢,改進的急切程度不高.所以,我們可以得出S6的后續(xù)設計需要圍繞系統(tǒng)、電池、成本來進行,并且這3項中系統(tǒng)流暢度提升要優(yōu)先進行,成本控制可最后考慮.
本文根據(jù)大數(shù)據(jù)和粗糙集理論,提出了一種基于大數(shù)據(jù)分析和粗糙集理論的產品需求分析方法,該方法具有如下特點:一是基于大數(shù)據(jù)技術,完全應用數(shù)據(jù)全體,排除了小數(shù)據(jù)時代過多依靠抽樣分析、問卷調查等手段引入的人為主觀引導和誤差;二是以粗糙集理論為基礎,結合QFD理論,計算產品各項技術特征權重,最后,根據(jù)權重數(shù)值的大小,準確反映產品潛在改進方向.
[1] 孫偉,馬沁怡,劉曉冰.基于設計倉庫的產品需求獲取與處理方法研究[J]. 計算機集成制造系統(tǒng),2003,9(8):686-690. SUN Wei, MA Qin-yi, LIU Xiao-bing. A method of product requirements acquisition and processing based on design repository [J]. Computer Integrated Manufacturing Systems,2003,9(8): 686-690.
[2] 郭偉,胡明艷.基于Web源的用戶需求獲取及分析方法 [J]. 計算機集成制造系統(tǒng),2004,10(9):1165-1170. GUO Wei, HU Ming-yan. Methodology of exploring and analyzing the VOC based on extensive Web data source [J]. Computer Integrated Manufacturing Systems,2004,10(9):1165-1170.
[3] SUNG M B,SUNG H H,SUNG C P. A Web-based system for analyzing the voices of call center customers in the service industry [J].Expert Systems with Applications,2005,28(1):29-41.
[4] 王靖,張金鎖.綜合評價中確定權重向量的幾種方法比較 [J].河北工業(yè)大學學報,2001,30(2):52-57. WANG Jing,ZHANG Jin-suo.Comparing several methods of assuring weight vector in synthetical evaluation [J]. Journal of Hebei University of Technology,2001,30(2):52-57.
[5] 李延來,唐加福,蒲云,等.質量功能展開中顧客需求的排序算法[J].計算機集成制造系統(tǒng),2007,13(6):1196-1203, 1240. LI Yan-lai,TANG Jia-fu,PU Yun,et al.Sorting algorithm of customer requirements in quality function deployment[J].Computer Integrated Manufacturing Systems,2007,13(6):1196-1203, 1240.
[6] 李學龍,龔海剛.大數(shù)據(jù)系統(tǒng)綜述 [J].中國科學(信息科學),2015,45(1):1-44. LI Xue-long,GONG Hai-gang. A survey on big data systems [J]. Scientia Sinica(Informations),2015,45(1):1-44.
[7] VIKTOR M S,KENNETH C.大數(shù)據(jù)時代(生活、工作與思維的大變革)[M] .盛楊燕,周濤,譯.杭州:浙江人民出版社,2013: 27-45. VIKTOR M S,KENNETH C.Big Data(A revolution that will transform how we live, work and think)[M]. Translated by SHENG Yang-yan, ZHOU Tao. Hangzhou: Zhejiang People’s Publishing House,2013: 27-45.
[8] JIANGTAO Y, YONG L, MARIO B,et al. GOM-Hadoop: A distributed framework for efficient analytics on ordered datasets[J]. Journal of Parallel and Distributed Computing, 2015,83:58-69.
[9] ZADROZNY P, KODALI R. Splunk.大數(shù)據(jù)分析[M].唐宏,陳建,譯.北京:機械工業(yè)出版社,2014: 29-80. ZADROZNY P,KODALI R.Big data analytics using Splunk[M]. Translated by TANG Hong, CHEN Jian. Beijing:China Machine Press,2014: 29-80.
[10] 陸佳圓,馮毅雄,譚建榮,等.產品顧客需求權重的動態(tài)趨勢預測與分析[J].計算機集成制造系統(tǒng),2011,17(10):2129-2136. LU Jia-yuan,F(xiàn)ENG Yi-xiong,TAN Jian-rong, et al. Prediction and analysis for dynamic trend of customer requirements weight on product[J].Computer Integrated Manufacturing Systems,2011,17(10):2129-2136.
Research on product demand analysis method based on Big Data and rough set
SI Guang-yao, WANG Kai, LI Wen-qiang, LI Yan, MOU Liang
(School of Manufacturing Science & Engineering, Sichuan University, Chengdu 610065, China)
Traditional product design method has many problems on requirements elicitation, such as unitary method, poor timeless and strong subjectivity. So a method of product requirements analysis based on Big Data and rough set was put forward. By the web crawler technology, designer could real-time acquire vast and unstructured product requirements in a variety of information carrier. By the Big Data analytic tool and rough set, the types of different semantic user requirements could be acquired. By the house of quality, product requirements were converted to the corresponding engineering design parameters, thus making sure the direction of product design was right. In addition, taking the “Galaxy S6 Edge” for example, by the Big Data analysis of this mobile phone’s user comments in micro-blogging and Jingdong MALL and the using of user requirements calculation method based on rough set, the effectiveness of the proposed method is verified.
internet; demand analysis; Big Data; rough set; QFD
2016-08-05.
本刊網(wǎng)址·在線期刊:http://www.zjujournals.com/gcsjxb
國家自然科學基金資助項目(51435011,51505309);科技部創(chuàng)新方法工作專項(2013IM030500).
司光耀(1990—),男,黑龍江哈爾濱人,碩士生,從事大數(shù)據(jù)技術在產品創(chuàng)新設計中的應用研究,E-mail:1780452857@qq.com.http://orcid.org//0000-0001-6211-1476 通信聯(lián)系人:王凱(1982—),男,四川成都人,講師,博士,從事產品創(chuàng)新設計等研究,E-mai: kai.wang@sun.edu.cn.
10.3785/j.issn. 1006-754X.2016.06.001
TH 122
A
1006-754X(2016)06-0521-09