亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        融合內(nèi)容分析和關(guān)聯(lián)分析的短生命周期體驗(yàn)品需求特征模式挖掘方法研究

        2019-12-13 03:49:56唐中君崔駿夫唐孝文朱慧珂
        中國(guó)管理科學(xué) 2019年11期
        關(guān)鍵詞:關(guān)聯(lián)規(guī)則特征

        唐中君,崔駿夫,唐孝文,朱慧珂

        (1.北京工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院,北京 100124;2.北京工業(yè)大學(xué)北京現(xiàn)代制造業(yè)發(fā)展研究基地,北京 100124)

        1 引言

        當(dāng)前有關(guān)需求模式挖掘的研究主要集中于特定產(chǎn)品的銷量與其產(chǎn)品屬性間的關(guān)系[1-3]。這些研究通過(guò)分析特定產(chǎn)品的屬性與銷量之間的關(guān)系,挖掘銷量與產(chǎn)品屬性間的規(guī)律,獲得該特定產(chǎn)品的銷量規(guī)律。然而,僅挖掘特定產(chǎn)品的銷量規(guī)律難以從市場(chǎng)全局掌握該類產(chǎn)品的需求特征,難以從一類產(chǎn)品的全局指導(dǎo)新產(chǎn)品研發(fā)。因此,需要從市場(chǎng)全局性趨勢(shì)識(shí)別可用于指導(dǎo)設(shè)計(jì)研發(fā)的需求特征模式。由于市場(chǎng)的動(dòng)態(tài)變化,還需要?jiǎng)討B(tài)識(shí)別需求特征模式。全局性的需求特征模式代表一類產(chǎn)品在近期消費(fèi)活動(dòng)中頻繁出現(xiàn)但需要挖掘一類產(chǎn)品的具有可重用性特點(diǎn)的全部屬性,還需要?jiǎng)討B(tài)挖掘該類產(chǎn)品的不同產(chǎn)品屬性及屬性間關(guān)系組合所代表的產(chǎn)品與其銷售總量之間的關(guān)系。本文旨在提出滿足這些要求的需求特征模式挖掘方法。

        根據(jù)產(chǎn)品的生命周期特性,可將產(chǎn)品分為長(zhǎng)生命周期產(chǎn)品和短生命周期產(chǎn)品。依據(jù)顧客從產(chǎn)品消費(fèi)中獲得的主要價(jià)值,產(chǎn)品可分為體驗(yàn)品和功能品。典型的短生命周期體驗(yàn)品有電影、體育賽事、電子游戲、話劇等。以電影為例,2013至2016年我國(guó)上映的476部商業(yè)電影中,總票房過(guò)億的有121部,其中超過(guò)10億的有12部;小于1千萬(wàn)的有151部,占比約32%。由此可見,短生命周期體驗(yàn)品的銷售總量具有極大的波動(dòng)性,難以挖掘需求特征,更難以挖掘其需求特征模式。因此本文以短生命周期體驗(yàn)品為對(duì)象,研究其需求特征模式挖掘方法。

        為解決短生命周期體驗(yàn)品因銷售總量的極大波動(dòng)性導(dǎo)致的需求特征難以挖掘問(wèn)題,本文提出一種按銷售總量分區(qū)的產(chǎn)品需求特征模式挖掘方法。分區(qū)的原因是,所有產(chǎn)品的銷售總量波動(dòng)性大,難以挖掘需求特征;依銷售總量分區(qū)后,各區(qū)的銷售總量波動(dòng)性相對(duì)小,各區(qū)的需求特征更具規(guī)律性,從而易于挖掘需求特征。本文的產(chǎn)品需求特征模式是指高銷售總量區(qū)間內(nèi)產(chǎn)品集具備,但中、低區(qū)間不具備的產(chǎn)品屬性關(guān)系模式。該模式說(shuō)明市場(chǎng)需求動(dòng)向,可用于指導(dǎo)新產(chǎn)品開發(fā)生產(chǎn),降低新產(chǎn)品投資風(fēng)險(xiǎn)。產(chǎn)品屬性關(guān)系模式包含關(guān)聯(lián)屬性集合及屬性間的關(guān)系特征。因此,本文所提方法包括產(chǎn)品屬性挖掘方法和屬性關(guān)系模式挖掘方法。有關(guān)產(chǎn)品屬性的挖掘方法,文獻(xiàn)有質(zhì)量功能展開[4]、灰色分析[5]、假設(shè)檢驗(yàn)[6]、結(jié)構(gòu)方程模型[7]、因子分析[8-10]、有向主題模型[11]、CART樹[12]、貝葉斯網(wǎng)絡(luò)[13]、潛在語(yǔ)義分析[14]、描述統(tǒng)計(jì)[15]等方法,但上述挖掘方法僅能得到不同體驗(yàn)品的主要屬性,未能挖掘相對(duì)全面的產(chǎn)品屬性,難以適用于短生命周期體驗(yàn)品產(chǎn)品屬性的全面挖掘。并且這些研究所用源信息主要是消費(fèi)者反饋數(shù)據(jù)[4,7,8-12,14]和產(chǎn)品本身數(shù)據(jù)[5-6,13,15],沒(méi)有用產(chǎn)品介紹。通常產(chǎn)品介紹為純文本文件且包含顯性及隱性屬性。內(nèi)容分析法是一種以文本及文本使用環(huán)境為源信息,并可獲得有效推論的研究方法,其主要功能是對(duì)源信息進(jìn)行顯性和隱性特征的共同挖掘。相較于上述文獻(xiàn)所用方法,內(nèi)容分析能挖掘更加全面的產(chǎn)品屬性,為更加準(zhǔn)確、動(dòng)態(tài)挖掘產(chǎn)品需求特征模式提供有利條件。因此,為挖掘較為全面的產(chǎn)品屬性,可以基于內(nèi)容分析法,提出短生命周期體驗(yàn)品的產(chǎn)品屬性挖掘方法,但尚未發(fā)現(xiàn)類似研究。

        對(duì)于按銷售總量分區(qū)的產(chǎn)品屬性關(guān)系模式挖掘,尚未發(fā)現(xiàn)有關(guān)研究。對(duì)于銷售總量與產(chǎn)品屬性間關(guān)系的挖掘方法有邏輯斯蒂回歸[16]、假設(shè)檢驗(yàn)[17]、文本情感分析[18]、統(tǒng)計(jì)推斷[19]、核方法[20]、支持向量回歸[21]。這些方法通過(guò)分析屬性與銷售總量之間的關(guān)系,可以挖掘銷售總量與產(chǎn)品屬性間的規(guī)律,適用于特定產(chǎn)品銷售量的預(yù)測(cè),但無(wú)法挖掘不同銷售總量區(qū)間內(nèi)產(chǎn)品集的產(chǎn)品屬性關(guān)系模式,難以從一類產(chǎn)品的總體去把握需求規(guī)律。關(guān)聯(lián)分析用于發(fā)掘數(shù)據(jù)集中變量之間的關(guān)系,該方法通過(guò)頻繁集和關(guān)聯(lián)規(guī)則表示變量之間的關(guān)聯(lián)關(guān)系,并利用支持度和置信度衡量變量之間的關(guān)聯(lián)強(qiáng)度。關(guān)聯(lián)分析可用于挖掘不同銷售總量區(qū)間內(nèi)產(chǎn)品集的產(chǎn)品屬性關(guān)系模式,進(jìn)而可以識(shí)別產(chǎn)品屬性關(guān)系模式與銷售總量區(qū)間值之間的關(guān)系。因此,可以基于關(guān)聯(lián)分析,提出短生命周期體驗(yàn)品按銷售總量分區(qū)的產(chǎn)品屬性關(guān)系模式挖掘方法,進(jìn)而可以獲得高銷售總量區(qū)間具備,但中、低區(qū)間不具備的關(guān)系模式,從而得到需求特征模式,但尚未發(fā)現(xiàn)類似研究。

        2 需求特征模式挖掘方法的提出

        2.1 方法概述

        為實(shí)現(xiàn)產(chǎn)品屬性的全面挖掘及按銷售總量分區(qū)的產(chǎn)品屬性關(guān)系挖掘,提出如圖1所示的融合內(nèi)容分析和關(guān)聯(lián)分析的短生命周期體驗(yàn)品需求特征模式挖掘方法。圖1中兩個(gè)虛線矩形分別代表兩個(gè)挖掘階段,包括產(chǎn)品屬性挖掘階段和屬性關(guān)系挖掘階段。每個(gè)階段包含若干活動(dòng),用實(shí)線矩形表示。每個(gè)活動(dòng)的輸入和輸出用平行四邊形表示。箭頭代表流程走向。

        圖1 需求特征模式挖掘主流程

        產(chǎn)品屬性挖掘階段以產(chǎn)品介紹為輸入,通過(guò)內(nèi)容分析識(shí)別和提取產(chǎn)品屬性,挖掘該類產(chǎn)品屬性,輸出產(chǎn)品屬性表。以該表為輸入,屬性關(guān)系挖掘階段按銷售總量將已有產(chǎn)品分成高、中、低三個(gè)區(qū)間,生成三類區(qū)間的產(chǎn)品屬性表,運(yùn)用關(guān)聯(lián)分析法獲取各區(qū)間中滿足最小支持度的頻繁集,進(jìn)而得到關(guān)聯(lián)屬性規(guī)則集,然后運(yùn)用關(guān)聯(lián)分析法的先驗(yàn)原理對(duì)關(guān)聯(lián)屬性規(guī)則集進(jìn)行網(wǎng)絡(luò)圖構(gòu)建,實(shí)現(xiàn)屬性間關(guān)聯(lián)關(guān)系的可視化表達(dá),得到不同銷售總量區(qū)間內(nèi)產(chǎn)品集的產(chǎn)品屬性關(guān)系模式,最終輸出該類產(chǎn)品的需求特征模式。

        2.2 基于內(nèi)容分析法的產(chǎn)品屬性挖掘方法

        基于內(nèi)容分析法的產(chǎn)品屬性挖掘方法如圖2所示。圖中,平行四邊形表示輸入和輸出;矩形表示工作內(nèi)容;菱形表示判斷條件;實(shí)線箭頭表示流程走向;虛線箭頭表示包含關(guān)系;左側(cè)虛線矩形表示粗粒度挖掘步驟;右側(cè)虛線矩形表示細(xì)粒度挖掘步驟。

        圖2 基于內(nèi)容分析法的產(chǎn)品屬性挖掘流程

        由圖2可知,依據(jù)輸入內(nèi)容的不同,基于內(nèi)容分析法的產(chǎn)品屬性挖掘分為兩大部分,分別是對(duì)已有產(chǎn)品介紹集的挖掘和對(duì)新產(chǎn)品介紹集的挖掘。

        對(duì)已有產(chǎn)品介紹集的屬性挖掘包括目標(biāo)確定、類目體系構(gòu)建、預(yù)編碼,正式編碼四個(gè)主步驟。每個(gè)主步驟包含若干子步驟。

        第一步,目標(biāo)確定。使用內(nèi)容分析法挖掘產(chǎn)品屬性的目標(biāo)是獲得產(chǎn)品屬性庫(kù),并得到已有產(chǎn)品介紹集的產(chǎn)品屬性表。產(chǎn)品屬性庫(kù)應(yīng)能涵蓋已有產(chǎn)品介紹集中的全部屬性。產(chǎn)品屬性表包含由產(chǎn)品屬性庫(kù)構(gòu)成的表頭和依據(jù)已有產(chǎn)品介紹編碼填充的二元值。

        第二步,類目體系構(gòu)建,包括產(chǎn)品屬性庫(kù)的構(gòu)建和編碼指南表的建立。選用結(jié)合法并遵循窮盡、互斥和均衡等原則[22-23]構(gòu)建類目,得到一個(gè)分層分級(jí)的多層級(jí)類目體系結(jié)構(gòu)。該體系首先由一級(jí)類目組成,一級(jí)類目應(yīng)盡可能使用粗粒度方式囊括短生命周期體驗(yàn)品的屬性類。例如,電影可分為犯罪類、愛情類等。接著對(duì)每一類屬性進(jìn)行細(xì)分,形成二級(jí)類目。例如,每種類型電影又可細(xì)分為主角設(shè)置、劇情模式和主題精神等。若二級(jí)類目的屬性無(wú)法滿足研究粒度需要,則進(jìn)一步細(xì)分。例如犯罪類電影的主角設(shè)置可分為警察、毒販、黑社會(huì)等。類目的總層級(jí)數(shù)根據(jù)研究所需粒度大小確定。此外,為滿足窮盡原則,應(yīng)在每一級(jí)類目中設(shè)置“其他”項(xiàng),用于代表非研究重點(diǎn)的類項(xiàng)。依據(jù)構(gòu)建好的類目體系,即可得到產(chǎn)品屬性庫(kù)。基于類目體系,可建立編碼指南表。該表應(yīng)包含類目體系、所有最細(xì)粒度類目說(shuō)明和編碼規(guī)則。類目說(shuō)明用于幫助編碼人員理解類目體系;編碼規(guī)則用于指導(dǎo)編碼人員編碼。

        第三步,預(yù)編碼。該步驟旨在消除類目構(gòu)建人員與編碼人員對(duì)類目理解的差異,從而驗(yàn)證類目體系,并使編碼人員能夠在正式編碼過(guò)程中將識(shí)別出的產(chǎn)品屬性歸入正確的類目。預(yù)編碼分為對(duì)編碼人員的編碼訓(xùn)練和信度檢驗(yàn)。編碼訓(xùn)練要求在正式預(yù)編碼之前,編碼人員熟悉并理解編碼指南表,并對(duì)短生命周期體驗(yàn)品的特性有一定了解,能夠識(shí)別產(chǎn)品介紹文本中涉及的隱性屬性,從而能夠正確編碼。如果編碼人員對(duì)編碼指南表理解有誤或類目構(gòu)建人員與編碼人員理解不一致,需要通過(guò)研究討論修改類目體系或重新定義類目,完善類目體系,使類目構(gòu)建人員與編碼人員最終達(dá)成一致。

        當(dāng)最終達(dá)成一致并且所有編碼者對(duì)編碼說(shuō)明和內(nèi)容文本熟悉后,即可進(jìn)行編碼訓(xùn)練和信度檢驗(yàn)。編碼訓(xùn)練要求編碼人員按照編碼規(guī)則對(duì)預(yù)編碼樣本進(jìn)行編碼。預(yù)編碼樣本需從已有全部產(chǎn)品介紹中按總體的20%抽取。編碼過(guò)程是,若類目體系中的屬性在某產(chǎn)品介紹中出現(xiàn),則在產(chǎn)品屬性表中相應(yīng)位置填入1,未出現(xiàn)則填0。信度檢驗(yàn)采用剔除隨機(jī)因素的一致率Scott'sPi方法,計(jì)算公式為Pi=(PAo-PAe)/(1-PAe),其中PAo是觀察到的一致率;PAe表示隨機(jī)一致率,等于每個(gè)數(shù)值出現(xiàn)概率的平方之和。該方法去除了偶然概率因素,檢驗(yàn)值在不小于0.75的情況下均可接受。若信度檢驗(yàn)未通過(guò),需對(duì)編碼人員再次進(jìn)行編碼訓(xùn)練并重新預(yù)編碼,直到通過(guò)信度檢驗(yàn)。

        第四步,正式編碼。編碼過(guò)程就是識(shí)別出已有產(chǎn)品介紹中的產(chǎn)品屬性,并將其歸入相應(yīng)類目。識(shí)別產(chǎn)品屬性可分為識(shí)別顯性屬性和隱性屬性。顯性屬性是指文本中明確說(shuō)明的屬性。例如,針對(duì)電影《毒戰(zhàn)》的介紹“剛剛結(jié)束一次危險(xiǎn)任務(wù)的津海市緝毒大隊(duì)隊(duì)長(zhǎng)張雷在醫(yī)院意外見到因車禍入院治療的蔡添明,身經(jīng)百戰(zhàn)的張雷迅速判定蔡添明與毒品勾當(dāng)有關(guān)”,可以明顯看出主角設(shè)置為警察和毒販。隱性屬性是指需經(jīng)過(guò)語(yǔ)境推斷得出的屬性。例如,針對(duì)電影《湄公河行動(dòng)》的介紹“2011年10月5日,兩艘商船在湄公河金三角水域遭遇襲擊,13名船員全部遇難。泰國(guó)警方從船上搜出90萬(wàn)顆冰毒。消息傳回國(guó)內(nèi)舉國(guó)震驚”,需要根據(jù)“湄公河”、“冰毒”、“消息傳回國(guó)內(nèi)”等推斷出劇情涉及走私、販毒。編碼完成后,得到已有短生命周期體驗(yàn)品的產(chǎn)品屬性表,并將其作為產(chǎn)品屬性關(guān)系模式挖掘階段的輸入。

        以上是針對(duì)已有產(chǎn)品介紹集的產(chǎn)品屬性挖掘,當(dāng)有新產(chǎn)品介紹出現(xiàn)后,首先將新產(chǎn)品介紹與已有產(chǎn)品屬性庫(kù)進(jìn)行匹配。若新產(chǎn)品介紹出現(xiàn)的屬性未能包含在已有的產(chǎn)品屬性庫(kù)之內(nèi),則在現(xiàn)有類目的基礎(chǔ)上完善類目體系,并進(jìn)行編碼,從而得到新一階段的產(chǎn)品屬性表。若新產(chǎn)品介紹出現(xiàn)的屬性均包含在屬性庫(kù)之內(nèi),則直接通過(guò)正式編碼,獲取新的產(chǎn)品屬性表。

        2.3 基于關(guān)聯(lián)分析的產(chǎn)品屬性關(guān)系模式挖掘方法

        基于關(guān)聯(lián)分析的產(chǎn)品屬性關(guān)系模式挖掘方法如圖3所示;圖例同圖2。產(chǎn)品屬性關(guān)系模式挖掘包括按銷售總量分區(qū)、產(chǎn)品屬性頻繁集發(fā)現(xiàn)、產(chǎn)品屬性關(guān)聯(lián)規(guī)則挖掘、網(wǎng)絡(luò)圖構(gòu)建和需求特征模式發(fā)現(xiàn)五個(gè)主步驟。每個(gè)主步驟又包含若干子步驟。

        圖3 基于關(guān)聯(lián)分析的產(chǎn)品屬性關(guān)系模式挖掘流程

        第一步,按銷售總量分區(qū)。依銷售總量的高、中、低將已有短生命周期體驗(yàn)品分為三類,分別代表需求熱點(diǎn)、基線水平和難以回本,進(jìn)而得到銷售總量高、中、低各區(qū)間內(nèi)產(chǎn)品集的產(chǎn)品屬性表。

        第二步,產(chǎn)品屬性頻繁集發(fā)現(xiàn)。在獲得分區(qū)的產(chǎn)品屬性表之后,設(shè)置合適的最小支持度并使用Apriori算法挖掘產(chǎn)品關(guān)聯(lián)屬性之間的關(guān)系。Apriori算法是發(fā)現(xiàn)關(guān)聯(lián)規(guī)則頻繁集的算法。在給定數(shù)據(jù)集D和最小支持度minsup下,該算法從數(shù)據(jù)集中找到頻率大于等于minsup的項(xiàng)集,支持度超過(guò)minsup而且由k個(gè)項(xiàng)構(gòu)成的項(xiàng)集稱為k-項(xiàng)集,記為L(zhǎng)k,即頻繁k-項(xiàng)集。支持度Support(X→Y)=|T(X∪Y)|/|T|,其中|T(X∪Y)|表示同時(shí)包含X產(chǎn)品屬性集合和Y產(chǎn)品屬性集合的數(shù)據(jù)個(gè)數(shù);|T|表示產(chǎn)品屬性表中的數(shù)據(jù)總數(shù)。最小支持度的設(shè)定需通過(guò)多次運(yùn)行Apriori算法并觀察頻繁集才能確定。用Apriori算法挖掘產(chǎn)品屬性頻繁集的算法描述如下:

        輸入:產(chǎn)品屬性表T,最小支持度minsup;

        輸出:產(chǎn)品屬性頻繁集;

        符號(hào)定義:Ck為k-項(xiàng)候選集;Lk為k-項(xiàng)頻繁集;

        L1={頻繁 1-項(xiàng)集};

        for (K=1;Lk!=?;k++) do begin

        Ck+1= 由Lk項(xiàng)集生成;

        for T表中的每條數(shù)據(jù)do begin

        對(duì)所有Ck+1中的項(xiàng)集,如果也同時(shí)包含于本條數(shù)據(jù),頻數(shù)增加1;

        Lk+1=Ck+1中滿足支持度大于或等于minsup的項(xiàng)集;

        end

        end

        returnLk+1

        第三步,產(chǎn)品屬性關(guān)聯(lián)規(guī)則挖掘。關(guān)聯(lián)規(guī)則挖掘是在得到頻繁集的基礎(chǔ)上,找出置信度超過(guò)最小置信度minconf的項(xiàng)集,并提取規(guī)則。規(guī)則的表示形式為X→Y,X稱為前項(xiàng),Y稱為后項(xiàng)。規(guī)則的置信度Confidence(X→Y)=|T(X∪Y)|/ |T(X)|,其中|T(X)|表示包含X產(chǎn)品屬性的數(shù)據(jù)個(gè)數(shù)。最小置信度的選取需在所得頻繁集的基礎(chǔ)上多次運(yùn)行規(guī)則挖掘算法并觀察規(guī)則集才能確定。關(guān)聯(lián)規(guī)則挖掘算法描述如下:輸入:產(chǎn)品屬性頻繁集,最小置信度minsup

        輸出:產(chǎn)品屬性關(guān)聯(lián)規(guī)則集合

        for each 頻繁集L do begin

        產(chǎn)生其所有子集s;

        for each 非空真子集s do begin

        ifSupport(L)/Support(s)>=minconf

        return 規(guī)則s→(L-s);

        end

        end

        第四步,網(wǎng)絡(luò)圖構(gòu)建。在得到的關(guān)聯(lián)規(guī)則集合中,由頻繁2-項(xiàng)集產(chǎn)生的規(guī)則能夠體現(xiàn)兩個(gè)屬性之間的關(guān)聯(lián)關(guān)系,且規(guī)則的前項(xiàng)和后項(xiàng)之間并非因果關(guān)系,故將每個(gè)屬性視為網(wǎng)絡(luò)節(jié)點(diǎn),并將頻繁2-項(xiàng)集的規(guī)則刻畫成無(wú)向網(wǎng)絡(luò)圖,從而可視化關(guān)聯(lián)屬性及屬性間的關(guān)系。對(duì)于其他由非頻繁2-項(xiàng)集產(chǎn)生的關(guān)聯(lián)規(guī)則,根據(jù)先驗(yàn)原理“如果一個(gè)項(xiàng)集是頻繁的,則它的所有子集也一定是頻繁的”,亦可轉(zhuǎn)化為對(duì)2-項(xiàng)頻繁集關(guān)聯(lián)規(guī)則的描述。例如對(duì)一條規(guī)則{a,b,c}→hvzdb9x可推出是由頻繁4-項(xiàng)集{a,b,c,d}產(chǎn)生,故該頻繁集的子集{a,d}、{b,d}、{c,d}都是頻繁的,所以產(chǎn)生的規(guī)則{a}→d35pn75、→5pr37v5、{c}→x5fvvn5中一定會(huì)有若干條滿足minconf的頻繁2-項(xiàng)集的關(guān)聯(lián)規(guī)則。網(wǎng)絡(luò)圖體現(xiàn)了產(chǎn)品關(guān)聯(lián)屬性及屬性間的關(guān)聯(lián)關(guān)系。其中,節(jié)點(diǎn)的度數(shù)越高,則該節(jié)點(diǎn)的尺寸越大,說(shuō)明與該屬性存在關(guān)聯(lián)關(guān)系的屬性越多。

        第五步,需求特征模式發(fā)現(xiàn)。在得到高、中、低銷售總量區(qū)間關(guān)系模式的網(wǎng)絡(luò)圖后,結(jié)合支持度、置信度兩項(xiàng)指標(biāo)和網(wǎng)絡(luò)分析方法對(duì)相應(yīng)規(guī)則以及屬性網(wǎng)絡(luò)進(jìn)行對(duì)比分析,即可識(shí)別高銷售總量區(qū)間關(guān)系模式與其他兩區(qū)間關(guān)系模式的差異。中、低銷售總量區(qū)間不具備,僅在高區(qū)間具備的關(guān)系模式即為當(dāng)前消費(fèi)者對(duì)該類產(chǎn)品的需求特征模式。

        2.4 方法特點(diǎn)

        本節(jié)所提方法具有五方面特點(diǎn)。第一,能動(dòng)態(tài)挖掘需求特征模式。需求偏好的不斷變化使得消費(fèi)者的需求特征模式不斷改變。該方法通過(guò)持續(xù)獲取新產(chǎn)品銷售總量及新產(chǎn)品介紹集的產(chǎn)品屬性表,能持續(xù)不斷地進(jìn)行關(guān)系模式的更新挖掘,從而動(dòng)態(tài)獲得需求特征模式。

        第二,能全面挖掘產(chǎn)品屬性并且產(chǎn)品屬性具有可重用性。所提方法不但能挖掘文本中的顯性特征,還能挖掘隱性特征,而其他文本挖掘方法只能針對(duì)文本中的顯性內(nèi)容進(jìn)行挖掘。短生命周期體驗(yàn)品的產(chǎn)品介紹沒(méi)有產(chǎn)品屬性的明確說(shuō)明,使用本文所提方法能夠提取產(chǎn)品的隱性屬性,從而可以獲取更全面的產(chǎn)品屬性。并且,因內(nèi)容分析法的類目構(gòu)建遵循窮盡原則,故產(chǎn)品屬性庫(kù)能囊括該類產(chǎn)品的近乎全部屬性。此外,所提方法不斷對(duì)新出現(xiàn)的產(chǎn)品介紹進(jìn)行類目構(gòu)建,能動(dòng)態(tài)得到短生命周期體驗(yàn)品的產(chǎn)品屬性庫(kù)。當(dāng)挖掘新產(chǎn)品的產(chǎn)品屬性時(shí),可以直接利用現(xiàn)有類目體系或在現(xiàn)有類目體系基礎(chǔ)上進(jìn)行完善以挖掘新的產(chǎn)品需求特征模式,可以大大減少時(shí)間成本。

        第三,能可視化構(gòu)建需求特征。所提方法通過(guò)關(guān)聯(lián)分析得到各銷售總量區(qū)間的產(chǎn)品屬性間的關(guān)聯(lián)規(guī)則,并將規(guī)則以網(wǎng)絡(luò)圖形式表達(dá),形成產(chǎn)品屬性關(guān)系網(wǎng)。通過(guò)對(duì)比高、中、低銷售總量區(qū)間的產(chǎn)品屬性關(guān)系網(wǎng),能得到可視化的需求特征模式。

        第四,對(duì)數(shù)據(jù)內(nèi)容具有包容性,適用性強(qiáng)。該方法利用短生命周期體驗(yàn)品的產(chǎn)品介紹提取產(chǎn)品屬性關(guān)系模式,產(chǎn)品介紹是文本數(shù)據(jù)。因此,該方法同樣適用于包含產(chǎn)品屬性的其它類別文本數(shù)據(jù),例如消費(fèi)者評(píng)論等。

        第五,對(duì)數(shù)據(jù)結(jié)構(gòu)具有包容性,適用性強(qiáng)。該方法以文本網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)為輸入數(shù)據(jù),將該類數(shù)據(jù)轉(zhuǎn)化為網(wǎng)絡(luò)圖形式體現(xiàn)數(shù)據(jù)節(jié)點(diǎn)之間的關(guān)系。因此,該方法同樣適用于能轉(zhuǎn)換為網(wǎng)絡(luò)圖的其它復(fù)雜結(jié)構(gòu)數(shù)據(jù),例如產(chǎn)品本身數(shù)據(jù)。

        3 需求特征模式挖掘方法的驗(yàn)證

        利用網(wǎng)絡(luò)爬蟲方法從電影資料庫(kù)(http://www.1905.com)抓取數(shù)據(jù),得到2013至2016年國(guó)內(nèi)上映的476部電影的劇情簡(jiǎn)介及總票房數(shù)據(jù)。對(duì)比各類電影數(shù)量及票房波動(dòng)性,選定數(shù)量較多且總票房波動(dòng)性較大的65部犯罪電影和190部愛情電影,分別進(jìn)行需求特征模式挖掘,以便驗(yàn)證本文所提方法的可行性。

        3.1 基于內(nèi)容分析法的電影產(chǎn)品屬性挖掘

        第一步,目標(biāo)確定。目標(biāo)是通過(guò)電影劇情簡(jiǎn)介獲取電影屬性庫(kù)及電影屬性表。

        第二步,類目體系構(gòu)建。通覽所獲劇情簡(jiǎn)介并結(jié)合現(xiàn)有文獻(xiàn)資料[24],構(gòu)建了電影產(chǎn)品屬性的三級(jí)類目體系。一級(jí)為電影類型;針對(duì)每個(gè)一級(jí)類目又分為主角設(shè)置、內(nèi)容模式和主題精神等二級(jí)類目;每個(gè)二級(jí)類目又?jǐn)U展出若干三級(jí)類目。兩類電影的類目體系如表1和表2所示。依據(jù)構(gòu)建的類目體系即可構(gòu)建電影屬性庫(kù)和電影編碼指南表。

        表1 犯罪電影類目體系

        表2 愛情電影類目體系

        第三、四步,預(yù)編碼及正式編碼。近年主要觀影人群為青年,碩士生具備文本閱讀和理解能力,易于識(shí)別電影簡(jiǎn)介中的顯、隱性屬性。因此,選取兩位具有觀影愛好的碩士生獨(dú)立進(jìn)行編碼工作。在編碼員熟悉類目體系并了解編碼規(guī)則后,進(jìn)入預(yù)編碼階段。為檢驗(yàn)編碼員的編碼信度,按總體的20%抽取樣本,得到13部犯罪電影和38部愛情電影樣本。采取剔除隨機(jī)因素的Scott'sPi方法對(duì)兩位編碼員的結(jié)果進(jìn)行檢驗(yàn),得到0.84的一致率,通過(guò)檢驗(yàn),可以進(jìn)入正式編碼階段。正式編碼時(shí),若劇情簡(jiǎn)介中提到的屬性與屬性庫(kù)中屬性重合,則在編碼表相應(yīng)位置填1,不重合填0。編碼完成后獲得由布爾型數(shù)據(jù)組成的電影屬性表。

        3.2 基于關(guān)聯(lián)分析的電影屬性關(guān)系模式挖掘

        挖掘電影屬性關(guān)系模式時(shí),首先依總票房對(duì)選定的兩類電影分區(qū)。綜合考慮總票房的波動(dòng)性及是否盈利,將電影劃分為票房過(guò)億區(qū)間,代表需求熱點(diǎn)電影集;小于一千萬(wàn)區(qū)間,代表難以回收成本電影集;一千萬(wàn)至一億區(qū)間,代表目前電影市場(chǎng)基線水平的電影集。對(duì)于犯罪類電影,各區(qū)間電影數(shù)依次為28、22、15部。對(duì)于愛情類電影,各區(qū)間電影數(shù)依次為57、73、60部。

        基于之前獲得的電影屬性表,依據(jù)上述分區(qū)即可獲得各區(qū)的電影屬性表,然后確定最小支持度和最小置信度。本文將上一步獲得的電影屬性表作為Apriori算法的輸入,經(jīng)過(guò)多次調(diào)試和對(duì)結(jié)果的觀察,最終確定犯罪類電影的最小支持度為15%,最小置信度為65%;愛情類電影的最小支持度為10%,最小置信度為80%。通過(guò)Apriori算法挖掘,得到犯罪類電影過(guò)億區(qū)間的規(guī)則23條,一千萬(wàn)至一億區(qū)間的規(guī)則12條,小于一千萬(wàn)區(qū)間的規(guī)則12條;愛情類電影過(guò)億區(qū)間的規(guī)則39條,一千萬(wàn)至一億區(qū)間的規(guī)則34條,小于一千萬(wàn)區(qū)間的規(guī)則14條。表3展示了兩類電影在不同總票房區(qū)間內(nèi)按置信度降序排列的部分規(guī)則。

        表3 犯罪類電影和愛情類電影關(guān)聯(lián)規(guī)則(部分)

        3.3 需求特征模式可視化及分析

        對(duì)每個(gè)總票房區(qū)間內(nèi)所有由頻繁2-項(xiàng)集產(chǎn)生的關(guān)聯(lián)規(guī)則進(jìn)行無(wú)向網(wǎng)絡(luò)圖構(gòu)建,并依節(jié)點(diǎn)度數(shù)區(qū)分節(jié)點(diǎn)大小。度數(shù)越大,代表該屬性節(jié)點(diǎn)的關(guān)聯(lián)屬性節(jié)點(diǎn)越多,從而該屬性節(jié)點(diǎn)度數(shù)越大。網(wǎng)絡(luò)圖見表4。

        對(duì)比按總票房分區(qū)的犯罪類電影關(guān)聯(lián)規(guī)則及網(wǎng)絡(luò)圖,可以發(fā)現(xiàn)該類電影具有如下需求特征。在主角設(shè)置方面,過(guò)億區(qū)間中警察屬性節(jié)點(diǎn)的度數(shù)為10,大于該區(qū)間內(nèi)其他主角屬性;其他兩區(qū)間中度數(shù)最大的主角屬性均為平凡人。在內(nèi)容模式方面,過(guò)億區(qū)間中警察與走私、追兇和販毒規(guī)則的置信度均超過(guò)80%;一千萬(wàn)至一億區(qū)間中復(fù)仇與平凡人規(guī)則的置信度達(dá)到87.5%;小于一千萬(wàn)區(qū)間中平凡人與詐騙、偷盜和復(fù)仇規(guī)則的置信度均超過(guò)80%。在主題精神方面,過(guò)億區(qū)間以強(qiáng)調(diào)邪不壓正和批判錯(cuò)誤的法律意識(shí)為主;其他兩區(qū)間主要以強(qiáng)調(diào)人性的自私和扭曲的道德意識(shí)為主。

        表4 兩類電影不同總票房區(qū)間的產(chǎn)品屬性關(guān)系模式網(wǎng)絡(luò)圖

        注:表中字體大小和節(jié)點(diǎn)大小代表屬性出現(xiàn)的頻率,越大頻率越高。

        綜合主角設(shè)置、內(nèi)容模式和主題精神的需求特征,可得出近年國(guó)內(nèi)犯罪類電影的需求特征模式是:集中于以警察為主角的故事,其主要對(duì)抗對(duì)象為毒販、殺手、黑社會(huì);情節(jié)以走私、販毒、追兇為主;主題精神突出邪不壓正和批判錯(cuò)誤的法律意識(shí)。體現(xiàn)該需求特征模式的代表作有《湄公河行動(dòng)》、《殺破狼2》、《掃毒》等。

        對(duì)比總票房分區(qū)的愛情類電影關(guān)聯(lián)規(guī)則及網(wǎng)絡(luò)圖,可以發(fā)現(xiàn)該類電影具有如下需求特征。在主角設(shè)置方面,過(guò)億區(qū)間中包含純情少年和傻妞規(guī)則的置信度最高,達(dá)到90.909%;一千萬(wàn)至一億區(qū)間中,高富帥和摩登女的故事則成了主旋律,包含高富帥和摩登女規(guī)則的置信度最高,達(dá)到100%;小于一千萬(wàn)區(qū)間中則沒(méi)有明顯的主角設(shè)置偏好。在內(nèi)容模式方面,過(guò)億區(qū)間主要集中于青春校園愛情故事和都市愛情故事,并且純情少年或傻妞的青春校園追愛故事規(guī)則的置信度均高達(dá)90%以上;其他兩區(qū)間則主要以都市愛情故事為主。在主題精神方面,目前愛情電影的主題精神以表達(dá)人們對(duì)愛情的迷茫為主。

        綜合主角設(shè)置、內(nèi)容模式和主題精神的需求特征,可得出近年愛情類電影的需求特征模式是:主角設(shè)置以純情少年或傻妞為主,故事的發(fā)生背景多以校園為主,講述青年們的追愛歷程,表現(xiàn)人們對(duì)愛情的迷茫。體現(xiàn)該需求特征模式的代表作有《致我們終將逝去的青春》、《匆匆那年》、《左耳》等。

        4 結(jié)語(yǔ)

        本文提出了一種按銷售總量分區(qū)的產(chǎn)品需求特征模式挖掘方法。該方法以不斷更新的已有短生命周期體驗(yàn)品產(chǎn)品介紹集和銷售總量為源信息;通過(guò)內(nèi)容分析建立產(chǎn)品屬性庫(kù),獲得較全面的產(chǎn)品屬性,得到產(chǎn)品屬性表;通過(guò)產(chǎn)品屬性關(guān)聯(lián)分析,對(duì)關(guān)聯(lián)分析結(jié)果進(jìn)行需求特征的可視化構(gòu)建,挖掘出高銷售總量區(qū)間內(nèi)產(chǎn)品集具備,但中、低區(qū)間不具備的產(chǎn)品屬性關(guān)系模式,從而得到反映市場(chǎng)需求動(dòng)向的動(dòng)態(tài)需求特征模式。該模式可用于指導(dǎo)新產(chǎn)品研發(fā)設(shè)計(jì),降低新產(chǎn)品投資風(fēng)險(xiǎn)。基于2013至2016年中國(guó)犯罪類電影和愛情類電影數(shù)據(jù),驗(yàn)證了方法的可行性,并且得到了近年犯罪類電影和愛情類電影的需求特征模式,可用于指導(dǎo)這兩類電影的創(chuàng)作。

        本文提出的需求特征模式挖掘方法所用信息源為產(chǎn)品介紹,因此,該方法不僅適用于短生命周期產(chǎn)品,同樣適用于具有產(chǎn)品介紹的長(zhǎng)生命周期產(chǎn)品。研究存在三方面局限。首先,本研究?jī)H通過(guò)產(chǎn)品介紹獲取需求特征模式,沒(méi)有運(yùn)用產(chǎn)品本身和消費(fèi)者評(píng)論。將來(lái)可嘗試豐富源信息,從而挖掘更加全面的需求特征模式。其次,該方法的第四步以人工方式進(jìn)行,具有一定主觀性,效率較低。為降低主觀性提升效率,未來(lái)可通過(guò)構(gòu)建產(chǎn)品屬性庫(kù)中的屬性類目和可能的顯性及隱性屬性之間的一對(duì)多關(guān)系,提出產(chǎn)品屬性表智能化構(gòu)建方法。第三,該方法只能用于按銷售總量挖掘的需求特征模式,無(wú)法挖掘產(chǎn)品銷售趨勢(shì)模式,值得將來(lái)研究。

        猜你喜歡
        關(guān)聯(lián)規(guī)則特征
        撐竿跳規(guī)則的制定
        “苦”的關(guān)聯(lián)
        數(shù)獨(dú)的規(guī)則和演變
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        奇趣搭配
        讓規(guī)則不規(guī)則
        Coco薇(2017年11期)2018-01-03 20:59:57
        抓住特征巧觀察
        智趣
        讀者(2017年5期)2017-02-15 18:04:18
        TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
        人人澡人人妻人人爽人人蜜桃麻豆 | 国产乱子伦农村xxxx| 荡女精品导航| 欧美性猛交xxxx乱大交蜜桃 | 3亚洲日韩在线精品区| 成人水蜜桃视频在线观看| 大又大又粗又硬又爽少妇毛片| 中国老熟妇506070| 狠狠做深爱婷婷久久综合一区| 久久久久久久综合狠狠综合| 亚洲精品456| 亚洲av成人一区二区三区色| 久久亚洲国产高清av一级| 国产亚洲91精品色在线| 国产精品久久久久久妇女| 国产乱xxⅹxx国语对白| 亚洲成人中文| 精品国产又大又黄又粗av| 国产精品国产三级野外国产| 无码国产精品一区二区免费式芒果 | 97久久草草超级碰碰碰| 国产亚洲欧美日韩综合一区在线观看| 免费观看成人稀缺视频在线播放| 国产一区在线视频不卡| 国产午夜精品无码| 国产精品无码不卡一区二区三区| 国产欧美久久久精品影院| 日韩av一区二区三区精品久久| 亚洲最大成人网站| 色欲av蜜桃一区二区三| 黑人性受xxxx黑人xyx性爽| 成人偷拍自拍在线视频| 国产91精品在线观看| 久久国产人妻一区二区| 国产精自产拍久久久久久蜜| 中文字幕成人精品久久不卡| 日韩精品一区二区三区人妻在线| 激烈的性高湖波多野结衣| 免费看久久妇女高潮a| 最新福利姬在线视频国产观看 | 国产亚洲精品综合在线网站|