亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        植基部落格之資料探勘模式以探索顧客需求

        2009-04-29 00:00:00陳隆升林姿呈
        中國管理信息化 2009年15期

        [摘 要]由于部落格(Blogs)的普及,導(dǎo)致愈來愈多的企業(yè)希望能從大量的使用者文章中擷取出有用的信息,從中了解消費(fèi)者需求及市場(chǎng)導(dǎo)向,以幫助企業(yè)改善商品及服務(wù)質(zhì)量,抑或評(píng)估企業(yè)本身或同業(yè)競(jìng)爭(zhēng)者的優(yōu)劣勢(shì)。本研究針對(duì)部落格中的產(chǎn)品使用心得,提出一套FAIR 模塊,希望藉由該模塊得以達(dá)到在短時(shí)間內(nèi)有效地分析產(chǎn)品評(píng)價(jià),以利于企業(yè)或消費(fèi)者在掌握商品重點(diǎn)特色及整體評(píng)價(jià)時(shí),能避免閱讀大量文章的時(shí)間耗費(fèi)并無從理出頭緒的情形。FAIR 模塊為模糊自適應(yīng)共振理論(Fuzzy ART)結(jié)合隱含語意索引(LSI)的特性,將文章集予以分群并從中擷取出代表性關(guān)鍵詞,以達(dá)到信息檢索的目的,最終再通過關(guān)聯(lián)法則(AR)提升關(guān)鍵詞的解釋性。通過FAIR模塊所擷取出來的消費(fèi)者心聲,我們更進(jìn)一步地應(yīng)用于質(zhì)量機(jī)能展開,將顧客需求轉(zhuǎn)化為技術(shù)需求,以分別了解產(chǎn)品本身或同業(yè)之間的競(jìng)爭(zhēng)力,使企業(yè)充分掌握顧客需求,并提升產(chǎn)品設(shè)計(jì)之適用性。最后,我們以美容保養(yǎng)品之部落格文章作為實(shí)驗(yàn)對(duì)象,以說明并驗(yàn)證所提出的FAIR 模塊之效力。

        [關(guān)鍵詞]信息檢索;模糊自適應(yīng)共振理論類神經(jīng)網(wǎng)絡(luò);隱含語意索引;關(guān)聯(lián)法則;質(zhì)量機(jī)能展開

        doi:10.3969/j.issn.1673-0194.2009.15.010

        [中圖分類號(hào)]TP391[文獻(xiàn)標(biāo)識(shí)碼]A[文章編號(hào)]1673-0194(2009)15-0031-05

        1 前 言

        部落格(Blogs)已成為時(shí)下流行的信息交流媒介之一,其普遍性可根據(jù)Technorati于2008年的統(tǒng)計(jì)數(shù)據(jù),全球網(wǎng)絡(luò)的部落格讀者已達(dá)1.889億人之多,其成長(zhǎng)的速度由2002年開始,平均每天至少有900 000篇新文章被發(fā)布。使用者可藉由部落格撰寫文章,為自己的生活做記錄,亦可分享本身經(jīng)驗(yàn)及對(duì)事物的評(píng)價(jià)和觀感[1]。

        相關(guān)文獻(xiàn)指出,人們通過部落格傳播個(gè)人的意見及想法,可能將導(dǎo)致互相影響的效果,甚至因而產(chǎn)生被洗腦的現(xiàn)象[2],這意味著部落格儼然已成為日常生活中不可或缺的溝通管道之一。近年來,許多企業(yè)已掌握住部落格快速傳播訊息的特性,適時(shí)地將其應(yīng)用于企業(yè)內(nèi)外部或服務(wù)顧客,甚至藉由部落格導(dǎo)正企業(yè)形象,避免及減少負(fù)面評(píng)價(jià)的產(chǎn)生。許多廠商亦開始將部落格視為一種經(jīng)營(yíng)產(chǎn)品的管道,提供部落客免費(fèi)試用及體驗(yàn)商品,藉由部落格的高度感染力,進(jìn)而提高產(chǎn)品的曝光程度、可信度、抑或?qū)υ撋唐纷魇袌?chǎng)調(diào)查[3]。故公司企業(yè)如果能成功地運(yùn)用部落格,依賴其快速且容易使人信服的口耳相傳特性,必定能達(dá)到有效的營(yíng)銷效果[4]。以Nissan為例,該公司于2005年為新車Tiida成立了專屬部落格,提供車主們分享駕駛心得、經(jīng)驗(yàn)、以及影音照片的空間,使車主以及潛在消費(fèi)者得以產(chǎn)生交流和互動(dòng),而部落格中所討論到的問題及評(píng)價(jià),也幫助該公司作為參考,從中發(fā)掘?qū)ζ髽I(yè)有用的信息[5]。

        過去也曾有諸位學(xué)者對(duì)部落格進(jìn)行網(wǎng)絡(luò)探勘的研究,Todoroki et al.建立一套以部落格為主的電子化系統(tǒng),讓使用者可以通過簡(jiǎn)易的操作平臺(tái),對(duì)部落格加以管理、編輯及搜尋[6];Chau and Xu以半自動(dòng)化的機(jī)制,針對(duì)部落格當(dāng)中的特殊族群(如種族主義者)進(jìn)行分析及監(jiān)控,避免危害社會(huì)的可能性[2];Lin and Huang從分析個(gè)案中發(fā)現(xiàn),部落格擁有強(qiáng)大的影響力,觀光業(yè)可藉由部落格的特性,開創(chuàng)市場(chǎng)商機(jī)[7];相關(guān)應(yīng)用之文獻(xiàn)皆以Web Usage Mining[8]及Web Structure Mining[2]為主要導(dǎo)向,而近年來有關(guān)于部落格之Web Content Mining的應(yīng)用,則主要通過資料之搜集,以分析當(dāng)前部落格主要的議題及討論趨勢(shì)[9]。其中以Latent Semantic Analysis(LSA)最常被應(yīng)用于部落格Content Mining之中。此外,針對(duì)部落格搜尋引擎的部分,亦常使用Probabilistic Latent Semantic Analysis(PLSA)于追蹤最熱門之部落格標(biāo)題及關(guān)鍵詞。然而,通過此類信息檢索技術(shù)所擷取出來的關(guān)鍵詞,并不易于解讀其代表之含意,故本研究提出一套FAIR(Fuzzy Adaptive Resonance Theory based Information Retrieval scheme)模塊,結(jié)合自適應(yīng)模糊理論(Fuzzy ART)類神經(jīng)網(wǎng)絡(luò)[10]及隱含語意索引(LSI)[11]達(dá)到信息檢索之功效,并通過關(guān)聯(lián)法則(Association Rules)[12,13]技術(shù),以提升其關(guān)鍵詞之可讀性。最后,我們以美容保養(yǎng)品之部落格文章作為實(shí)驗(yàn)對(duì)象,以驗(yàn)證所提出的FAIR模塊之有效性。

        2 FAIR模塊

        本章將針對(duì)所提出之FAIR模塊進(jìn)行詳細(xì)的方法及流程介紹,將部落格之產(chǎn)品使用心得分享做內(nèi)容探勘,利用分群技術(shù)將文章集劃分為若干群組,并通過探勘技術(shù)擷取出文章的代表性詞匯,以達(dá)到短時(shí)間內(nèi)即可掌握相關(guān)評(píng)價(jià)信息。FAIR之研究流程可分為5個(gè)步驟:

        (1)搜集部落格文章;

        (2)數(shù)據(jù)之前置處理;

        (3)文章分群;

        (4)語意檢索;

        (5)提升解釋性;

        (5)質(zhì)量機(jī)能展開。

        各步驟之詳細(xì)介紹請(qǐng)參考2.1~2.6節(jié)之內(nèi)容。

        2.1 部落格之文章搜集

        由于使用者從部落格參考特定內(nèi)容之文章,勢(shì)必耗費(fèi)大量的時(shí)間瀏覽閱讀,而文章內(nèi)容及評(píng)價(jià)皆不一,使得獲得信息的過程變得冗長(zhǎng)、無效率,進(jìn)而使得參考的結(jié)果較為模糊化,讓部落客在擷取產(chǎn)品信息而言,成為一門耗時(shí)且耗力的工作。故本研究針對(duì)部落格文章進(jìn)行內(nèi)容探勘,故首要步驟為搜集部落格文章,而文章的篩選條件則以美容保養(yǎng)品為例,希望藉由資料探勘的過程,擷取出該產(chǎn)品的重點(diǎn)信息,以具代表性之關(guān)鍵詞表達(dá)該產(chǎn)品的優(yōu)缺點(diǎn),亦或備受關(guān)切的要項(xiàng)及特點(diǎn)。

        2.2 數(shù)據(jù)之前置處理

        在進(jìn)行數(shù)據(jù)探勘之前,必須對(duì)資料做前置處理的動(dòng)作,為避免太多噪聲的干擾,進(jìn)而影響探勘的結(jié)果及效率,故于文章搜集后,逐篇針對(duì)其文字及注音文進(jìn)行修改或刪除的動(dòng)作。再者,我們利用中央研究院的中文斷字系統(tǒng)進(jìn)行斷詞,該系統(tǒng)依據(jù)其定義的詞典,進(jìn)而將特定詞匯切割為一個(gè)獨(dú)立字詞,斷詞后的文章,依名詞及動(dòng)詞作為篩選條件,將符合其詞性之詞匯擷取出,以作為文章之關(guān)鍵詞。

        詞匯-文件向量矩陣常被使用于信息檢索中,由于它能表達(dá)詞匯與文件間的關(guān)聯(lián)性,向量的結(jié)果亦方便進(jìn)行群聚及分類的處理,故本研究根據(jù)斷詞后的篩選結(jié)果,進(jìn)行建立詞匯-文件向量矩陣的步驟,以欄作為關(guān)鍵詞的向量表示,以列作為文章編號(hào)的向量表示,依據(jù)每篇文章的關(guān)鍵詞集合,在該文章編號(hào)所對(duì)應(yīng)的關(guān)鍵詞向量當(dāng)中,該關(guān)鍵詞未出現(xiàn)于文章中則填入0值,反之,該關(guān)鍵詞出現(xiàn)于文章中則填入1值。

        2.3 文章分群

        根據(jù)步驟二所建立的詞匯-文件向量矩陣,我們將其作為文章分群的依據(jù),藉由模糊自適應(yīng)共振理論(Fuzzy ART)類神經(jīng)網(wǎng)絡(luò)將文章區(qū)分為若干個(gè)集合,將文章內(nèi)容近似的文章視為同一個(gè)群組,希望從分群的結(jié)果中,觀察顧客對(duì)該產(chǎn)品的心得主要可劃分為哪些類別要項(xiàng)。

        Fuzzy ART類神經(jīng)網(wǎng)絡(luò)于1991年由Carpenter et al.所提出,屬于非監(jiān)督式學(xué)習(xí)的網(wǎng)絡(luò)模式,其結(jié)合模糊集合理論(Fuzzy Set Theory)與自適應(yīng)共振理論(Adaptive Resonance Theory,ART),以改善過去ART所面臨的輸入格式之限制。相較于Fuzzy ART,ART1僅接受二元值作為輸入數(shù)據(jù)的格式,不支持介于0至1之間的連續(xù)值;而整體執(zhí)行架構(gòu)方面,F(xiàn)uzzy ART亦比ART2簡(jiǎn)單得多,不須要經(jīng)過數(shù)據(jù)正規(guī)化的程序,即可達(dá)到快速并穩(wěn)定的收斂分群[14]。此外,F(xiàn)uzzy ART不需要事先定義分群數(shù),故可避免人為因素的干擾,進(jìn)而影響分群結(jié)果的準(zhǔn)確性。

        Fuzzy ART的運(yùn)作方式與人類的記憶系統(tǒng)相似[15],在學(xué)習(xí)新對(duì)象特性的同時(shí)(具可塑性),又必須保留舊對(duì)象特性的記錄(穩(wěn)定性),但此兩項(xiàng)特性存在著沖突關(guān)系,而解決此項(xiàng)問題的方法即采用共振測(cè)試或稱警戒值測(cè)試(Vigilance test)。共振測(cè)試即通過警戒值判斷數(shù)據(jù)相似與否[16,17]。當(dāng)向量數(shù)據(jù)輸入時(shí),首先必須設(shè)定其相關(guān)參數(shù):ρ(Vigilance parameter),定義群集相似度的標(biāo)準(zhǔn);α(Choice parameter),在快速學(xué)習(xí)模式中,通常建議趨近于0。若α=1,則表示無條件通過共振測(cè)試;β(Learning rate),更新權(quán)重時(shí)所使用,其大小影響學(xué)習(xí)速度的快慢。

        再者,通過計(jì)算選擇函數(shù)(1),確定元素執(zhí)行共振測(cè)試時(shí)之順序,以最大值為優(yōu)先(2),其計(jì)算方式如下列公式所示[11]:

        Tj=|I∧Wj|α+|Wj|(1)

        Tj=MAX{Tj∶j=1,N}(2)

        其中,Wj為輸入向量數(shù)據(jù)I之權(quán)重;∧的定義為(X∧Y)=MIN(Xi, Yi);||之定義為|X|=∑mi=2Xi。確定優(yōu)先級(jí)后,依公式(3)計(jì)算該值與群組之間的相似度,若大于等于ρ值,則表示通過共振測(cè)試,其條件符合該群組之特色,可歸納為同一群組。

        |I∧Wj||I|≥ρ(3)

        2.4 信息攫取

        文章經(jīng)由分群后,必須擷取出每個(gè)群組所表達(dá)的主旨,因此本研究利用隱含語意索引(Latent Semantic Index,LSI)進(jìn)行文章內(nèi)容分析,而經(jīng)由奇異值分解(Singular Value Decomposition,SVD)后的結(jié)果,將可擷取出每篇文章最具代表性的關(guān)鍵詞,每個(gè)群組根據(jù)所屬的關(guān)鍵詞集合,便可輕易地觀察出哪些文章關(guān)切著什么重點(diǎn),例如若干人認(rèn)為該產(chǎn)品售價(jià)太貴、若干人認(rèn)為該產(chǎn)品的味道很刺鼻等。

        學(xué)者Deerwester et al.于1990年提出了隱含語意索引(Latent Semantic Index,LSI)的概念,為信息檢索領(lǐng)域中常被予以應(yīng)用的一項(xiàng)技術(shù),用以發(fā)掘文件之隱含語意。隱含語意索引利用向量空間的概念,將文件及索引詞以投影至向量空間的方式呈現(xiàn),可表示出索引詞與索引詞、索引詞與文件、及文件與文件之間的關(guān)聯(lián),其主要目的為有效縮減數(shù)據(jù)維度,減少信息檢索所必需秏費(fèi)的時(shí)間,并可解決一字多義(polysemy)及多字一義(synonymy)之問題。

        隱含語意索引主要仰賴奇異值分解(Singular Value Decomposition,SVD)的執(zhí)行,其目的為將數(shù)據(jù)維度縮減100至300大小的維度空間[18]。假設(shè)A為m×n之矩陣,其rank(A)=r并滿足m≥n之條件,對(duì)A做奇異值分解則可表示為A=USVT,其中S=diag(σ1,…, σn),σ1>0 for 1≤i≤r,σj=0 for σj≥r+1,且UTU=VTV=In。U為詞匯之向量集合,其行向量稱之為左奇異向量(Left singular value)。V為文件之向量集合,其行向量稱之為右奇異向量(Right singular value),S為對(duì)角矩陣,其示意圖如圖1所示[19]。

        圖1 奇異值分解之示意圖

        2.5 提升解釋性

        由上個(gè)步驟可得知每個(gè)群組的代表性關(guān)鍵詞,然而,關(guān)鍵詞的可讀性不甚理想,故本研究通過關(guān)聯(lián)法則,將詞匯做組合的動(dòng)作,使得結(jié)果更具邏輯且精確,而使用者也能更輕易地解讀其最終結(jié)果。

        關(guān)聯(lián)法則(Association rules)系由學(xué)者Agrawal et al.于1993年提出,其主要目的為找出項(xiàng)目之間所隱含的關(guān)聯(lián)性[12]。關(guān)聯(lián)法則應(yīng)用于交易系統(tǒng)中,可輕易地從大量的顧客交易數(shù)據(jù)記錄里,依顧客的消費(fèi)習(xí)性及購買商品清單,發(fā)掘出人為不易發(fā)現(xiàn)的隱藏信息。譬如購買了某產(chǎn)品的同時(shí),通常也會(huì)伴隨另一項(xiàng)產(chǎn)品的購買欲,此類信息即可提供決策者擬定有效的產(chǎn)品組合或促銷活動(dòng),并有助于賣場(chǎng)動(dòng)線規(guī)劃及控管進(jìn)貨量的安排。

        假設(shè)I為所有項(xiàng)目的集合,而X和Y各代表某些項(xiàng)目的集合,并且滿足X及Y皆包含于I、X∩Y不為空集之條件,如欲觀察消費(fèi)者購買X與Y項(xiàng)目的關(guān)聯(lián)性,則可通過關(guān)聯(lián)法則之表示式X→Y[support%, confidence%]得知,而該法則成立與否則是依據(jù)事先定義的支持度(support)與信心度(confidence)之門坎值來判斷,支持度與信心度必須等于或大于門坎值,該法則才予以有效性及參考價(jià)值。支持度與信心度為關(guān)聯(lián)法則的主要評(píng)量指針,支持度可顯示特定的項(xiàng)目集在所有項(xiàng)目集中所占有的比率,其值愈高即表示該項(xiàng)目集出現(xiàn)的次數(shù)愈頻繁,計(jì)算方法如公式(4)所示;信心度則可顯示觸發(fā)X項(xiàng)目的情況下,Y項(xiàng)目亦伴隨發(fā)生的條件概率,計(jì)算方法如公式(5)所示。

        Support(X→Y)=X∩YI(4)

        Conridence(X→Y)=Support(X→Y)Support(X)(5)

        2.6 質(zhì)量機(jī)能展開

        質(zhì)量機(jī)能展開(Quality Function Deployment,QFD)為幫助企業(yè)了解顧客需求的一套工具,系由日本質(zhì)量學(xué)家赤尾洋二與水野滋所提出[20]。QFD可將顧客之意見納入產(chǎn)品開發(fā)的過程,以確保公司產(chǎn)品在經(jīng)過消費(fèi)者需求之考慮后,可達(dá)到滿足甚至超越顧客之期望,進(jìn)而提升企業(yè)競(jìng)爭(zhēng)力與獲利。而QFD的主要結(jié)構(gòu)是以一關(guān)系矩陣為基礎(chǔ),如圖2所示,該矩陣包含了兩種向量概念,一為顧客需求(What),另一個(gè)則為技術(shù)需求(How)。顧客需求即企業(yè)通過問卷或市場(chǎng)調(diào)查所獲取并歸納出的顧客需要,技術(shù)需求則是為了衡量及具體化顧客需求所產(chǎn)生的要件和尺標(biāo),而這顧客需求及技術(shù)需求之間的關(guān)聯(lián)強(qiáng)度則是通過關(guān)系矩陣來表示,通常以◎、○、△表示其對(duì)應(yīng)關(guān)系的強(qiáng)、中、弱,并分別以9、3、1作為其數(shù)值化的參考。每項(xiàng)顧客需求則需依顧客的角度定義其重要度,通常重要度由低至高以1到10表示之。于QFD結(jié)構(gòu)最下層之加權(quán)重要性,則表示著每項(xiàng)技術(shù)需求的重要程度(影響力),計(jì)算方式為顧客需求之重要性與技術(shù)需求之關(guān)聯(lián)強(qiáng)度乘積之加總。

        圖2 質(zhì)量機(jī)能展開之主要結(jié)構(gòu)

        3 實(shí) 驗(yàn)

        3.1 部落格之文章搜集

        本研究以美容保養(yǎng)產(chǎn)品“雪肌精化妝水”作為實(shí)驗(yàn)范例,搜集該產(chǎn)品之相關(guān)部落格文章,以FAIR模塊實(shí)證研究目的之效益。數(shù)據(jù)來源以“無名小站部落格”以及“UrCosm化妝品使用心得分享網(wǎng)站”為主,以雪肌精化妝水為搜尋主題,搜集該產(chǎn)品之使用心得文章,文章筆數(shù)共300則,以下為文章內(nèi)容之范例:

        最近愛上雪肌精,我還滿愛它那個(gè)味道的~香香的,靠柜當(dāng)天用完也沒有紅or其他事情發(fā)生,那天柜姊也有幫我上乳液,本來想說會(huì)很油,但是我個(gè)人覺得還ok耶,而且也是香香的~~,真的是買對(duì)了(感動(dòng)~~~~),我很enjoy那個(gè)味道~呵,都是用化妝棉沾濕上全臉,大家說用完會(huì)很干,不過我不會(huì)耶~~,不黏不油,good~!!!

        3.2 數(shù)據(jù)之前置處理

        文章內(nèi)容經(jīng)由適當(dāng)?shù)男拚螅催M(jìn)行中文斷詞之處理,依斷詞后之詞性,擷取出符合名詞及動(dòng)詞之詞匯作為文章關(guān)鍵詞之代表。300篇文章之?dāng)嘣~結(jié)果共產(chǎn)生了736筆非重復(fù)詞匯,經(jīng)由詞性篩選關(guān)鍵詞之步驟后,詞匯數(shù)則降至為466筆。最后依關(guān)鍵詞及文件之分布關(guān)系,建立詞匯-文件向量矩陣,其大小為300 × 466,該矩陣之部分范例結(jié)果如表1所示。

        表1詞匯-文件向量矩陣之范例結(jié)果

        美白透亮嗆鼻酒精效用…

        Doc 111011…

        Doc 201100…

        Doc 301010…

        …………………

        3.3 文章分群之結(jié)果

        之相關(guān)參數(shù)設(shè)定如下:α設(shè)置為0.000 1、β設(shè)置為1。而由于無法事先定義最終之分群數(shù),故采取實(shí)驗(yàn)不同ρ值之分群,其范圍從0.9至0.5,以0.05作為間隔單位,結(jié)果如圖3所示。

        圖3 不同ρ值之分群數(shù)比較

        當(dāng)ρ=0.55時(shí),其分群數(shù)開始達(dá)到收斂之效果,與其他分群數(shù)之差距甚小,故本實(shí)驗(yàn)選擇分群數(shù)為4之結(jié)果作為依據(jù)。而根據(jù)Fuzzy ART之執(zhí)行結(jié)果,群組一到群組四之文件數(shù)各別為84、47、66及103篇。

        3.4 語意檢索

        根據(jù)SVD之文件向量V矩陣(右奇異向量),于每個(gè)文件所對(duì)應(yīng)到的關(guān)鍵詞集合中,取其最大值所對(duì)應(yīng)之關(guān)鍵詞作為該文件之代表性詞匯。而根據(jù)Fuzzy ART之分群結(jié)果,可匯整出每個(gè)群組所對(duì)應(yīng)之文件集合,而經(jīng)由LSI之萃取文件代表性詞匯的過程,各群組則可表示為若干個(gè)代表性詞匯的集合,如表2所示,其結(jié)果為取代表性詞匯出現(xiàn)頻率大于5之部分范例。

        表2各群組之代表性詞匯

        群組一群組二群組三群組四

        均勻刺激清爽痘痘

        味道酒精味效果消炎

        美白傷口明顯舒服

        …………

        3.5 關(guān)聯(lián)法則之提升解釋性

        從表2中可發(fā)現(xiàn),逐筆解讀每個(gè)關(guān)鍵詞之意義頗為困難,由于字匯缺乏該程度之描述,譬如以關(guān)鍵詞“功效”而言,意味著該產(chǎn)品具有功效?抑或該產(chǎn)品具有何種功效?其模糊性質(zhì)導(dǎo)致無法從關(guān)鍵詞揣測(cè)其代表之意涵。為解決此一問題,本研究導(dǎo)入關(guān)聯(lián)法則以提升關(guān)鍵詞之可讀性。表3為群組一及群組二之實(shí)驗(yàn)結(jié)果。

        表3導(dǎo)入關(guān)聯(lián)法則之結(jié)果

        組 別項(xiàng) 目關(guān)聯(lián)法則Sup%times

        群組一

        Item 1好→效果16.667% 14

        Item 2味道→效果5.952% 5

        Item 3變白→效果8.333% 7

        Item 4痘痘→效果11.905% 10

        群組二

        Item 1刺激→變白6.383% 3

        Item 2刺激→酒精味6.383% 3

        Item 3刺激→臉8.511% 4

        由分析結(jié)果可發(fā)現(xiàn),關(guān)聯(lián)法則有效提升了關(guān)鍵詞之可讀性,比較于單一詞匯之結(jié)果,關(guān)聯(lián)法則以詞匯組合的方式呈現(xiàn),有助于降低其模糊性質(zhì),同時(shí)亦能看出各群組之消費(fèi)者所著重的概念為何,以表3結(jié)果為例,群組一之顧客群著重于效果的呈現(xiàn),群組二之顧客群則著重于刺激性的描述。藉此,使得企業(yè)決策者或消費(fèi)者更易于明白其涵義,對(duì)于改善產(chǎn)品或購買決策而言,該分析結(jié)果能提供更為精確之參考方針。

        3.6 質(zhì)量機(jī)能展開

        本研究通過關(guān)聯(lián)法則的解釋作為顧客需求的依據(jù),并根據(jù)關(guān)聯(lián)法則的解釋作為顧客需求的依據(jù),并根據(jù)關(guān)聯(lián)規(guī)則所包含的詞匯,計(jì)算其出現(xiàn)頻率的總合并正規(guī)化,使其范圍落于1至10之間,作為重要性指標(biāo)之值。而由于該保養(yǎng)品之顧客需求主要皆著重在質(zhì)地及效果的部分,故本研究以產(chǎn)品成分作為技術(shù)要求的參考依據(jù),質(zhì)量機(jī)能展開之結(jié)果如表4所示。

        表4雪肌精化妝水之質(zhì)量機(jī)能展開

        重要性

        顧客面

        技術(shù)面

        GlycerinTriticumVulgare StarchGerm OilDipotassiumGlycyrrhizateHamanelisExtractTocopheryl Acetate

        8質(zhì)地很清爽 9

        6擦起來冰冰涼涼

        6皮膚感覺不油膩 3

        6保濕度很好 999

        6產(chǎn)品物超所值33

        5感覺具有消炎作用999

        4擦起來很保濕999

        3幫助消炎抗痘999

        加權(quán)重要性9090162909090

        由結(jié)果可知,Germ Oil為影響力較大之技術(shù)需求,該成分之特性對(duì)于保濕及抗氧化皆有明顯功效,符合消費(fèi)者所著重之需求,可視為該產(chǎn)品之優(yōu)勢(shì)。企業(yè)能藉由QFD了解產(chǎn)品于市場(chǎng)中的表現(xiàn),進(jìn)一步發(fā)掘各項(xiàng)技術(shù)需求是否足以使得顧客滿意,進(jìn)而繼續(xù)維持優(yōu)勢(shì),抑或改善表現(xiàn)較為不甚理想之技術(shù)需求。

        4 結(jié) 論

        隨著部落格使用性的普及,其儼然已成為一項(xiàng)不可或缺之溝通媒介,使用者藉由部落格與其他部落客分享彼此的生活及想法,輕易地便可從部落格當(dāng)中,查詢到豐富的信息。然而,在信息過載的情況下,使用者及企業(yè)如何從中有效地發(fā)掘重點(diǎn)信息為其關(guān)鍵要項(xiàng)。本研究提出一套FAIR模塊,并以美容保養(yǎng)品-雪肌精為例,以探勘部落格之關(guān)鍵信息為目的。

        本研究嘗試以FAIR模塊,利用Fuzzy ART將關(guān)于雪肌精化妝水之部落格文章做分群,內(nèi)容性質(zhì)相似的文章得以群聚,從各群組中也可觀察出消費(fèi)者對(duì)于該產(chǎn)品有哪些主要的特征及認(rèn)知,并以LSI及AR幫助解讀各群組之涵義。于實(shí)際執(zhí)行該模塊流程后發(fā)現(xiàn),F(xiàn)AIR模塊可確實(shí)擷取出該產(chǎn)品之主要特征,于未事先了解該產(chǎn)品信息之前,通過FAIR之分析結(jié)果,即可大約掌握其產(chǎn)品之特征信息,對(duì)于企業(yè)決策者而言,能以實(shí)時(shí)且最有效之方法,掌握消費(fèi)者對(duì)于該產(chǎn)品之重點(diǎn)認(rèn)知及產(chǎn)品動(dòng)向。

        此外,對(duì)于企業(yè)而言,F(xiàn)AIR與質(zhì)量機(jī)能展開之結(jié)合,不僅可提供其了解質(zhì)量要項(xiàng)對(duì)于產(chǎn)品之影響力,以作為日后產(chǎn)品改善的參考,更進(jìn)一步地提升了企業(yè)獲取消費(fèi)者意見的效力,以質(zhì)量機(jī)能展開而言,傳統(tǒng)做法的前置步驟為必需先經(jīng)由市場(chǎng)調(diào)查及問卷分析,然而該過程往往必須耗費(fèi)大量的人力及時(shí)間,但藉由FAIR模塊的執(zhí)行,企業(yè)可于短時(shí)間內(nèi)處理并掌握消費(fèi)者于部落格所發(fā)表的評(píng)價(jià)及意見,以延伸至質(zhì)量機(jī)能展開之應(yīng)用。

        5 致 謝

        本研究受到臺(tái)灣科技會(huì)計(jì)劃(契約編號(hào) NSC 96-2416-H-324-003-MY2)部分贊助,作者在此表達(dá)感謝之意。

        主要參考文獻(xiàn)

        [1] A N Bonnie, J S Diane, et al. Why We Blog[J]. Communications of the ACM, 2004, 47(12): 41-46.

        [2] M Chau and J Xu. Mining Communities and Their Relationships in Blogs: A Study of Online Hate Groups[J]. International Journal of Human - Computer Studies, 2007, 65(1):57-70.

        [3] 安德魯#8226;基恩. 你在看誰的部落格[M]. 尤傳莉,譯. 臺(tái)北:早安財(cái)經(jīng)文化有限公司,2008.

        [4] 陳穆臻. 青蛙變身術(shù) Blog 行銷有多行?![J]. 管理雜志,2005(376): 114-117.

        [5] 蔡孟珈. 個(gè)人部落格內(nèi)容出版之探討[D]. 臺(tái)北:世新大學(xué)圖文傳播暨數(shù)位出版系,2007.

        [6] S Todoroki, T Konishi, and S Inoue. Blog-Based Research Notebook: Personal Informatics Workbench for Highthroughput Experimentation[J]. Applied Surface Science, 2006, 252(7): 2640-2645.

        [7] Yu-shan Lin, and Jun-Ying Huang.Internet Blogs as A Tourism Marketing Medium: A Case Study[J]. Journal of Business Research, 2006, 59(10/11): 1201-1205.

        [8] F M Facca and P L Lanzi. Mining Interesting Knowledge from Weblogs: A Survey[J]. Data Knowledge Engineering, 2005, 53(3): 225-241.

        [9] Y Chen, F S Tsai, and K L Chan. Machine Learning Techniques for Business Blog Search and Mining[J]. Expert Systems with Applications, 2008, 35(3): 581-590.

        [10] G A Carpenter, S Grossberg and D B Rosen. Fuzzy ART: Fast Stable Learning and Categorization of Analog Patterns by an Adaptive Resonance System[J]. Neural Networks, 1991, 4(6): 759-771.

        [11] S Deerwester, S T Dumais, et al. Indexing by Latent Semantic Analysis[J]. Journal of the Society for Information Science, 1990, 41(6): 391-407.

        [12] R Agrawal, T Imielinski, and A Swami. Mining Association Rules between Sets of Items in Large Databases[C]. ACM SIGMOD International Conference on Management of Data, 1993: 207-216.

        [13] R Agrawal and R Srikant. Fast Algorithm for Mining Association Rules[C]. 20th International Conference on Very Large Data Bases, 1994: 487-499.

        [14] P Sungjine. Neural Networks and Customer Grouping in E-commerce:A Framework Using Fuzzy ART[C]. Proceedings of Academia/Industry Working Conference, 2000: 331-336.

        [15] 謝正嘉. 應(yīng)用Fuzzy ART與啟發(fā)式規(guī)則偵測(cè)數(shù)據(jù)庫異常聯(lián)機(jī)[R]. 臺(tái)中: 朝陽科技大學(xué)信息管理系,2006.

        [16] L Chen and C Su. Using Granular Computing Model to Induce Scheduling Knowledge in Dynamic Manufacturing Environments[J]. International Journal of Computer Integrated Manufacturing, 2008, 21(5): 569-583.

        [17] C Su, L Chen and Y Yih. Knowledge Acquisition through Information Granulation for Imbalanced Data[J]. Expert System with Applications, 2006, 31(3): 531-541.

        [18]彭華瑞. 應(yīng)用潛在式語意分析于語言模型之研究[D]. 臺(tái)南:成功大學(xué)資訊工程系,2002.

        [19] 吳佳升.使用貝氏潛在語意分析于文件分類及信息檢索[D]. 臺(tái)南:成功大學(xué)資訊工程系,2005.

        [20] 徐世輝. 全面質(zhì)量管理[M]. 臺(tái)北: 華泰文化事業(yè)服務(wù)有限公司,2006.

        Discovering Customer Needs Based on Data Mining from Blogs

        CHEN Long-sheng,LIN Zi-cheng

        (Department of Information Management, Chaoyang University of Technology

        Township, Taichung County 41349, Taiwan, China)

        Abstract:Due to the popularization of blogs, more and more enterprises attempt to acquire useful information from the huge amount of bloggers’ articles to discover customer needs, to trace market shift, and to assist them in improving quality of products or services. In addition, based on these discovered commercial knowledge, enterprises can analyze their strength and weakness compared with their competitors. Therefore, focusing on evaluation comments of products, this study proposes a FAIR (Fuzzy Adaptive resonance theory network based Information Retrieval) scheme by introducing fuzzy ART network, Latent Semantic Indexing (LSI), and Association Rules (AR) discovery to analyze evaluation comments of product features. In FAIR scheme, Fuzzy ART network first has been employed to segment bloggers. For each customer segment, we use LSI technique to retrieve important keywords. Then, in order to make the extracted keywords understandable, AR is presented to organize these keywords to form concepts. Finally, for further applications of these extracted voices of customers, Quality Function Deployment (QFD) and homogeneity analysis have been employed to transform customers needs to technical requirements and to understand the ability of competitors, respectively. Finally, a real case of cosmetics products has been provided to demonstrate the effectiveness of the proposed FAIR scheme.

        Key words: Information Retrieval; Fuzzy Adaptive Resonance Theory Neural Network; Latent Semantic Indexing; Association Rule; Quality Function Deployment

        av网址大全在线播放| 亚洲欧美在线观看| 视频一区二区在线播放| 国产不卡视频一区二区在线观看| 伊人精品成人久久综合97| 久久久久九九精品影院| 精品无码久久久久成人漫画| 另类一区二区三区| 日产精品一区二区在线| 中文字幕乱码亚洲无限码| 国产盗摄xxxx视频xxxx| 欧美日韩国产综合aⅴ| 亚洲综合精品一区二区三区| 亚洲色图三级在线观看| 国产色无码精品视频国产| 国产日韩久久久精品影院首页| 日本高清一区二区三区在线 | 欧美顶级少妇作爱| 无码av免费一区二区三区| 亚洲成a人片在线播放观看国产| 一区二区日本免费观看| 国产成人无码a区在线观看导航 | 一区二区三区精品偷拍| 精品人伦一区二区三区蜜桃91| 亚洲精品一区久久久久久| 美女一级毛片免费观看97| 精品亚洲国产亚洲国产| 天天做天天摸天天爽天天爱| 日本久久精品视频免费| 色视频线观看在线网站| 成人区人妻精品一区二区不卡网站| 日本人妻av在线观看| 电驱蚊液可以插一晚上吗| 国产精品ⅴ无码大片在线看| 综合激情网站| 亚洲av本道一本二本三区| 日本一区二区在线播放| 亚洲精品国产美女久久久| 亚洲精品精品日本日本| 色狠狠一区二区三区中文| 免费a级毛片无码无遮挡|