亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        移動(dòng)APP 演化策略研究*

        2020-01-11 06:26:30歐陽(yáng)逸於志文
        計(jì)算機(jī)與生活 2020年1期
        關(guān)鍵詞:情感用戶模型

        孫 悅,郭 斌,歐陽(yáng)逸,於志文,王 柱

        西北工業(yè)大學(xué) 計(jì)算機(jī)學(xué)院,西安710072

        1 引言

        2018 年1 月發(fā)布的第41 次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》(http://www.cac.gov.cn/2018-01/31/c_1122347026.htm)顯示,截至2017 年11 月,中國(guó)市場(chǎng)上監(jiān)測(cè)到的手機(jī)應(yīng)用軟件(application,APP)在架數(shù)量為391 萬(wàn)款,規(guī)模分布依次為游戲類、生活服務(wù)類、電子商務(wù)類、辦公學(xué)習(xí)類等。APP 的迅猛發(fā)展離不開(kāi)用戶的參與,此外用戶對(duì)APP 的使用態(tài)度和偏好也是決定APP 能否占領(lǐng)市場(chǎng)的關(guān)鍵要素之一。實(shí)時(shí)關(guān)注用戶使用APP 的情況,從反饋系統(tǒng)中了解用戶體驗(yàn)反饋,從而獲得更多用戶積累和支持,對(duì)APP 運(yùn)營(yíng)和演化起到重要作用。

        傳統(tǒng)調(diào)查問(wèn)卷的方法由于其成本高、周期長(zhǎng)、實(shí)時(shí)性差等缺陷,已經(jīng)不能滿足APP 演化的需要。而在線問(wèn)卷等網(wǎng)絡(luò)調(diào)查手段也存在回復(fù)率低,受訪用戶缺乏代表性等問(wèn)題,效果仍不理想。

        2004 年以來(lái),網(wǎng)絡(luò)信息的生成方式發(fā)生了重大變革,海量用戶生成上傳數(shù)據(jù)替代了傳統(tǒng)的網(wǎng)絡(luò)平臺(tái)生成數(shù)據(jù),這些數(shù)據(jù)稱為群智數(shù)據(jù)——用戶群體通過(guò)不同參與模式貢獻(xiàn)的數(shù)據(jù)[1]。近年來(lái),人們開(kāi)始越來(lái)越多地使用各種各樣的在線口碑評(píng)價(jià)平臺(tái)來(lái)分享他們的消費(fèi)體驗(yàn)和對(duì)各種產(chǎn)品的偏好,同時(shí)用戶在選擇使用或者購(gòu)買產(chǎn)品的時(shí)候也會(huì)參考其他用戶對(duì)該產(chǎn)品的評(píng)價(jià)[2]。用戶在應(yīng)用商店評(píng)論自己的使用情況、態(tài)度偏好等,還可以對(duì)APP 進(jìn)行評(píng)星和評(píng)分,這些信息由大量APP 使用者共同參與生成,是典型的群智數(shù)據(jù)中的一種,整理分析這些數(shù)據(jù)能夠幫助APP 實(shí)現(xiàn)智能演化。對(duì)于APP 設(shè)計(jì)者和開(kāi)發(fā)商來(lái)說(shuō),用戶評(píng)價(jià)不僅會(huì)決定APP 的市場(chǎng)前景和流行度,甚至還會(huì)影響商業(yè)規(guī)劃和決策。

        近年來(lái),以在線評(píng)論數(shù)據(jù)為代表的群智數(shù)據(jù)的研究已經(jīng)成為熱點(diǎn),但目前針對(duì)移動(dòng)APP 評(píng)論的研究卻方興未艾,最近的研究有2017 年Martin 等[3]強(qiáng)調(diào)挖掘應(yīng)用商店評(píng)論信息具有巨大價(jià)值,對(duì)于軟件開(kāi)發(fā)團(tuán)隊(duì)在需求設(shè)計(jì)、軟件發(fā)布和測(cè)試等多方面都有直接且重要的意義。有關(guān)研究都表明APP 應(yīng)用商店的文本評(píng)論能夠反映出用戶在選擇APP 使用時(shí)的需求和偏好,并且這些評(píng)論中蘊(yùn)含巨大價(jià)值,對(duì)APP 開(kāi)發(fā)和演化具有促進(jìn)作用。

        因此,本文主要基于群智數(shù)據(jù)——APP 用戶評(píng)論數(shù)據(jù)進(jìn)行分析建模,結(jié)合經(jīng)典評(píng)價(jià)模型,從開(kāi)發(fā)者的角度對(duì)APP 提出演化策略,并給出版本預(yù)測(cè)模型,指導(dǎo)APP 版本更新迭代。

        2 相關(guān)工作

        2.1 在線評(píng)論挖掘

        在線評(píng)論挖掘廣泛應(yīng)用于電子商務(wù)中,綜合文本挖掘、自然語(yǔ)言處理、信息提取、機(jī)器學(xué)習(xí)、信息檢索、概率統(tǒng)計(jì)等多個(gè)知識(shí)領(lǐng)域的研究。對(duì)于產(chǎn)品的在線評(píng)論研究則主要包括:評(píng)論屬性的提取和情感識(shí)別和分類等。

        在線評(píng)論中對(duì)于屬性的識(shí)別方法有很多,如基于人工定義的方法[4]、基于詞頻的方法[5-6]、基于詞語(yǔ)共現(xiàn)的方法[7]、基于模式或規(guī)則的方法[8-9]、基于本體論的方法[10-12]。傳統(tǒng)的屬性提取方法是基于規(guī)則的方法,根據(jù)語(yǔ)法規(guī)則、評(píng)論等陳述性的語(yǔ)句中,主語(yǔ)就是評(píng)論屬性[8]?;谠~頻的方法是按照產(chǎn)品評(píng)論的統(tǒng)計(jì)規(guī)律抽取評(píng)論屬性?;诠铂F(xiàn)模式的研究如Kobayashi 等[13]以車和游戲文本為例用半自動(dòng)化的方式提取產(chǎn)品屬性,Hu 等[5]以電子產(chǎn)品為例,采用詞性標(biāo)注和候選頻繁項(xiàng)集生成、剪枝、識(shí)別等完成屬性識(shí)別。Song 等[14]結(jié)合語(yǔ)料標(biāo)注過(guò)程和支持向量機(jī)的分類原理實(shí)現(xiàn)了一個(gè)基于主動(dòng)學(xué)習(xí)的屬性元素標(biāo)注工具。

        情感識(shí)別和分類的主要任務(wù)是判斷評(píng)論情感傾向是褒義、中性還是貶義,分類方法有基于無(wú)監(jiān)督的點(diǎn)互信息(point-wise mutual information,PMI)的方法[15-16]、基于詞語(yǔ)極性推測(cè)的方法[17]、基于情感詞典的方法[18-19]。Turney[16]提出了應(yīng)用無(wú)監(jiān)督的分類方法識(shí)別產(chǎn)品語(yǔ)義傾向的方法,還采用互信息(PMI)和信息檢索(information retrieval,IR)結(jié)合的算法計(jì)算短語(yǔ)的語(yǔ)義傾向[20]。Hu 等[6]提出利用詞典的詞匯關(guān)系判定詞的極性,根據(jù)WordNet 詞典的特點(diǎn),設(shè)計(jì)了極性詞自動(dòng)分類的算法。

        2.2 需求計(jì)量模型

        需求計(jì)量是產(chǎn)品定位和營(yíng)銷與發(fā)展策略的基礎(chǔ)。其中聯(lián)合分析[21]是一種多元的統(tǒng)計(jì)分析方法,一種用于市場(chǎng)研究,幫助人們定量研究消費(fèi)者選擇偏好的方法,用于估測(cè)消費(fèi)者對(duì)一些能夠詳細(xì)定義的產(chǎn)品屬性的相對(duì)重要性和屬性水平的效用的評(píng)價(jià)。另一種評(píng)價(jià)產(chǎn)品屬性對(duì)顧客滿意度的方式是KANO模型[22]。該模型最早源于日本學(xué)者Noriaki Kano 在20 世紀(jì)80 年代提出的產(chǎn)品開(kāi)發(fā)和客戶滿意度理論,如圖1 所示。

        Fig.1 Diagram of KANO model圖1 KANO 模型示意圖

        該理論將用戶偏好分為五類:(1)魅力屬性。用戶意想不到的,如果不提供此需求,用戶滿意度不會(huì)降低,但當(dāng)產(chǎn)品提供此需求,用戶滿意度會(huì)大幅提升。(2)期望屬性。當(dāng)產(chǎn)品提供此需求,用戶滿意度會(huì)提升,當(dāng)不提供此需求,用戶滿意度會(huì)降低,或稱之為一維屬性。(3)必備屬性。當(dāng)產(chǎn)品優(yōu)化必備屬性的需求,用戶滿意度不會(huì)提升,當(dāng)不提供此需求,用戶滿意度會(huì)大幅降低。(4)無(wú)差異屬性。無(wú)論提供或不提供此需求,用戶滿意度都不會(huì)有改變,用戶根本不在意。(5)反向?qū)傩?。用戶根本都沒(méi)有此需求,提供后用戶滿意度反而會(huì)下降。

        該模型被廣泛應(yīng)用于質(zhì)量管理領(lǐng)域、產(chǎn)品設(shè)計(jì)領(lǐng)域和各種服務(wù)行業(yè)中[23-25]。

        2.3 APP 評(píng)論挖掘

        APP 評(píng)論是用戶直接反饋使用情況和感受的途徑,挖掘其中的信息有助于開(kāi)發(fā)商更好地完成產(chǎn)品升級(jí),更深理解用戶需求和偏好,具有十分重大的研究?jī)r(jià)值。

        Chandy 等[26]最早利用APP Store中爬取的用戶評(píng)論數(shù)據(jù)集設(shè)計(jì)了一個(gè)簡(jiǎn)單模型識(shí)別評(píng)論中的垃圾評(píng)論。后來(lái),Iacob 等[27]基于語(yǔ)言規(guī)則的方法構(gòu)造了一個(gè)用于APP 評(píng)論分析的工具模型(mobile APP review analyzer,MARA),能夠?qū)崿F(xiàn)自動(dòng)檢索評(píng)論中所體現(xiàn)的APP 功能請(qǐng)求。Chen 等[28]創(chuàng)新性地提出了一個(gè)APP 評(píng)論計(jì)算框架(APP review mining,AR-Miner)識(shí)別評(píng)論中的有效信息,并對(duì)信息有效性排序。Vu等[29]提出一種基于關(guān)鍵字的半自動(dòng)化評(píng)論分析框架(mining and analyzing reviews by keywords,MARK),實(shí)現(xiàn)了對(duì)于某一關(guān)鍵詞評(píng)論的篩選、提煉和分析,并能以時(shí)間序列檢測(cè)繪制關(guān)鍵詞屬性的變化曲線。

        至于APP 評(píng)論的情感分析,Thelwall 等[30]首先提出一種基于非正式網(wǎng)絡(luò)信息文本的情感檢測(cè)算法,以商業(yè)目的為導(dǎo)向,檢測(cè)在線產(chǎn)品評(píng)論文本中用戶對(duì)產(chǎn)品的意見(jiàn)。對(duì)于后續(xù)APP 演化升級(jí)的研究,F(xiàn)u等[31]提出一個(gè)可以從細(xì)節(jié)層級(jí)分析用戶評(píng)論和評(píng)分的系統(tǒng),給出了用戶傾向的原因,為應(yīng)用市場(chǎng)提供有價(jià)值可參考的意見(jiàn),同時(shí)也能給APP 市場(chǎng)開(kāi)發(fā)人員提供技術(shù)支持。Guzman 等[32]提出一種幫助APP 開(kāi)發(fā)者自動(dòng)篩選、聚合和分析評(píng)論的方法,首先使用自然語(yǔ)言處理識(shí)別評(píng)論中包含的應(yīng)用程序的屬性,然后在所有識(shí)別的屬性評(píng)論中,給該屬性進(jìn)行一個(gè)評(píng)分,最終幫助開(kāi)發(fā)者系統(tǒng)分析APP 單一屬性的意見(jiàn)。后來(lái),Guzman 等[33]又提出一個(gè)基于特征和情感為中心的檢索方法,能自動(dòng)為開(kāi)發(fā)人員提供不同的用戶評(píng)論,代表評(píng)論中涉及的不同意見(jiàn)和經(jīng)驗(yàn)。

        3 APP 評(píng)論數(shù)據(jù)的采集和預(yù)處理

        為便于用戶對(duì)比選擇,APP 市場(chǎng)的應(yīng)用商店會(huì)給出APP 的綜合評(píng)級(jí)(或評(píng)分)和排行情況。同時(shí),APP應(yīng)用商店還會(huì)鼓勵(lì)下載用戶及時(shí)反饋問(wèn)題和使用情況。APP 開(kāi)發(fā)商可以通過(guò)各大應(yīng)用商店獲取用戶評(píng)論,從反饋的信息中挖掘功能需求、用戶偏好和建議等,有助于實(shí)現(xiàn)APP 的演化,從而不斷實(shí)現(xiàn)功能完善、界面優(yōu)化等。

        國(guó)內(nèi)知名移動(dòng)應(yīng)用商店有:安智市場(chǎng)、豌豆莢、騰訊應(yīng)用寶、360 手機(jī)助手、百度應(yīng)用商店等。除此之外,各大品牌手機(jī)都有專門(mén)的應(yīng)用商店。為了保證數(shù)據(jù)可靠性,同時(shí)也能保證應(yīng)用商店的評(píng)論是足量且可獲取的,從數(shù)個(gè)平臺(tái)上挑選出以下9 家平臺(tái)進(jìn)行數(shù)據(jù)采集。它們分別是:360 手機(jī)助手、百度手機(jī)助手、騰訊應(yīng)用寶、豌豆莢、華為應(yīng)用商店、OPPO 應(yīng)用商店、VIVO 應(yīng)用商店、魅族應(yīng)用商店和聯(lián)想開(kāi)發(fā)者社區(qū)。

        3.1 采集數(shù)據(jù)篩選

        圖2 和圖3 展示了來(lái)自360 手機(jī)助手的一款應(yīng)用——摩拜單車APP 的應(yīng)用信息和應(yīng)用評(píng)價(jià)。

        Fig.2 Application information of Mobike APP of 360 mobile assistant圖2 360 手機(jī)助手中摩拜單車APP 的應(yīng)用信息

        Fig.3 Comments on Mobike APP of 360 mobile assistant圖3 360 手機(jī)助手中摩拜單車APP 的評(píng)論信息

        圖2 顯示包含應(yīng)用名稱、應(yīng)用綜合評(píng)分、總評(píng)價(jià)數(shù)目、下載次數(shù)等在內(nèi)的APP 的基本信息。綜合評(píng)分、總評(píng)價(jià)數(shù)目和下載次數(shù)較為重要,可以表明應(yīng)用的受歡迎程度和熱度。

        圖3 的評(píng)論信息則包含了詳細(xì)的用戶使用情況和感受評(píng)價(jià)。評(píng)價(jià)的總體態(tài)度是一個(gè)離散的情感傾向值,分別是好評(píng)、中評(píng)和差評(píng)。

        本文從其他應(yīng)用商店中搜集整理APP 應(yīng)用的總體信息界面和詳細(xì)評(píng)論頁(yè)面總結(jié),最終決定采集APP應(yīng)用介紹、大小、分類、標(biāo)簽等基本信息和更新記錄、綜合評(píng)分/評(píng)星、評(píng)論詳細(xì)文本內(nèi)容、評(píng)價(jià)時(shí)間等評(píng)論信息。由于APP 評(píng)論還在不斷更新,本文采集到自2016 年8 月8 日起至2017 年10 月15 日的評(píng)論數(shù)據(jù)和版本更新數(shù)據(jù)信息,并基于此加以研究。

        3.2 數(shù)據(jù)預(yù)處理

        首先對(duì)于如應(yīng)用介紹、大小、標(biāo)簽等APP 基本信息進(jìn)行表格匯總,其次,對(duì)于APP 更新記錄信息,以統(tǒng)計(jì)表的形式展示版本、更新日期和更新日志。最后針對(duì)詳細(xì)評(píng)論信息,本文構(gòu)建一張數(shù)據(jù)表對(duì)評(píng)論數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理和存儲(chǔ),如圖4 所示,評(píng)論數(shù)據(jù)表項(xiàng)為:評(píng)論日期、應(yīng)用商店、評(píng)論用戶名、評(píng)星、評(píng)價(jià)詳細(xì)內(nèi)容。

        Fig.4 Display of database table entries圖4 數(shù)據(jù)庫(kù)表項(xiàng)展示

        4 基于KANO 模型的用戶需求分析

        本章基于采集處理的APP 評(píng)論數(shù)據(jù)對(duì)用戶需求進(jìn)行分析。

        如圖5 所示,針對(duì)用戶需求進(jìn)行分析的基本步驟為:(1)屬性識(shí)別。構(gòu)建包含APP 屬性的屬性詞典,包含無(wú)效評(píng)論的過(guò)濾。(2)情感分析。評(píng)論文本的情緒傾向識(shí)別,完成評(píng)論者對(duì)APP 屬性的具體感情傾向的識(shí)別。(3)需求權(quán)重分析?;谠u(píng)論整體感情傾向和屬性情感傾向聯(lián)合分析,確定用戶需求的不同權(quán)重。

        4.1 屬性識(shí)別和情感分析

        4.1.1 屬性詞典的構(gòu)建

        本文通過(guò)分詞將評(píng)論中的屬性詞匯分割,然后根據(jù)TextRank 算法根據(jù)頻率和術(shù)語(yǔ)的語(yǔ)義關(guān)系對(duì)術(shù)語(yǔ)進(jìn)行排序。算法1 屬性詞典的建立方式描述如下:

        算法1 屬性詞典的建立

        輸入:評(píng)論數(shù)據(jù)庫(kù)中的數(shù)據(jù)表。

        輸出:候選屬性、相應(yīng)詞頻。

        步驟1 連接讀取數(shù)據(jù)庫(kù)中的數(shù)據(jù)表,讀取原始評(píng)論語(yǔ)句;

        步驟2 使用正則匹配過(guò)濾無(wú)效字符或字符串;

        步驟3 文本分詞,使用結(jié)巴分詞以默認(rèn)模式分詞并劃分詞性,移除停用詞;

        步驟4 詞頻統(tǒng)計(jì)與展示,對(duì)分詞結(jié)果統(tǒng)計(jì),提取APP 相關(guān)詞頻最高的名詞,作為候選屬性詞云展示。

        Fig.5 Analysis framework of user demand measurement圖5 用戶需求計(jì)量分析框架

        算法1 步驟2 中提到無(wú)效字符的過(guò)濾,如標(biāo)點(diǎn)符號(hào)等,在分詞過(guò)程中不僅是無(wú)實(shí)際意義的,反而還會(huì)造成分詞效果混亂。步驟3 中文本分詞后創(chuàng)建一個(gè)列表存儲(chǔ)分詞片段和詞性分類。這個(gè)過(guò)程需要注意移除停用詞。停用詞是指高頻無(wú)效詞和低頻錯(cuò)誤詞,即在文本集合中出現(xiàn)次數(shù)較多但無(wú)實(shí)際意義的詞,如“的”“等”“這”等,目前中文的停用詞詞庫(kù)暫時(shí)還沒(méi)有,通過(guò)語(yǔ)料查詢,搜集整理了包含特殊符號(hào)在內(nèi)的1 894 個(gè)中文停用詞作備用。

        結(jié)果共提取了500 個(gè)術(shù)語(yǔ)作為候選屬性,經(jīng)過(guò)咨詢、排查和篩選,過(guò)濾與APP 相關(guān)的屬性項(xiàng)分為15 個(gè)類別,構(gòu)建了候選屬性的詞匯表。表1 給出篩選屬性和出現(xiàn)頻數(shù)統(tǒng)計(jì)情況,制作相應(yīng)的詞云圖案如圖6所示。

        Table 1 Frequency statistics of selected attributes表1 篩選屬性的頻數(shù)統(tǒng)計(jì)

        4.1.2 屬性詞典的構(gòu)建

        情感識(shí)別是一項(xiàng)專門(mén)且精細(xì)的任務(wù),需要進(jìn)行細(xì)粒度的情感分析處理。由于漢語(yǔ)語(yǔ)法的原因,針對(duì)評(píng)論作觀點(diǎn)詞性總結(jié)。

        Fig.6 Word cloud display of selected attributes圖6 候選屬性詞云展示圖

        一般說(shuō)來(lái),陳述性質(zhì)的用戶評(píng)論具有相似的固定的句式結(jié)構(gòu)。表2 列舉了一些常見(jiàn)的評(píng)論觀點(diǎn)句式,可以發(fā)現(xiàn)屬性觀點(diǎn)的傾向主要與形容屬性的形容詞的情感傾向相關(guān),還與一些具有否定意義的助詞“不”“否”“無(wú)”等意義聯(lián)系緊密。利用這樣的規(guī)則可以簡(jiǎn)單有效地提取出用戶評(píng)論對(duì)于具體屬性的態(tài)度和情感傾向。

        Table 2 Sentence structures of common APP reviews表2 一些常見(jiàn)的APP 評(píng)論句式

        以算法1 屬性詞典的建立方式篩選形容詞分類,結(jié)合知網(wǎng)Hownet 情感詞典(http://www.keenage.com/html/c_bulletin_2007.htm)給出的中文情感分析用語(yǔ)詞集,構(gòu)建一個(gè)情感詞典,其中包含7 425 個(gè)詞的情感詞匯,如表3 所示。

        對(duì)于否定意義的助詞的判斷,本文搜集整理出一個(gè)否定意義詞詞庫(kù),共42 個(gè)詞,如:不、不是、不可、別、沒(méi)、莫、無(wú)、勿、休等。因?yàn)樵跐h語(yǔ)文法當(dāng)中雙重否定表示肯定,需統(tǒng)計(jì)否定詞的個(gè)數(shù)看其奇偶性來(lái)改變情感傾向狀態(tài),所以需要統(tǒng)計(jì)否定意義詞匯個(gè)數(shù)對(duì)情感傾向判定,最終會(huì)得到每條評(píng)論中包含的屬性及其明確的感情傾向。算法2 整體思路如下:

        Table 3 Classification of emotions and the number of their related terms表3 情感分類和相關(guān)術(shù)語(yǔ)數(shù)量

        算法2 屬性情感傾向的判斷

        輸入:原始評(píng)論、篩選屬性、肯定/否定情感傾向詞典、否定意義詞詞庫(kù)。

        輸出:評(píng)論中屬性的情感傾向。

        步驟1 將評(píng)論分詞,以列表的形式記錄;

        步驟2 對(duì)分詞列表進(jìn)行掃描,找到屬性詞,并記錄其位置,并在其所在的評(píng)論分句中查找情感詞;

        夏冰扶著欄桿輕輕爬上平臺(tái)。范堅(jiān)強(qiáng)和一杭正在對(duì)飲。范堅(jiān)強(qiáng)抬頭看到他,大吃一驚:“你怎么在這里?”夏冰見(jiàn)被發(fā)現(xiàn),便不再躲藏,大搖大擺走到范堅(jiān)強(qiáng)旁邊坐下?!拔衣劦骄葡?,就進(jìn)來(lái)了。”說(shuō)完,抓起桌上的酒瓶,對(duì)著瓶口喝了一大口,又將一塊牛排塞在嘴里。

        步驟3 查詞典得到情感詞所代表的情感傾向,并存儲(chǔ)其情感傾向狀態(tài);

        步驟4 在分句中查找是否包含有否定詞,如果有且是奇數(shù)個(gè)否定詞,則將情感傾向狀態(tài)改變;

        步驟5 循環(huán)執(zhí)行1~4 步,直至遍歷所有的評(píng)論。

        令h{pos,neg}代表屬性各自的情感,使用式(1)將數(shù)據(jù)轉(zhuǎn)化為二值數(shù)據(jù):

        也就是說(shuō),當(dāng)屬性j在評(píng)論i中包含肯定情感傾向時(shí),;當(dāng)屬性j在評(píng)論i中包含否定情感傾向時(shí),;當(dāng)同時(shí)為0,那么評(píng)論i不包含屬性j,即其為空值。這樣就將其結(jié)構(gòu)化,評(píng)論情感分析結(jié)果如表4 所示。

        Table 4 Results of attribute extraction and emotional analysis of every comment表4 每條評(píng)論中屬性提取和情感分析的結(jié)果

        于是可以得到數(shù)據(jù)集D1={x},其中x是一個(gè)顧客對(duì)不同屬性的情緒傾向的30 維的行向量。

        應(yīng)用商店對(duì)于評(píng)論文本整體而言,文本所體現(xiàn)的情感與用戶真實(shí)體驗(yàn)更為一致。因?yàn)橛脩粼谔顚?xiě)評(píng)論時(shí)候,會(huì)相對(duì)仔細(xì)回憶使用體驗(yàn),并寫(xiě)下印象最為深刻的相關(guān)部分。因此,應(yīng)用自然語(yǔ)言處理技術(shù)來(lái)推斷文本的情緒,使用Snow NLP 工具包(https://pypi.org/project/snownlp/0.11.1/)可以方便地處理中文文本的情感值,工具對(duì)每條評(píng)論的情感值進(jìn)行評(píng)估預(yù)測(cè),設(shè)其預(yù)測(cè)值為ye,其取值范圍為[0,1]。設(shè)置一個(gè)離散集合{-1,0,1}分別表示否定情緒、中性和肯定情緒:

        這樣可以得到一個(gè)新的數(shù)據(jù)集D2={y},表示評(píng)論文本整體的情感傾向。

        4.2 KANO 模型分析用戶需求權(quán)重

        本節(jié)主要使用聯(lián)合分析的方法來(lái)衡量產(chǎn)品屬性對(duì)用戶的影響[34]。上一節(jié)中,使用情感識(shí)別將評(píng)論轉(zhuǎn)換為包含某些屬性情感傾向的二值化數(shù)據(jù)。每個(gè)屬性都有三個(gè)離散情感值:肯定傾向、否定傾向和缺失值。KANO 模型揭示了用戶滿意度不會(huì)隨著屬性水平而改變,因此在快速迭代變化的APP 中,確定理想的模式和狀態(tài)是不可能的,從而本文將每一項(xiàng)評(píng)論作為用戶需求情感值的刺激,將文本包含的情感傾向作為用戶體驗(yàn)。

        其中,y是用戶體驗(yàn);同式(1);是對(duì)肯定情緒的偏好值,是對(duì)否定情緒的偏好值,如果情緒為缺失值,那么默認(rèn)的權(quán)值為0。由式(3)可以估計(jì)參數(shù)值。對(duì)于每個(gè)屬性,有3 個(gè)觀測(cè)值:。通過(guò)這3 個(gè)觀測(cè)點(diǎn)并結(jié)合圖1,可以根據(jù)KANO 模型將屬性映射到不同類別上。下面給出映射規(guī)則,在此之前,首先需要建立兩個(gè)基本變量:

        在此基礎(chǔ)上可以給出每個(gè)屬性的權(quán)重為:

        Fig.7 Mapping rules for results of KANO model圖7 KANO 模型的映射規(guī)則

        4.3 實(shí)驗(yàn)結(jié)果分析

        4.3.1 模型的結(jié)果

        根據(jù)屬性詞典和情感識(shí)別結(jié)果,使用線性回歸方法,估計(jì)出各個(gè)屬性在兩種情感傾向下的權(quán)重,再將其利用圖7 的映射規(guī)則對(duì)屬性進(jìn)行歸類,得到對(duì)應(yīng)KANO 模型的分類結(jié)果。在參數(shù)估計(jì)中選用12 719條有效評(píng)論,得到估計(jì)參數(shù)的結(jié)果如表5 所示。

        4.3.2 演化策略及其有效性分析

        將估計(jì)參數(shù)代入式(4)和式(5)中,映射得到KANO 模型的屬性分類,如表6 所示。

        大多數(shù)屬性被標(biāo)識(shí)為必備屬性,包括:網(wǎng)絡(luò)、服務(wù)器、后臺(tái)、紅包、客服、地圖、計(jì)費(fèi)、掃碼、二維碼、版本、界面和驗(yàn)證碼。缺少這些屬性,會(huì)引起用戶極大的不滿,因此要在APP 升級(jí)演化過(guò)程中發(fā)現(xiàn)用戶的需要,如:快速穩(wěn)定的網(wǎng)絡(luò)連接;流暢的后臺(tái)和服務(wù)器的工作;真實(shí)的紅包優(yōu)惠;及時(shí)的客服處理;精準(zhǔn)的地圖服務(wù);便利的掃碼過(guò)程和清晰明顯的二維碼;合理即關(guān)即停的計(jì)費(fèi)模塊;性能穩(wěn)定的版本更新;快捷的驗(yàn)證碼發(fā)送。如果能對(duì)這些必備屬性先改進(jìn)優(yōu)化,必能大大減少負(fù)面評(píng)論的數(shù)量,有助于APP 良性發(fā)展。

        Table 5 Estimated parameters of conjoint analysis表5 聯(lián)合分析估計(jì)參數(shù)

        Table 6 Category of each attribute表6 每個(gè)屬性的類別

        體驗(yàn)和定位是期望屬性,它們的變化與滿意度呈現(xiàn)正線性關(guān)系。有關(guān)這些屬性的評(píng)論,用戶表現(xiàn)出多是反饋和建議,希望開(kāi)發(fā)者對(duì)其進(jìn)一步改進(jìn)優(yōu)化。這一類屬性的負(fù)面評(píng)價(jià)略微多于正面評(píng)價(jià),情感相比必備屬性的評(píng)論情感緩和許多。如果能在其原有基礎(chǔ)上適當(dāng)改進(jìn),會(huì)提升APP 的用戶粘度,幫助APP 平穩(wěn)迭代。

        魅力屬性包括賬號(hào)。這些屬性可以極大地提高滿足度,但是在不滿足的時(shí)候,也不會(huì)造成嚴(yán)重的滿意度下降。評(píng)論中大量用戶提到一個(gè)賬戶可以支持多開(kāi)幾輛自行車,因此運(yùn)營(yíng)商應(yīng)該逐步考慮實(shí)現(xiàn)該需求。

        從總體來(lái)看,開(kāi)發(fā)者應(yīng)該首先滿足必備屬性和期望屬性的需求。摩拜單車APP 于2017 年12 月15日發(fā)布6.5.0 版本的更新日志顯示:“摩拜單車APP 終于等到一個(gè)很大很棒的更新啦!設(shè)計(jì)師們這一次投入了很多精力哦~更快:掃碼開(kāi)鎖速度、地圖加載更快;更輕:簡(jiǎn)單易懂的操作界面;更美:設(shè)計(jì)大改版,優(yōu)化調(diào)整40 余處細(xì)節(jié),去下載騎車體驗(yàn)一個(gè)。”可以發(fā)現(xiàn)模型分詞所給出的策略與后續(xù)官方更新日志基本吻合,可以認(rèn)定本文所給出的演化策略是合理或有效的。

        將收集到的所有評(píng)論,按照日期取情感預(yù)測(cè)值的評(píng)論值和整體的平均值,結(jié)合APP 版本升級(jí)日期的標(biāo)簽,如圖8 所示。

        Fig.8 Average emotional value curve of comments on Mobike APP from Aug 8,2016 to Oct 15,2017圖8 自2016 年8 月8 日至2017 年10 月15 日摩拜單車評(píng)論的平均情感值變化曲線

        該圖展示出自2016 年8 月以來(lái),該款A(yù)PP 持續(xù)穩(wěn)定更新,先前平均情感值穩(wěn)定在0.55 附近,隨著APP 不斷的版本更新升級(jí),平均情感值大大提升,整體平均情感值為0.659,并且情感值曲線在0.65 附近波動(dòng)??梢?jiàn),APP 版本更新使得用戶評(píng)論的平均情感值提升,用戶體驗(yàn)有所改善。

        4.3.3 模型的魯棒性分析

        為了測(cè)試模型魯棒性,將樣本隨機(jī)分成5 種樣本,并將其逐一加入到訓(xùn)練集中,計(jì)算屬性的范圍和權(quán)重,并比較屬性排名。

        由表7 可以發(fā)現(xiàn)隨機(jī)輸入模型的樣本數(shù)量達(dá)到全部(5/5)時(shí),屬性的權(quán)重排序和模型原輸入樣本得到的結(jié)果稍有差別,原因是由于在進(jìn)行參數(shù)估計(jì)的時(shí)候使用了scikit-learn 庫(kù)中的Cross-validation 模型。該模型對(duì)輸入的有限數(shù)據(jù)集進(jìn)行打亂,分為訓(xùn)練集和測(cè)試集,本文的實(shí)驗(yàn)設(shè)置測(cè)試集的比率是20%,由于算法自身隨機(jī)抽取測(cè)試集的特點(diǎn),每次選取的測(cè)試數(shù)據(jù)不同,導(dǎo)致最終結(jié)果稍有差異。如表7所示,起初屬性的排名波動(dòng)差異較大,然而隨著樣本的不斷添加,模型性能逐漸保持一致,屬性的級(jí)別排名逐漸穩(wěn)定,模型魯棒性得以檢驗(yàn)。

        Table 7 Attribute weight ranking changes with the addition of training sample size表7 屬性隨加入訓(xùn)練樣本量變化的權(quán)重排名

        4.4 模型推廣

        本文將此模型應(yīng)用到高德地圖APP 的評(píng)論數(shù)據(jù)之上,得到導(dǎo)航類APP 的演化改進(jìn)策略。

        首先選取評(píng)論與該類APP 演化相關(guān)的屬性,經(jīng)過(guò)咨詢、篩查,最終確定10 個(gè)屬性為定位、路線、信號(hào)、版本、語(yǔ)音、離線、路況、界面、權(quán)限和體驗(yàn)。按照4.2 節(jié)的實(shí)驗(yàn)方法,對(duì)這些屬性進(jìn)行權(quán)重的參數(shù)估計(jì),然后將其映射到KANO模型上,得到結(jié)果如表8所示。

        Table 8 Results of mapping attributes of navigation class APPs'comments to KANO model表8 將導(dǎo)航類應(yīng)用評(píng)論屬性映射到KANO 模型的結(jié)果

        對(duì)于如高德等導(dǎo)航類APP 而言,魅力屬性是語(yǔ)音,APP 開(kāi)發(fā)者應(yīng)該考慮頗具特色的明星代言語(yǔ)音播報(bào)會(huì)十分吸引用戶下載使用。

        劃分為期望屬性的是體驗(yàn)、界面、路況、離線和定位。這幾個(gè)屬性的完善情況和用戶的滿意度是呈線性關(guān)系的,APP 開(kāi)發(fā)者應(yīng)該考慮對(duì)其功能更新完善。

        信號(hào)和路線被歸類為必備屬性,可見(jiàn)相對(duì)于上述屬性,用戶在使用過(guò)程中對(duì)GPS 信號(hào)和路線推薦十分不滿意。對(duì)于開(kāi)發(fā)者而言,應(yīng)該重視這類問(wèn)題,盡早優(yōu)化推薦路線的算法和GPS 信號(hào)弱的缺陷問(wèn)題。

        在所有的屬性中出現(xiàn)了兩個(gè)反向?qū)傩?,分別是權(quán)限和版本。用戶評(píng)論普遍表現(xiàn)出的是拒絕該導(dǎo)航類APP 獲取不必要的手機(jī)高級(jí)權(quán)限和對(duì)APP 頻繁更新版本的行為極其反感。APP 開(kāi)發(fā)者應(yīng)該適當(dāng)減少版本更新頻率,實(shí)現(xiàn)穩(wěn)步迭代,此外應(yīng)注意保護(hù)用戶隱私,在獲取手機(jī)高級(jí)權(quán)限前需滿足隱私協(xié)議并詢問(wèn)征求用戶意見(jiàn)。

        總體來(lái)看,對(duì)于如高德地圖等導(dǎo)航類APP,應(yīng)首要處理用戶權(quán)限的訪問(wèn)問(wèn)題,并降低APP 版本更新頻率,其次應(yīng)優(yōu)化路線推薦算法和增強(qiáng)接收信號(hào)的強(qiáng)度。在此基礎(chǔ)上,不斷對(duì)界面、離線地圖、路況和定位進(jìn)行完善,并保持明星語(yǔ)音播報(bào)素材包的更新熱度。高德導(dǎo)航APP 于2017 年9 月22 日發(fā)布8.1.8.2132 版本的更新日志顯示:“【亮點(diǎn)】1、明星語(yǔ)音新選擇,地圖搜“高曉松語(yǔ)音”可下載使用;2、騎行規(guī)劃支持多種方案,總有一種適合您?!緝?yōu)化】1、異地?zé)衢T(mén)城市使用搜索首頁(yè),即獲精彩推薦;2、任意地標(biāo)酒店輕松搜索,為您推薦專屬房型?!逼渲兴w現(xiàn)的新明星語(yǔ)音、路線多方案規(guī)劃、界面優(yōu)化等與本文提出的更新策略相吻合,因此可以認(rèn)為模型是有效且合理的。

        5 結(jié)束語(yǔ)

        本文主要基于群智數(shù)據(jù)——APP 用戶評(píng)論數(shù)據(jù)進(jìn)行分析,使用聯(lián)合分析方法,引入KANO 模型評(píng)估不同屬性的重要程度,從開(kāi)發(fā)者的角度對(duì)APP 提出演化策略,并證明了模型的魯棒性和策略的合理性。

        不足之處是:研究過(guò)程是建立在評(píng)論者偏好一致的假設(shè)上進(jìn)行總體的分析,并且模型在一定程度上受到各應(yīng)用商店的評(píng)論源數(shù)據(jù)的限制。因此如果能在情感估計(jì)前使用主題聚類的方法或結(jié)合其他數(shù)據(jù)源進(jìn)行多源分析,可能會(huì)提高模型的效果。

        猜你喜歡
        情感用戶模型
        一半模型
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        3D打印中的模型分割與打包
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        女人av天堂国产在线| 国产熟女精品一区二区三区| 精品免费看国产一区二区白浆| 人妻精品一区二区三区蜜桃| 无码a级毛片免费视频内谢| 中文字幕一区二区三区精华液| 精品午夜一区二区三区久久| 久久精品国产亚洲av夜夜| 绝顶高潮合集videos| 亚洲av无码专区电影在线观看| 亚洲AⅤ无码片一区二区三区| 伊人狼人影院在线视频| 国产小视频在线看不卡| 色欲人妻综合网| 亚洲AV无码精品色午夜超碰| 国产福利一区二区三区在线观看 | 国产又爽又粗又猛的视频| 久精品国产欧美亚洲色aⅴ大片| 午夜亚洲精品视频网站| 米奇欧美777四色影视在线| 人人爽人人爱| 加勒比在线一区二区三区| 国产精品麻豆一区二区三区| 欧美精品videosse精子| 无码丰满少妇2在线观看| 粉嫩av一区二区在线观看| 偷拍一区二区三区四区 | 国产成人+亚洲欧洲+综合| 少妇一级aa一区二区三区片| 国产色婷婷久久又粗又爽| 久久国产精品精品国产色婷婷| 一本大道久久东京热无码av| 熟女少妇av一区二区三区| 日本少妇春药特殊按摩3| 欧美一片二片午夜福利在线快 | 国产内射视频在线观看| 国产精品黑丝高跟在线粉嫩| 人妻少妇精品专区性色av| 久久青草国产免费观看| 午夜免费观看日韩一级片| av 日韩 人妻 黑人 综合 无码|