柯 潔,楊 婉,黃桂玲,王 璇,劉 倩
隨著互聯網醫(yī)療行業(yè)的快速發(fā)展,各類移動醫(yī)療App 不斷涌現。根據移動應用市場知名咨詢公司data.ai 的統計數據顯示,截至2022 年2 月,中國移動醫(yī)療App 數量已近2 000 個,涉及在線問診、網上就醫(yī)、醫(yī)藥服務、健康管理等多個細分領域[1]。受新型冠狀病毒肺炎(以下簡稱“新冠肺炎”)疫情影響,人們對醫(yī)療App 的使用需求持續(xù)增長,進一步推動了傳統醫(yī)療服務向移動端延伸。移動醫(yī)療App 建立了醫(yī)院信息系統、移動網絡平臺和用戶就醫(yī)需求之間的多元連接,使用戶可以隨時隨地訪問醫(yī)療資源并獲取相應的醫(yī)療健康服務,是未來互聯網醫(yī)療行業(yè)發(fā)展的主要模式之一[2]。但隨著移動醫(yī)療App 數量的爆發(fā)式增長,也引發(fā)了同質化競爭加劇、服務質量參差不齊等一系列問題。如何及時準確地了解移動醫(yī)療App 的用戶使用體驗和評價意見,進而推動移動醫(yī)療的創(chuàng)新與發(fā)展,已成為國內外學者和互聯網醫(yī)療行業(yè)共同關注的焦點。
App 在線評論是洞察用戶體驗和滿意度的重要數據來源,表達了用戶使用App 后的真實感受,蘊含著重要研究價值。一方面有助于App 開發(fā)商、運營商等主體基于用戶反饋信息進行App 優(yōu)化與創(chuàng)新,提升用戶體驗和使用意愿;另一方面可以幫助潛在用戶全面比較同類醫(yī)療App 之間的功能、內容等差異,從而做出更加理性和正確的決策。而在線評論中往往包含用戶對App 不同屬性維度的評價,并帶有強烈的感情色彩。通過對在線評論進行維度挖掘和情感分析,可以準確、全面地掌握用戶對移動醫(yī)療App 的關注重點和滿意程度,進而為優(yōu)化用戶體驗指明方向。
目前,常用的評論挖掘與情感分析方法包括情感詞典、機器學習算法和深度學習算法。其中,情感詞典中情感詞的判別與選擇取決于先驗知識與實驗設計,在完備性和準確性方面還存在不足;而傳統機器學習算法的精確度在很大程度上取決于標注訓練集的質量,對人類經驗和領域知識的依賴性很高。隨著深度學習的快速發(fā)展,基于深度學習的文本情感分析方法逐漸得到廣泛應用,并在自適應特征學習和模型泛化能力上體現出明顯優(yōu)勢。因此,本文將綜合應用多種深度學習算法,對移動醫(yī)療App 在線評論進行維度挖掘與情感分析。
評論維度抽取是指通過挖掘評論中的特征詞提取出用戶對產品或服務的具體評價維度,是對評論文本進行細粒度觀點挖掘和情感識別的基礎[3]。常用的評論維度抽取方法主要包括模式匹配法、詞頻統計法和監(jiān)督學習法。
模式匹配法是通過詞典中的每個詞與被處理文本之間逐一進行匹配,或者根據文本特點與定制規(guī)則進行匹配[4]。有學者基于中國知網(CNKI)提供的詞典,采用語義相似度計算方法實現觀點維度詞的抽取[5];有學者專門構建了一個汽車領域的本體詞典,用于從相關評論中抽取客戶對不同品牌汽車性能和配置指標的評價[6]。模式匹配法使用簡單,準確率高,但一般需要領域專家針對不同領域建立相應的詞典和規(guī)則庫,投入的時間和人力成本很高,并且需要定期更新維護。
基于詞頻統計的方法是將詞頻作為衡量詞語對文本重要性的測量指標,主要分為詞頻統計法和加權統計法[7]。有學者使用TF-IDF 算法和位置加權算法在新聞和博客評論文本中提取評論維度特征[8];有學者提出了一種基于C-value 度量統計的方法,用于對用戶評論進行維度抽?。?]。詞頻統計法的優(yōu)勢在于可以快速提取主題詞及分析特征詞詞頻與主題類別之間的關系,但對評論中不常出現的特征詞分析效果較差。
監(jiān)督學習法是將評論維度抽取作為自然語言處理領域中常見的序列標注問題,主要包括兩大類。一是基于語料庫的無監(jiān)督抽取,典型算法有隱式語義分析(latent semantic analysis,LSA)、隱含狄利克雷分布(latent dirichlet allocation,LDA)等,但這些算法沒有考慮評論文本中各個詞之間的位置關系,對細粒度的特征詞抽取效果并不理想;二是基于單文本的抽取,典型算法包括基于詞圖網絡的快速關鍵詞提取算法(rapid automatic keyword extraction,RAKE)、主題排序算法(topic rank,TR)、位置排序算法(position rank,PR)等[10-12],主要通過計算候選詞向量與主題的語義相似度排序并提取出特征詞。但常用于計算詞向量的Word2vec 等模型均為靜態(tài)模型,在語義環(huán)境變化較大的情況下容易產生誤差。近年來,有研究者嘗試通過將預訓練深度神經網絡模型作為語言模型,針對具體任務使用微調的方式進行自然語言處理,取得了很好的效果。BERT 模型就是預訓練模型之一,該模型利用其獨特的Transformer 結構對文本進行雙向學習和處理,利用自注意力機制(self-attention)學習詞間的關系,從而使詞向量產生更加豐富的內涵,使原有的靜態(tài)向量具有“動態(tài)”語言意義,甚至能在一定程度上讓同一個詞表達不同含義[13]。
情感分析也稱為“情感傾向分析”或“意見挖掘”,是目前自然語言處理領域的研究熱點,其目的是從文本中識別出用戶積極、中立或消極的情感態(tài)度[14]。情感分析方法主要包括情感詞典方法、傳統機器學習情感分析方法和深度學習方法。
情感詞典方法主要依賴詞典的構建,即先基于情感詞典獲取文檔中情感詞的情感值,再通過加權計算確定文檔的整體情感傾向,因此需要針對特定領域建立相應的情感詞典,提高分類準確率[15]。對于小樣本數據而言,該方法能夠取得較好的分類結果且易于理解,但隨著在線評論數據量的快速增長,情感詞典需要不斷更新擴展才能提高結果的準確率[16]。
傳統機器學習情感分析方法是通過訓練情感分類器來預測文本的情感傾向[17]。與情感詞典方法相比,機器學習的擴展性和可重復性更好,能取得更加準確的分類結果,但其準確度很大程度上依賴于標注訓練集的質量,受人工成本、專家經驗等因素的影響較大。
近年來,深度學習方法在情感分析領域得到廣泛應用。經典的深度學習模型包括卷積神經網絡(convolutional neural networks,CNN)、循環(huán)神經網絡(recurrent neural network,RNN)、長短期記憶神經網絡(long short-term memory,LSTM)、雙向長短期記憶神經網絡(Bi‐directional long short-term temory,BiLSTM)和注意力機制等[18]。深度學習方法比情感詞典方法和傳統機器學習方法有更強的表達能力和模型泛化能力。與此同時,在單一深度學習模型基礎上,研究者還進一步對集成多種神經網絡方法的文本情感分析展開了探索。有學者結合CNN 和LSTM 兩種模型的優(yōu)點,利用CNN 模型提取較高層次的單詞或詞組,用向量進行數據建模,并將其輸入LSTM 模型中得到更加復雜的向量表示,這樣既能獲取文本的局部特征,又能得到句子的時態(tài)語義[19];有學者應用CNN 和RNN 結合的方法進行在線評論情感分類,也取得了良好的分類效果[20]。
在已有研究成果的基礎上,本文針對移動醫(yī)療App 在線評論數據量大、口語特征明顯、一詞多義等特點,采用集成多策略的深度學習方法,通過詞頻-逆向文件頻率算法(term frequency-inverse document frequency,TF-IDF)、BERT 模型與混合聚類的協同過濾推薦算法(Canopy+K-means)相結合的方式挖掘移動醫(yī)療App 評論維度,明確用戶重點關注的App 屬性維度;應用LSTM-CNN 模型進行維度情感分析,從不同層面評估用戶對移動醫(yī)療App 的滿意度,并通過實證研究,對所提出的評論維度挖掘和情感分析模型的準確性和穩(wěn)定性進行有效驗證,為移動醫(yī)療App 在線評論挖掘和用戶滿意度研究提供有益參考。
本文采用一種集成多策略的深度學習方法對移動醫(yī)療App 在線評論進行維度挖掘和情感分析。維度挖掘的步驟:首先對采集到的移動醫(yī)療App在線評論數據進行清洗、分詞、詞性標注和去停用詞等預處理,然后使用TF-IDF 算法對評論進行抽詞標引,提取特征詞,再應用預訓練的BERT 模型生成特征詞的詞向量,接著利用Canopy+K-means算法進行特征詞分析,投射到高維空間進行聚類,由此得到移動醫(yī)療App 用戶在線評論中的不同維度。情感分析的步驟:進一步通過分句和依存句法分析2 種文本分析方法從評論樣本中得到包含具體維度特征詞的短句,作為LSTM-CNN 情感分類模型的輸入語料,并根據各維度在所有評論中被提及的概率和該維度的情感傾向與整體評論情感傾向的一致性計算各維度權重。同時,利用訓練集與測試集評論語料對LSTM-CNN 情感分類模型進行訓練,并基于訓練好的模型進行評論情感傾向分類,進而計算用戶對移動醫(yī)療App 具體屬性維度的積極情感傾向率,在此基礎上評價用戶滿意度。具體研究框架如圖1 所示。
圖1 移動醫(yī)療App 在線評論維度挖掘與情感分析研究框架
移動醫(yī)療App 在線評論具有明顯的口語化和網絡用語化特點,而且存在很多低價值甚至無效的信息。因此,首先需要對采集的評論數據進行清洗、文本分詞、詞性標注和去停用詞等預處理。其次,為了兼顧評論中特征詞抽取的時效性和準確性,本文使用 TF-IDF 算法進行特征詞抽取,并選取TF-IDF 值較高的名詞表征移動醫(yī)療App 的屬性特征,進行向量數據建模,作為后續(xù)特征聚類的輸入向量語料。
在此基礎上,將候選特征詞輸入經過預訓練的BERT 模型,得到相應詞向量,接著進行“二階段”聚類:第一階段使用Canopy 聚類算法對在線評論中的屬性特征和向量語料進行“粗”聚類,得到初始分類K 值;第二階段采用第一階段輸出的K 值進行K 均值聚類(K-means),從而獲得更加精準的分類結果,由此得到在線評論中用戶所關注的移動醫(yī)療App 的主要維度[21]。與傳統K-means 聚類算法相比,Canopy 聚類算法的優(yōu)勢在于無須事先指定K 值,能夠顯著提高聚類效率,具有更高的實際應用價值。
由于移動醫(yī)療App 各維度的評價意見對用戶滿意度會產生不同程度的影響,因此需要進一步通過權重計算明確不同維度的重要性。具體而言,維度ax的權重主要與兩方面因素有關。一是維度ax在所有評論中被提及的頻次;二是用戶對維度ax的評論情感傾向與用戶整體評論情感傾向的一致性[22]。因此,可以通過公式(1)和公式(2)進行計算。
其中WX表示維度ax的權重值,A表示在線評論中所提取的維度個數,si表示涉及維度ax的評論情感傾向,Si表示整體評論情感傾向。計算得到的維度ax的權重值越高,說明其受用戶的關注度越高,對用戶整體評論情感傾向的決定性作用越強。
本文構建的LSTM-CNN 情感分析模型結構如圖2 所示。該模型主要由LSTM 層、輸入層、卷積層、池化層和全連接層構成。LSTM 模型是一種改進的基于RNN 模型的網絡結構,能夠有效保存長序列的歷史信息;而CNN 模型在整個分析過程中能夠比較精準地定位核心語義信息,從而為后續(xù)數學模型判定得到文本的關鍵語義。因此,本文綜合應用LSTM 和CNN 模型來提高移動醫(yī)療App 在線評論情感分類的準確率。
圖2 LSTM-CNN 模型結構
首先利用提前訓練好的BERT 模型將評論語料映射成向量矩陣,每1 個詞為1 個向量,將其按時序輸入LSTM 模型,從中提取有用的語義特征,從而使卷積層能提取到更加豐富的局部信息,提高模型分類的準確率。接著,將LSTM 模型輸出的向量矩陣作為CNN 模型的輸入,在卷積層對LSTM每一時刻的輸出數據進行卷積操作,提取出最重要的語義特征,再由池化層對卷積層輸出的數據進行最大池化。其中,池化操作是設定一個Max 值作為中間變量,取每個過濾器中的Top-K 個最大值作為該過濾器的語義信息。最后,通過全連接層將前面提取到的局部特征進行整合與歸一化處理,并基于柔性最大回歸(softmax regression)得到最終分類結果。
本文以App Store 中國應用市場中醫(yī)療類免費App 下載排行榜為依據,在“七麥數據”平臺上逐一查詢排名前50 位的移動醫(yī)療App 的評論數據。“七麥數據”是權威的移動應用數據分析平臺,記錄了App Store、Google Play 和中國8 個主要的安卓手機應用市場上App 的各類榜單、評分、評論等多維數據[23]。根據查詢結果,本文選取了2020 年1 月1 日至2021 年12 月31 日期間評論量超過500條的15 個醫(yī)療類App 作為實證研究對象。根據這些App 的詳細介紹,將其進一步細分為互聯網醫(yī)院App(4 個)、醫(yī)藥服務App(2 個)、健康管理App(4 個)和綜合服務App(5 個)四大類。首先,應用Python 爬蟲技術采集這些App 的評論數據,包括App 評分、評論數量、評論內容、評論人、評論時間等,同時對用戶ID 進行了隱私保護處理。采集格式如表1 所示。然后,對這些評論數據進行清洗,得到23 771 條有效評論。接著從15 個樣本App 的在線評論中各隨機提取500 條評論數據作為情感分析語料,同時將沒有被提取的評論數據分成兩部分,其中80%的語料作為LSTM-CNN模型深度學習算法的訓練集,20%的語料作為測試集。之后,使用jieba 工具對所有評論數據進行分詞和詞性標注,并進行停用詞過濾,作為初始化語料。
表1 移動醫(yī)療App 在線評論數據采集樣例
采用TF-IDF 算法計算得到移動醫(yī)療App 在線評論對應的TF-IDF 值,將這些值進行排序,選擇排序靠前的特征詞作為候選特征詞,然后進一步篩除詞頻較低和與醫(yī)療類App 屬性特征無關的詞語,最終得到437 個特征詞。采用經過預訓練的BERT模型得到每個詞的詞向量,并進行聚類分析。為測試基于BERT 的Canopy+K-Means 聚類算法的效果,本文嘗試提取BERT 倒數第2 層、倒數第3 層的特征,并用10%的語料進行簡單的FINE-TUNE 分類微調,對提取調整后的BERT 特征進行評估,結果如表2 所示。
表2 基于BERT 模型不同聚類方法的效果比較
表2 中聚類效果得分越高表示模型聚類效果越好。可以看到,將BERT 模型微調后得到的句向量進行求平均后得出的特征可以較好地生成聚類結果,因此本文采用BERT-FINE-TUNE-MEAN 方法進行特征詞聚類。最終,通過Canopy+K-Means 聚類分析方法確定K 值為5。聚類后提取出專業(yè)性、易用性、可靠性、特色性、交互性5 個評論維度。各維度下的具體特征詞如圖3 所示。為了使提取到的維度盡可能全面覆蓋評論中涉及的App 屬性特性,本文利用通過維基百科中文語料訓練的BERT詞向量對每個維度下的特征詞進行了擴充,得到移動醫(yī)療App 評論特征詞集。
圖3 移動醫(yī)療App 在線評論維度提取結果
根據App 在線評論維度提取結果,隨機選擇在線評論子集R,對R 中每條評論所包含的維度特征詞及其情感傾向進行人工標注。根據評論星級設定評論的整體情感傾向,5 星和4 星代表積極情感,3 星代表中性情感,1 星和2 星代表消極情感。其中,積極情感評論所占比例為58.3%,中性情感評論所占比例為12.6%,消極情感評論所占比例為29.1%。根據前述公式(1)和公式(2),計算得到移動醫(yī)療App 5 個屬性維度的權重值,從高到低依次為:專業(yè)性(0.367)、可靠性(0.296)、交互性(0.153)、易用性(0.125)、特色性(0.059),如圖4 所示。其中,專業(yè)性和可靠性是用戶提到頻次最多且與評論整體情感一致性最高的2 個維度,所以權重值最高??梢?,移動醫(yī)療App 提供的信息內容與服務是否專業(yè)和是否可靠是用戶最為關注的方面。而“醫(yī)生的回復”“用戶間的社交聯系”“平臺的反饋”等內容也經常被用戶提及,這些內容反映了醫(yī)患之間、用戶之間和用戶與平臺之間的多元交互性,也是醫(yī)療App 用戶關注的重點,因此權重值也較高。此外,還有部分用戶對App 的界面是否簡潔、功能是否易于使用、信息發(fā)布是否及時等易用性特征做出了評價。分析結果顯示,用戶評論里較少提及移動醫(yī)療App 的特色性。通過對樣本App 進行觀察發(fā)現,大部分App 的功能和內容同質化現象嚴重,缺乏核心特色,導致用戶對醫(yī)療App 屬性特色的敏感度較低,也使該維度相關評論在整體評論中不具有主導作用,所以權重值最低。
圖4 移動醫(yī)療App 的在線評論維度權重值
本文從15 個樣本App 中各抽取500 條在線評論,然后進行特征分句,并過濾掉其中不包含上述5 個維度特征詞的短句,將過濾后的評論內容作為情感分析依據。同時,對包含不止1 個屬性特征的短句進行依存句法分析,即通過語言單位內成分之間的依存關系揭示句子的句法結構,如“醫(yī)生非常專業(yè)但回復速度太慢”,就需要分別提取包含專業(yè)性和交互性維度特征詞的兩個短句進行情感分析,由此得到進行移動醫(yī)療App 在線評論情感分析的語料。
采用LSTM-CNN 模型作為情感分析模型。為了驗證模型的有效性與精確性,本文同時使用決策樹(Decision Tree)、LSTM、CNN 等4 種模型進行情感分類效果對比(表3)。
表3 不同模型的情感分類結果比較
情感分類結果顯示,LSTM-CNN 模型在準確率、召回率和F1 值上均取得了比單一深度學習模型更佳的效果,證明它能夠保證移動醫(yī)療App 在線評論情感分類的準確性與可靠性。在此基礎上,本文利用LSTM-CNN 模型對經過特征分句處理的用戶評論語料進行情感分析,分別得到15 個樣本App 在5個維度上的用戶評論積極情感傾向、中性情感傾向和消極情感傾向分析結果。其中,樣本App 的用戶評論積極情感傾向分析結果有顯著差異,而中性評論與消極評論由于數量相對較少,情感分析結果并未呈現出較大差異。根據已有研究提出的App 用戶滿意度評價標準,在線評論的積極情感傾向率(積極情感傾向的評論在所有評論情感傾向中所占的比率)可作為衡量用戶體驗和滿意度的重要依據[21,24],因此本文通過計算5 個維度上每個樣本App 的用戶評論積極情感傾向率來衡量用戶滿意度(表4)。
表4 移動醫(yī)療樣本App 各維度的用戶評論積極情感傾向率/%
樣本App 在線評論的情感分析結果顯示,在專業(yè)性和可靠性維度上,“丁香醫(yī)生”“好大夫在線”“春雨醫(yī)生”“叮當快藥”等移動醫(yī)療App的積極情感傾向率都超過80%,說明用戶對它們認可度較高,而這些App 在我國移動醫(yī)療服務起步階段就已上線,經過多年運營與發(fā)展,已擁有龐大的用戶基礎和極高的知名度,并與國內眾多三甲醫(yī)院、醫(yī)療服務機構、藥品生產企業(yè)建立了廣泛的合作關系,積累了豐富的在線醫(yī)療資源,因此在專業(yè)性和可靠性上獲得了用戶高度認可。“醫(yī)鹿”和“京東健康”兩個App 在專業(yè)性和可靠性維度上的積極情感傾向率也位居前列,它們分別由阿里巴巴和京東兩個互聯網領軍企業(yè)開發(fā)。由此可見,開發(fā)者的規(guī)模、實力、信譽等因素會對用戶觀點產生重要影響。在交互性和易用性維度上,由阿里巴巴、京東、字節(jié)跳動等大型互聯網企業(yè)開發(fā)的“醫(yī)鹿”(阿里巴巴)、“京東健康”(京東)、“小荷健康”(字節(jié)跳動)的用戶評論積極情感傾向率明顯高于其他App,主要原因可能是這些互聯網企業(yè)具有豐富的App 設計與開發(fā)經驗,更加注重產品的交互設計細節(jié)與可用性測試,因此能帶給用戶更佳的使用體驗;而其他App 則更多關注內容生態(tài)和服務體系建設,忽視了交互的便利性與功能的易用性。在特色性維度上,各App 在線評論積極情感傾向率均較低,基本都在70%以下,僅有“微醫(yī)”(88.27%)和“健康云”(82.21%)的用戶反饋較好。其中,“微醫(yī)”除了預約掛號、在線問診等基本醫(yī)療服務外,還推出了“病友幫”“服務包”等特色服務,而“健康云”則推出了親人健康管理、慢病管理、醫(yī)療資源智能匹配等特色化功能,在同類App 中表現出明顯的特色優(yōu)勢。
不同類別的移動醫(yī)療App 用戶在線評論積極情感傾向率顯示,醫(yī)藥服務類App 和綜合服務類App 在專業(yè)性、可靠性、交互性和易用性4 個維度上的用戶滿意度均較高,而健康管理類App 在這4個維度上的消極評價則較多(圖5),說明目前我國移動醫(yī)療應用市場中,醫(yī)藥服務類App 和綜合服務類App 的整體發(fā)展情況較好,用戶接受程度較高;而健康管理類App 的醫(yī)療資源質量和服務水平則參差不齊,有待進一步提升。此外,在特色性維度上,各類App 的用戶在線評論積極情感傾向率均較低,說明目前移動醫(yī)療App 的同質化現象嚴重,缺乏符合用戶個性化需求的特色功能與服務。雖然各大醫(yī)療App 開發(fā)商已經開始重視特色化和精準性醫(yī)療健康服務的建設,但在醫(yī)療資訊、在線問診、在線購藥等核心功能方面的創(chuàng)新性還有待進一步加強。
圖5 移動醫(yī)療細分領域App 在線評論積極情感傾向率分布
本文綜合應用TF-IDF 算法、BERT 模型和Canopy+K-means 聚類分析方法,以當前我國移動醫(yī)療應用市場中用戶廣泛使用的App 為實證對象,基于真實的大規(guī)模評論數據,提取得到受移動醫(yī)療App 用戶關注的專業(yè)性、可靠性、交互性、易用性、特色性5 個主要維度作為衡量用戶滿意度的關鍵指標,進一步細化了基于傳統問卷調查和專家經驗提出的評價框架。已有研究大多側重于從服務質量、信息質量、交互質量3 個維度衡量App 用戶滿意度,未能充分體現用戶對移動醫(yī)療App 專業(yè)性、可靠性的特殊需求,也難以突出激烈市場競爭下App 的特色性對用戶滿意度的重要影響[25-27]。因此,本文的研究結果能更全面、精準地幫助App開發(fā)商和運營商把握用戶對移動醫(yī)療服務的現實需求。與此同時,在評論維度挖掘基礎上,本文還進一步計算了各維度的權重值,比較了不同維度對用戶滿意度的影響,明確了移動醫(yī)療App 未來發(fā)展的重點方向。
通過基于LSTM-CNN 模型的移動醫(yī)療App 在線評論情感分析,本文通過計算得到各App 在不同維度上的用戶評論積極情感傾向率,并由此詳細比較了不同App 的優(yōu)勢與劣勢,深入揭示了影響用戶滿意度的具體因素,有助于App 開發(fā)商和運營商在“健康中國”戰(zhàn)略引導下,以用戶需求為中心,更有針對性地進行內容、功能、界面的優(yōu)化與完善。同時,通過醫(yī)療健康各細分領域App 間的橫向比較,進一步明確了不同類型移動醫(yī)療App的核心優(yōu)勢和發(fā)展方向,有助于推動我國移動醫(yī)療App 的創(chuàng)新與發(fā)展,帶動我國傳統醫(yī)療行業(yè)的數字化轉型與智能化升級。
隨著移動醫(yī)療服務的快速發(fā)展和新冠肺炎疫情的常態(tài)化防控,移動醫(yī)療App 正逐漸成為人們有效使用醫(yī)療資源和服務的便捷方式。通過對移動醫(yī)療App 在線評論進行維度挖掘和情感分析,可以深入了解用戶在使用移動醫(yī)療服務時的關注重點和體驗效果,對App 開發(fā)商和運營商進行產品迭代創(chuàng)新和用戶體驗優(yōu)化具有重要價值。針對已有研究方法的局限性,本文提出了一種集成多策略的深度學習方法對移動醫(yī)療App 在線評論進行維度挖掘和情感分析,綜合應用TF-IDF 算法、BERT模型和Canopy+K-means 聚類分析方法提取App 在線評論的主要維度,在此基礎上進一步利用LSTM-CNN 模型進行在線評論細粒度情感分析,從而全面、準確地衡量了用戶對不同移動醫(yī)療App的滿意度。實驗結果顯示,本文提出的集成多策略的深度學習方法在移動醫(yī)療App 在線評論維度挖掘和情感分類上具有很好的適用性、穩(wěn)定性和可推廣性,可為App 評論文本精準分析和用戶滿意度評價提供重要理論依據和技術支持。
但本文也存在一定的局限性??紤]到深度學習方法對在線評論挖掘和情感分類的數據量要求,本文僅選擇了目前用戶數量較多且評論數據豐富的代表性移動醫(yī)療App 進行實證研究,樣本規(guī)模不足,未能充分反映我國移動醫(yī)療應用市場的整體情況。在今后的研究中,隨著用戶評論數據的不斷累積,我們將進一步擴大樣本規(guī)模,并針對更多醫(yī)療細分領域的App 展開可持續(xù)研究。同時,進一步優(yōu)化基于深度學習的細粒度評論情感分類模型,為推動我國移動醫(yī)療App 的創(chuàng)新發(fā)展提供更有效的理論和實踐指導。