亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        情感分類器結合Norton模型預測汽車銷量

        2021-03-04 07:36:13顧洪建張帆萬甜甜張衡
        時代汽車 2021年3期

        顧洪建 張帆 萬甜甜 張衡

        摘 要:為了在“互聯(lián)網(wǎng)+大數(shù)據(jù)+人工智能+區(qū)塊鏈+物聯(lián)網(wǎng)”高度信息化的社會精準預測汽車銷量,本文首先利用詞圖、維特比等算法對汽車評價內容進行分詞操作來獲取關鍵詞語;其次利用樸素貝葉斯分類器的方法對分詞的結果進行計算,獲得每條評論內容的情感指數(shù);再次利用Norton模型的三代產(chǎn)品模型結合情感指數(shù)來組成擬合模型,同時利用最小二乘原理估計擬合模型的參數(shù);最后利用估計的參數(shù)結合某款汽車的評論數(shù)據(jù)以及每個季度的汽車銷量來驗證模型,驗證結果的準確性高達91.29%?;诖四P停髽I(yè)可進行車型的銷量預測,為合理規(guī)劃生產(chǎn)和戰(zhàn)略布局提供參考和依據(jù)。

        關鍵詞:詞圖 維特比 情感指數(shù) 樸素貝葉斯 Norton模型 最小二乘法

        Sentiment Classifier Combined With Norton Model to Predict Car Sales

        Gu Hongjian,Zhang Fan,Wan Tiantian,Zhang Heng

        Abstract:In order to accurately predict the sales of cars in a highly informatized society of "Internet + Big Data + Artificial Intelligence + Blockchain + Internet of Things", this article first uses word graphs, Viterbi and other algorithms to segment the car evaluation content to obtain the keywords; secondly, the article uses the naive Bayes classifier method to calculate the result of word segmentation to obtain the sentiment index of each review content; thirdly the article uses the three-generation product model of the Norton model combined with the sentiment index to form a fitting model, while the principle of the square method is used to estimate the fifteen parameters of the fitting model; finally, the estimated parameters are combined with the review data of a certain car and the car sales of each quarter to verify the model; the accuracy of the verification results is as high as 91.29%. This model can basically meet the actual forecasting needs, and can provide reference and basis for the reasonable production planning of the enterprise.

        Key words:word graph, Viterbi, sentiment index, naive Bayes, Norton model, least square method

        1 引言

        一直以來汽車都是我國國民經(jīng)濟重要的支柱產(chǎn)業(yè),改革開放以來,我國汽車產(chǎn)業(yè)快速發(fā)展,技術水平穩(wěn)步增強,現(xiàn)已成為世界較大的汽車市場。精準的預測汽車銷量不但可以為汽車產(chǎn)業(yè)的營銷提供有力支撐,而且還有利于管理、生產(chǎn)、采購、物流等計劃流程的優(yōu)化。此外,銷量預測還可以在一定程度上為車企獲得健康持續(xù)發(fā)展的源動力提供保證。從今年市場表現(xiàn)來看,在疫情最嚴重的2月,我國汽車行業(yè)的生產(chǎn)和銷售基本處于停滯狀態(tài),成為拉低全國經(jīng)濟指標的最主要因素。我國工業(yè)增長值同比增長速度和汽車同比增速及日均產(chǎn)量,均受疫情影響出現(xiàn)斷崖式的波動,因此精準預測汽車銷量對國民經(jīng)濟健康有序發(fā)展具有一定的推動,對十四五規(guī)劃起到?jīng)Q定性作用[1-2]。

        當下,人們以帖子、論觀點等形式表達和分享對各種主題的看法。這些評論和看法通常會透露出個人情感,例如幸福、憤怒、悲傷、批評和稱贊,并且潛在的消費者可以瀏覽產(chǎn)品的公眾意見,從而做出購買決定。在過去近十年里,網(wǎng)站評論內容傳達的情感已經(jīng)通過情感分析技術轉化為正向評價(正向情感)和負向評價(負向情感)的二分類問題,進一步帶動了自然語言處理的發(fā)展與進步[3]。

        Norton模型的誕生是以Bass模型為基礎,但是Norton模型更符合當前的市場,因為當新一代產(chǎn)品出生之后,老一代產(chǎn)品并不會立刻消失、消亡,它會和新產(chǎn)品共存一段時間,新一代產(chǎn)品的影響力是一個逐漸向四周擴散的過程。同時新一代產(chǎn)品的影響力影響力獲得包括兩個方面:一方面是從上代產(chǎn)品的影響力轉移過來,另一個方面是由于新產(chǎn)品本身的先進性而新創(chuàng)造的市場影響力。汽車產(chǎn)品的更新迭代非常符合這種趨勢,因此本文采用一種“情感分類器結合Norton模型預測汽車銷量”的方法來預測短時間內的汽車銷量。

        2 研究路線

        本文研究內容主要分為四個部分,第一部分是數(shù)據(jù)的采集以及數(shù)據(jù)的預處理;第二部分是利用機器學習方法對線上評論的數(shù)據(jù)進行情感分類(積極因素和消極因素);第三部分利用情感分類的結果結合Norton模型擬合新的模型;第四部分利用擬合后的模型對數(shù)據(jù)進行預測及分析,本文具體的結構圖如下圖1所示。

        2.1 數(shù)據(jù)采集及預處理

        2.1.1 數(shù)據(jù)采集

        數(shù)據(jù)采集收集了兩種類型的數(shù)據(jù),即評論數(shù)據(jù)和產(chǎn)品的歷史銷售數(shù)據(jù)。銷量數(shù)據(jù)可以在各個產(chǎn)品的官方網(wǎng)站或者國家統(tǒng)計局上面獲取。

        2.1.2 分詞處理

        對評論內容的分詞采用的方法是基于python語言結合詞圖、節(jié)點之間距離以及維特比算法來進行分詞,分詞結果如下表1所示。

        2.1.3 篩選關鍵詞語的頻數(shù)

        經(jīng)過2.1.2小節(jié)分詞后,會存在很多無意義的詞存在,比如“的”、“呀”、“很”等詞語,然后對其余詞語進行詞頻統(tǒng)計,比如“我很喜歡這個車型,對里面的配置也很喜歡,開著它會讓我感到很快樂和高興,它是我的兄弟以及好朋友,我建議大家都可以來購買這個很不錯的車”這句話經(jīng)過分詞處理以及剔除無意的詞語,最后得到的關鍵詞語詞頻如下圖2所示[3-5]。

        2.1.4 確定情感詞語詞庫

        要計算評論內容的情感分類要使用情感詞典,本文在眾多情感詞典中選用更具權威性的CNKI,即2007年10月22日知網(wǎng)發(fā)布“情感分析用詞語集(beta版)”的情感詞典,在本文中情感類別主要分為兩類(正面評價和負面評價)。

        2.2 情感分類

        在情感分類器中,選擇樸素貝葉斯作為情感分類器,樸素貝葉斯是一種概率型分類器,對一個評論內容來說,貝葉斯分類器會返回給后驗概率最大的情感類別,情感類別用表示,即C+和C-分別表示正面評價的類別和負面評價的類別。根據(jù)樸素貝葉斯原理,可以用如下公式計算每條口碑的情感類別[3-5],如下公式(1)所示。

        (1)

        如果有k條評論,那么公式(1)可以改為公式(2)。

        (2)

        假設通過每個時間段t需要計算評論情感,那么情感指數(shù)Q(t)由下式(3)計算:

        (3)

        其中,m為t時間段評論的次數(shù),qtm經(jīng)過樸素貝葉斯公式得到,sgn為二值化函數(shù),如果c為-1,sgn(c)=-1;如果c為1,sgn(c)=1;Q(t)為計算后的情感指數(shù)。

        2.3 擬合模型

        擬合模型指的是利用2.2小節(jié)計算的情感指數(shù)結合Norton模型,利用最小二乘法估計的參數(shù)擬合模型,使得這組參數(shù)保證擬合的結果與實際結果的差值最小。

        2.3.1 模型原理介紹

        Norton模型是以Bass模型為基礎拓展起來的,Bass模型假定潛在的消費者可以分為兩類,即創(chuàng)新者和模仿者,并且Bass模型的一般形式如下:Bass模型一般形式如下式(4)所示:

        (4)

        其中,s(t)為時間段t結束時前消費者的數(shù)量,m是潛在購買量的總數(shù), p表示創(chuàng)新群體系數(shù)(且0<=p<=1),q表示模仿群體系數(shù)(且0<=q<=1),公式(4)可以看出,知道了m、p、q的值,就可以預測t+1時間段內消費者的數(shù)量,因為s(t)不是產(chǎn)品的銷售量,但是可以根據(jù)消費者利用的頻率間接估算產(chǎn)品的銷售量,在現(xiàn)實生活中汽車是耐用消費品,因此此內容提取的情感時費者的數(shù)量可以視為產(chǎn)品銷售量[6-9]。

        評論區(qū)指數(shù)可被可被用來表示消費者對該產(chǎn)品的個人偏好。如果該產(chǎn)品獲得消費者更多贊譽與肯定(正面評價),并且這種積極的肯定將影響潛在的消費者積極購買該產(chǎn)品;同樣如果該產(chǎn)品獲得了消費者的更多批評與否定(負面評價),并且這種消極的否定也會影響潛在的消費者放棄購買該產(chǎn)品,轉向其他的競品產(chǎn)品;因此模仿群體的購買決策時間會受到社會系統(tǒng)成員之間的相互影響。

        基于上面分析可知模仿群體系數(shù)q與消費者對該產(chǎn)品的情感指數(shù)有關,因此模仿群體系數(shù)q可以看作是感指數(shù)Q(t)的函數(shù),如下公式(5)所示。

        q=f(Q(t)) (5)

        Verhulst于1983年根據(jù)WOM理論提出來的模仿群體系數(shù)q與情感指數(shù)Q(t)呈現(xiàn)S型曲線,當情感指數(shù)Q(t)為正向評價時,q的值隨著Q(t)的增加而增大,并且 q的二階導數(shù)隨著Q(t)的增加先增加后減少;當情感指數(shù)Q(t)為負向評價時,q的值隨著Q(t)的增加而減小,并且q的二階導數(shù)隨著Q(t)的增加先增加后減少。

        2.3.2 模型參數(shù)求解

        2.3.1小節(jié)介紹了Norton模型的原理以及參數(shù),本小節(jié)將介紹普通最小二乘法求解模型的參數(shù),因為Norton模型是三代產(chǎn)品模型。普通最小二乘法(OLS)是回歸模型最根本的一個模型,并且它是一種數(shù)學優(yōu)化模型,最小二乘法模型可以估計參數(shù),從而簡單地求得該產(chǎn)品的銷量,并使得求出來的銷量與實際銷量之間誤差的平方和為最小,也就是所有觀測值到回歸模型之間的距離平方和最小。

        2.4 預測分析

        2.4.1 模型求解

        汽車作為耐用消費產(chǎn)品,以此為例來說明此模型更具有魯棒性。網(wǎng)站收集了名稱為X的汽車產(chǎn)品量,該汽車產(chǎn)品共有三代。中將這三代產(chǎn)品命名為A產(chǎn)品,A+產(chǎn)品和A++產(chǎn)品。下圖3給出了X汽車產(chǎn)品3代的每個季度銷量的示意圖。

        利用表4X汽車產(chǎn)品每個季度的銷量以及評論數(shù)據(jù),帶入到以上小節(jié)的公式中,經(jīng)過多次利用最小二乘法計算模型的參數(shù)。

        2.4.2 預測結果分析

        利用表5的參數(shù)以及模型,可以預測出X汽車產(chǎn)品第3代(A++產(chǎn)品)后五個季度的汽車銷量,然后該預測數(shù)據(jù)與實際數(shù)據(jù)相比較獲得模型的準確度。X汽車產(chǎn)品第3代(A++產(chǎn)品)預測銷量的誤差占實際銷量比例如圖4所示。

        利用此模型預測的X汽車產(chǎn)品第3代(A++產(chǎn)品)的以后五個季度的汽車銷量的誤差都在8%-10%之內,五個季度的平均誤差為8.71%,基本可以給企業(yè)提出一些生產(chǎn)的建議,使企業(yè)在投入最小的資本獲得更大的利潤,同時帶動汽車產(chǎn)業(yè)進一步發(fā)展。

        3 結語

        本文基于樸素貝葉斯情感分類器結合Norton模型對某款型號汽車的三代產(chǎn)品進行分析,預測的結果平均誤差大約為8.71%,具有一定的指導作用。為了提高準確率,文本可以進一步擴大數(shù)據(jù)源,把抖音等數(shù)據(jù)結合起來計算;還可以提取線性支持向量機(SVM)情感分類器結合Norton模型預測銷量;并且采用深度學習技術求解模型參數(shù),使得求解參數(shù)更加準確,預測結果更加符合實際。

        參考文獻:

        [1]D.Fantazzini and Z.Toktamysova, “Forecasting German car sales using Google data and multivariate models,”International Journal of Production Economics,vol.170,pp. 97-135,2015,http://dx.doi.org/10.1016/j.ijpe.2015.09.010.

        [2]E.Cambria,Affective computing and sentiment analysis,IEEE Intell. Syst. 31(2)(2016)102-107.

        [3]梁柯,李健,陳穎雪,劉志鋼.基于樸素貝葉斯的文本情感分類及實現(xiàn)[J].智能計算機與應用,2019,9(05):150-153+157. LIANG K,LI J,CHEN Y X,LIU Z.Text sentiment classification and realization based on Naive Bayes[J]. Intelligent Computers and Applications,2019,9(05):150-153+157.

        [4]李丹陽.面向中文評論的情感分析方法研究[D].西安工業(yè)大學,2019.LI D Y. Research on sentiment analysis methods for Chinese comments [D].Xi'an Technological University,2019.

        [5]葛霓琳.基于詞典和機器學習的酒店評論情感分析[D].江蘇科技大學,2019. GE N L. Sentiment analysis of hotel reviews based on dictionary and machine learning [D]. Jiangsu University of Science and Technology,2019.

        [6]Zhi-Ping Fan,Yu-Jie Che,Zhen-Yu Chen. Product sales forecasting using online reviews and historical sales data:A method combining the Bass model and sentiment analysis[J]. Journal of Business Research,2017,74.

        [7]https://baike.sogou.com/v200960.htm?fromTitle=%E6%9C%80%E5%B0%8F%E4%BA%8C%E4%B9%98%E6%B3%95.

        [8]劉丹丹,周躍進.基于偏最小二乘法結構方程模型的江蘇外資高質量評價研究[J].江蘇商論,2020(08):41-45+58. LIU D D, ZHOU Y J. Research on the high-quality evaluation of Jiangsu foreign capital based on partial least squares structural equation model[J]. Jiangsu Commercial Theory,2020(08):41-45+58.

        [9]張妤,鄧廷勇,夏冰.基于LS-SVM的中文文本情感分類[J].科學技術創(chuàng)新,2019(26):56-57. ZHANG Y,DENG T Y,XIA B. Chinese text sentiment classification based on LS-SVM[J].Science and Technology Innovation,2019(26):56-57.

        亚洲综合网站精品一区二区| 在线成人爽a毛片免费软件| 中文字幕日韩精品无码内射| 一本大道香蕉视频在线观看| 亚洲精品高清av在线播放| 精品女厕偷拍视频一区二区| 亚洲精品国产一区二区| 99精品视频在线观看免费| 欧美日韩高清一本大道免费| 日韩成人高清不卡av| 日本亲近相奷中文字幕| 亚洲午夜精品久久久久久人妖| 九色91精品国产网站| 国产成人亚洲精品一区二区三区 | 中国男女黄色完整视频| 人妻少妇久久久久久97人妻| 久久久久亚洲精品无码网址| 男人深夜影院无码观看| 一级一片内射视频网址| 国产综合久久久久久鬼色| 激情内射亚洲一区二区三区爱妻| 一区二区丝袜美腿视频| 中文字幕av长濑麻美| 岳好紧好湿夹太紧了好爽矜持 | 国产码欧美日韩高清综合一区 | 在线播放免费播放av片| 亚洲AⅤ无码国精品中文字慕| 久久偷拍国内亚洲青青草| 精品香蕉一区二区三区| 夫妇交换刺激做爰视频| 国产丝袜精品丝袜一区二区| 亚洲精品第四页中文字幕| 久久久久国产综合av天堂| 国产欧美精品一区二区三区–老狼| 日韩性感av一区二区三区| 国产成人无码专区| 7777精品伊人久久久大香线蕉| 亚州五十路伊人网| 国产三级黄色免费网站| аⅴ资源天堂资源库在线| 亚洲国产欧美另类va在线观看|