楊浩然
摘要:本文應(yīng)用了pandas算法對附件進(jìn)行數(shù)據(jù)清洗,建立基于熵權(quán)法的權(quán)重分析模型分析因素對不同品牌電動汽車的銷售的影響,從而得出目標(biāo)客戶購買電動汽車的可能性。首先需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,將數(shù)據(jù)分為兩個(gè)部分,利用Excel對各項(xiàng)指標(biāo)的進(jìn)行均值計(jì)算,然后用ACSI模型進(jìn)行滿意度分析,構(gòu)建滿意度的數(shù)學(xué)關(guān)系式,篩選出所有有意愿購買電動汽車的客戶,將各品牌銷售的綜合分?jǐn)?shù)則作為因變量,建立基于熵權(quán)法的權(quán)重分析模型,權(quán)重越大,則評分越高,得出a1,a2,B12,B13,B15,B17等因素對不同品牌電動汽車的銷售有影響,其中B17的權(quán)重最大,其影響則為最大。
關(guān)鍵詞:pandas 法;熵權(quán)法;相關(guān)性分析
1 引言
汽車產(chǎn)業(yè)是國民經(jīng)濟(jì)的重要支柱產(chǎn)業(yè),而新能源汽車產(chǎn)業(yè)是戰(zhàn)略性新興產(chǎn)業(yè)。大力發(fā)展以電動汽車為代表的新能源汽車是解決能源環(huán)境問題的有效途徑,市場前景廣闊。但是,電動汽車畢竟是一個(gè)新興的事物,與傳統(tǒng)汽車相比,消費(fèi)者在一些領(lǐng)域,如電池問題,還是存在著一些疑慮,其市場銷售需要科學(xué)決策。
2 問題分析
針對該問題,首先需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,應(yīng)用 Python 的強(qiáng)大的 pandas 處理,找出異常值,利用均值插值法對異常值進(jìn)行處理,同時(shí)將 B7 的空值全部取值為 0。我們將數(shù)據(jù)分為兩個(gè)部分,分別是汽車的滿意度打分,一個(gè)是問卷調(diào)查數(shù)據(jù),將數(shù)據(jù)進(jìn)行處理后,進(jìn)行均值處理,然后進(jìn)行滿意度分析,最后利用 spss 進(jìn)行描述性統(tǒng)計(jì)分析。篩選出所有有意愿購買電動汽車的客戶,然后導(dǎo)入 spss 進(jìn)行相關(guān)性分析得出的相關(guān)性,然后根據(jù)相關(guān)性分析的結(jié)果,篩選出 11 個(gè)影響因子,然后根據(jù)這些影響因子建立基于熵權(quán)法的權(quán)重分析模型,對影響各品牌銷售的進(jìn)行綜合評分,因子的權(quán)重越大,則對評分影響就越大,分析各個(gè)因子的權(quán)重,得出影響各品牌銷售的因素。
3 數(shù)據(jù)清洗與分析
附件中的數(shù)據(jù)有異常值與缺失值,所以我們需要對數(shù)據(jù)進(jìn)行處理。我們首先需要對數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗,應(yīng)用 Python 的強(qiáng)大的 pandas 處理,找出異常值,利用均值插值法對異常值進(jìn)行處理,同時(shí)將 B7 的空值全部取值為 0。我們將數(shù)據(jù)分為兩個(gè)部分,分別是汽車的滿意度打分,一個(gè)是問卷調(diào)查數(shù)據(jù),將數(shù)據(jù)進(jìn)行處理后,進(jìn)行均值處理,然后進(jìn)行滿意度分析,最后利用 spss 進(jìn)行描述性統(tǒng)計(jì)分析,可以得出部分異常值如下所示:
4 滿意度分析
我們應(yīng)用 ACSI 模型進(jìn)行滿意度分析,首先構(gòu)建滿意度的數(shù)學(xué)關(guān)系式:
分析 a1-a8 的每列打分的平均值,以及這 8 列的總體平均分,其數(shù)學(xué)描述如下:
我們應(yīng)用 Python 進(jìn)行編程計(jì)算得出的結(jié)果如下表所示:
根據(jù)表 2可得,三個(gè)品牌在群眾中的滿意度分別是 77.45%,77.37%,78.54%,由此可以得出 3 品牌的滿意度更高。
5基于熵權(quán)法的權(quán)重分析模型
本文選用熵權(quán)法對一級指標(biāo)進(jìn)行權(quán)重的確定。首先這十個(gè)影響因子的數(shù)據(jù),對各個(gè)危險(xiǎn)因素的重要性進(jìn)行評價(jià)與測度,以熵權(quán)法進(jìn)行權(quán)重[4]的計(jì)算,主要步驟與計(jì)算邏輯如下:
由于各項(xiàng)指標(biāo)的計(jì)量單位并不統(tǒng)一,因此在用它們計(jì)算綜合指標(biāo)前,先要進(jìn)行標(biāo)準(zhǔn)化處理,即把指標(biāo)的絕對值轉(zhuǎn)化為相對值,從而解決各項(xiàng)不同質(zhì)指標(biāo)值的同質(zhì)化問題。
另外,正向指標(biāo)和負(fù)向指標(biāo)數(shù)值代表的含義不同(正向指標(biāo)數(shù)值越高越好,負(fù)向指標(biāo)數(shù)值越低越好),因此,對于正向負(fù)向指標(biāo)需要采用不同的算法進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理:正向指標(biāo)
6 結(jié)論分析
表2可得,a1,a2,B12,B13,B15,B17 等因素是對 Q 存在影響的,則 a1,a2,B12,B13,B15,B17 等因素對不同品牌電動汽車的銷售有影響,其中 B17 的權(quán)重最大,為 0.46,其影響則為最大。
參考文獻(xiàn):
[1]歐陽元東,基于 Python 的網(wǎng)站數(shù)據(jù)爬取與分析的技術(shù)實(shí)現(xiàn)策略[J],電腦知識與技術(shù) . 2020,16(13).
[2]Python 數(shù)據(jù)分析中的數(shù)據(jù)整理探討[J]. 張向偉. ?電子世界. ?2021(11)
[3]基于 Python 的數(shù)據(jù)分析[J]. 李俊華. 電子技術(shù)與軟件工程. 2018(17)
[4]張 虹、莊文英,基于創(chuàng)新能力的小微企業(yè)活力指數(shù)體系研究[J],Business Management,商業(yè)經(jīng)濟(jì)研究 2019 年 16 期
[5]張軍.算法設(shè)計(jì)與分析[M].清華大學(xué)出版社.2011.8.P100-P215