亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的商品報(bào)價(jià)模型

        2022-08-04 08:44:38廈門大學(xué)管理學(xué)院高晨芳廈門正航軟件科技有限公司陳斌全廈門大學(xué)管理學(xué)院陳亞盛
        管理會(huì)計(jì)研究 2022年4期
        關(guān)鍵詞:模型

        文 · 廈門大學(xué)管理學(xué)院 高晨芳 廈門正航軟件科技有限公司 陳斌全 廈門大學(xué)管理學(xué)院 陳亞盛

        一、引言

        定價(jià)決策是企業(yè)為了促成產(chǎn)品銷售而制定產(chǎn)品最佳價(jià)格的過程。企業(yè)在實(shí)際經(jīng)營過程中,可能對同一種產(chǎn)品制定多種價(jià)格。在實(shí)務(wù)中,一種產(chǎn)品的價(jià)格通常以成本為基礎(chǔ),結(jié)合目標(biāo)利潤、顧客需求、商品屬性等因素進(jìn)行綜合調(diào)整,還可能因不同地區(qū)的經(jīng)濟(jì)水平、消費(fèi)者觀念、文化等的不同存在差異1作者在《營銷管理》一書中從五個(gè)方面闡述了顧客群體的細(xì)分變量,即人口統(tǒng)計(jì)變量、經(jīng)營變量、購買方式、情景因素和個(gè)人特征。這里的顧客細(xì)分市場是對客戶細(xì)分變量的通稱。這種定價(jià)方法也叫作差別定價(jià)法。差別定價(jià)是企業(yè)在經(jīng)營活動(dòng)中獲利的一種重要手段,也是滿足不同顧客群體的價(jià)格策略。在執(zhí)行這種差別定價(jià)方法時(shí),銷售人員需要有足夠的經(jīng)驗(yàn)積累和較強(qiáng)的計(jì)算能力,才能在顧客詢價(jià)時(shí)及時(shí)給出顧客愿意接受的價(jià)格,促成銷售。有豐富經(jīng)驗(yàn)和快速計(jì)算能力的銷售人員是稀缺資源,這種人力資源的稀缺制約了企業(yè)差別定價(jià)的有效執(zhí)行。隨著以機(jī)器學(xué)習(xí)為代表的人工智能方法的普及,很多企業(yè)已經(jīng)在經(jīng)營活動(dòng)中使用人工智能技術(shù)來彌補(bǔ)人力資源的短缺。機(jī)器學(xué)習(xí)方法最大的特點(diǎn)是計(jì)算機(jī)可以充分利用自身的算力,通過自主學(xué)習(xí),在短時(shí)間內(nèi)根據(jù)數(shù)據(jù)間的相關(guān)關(guān)系發(fā)現(xiàn)其中蘊(yùn)含的規(guī)律。在差別定價(jià)的場景中,這種發(fā)現(xiàn)規(guī)律的經(jīng)驗(yàn)積累能力加上計(jì)算機(jī)的算力,可以較好地補(bǔ)足人力資源的短缺。因此,本文嘗試整合企業(yè)的管理信息系統(tǒng)數(shù)據(jù)和機(jī)器學(xué)習(xí)算法,探索建立一個(gè)能夠自動(dòng)根據(jù)客戶需求預(yù)測最優(yōu)產(chǎn)品報(bào)價(jià)的模型,輔助銷售人員進(jìn)行產(chǎn)品定價(jià)決策。

        二、相關(guān)理論

        (一)價(jià)格影響因素分析

        目前國內(nèi)外對商品定價(jià)的研究較為豐富,本節(jié)通過對文獻(xiàn)的分析,總結(jié)差別定價(jià)的影響因素,為后續(xù)收集數(shù)據(jù)和構(gòu)建模型特征提供理論支持。經(jīng)過對價(jià)格影響因素文獻(xiàn)的梳理,我們發(fā)現(xiàn)影響商品價(jià)格的因素大致可以分為以下五個(gè)維度:宏觀環(huán)境、客戶屬性、產(chǎn)品屬性、需求屬性、供應(yīng)屬性。宏觀環(huán)境指一個(gè)國家或地區(qū)的整體經(jīng)濟(jì)環(huán)境。經(jīng)濟(jì)發(fā)展階段、增長速度和景氣程度都會(huì)影響客戶的購買力,進(jìn)而影響他們對產(chǎn)品價(jià)格的期望??蛻魧傩灾饕强蛻粼诩?xì)分維度上的特質(zhì),客戶的不同市場地位和財(cái)務(wù)狀況等特質(zhì)會(huì)影響客戶對價(jià)格的敏感度和議價(jià)能力。產(chǎn)品屬性是產(chǎn)品的性狀和品質(zhì)等特征。需求屬性是指客戶提出購買需求所附帶的要求,例如交貨時(shí)間、地點(diǎn)和購買量等。供應(yīng)屬性是指銷售商供貨的形式和條件,例如供貨地點(diǎn)、送貨方式和供貨量等。表1歸納總結(jié)了國內(nèi)外針對上述五個(gè)維度的商品價(jià)格影響因素的前期研究。

        表1 國內(nèi)外商品價(jià)格影響因素文獻(xiàn)回顧

        (二)機(jī)器學(xué)習(xí)分析流程

        人工智能是1956年計(jì)算機(jī)科學(xué)家們在達(dá)特茅斯會(huì)議上提出的一個(gè)大膽的概念。他們希望計(jì)算機(jī)也能像人一樣思考。而管理會(huì)計(jì)是運(yùn)用專門的方式、方法,通過確認(rèn)、計(jì)量、歸集、分析、編制、解釋、傳遞等一系列工作,為管理者和決策者提供信息,并參與企業(yè)經(jīng)營管理。人工智能作為基于數(shù)據(jù)形成的產(chǎn)物,本質(zhì)是一些更高級更復(fù)雜的計(jì)算方法,可以作為管理會(huì)計(jì)實(shí)務(wù)的新方法。借鑒機(jī)器學(xué)習(xí)模型構(gòu)建的通用流程,本文將在管理會(huì)計(jì)中使用機(jī)器學(xué)習(xí)模型的步驟總結(jié)為以下4步,如圖1所示。

        圖1 設(shè)計(jì)流程與實(shí)現(xiàn)思路

        (1)定義問題:財(cái)務(wù)人員應(yīng)在了解公司真實(shí)的業(yè)務(wù)痛點(diǎn)后,將業(yè)務(wù)上需要解決的問題拆解成可以用算法模型輔助完成的分析或預(yù)測的需求。

        (2)構(gòu)建特征工程:將分析或預(yù)測需求轉(zhuǎn)化為抽象算法模型的過程,重點(diǎn)是設(shè)計(jì)這些算法模型的輸入特征數(shù)據(jù)和預(yù)期輸出結(jié)果。選取特征是機(jī)器學(xué)習(xí)非常重要的一部分,決定了利用機(jī)器學(xué)習(xí)進(jìn)行分析或預(yù)測的效果。同時(shí),這個(gè)流程中確認(rèn)的輸入與輸出特征也決定了構(gòu)建模型所需數(shù)據(jù)的深度與廣度。

        (3)數(shù)據(jù)分析:將收集到的數(shù)據(jù)進(jìn)行清洗、歸納,并選擇一種機(jī)器學(xué)習(xí)方法從上述輸入數(shù)據(jù)特征與輸出數(shù)據(jù)特征的相關(guān)性中發(fā)現(xiàn)隱藏在數(shù)據(jù)中的規(guī)律。發(fā)現(xiàn)這些規(guī)律的過程,也是利用機(jī)器學(xué)習(xí)進(jìn)行解決業(yè)務(wù)問題的分析與預(yù)測的過程。

        (4)模型診斷和參數(shù)調(diào)整:基于構(gòu)建特征工程時(shí)所確認(rèn)的模型預(yù)期效果,對模型進(jìn)行優(yōu)化,獲取最佳使用效果。模型參數(shù)調(diào)整是對機(jī)器學(xué)習(xí)用于分析或預(yù)測所能達(dá)到效果(通常是準(zhǔn)確性)的進(jìn)一步完善,也就是降低模型在未知的數(shù)據(jù)上的誤差。常用的模型評估指標(biāo)有MSE(Mean Square Error,統(tǒng)計(jì)預(yù)測值和原始值誤差平方和的均值。數(shù)值越小,表示誤差越小)、RMSE(Root Mean Square Error,統(tǒng)計(jì)預(yù)測值和原始值誤差的標(biāo)準(zhǔn)差。數(shù)值越小,表示誤差越小)、MAE(Mean Absolute Error,統(tǒng)計(jì)預(yù)測值和原始值絕對誤差的平均值。數(shù)值越小,表示誤差越小)和R2(RSquared,統(tǒng)計(jì)預(yù)測值和真實(shí)值的擬合程度。數(shù)值越接近1,表示擬合效果越好,也可為負(fù)數(shù),表示擬合效果很差)。

        三、案例分析背景及介紹

        (一)案例公司概況

        為了驗(yàn)證機(jī)器學(xué)習(xí)模型應(yīng)用于商品報(bào)價(jià)的可行性,本文以深圳某電子元器件貿(mào)易公司作為研究樣本。該公司主要從事電子元器件的貿(mào)易代理服務(wù),擁有多家國內(nèi)外知名電子元器件制造商的代理和經(jīng)銷資質(zhì),并擁有自己的現(xiàn)貨庫存。主營產(chǎn)品包括電阻、電容、三極管等。通常情況下,公司會(huì)結(jié)合自身優(yōu)勢,加之對市場的了解,提前購買大量的商品形成自有庫存。當(dāng)下游采購時(shí),直接進(jìn)行現(xiàn)貨銷售,加快商品流通。

        (二)問題定義

        該公司商品通常采用成本定價(jià)法確定商品參考價(jià)格,但該參考價(jià)格只能作為管理層和業(yè)務(wù)人員在經(jīng)營過程中的參考依據(jù);而最終合同成交價(jià)格,可能因客戶類別、購買數(shù)量以及市場環(huán)境的不同而存在差異,需要銷售人員憑經(jīng)驗(yàn)報(bào)價(jià)。過高的報(bào)價(jià)可能會(huì)嚇跑顧客,太低的價(jià)格又會(huì)損害公司利潤,因此銷售人員面臨的業(yè)務(wù)問題是如何找到一個(gè)既可以讓顧客接受又能給公司帶來最大利潤的最佳報(bào)價(jià)。該公司的業(yè)務(wù)員需要解決的問題,也是其他行業(yè)常見的差別定價(jià)的問題。這種差別定價(jià)的傳統(tǒng)決策過程是銷售人員根據(jù)市場經(jīng)濟(jì)條件、訂單交付環(huán)境、客戶屬性等多方面綜合考慮后,對統(tǒng)一的參考價(jià)格進(jìn)行調(diào)整,給出一個(gè)銷售員認(rèn)為最有可能促成交易的價(jià)格。為了讓計(jì)算機(jī)能夠輔助銷售人員更快更準(zhǔn)地找到這個(gè)價(jià)格,一個(gè)可行的方案是讓計(jì)算機(jī)從銷售人員的成功經(jīng)驗(yàn)中學(xué)習(xí)到價(jià)格影響因素與價(jià)格之間的規(guī)律,然后在實(shí)際交易中快速根據(jù)收集到的價(jià)格影響因素信息算出最佳報(bào)價(jià)?;谶@個(gè)思路,本文嘗試以該公司歷史交易記錄中的真實(shí)成交價(jià)作為最佳報(bào)價(jià),以基于成交價(jià)計(jì)算的真實(shí)利潤率作為模型最終的預(yù)測值,收集與價(jià)格相關(guān)的影響因素作為特征值,再利用機(jī)器學(xué)習(xí)的方法,找出特征因素和價(jià)格的關(guān)系,幫助銷售人員做出決策。

        (三)構(gòu)建特征工程

        通過上文“價(jià)格影響因素分析”部分的梳理和總結(jié),可以發(fā)現(xiàn)影響商品價(jià)格的因素有很多。將這些維度轉(zhuǎn)化為可以收集和分析的數(shù)據(jù),首先需要結(jié)合該公司的業(yè)務(wù)特點(diǎn),提煉出具有代表性的輸入變量和輸出變量。我們結(jié)合案例公司實(shí)際經(jīng)營狀況以及數(shù)據(jù)的可獲取和可量化程度,從宏觀環(huán)境、客戶屬性、產(chǎn)品屬性、需求屬性和供應(yīng)屬性5個(gè)維度對該公司商品價(jià)格影響因素進(jìn)行總結(jié)。最終共收集到17個(gè)變量特征。具體變量如表2所示。

        表2 樣本公司商品價(jià)格影響變量

        (四)數(shù)據(jù)分析

        本文選取樣本公司2019年6月至2020年1月的歷史訂單,以其中的電阻類銷售訂單為樣本,對每筆交易記錄的17個(gè)特征屬性變量進(jìn)行統(tǒng)計(jì)。刪除其中少量缺失值以后,共收集了12109個(gè)歷史訂單。表3列示了經(jīng)清洗后的樣本數(shù)據(jù)。表格的每行代表一條銷售訂單明細(xì)信息,每個(gè)列代表一個(gè)特征屬性變量。最后一列“利潤率”是標(biāo)簽,也是機(jī)器學(xué)習(xí)模型需要預(yù)測的目標(biāo)值。舉例說明,表中第一行數(shù)據(jù)表達(dá)的含義為某訂單由4號業(yè)務(wù)員接單,銷售數(shù)量為15件,商品原價(jià)為1.93元,商品成本為1.28元,銷售通路代碼為1……,單個(gè)銷售商品的利潤率約為0.50。

        表3 清洗后的樣本數(shù)據(jù)(部分)

        通過對比“原價(jià)(購入成本價(jià))利潤率”與“售價(jià)利潤率”的差異,可以分析業(yè)務(wù)人員銷售過程中的調(diào)價(jià)情況。分析結(jié)果如圖2所示,圖中橫坐標(biāo)表示“原價(jià)利潤率”,縱坐標(biāo)表示“售價(jià)利潤率”。若商品以原價(jià)銷售,則圓點(diǎn)應(yīng)在直線Y=X上,否則就會(huì)偏離直線。我們通過圖2可以看出,大多數(shù)樣本不在直線Y=X上,即售價(jià)不等于原價(jià),說明業(yè)務(wù)人員在銷售過程中,普遍存在調(diào)價(jià)行為,而且從圓點(diǎn)的離散程度我們可以看到,利潤率較高的產(chǎn)品的調(diào)價(jià)幅度更大。

        圖2 原價(jià)與成交價(jià)利潤率對比

        數(shù)據(jù)分析的模型有很多種,在建立模型時(shí),我們通常不能提前預(yù)知哪種模型才是最優(yōu)解,但把所有的算法都嘗試一遍也不實(shí)際。根據(jù)華盛頓大學(xué)數(shù)據(jù)科學(xué)博士Michael Beyeler提出的算法選擇方法論,可以將模型選擇流程分為三個(gè)步驟。第一,先了解備選算法的基本原理以及可以解決的問題,并將這些算法分為有監(jiān)督式學(xué)習(xí)算法和無監(jiān)督式學(xué)習(xí)算法;第二,根據(jù)收集到的數(shù)據(jù)是否有事先標(biāo)注的數(shù)據(jù)標(biāo)簽,將備選算法范圍縮小到有監(jiān)督式學(xué)習(xí)算法或無監(jiān)督式學(xué)習(xí)算法,有數(shù)據(jù)標(biāo)簽的選擇有監(jiān)督式學(xué)習(xí)算法,沒有數(shù)據(jù)標(biāo)簽的選擇無監(jiān)督式學(xué)習(xí)算法;第三,在選定的算法類別中,嘗試建立多種可用的模型,并通過反復(fù)的實(shí)驗(yàn)得到最優(yōu)算法。本文商品報(bào)價(jià)分析的目的是預(yù)測商品的利潤率,我們獲取的樣本公司歷史訂單記錄中有利潤率的信息,屬于有標(biāo)簽數(shù)據(jù),因此應(yīng)當(dāng)選擇有監(jiān)督式學(xué)習(xí)算法。利潤率是一個(gè)連續(xù)變量,因此我們初步篩選出了四種適用于連續(xù)型變量的有監(jiān)督式學(xué)習(xí)算法模型,分別是決策樹、隨機(jī)森林、K近鄰(KNN)、多層感知機(jī)(MLP神經(jīng)網(wǎng)絡(luò))。

        (五)模型診斷和參數(shù)調(diào)整

        在模型診斷與參數(shù)調(diào)整階段,我們隨機(jī)抽選95%的樣本作為訓(xùn)練集,剩余5%樣本留作測試集,利用P y thon機(jī)器學(xué)習(xí)算法庫構(gòu)造相應(yīng)的商品報(bào)價(jià)模型,并對預(yù)測結(jié)果進(jìn)行對比分析,以期篩選出最優(yōu)算法模型??紤]到評估指標(biāo)MSE、RMSE和MAE的含義相似,由于本研究中標(biāo)簽值(利潤率)均是小于1的數(shù),對誤差求平方將過度縮放誤差,不利于觀察,因此本文采用MAE指標(biāo)進(jìn)行評價(jià)。此外,僅探尋數(shù)據(jù)預(yù)測的準(zhǔn)確性是不夠的,還需要評估模型預(yù)測結(jié)果與真實(shí)值的擬合程度,所以本文也將R2作為模型評價(jià)指標(biāo)。我們對選取的每一個(gè)機(jī)器學(xué)習(xí)模型都采用MAE和R2進(jìn)行評價(jià),然后再根據(jù)它們在這兩個(gè)指標(biāo)上的表現(xiàn),調(diào)整模型參數(shù),尋求最佳參數(shù)組合。

        各模型的初始結(jié)果如表4所示,其中預(yù)測結(jié)果圖像中的橫軸表示真實(shí)數(shù)據(jù),縱軸表示預(yù)測數(shù)據(jù)。若真實(shí)值與模型預(yù)測值一致,那么樣本點(diǎn)會(huì)落在Y=X的直線上。預(yù)測精度越高,樣本點(diǎn)越接近直線,否則樣本點(diǎn)越散亂,與直線的偏差越大。比較訓(xùn)練集和預(yù)測集的預(yù)測精度差異,可以看出模型在訓(xùn)練過程中是否出現(xiàn)過擬合問題。例如,決策樹模型在訓(xùn)練數(shù)據(jù)中表現(xiàn)近乎完美,但是在由未知數(shù)據(jù)組成的測試集中表現(xiàn)卻有很大落差,說明決策樹模型有過擬合風(fēng)險(xiǎn)。綜合對比各模型的輸出結(jié)果,可以看到隨機(jī)森林模型的初始表現(xiàn)最好。

        表4 各模型預(yù)測結(jié)果

        模型不可能通過一次訓(xùn)練就達(dá)到目標(biāo),需要不斷進(jìn)行優(yōu)化調(diào)試。在初始模型的基礎(chǔ)上,為進(jìn)一步提高其準(zhǔn)確率,我們嘗試調(diào)整了隨機(jī)森林模型的主要參數(shù)。經(jīng)過調(diào)整后的模型更為準(zhǔn)確,R2=0.893,較調(diào)整前上升0.006;MAE=0.059,較調(diào)整前下降0.002。

        具體的調(diào)整步驟如下:

        (1)調(diào)整隨機(jī)森林中樹的個(gè)數(shù)(n_estimators)2表示隨機(jī)森林最大的決策樹個(gè)數(shù),n_estimators值過小,選取的樣本可能太少,模型容易欠擬合;反之,數(shù)值過大,可能需要多次隨機(jī)選擇,導(dǎo)致數(shù)據(jù)量過大,模型學(xué)習(xí)時(shí)間會(huì)很長。n_estimators增大到一定程度后,模型預(yù)測精度會(huì)很難向上提升,通常情況下參數(shù)默認(rèn)值為100:測試1—50棵樹在“森林”中生長對預(yù)測精確度的影響。參數(shù)調(diào)整結(jié)果如圖3所示,圖中的橫坐標(biāo)均表示“樹”的個(gè)數(shù),縱坐標(biāo)表示模型的評估結(jié)果。上圖為MAE的評估結(jié)果,下圖為R2的評估結(jié)果。根據(jù)圖3可以發(fā)現(xiàn),隨著“森林”中“樹木”的增多,預(yù)測模型的平均絕對誤差(MAE)逐漸下降,決定系數(shù)(R2)的預(yù)測結(jié)果越來越接近1,說明模型的準(zhǔn)確率在不斷提高,但當(dāng)“樹”達(dá)到30棵以后,模型的預(yù)測精度已經(jīng)很難大幅度提高,精度達(dá)到極限。經(jīng)過不斷嘗試,當(dāng)參數(shù)被調(diào)整到47時(shí),精度最高,所以本文將n_estimators參數(shù)定為47。

        圖3 n_estimators參數(shù)調(diào)整結(jié)果

        (2)調(diào)整模型中最大特征個(gè)數(shù)(ma x_features)3模型訓(xùn)練時(shí)的最大特征數(shù),默認(rèn)為auto,決定樹的生成時(shí)間:測試1—17個(gè)最大特征值對模型精度的影響。參數(shù)調(diào)整結(jié)果如圖4所示,圖中的橫坐標(biāo)表示特征值的個(gè)數(shù),縱坐標(biāo)表示模型的評估結(jié)果。其中,上圖為MAE的評估結(jié)果,下圖為R2的評估結(jié)果。結(jié)果表明,隨著特征值個(gè)數(shù)的增加,預(yù)測模型的平均絕對誤差(MAE)逐漸下降,決定系數(shù)(R2)的預(yù)測結(jié)果越來越接近1。說明在本案例中,隨著樣本的模型特征變量數(shù)量逐漸增多,預(yù)測的精度也隨之提高。因此,本文把max_features參數(shù)調(diào)整到17,即最大特征數(shù)。

        圖4 max_features參數(shù)調(diào)整結(jié)果

        (3)調(diào)整模型葉子節(jié)點(diǎn)最少樣本數(shù)(min_samples_leaf)4葉子節(jié)點(diǎn)所需的最少樣本數(shù),默認(rèn)值為1,如果訓(xùn)練樣本集數(shù)據(jù)非常多,則需要增加該值的大?。簻y試節(jié)點(diǎn)數(shù)量為1—10時(shí),對模型預(yù)測精確度的影響。參數(shù)調(diào)整結(jié)果如圖5所示,圖中的橫坐標(biāo)表示葉子節(jié)點(diǎn)最少樣本個(gè)數(shù),縱坐標(biāo)表示模型的評估結(jié)果。其中,上圖為MAE的評估結(jié)果,下圖為R2的評估結(jié)果。結(jié)果表明,隨著葉子節(jié)點(diǎn)數(shù)的增加,預(yù)測模型的平均絕對誤差(MAE)逐漸上升,決定系數(shù)(R2)的預(yù)測結(jié)果也從原本的接近1逐漸下降。說明在本案例中,隨著模型中葉子節(jié)點(diǎn)數(shù)的增多,模型的精度也在逐漸下降。因此本文把min_samples_leaf參數(shù)設(shè)置為1。

        圖5 min_samples_leaf參數(shù)調(diào)整結(jié)果

        四、研究結(jié)果

        (一)模型預(yù)測結(jié)果

        1.預(yù)測結(jié)果誤差分析

        對于預(yù)測商品價(jià)格準(zhǔn)確率的衡量,不僅要考慮測量誤差大小,還要考慮誤差的方向,是正誤差還是負(fù)誤差。因?yàn)檎`差和負(fù)誤差的經(jīng)濟(jì)效果是不一樣的。如果機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果有正向誤差(模型推薦以較高價(jià)格報(bào)價(jià)),雖然可能會(huì)因?yàn)閳?bào)價(jià)太高而丟掉潛在客戶,但是公司不會(huì)有即時(shí)的損失;如果機(jī)器學(xué)習(xí)模型預(yù)測結(jié)果有負(fù)誤差(模型推薦以較低價(jià)格報(bào)價(jià)),那么公司可能會(huì)因?yàn)轭櫩鸵赃^低價(jià)格購買走商品而承受即時(shí)的損失。因此,有必要將較少的不同方向誤差作為衡量一個(gè)模型優(yōu)劣的標(biāo)準(zhǔn)。

        由于案例公司采用成本加成定價(jià)法計(jì)算基于成本的“原價(jià)利潤率”,為驗(yàn)證模型預(yù)測利潤率與實(shí)際利潤率(以實(shí)際成交價(jià)為基礎(chǔ)計(jì)算的利潤率)的趨勢一致性,本文將原價(jià)利潤率作為衡量基準(zhǔn),對預(yù)測利潤率與實(shí)際利潤率進(jìn)行比較。當(dāng)實(shí)際利潤率小于原價(jià)利潤率時(shí),表示為“實(shí)際交易價(jià)格<原價(jià)”,說明業(yè)務(wù)人員降價(jià)銷售商品。反之,用“實(shí)際交易價(jià)格>原價(jià)”表示。當(dāng)預(yù)測利潤率小于原價(jià)利潤率時(shí),表示為“預(yù)測交易價(jià)格<原價(jià)”,說明機(jī)器學(xué)習(xí)模型建議降價(jià)銷售。反之,用“預(yù)測交易價(jià)格>原價(jià)”表示。如果實(shí)際交易價(jià)格小于原價(jià)的時(shí)候預(yù)測交易價(jià)格也小于原價(jià),那就說明機(jī)器學(xué)習(xí)模型預(yù)測的方向是對的,機(jī)器在銷售人員降價(jià)銷售成功的時(shí)候也是建議降價(jià);反之則說明模型預(yù)測的方向是錯(cuò)的。

        為了驗(yàn)證隨機(jī)森林算法對提價(jià)和降價(jià)方向性判斷的準(zhǔn)確性,我們通過計(jì)算分類評估指標(biāo)F15F1分?jǐn)?shù)是統(tǒng)計(jì)學(xué)中用來衡量二分類模型精確度的一種指標(biāo)。它同時(shí)兼顧了分類模型的精確率和召回率值,對測試集的606個(gè)樣本數(shù)據(jù)(總樣本的5%)的商品價(jià)格預(yù)測結(jié)果進(jìn)行了方向準(zhǔn)確性檢驗(yàn)。分析結(jié)果如表5所示:F1(實(shí)際交易價(jià)和預(yù)測價(jià)格都大于原價(jià))預(yù)測準(zhǔn)確率為84.42%684.42% =(363×2)÷(2×363+77+57);F1(實(shí)際交易價(jià)和預(yù)測價(jià)格都小于原價(jià))= 61.93%;數(shù)據(jù)總體預(yù)測準(zhǔn)確率為77.89%777.89% =(363+109)÷ 606??梢钥闯觯瑹o論是降價(jià)銷售還是提價(jià)銷售,隨機(jī)森林算法都能較好地和銷售人員保持一致,說明該模型對價(jià)格的漲跌趨勢預(yù)測有一定的指導(dǎo)作用。

        表5 預(yù)測價(jià)格與實(shí)際價(jià)格對比

        2.預(yù)測結(jié)果簡析

        經(jīng)過上述分析,說明對于測試集數(shù)據(jù)而言,模型的預(yù)測結(jié)果與8 9.3%的真實(shí)結(jié)果擬合(R2=0.893),平均絕對誤差為0.059(MAE=0.059)。為了更好地展示模型的訓(xùn)練結(jié)果,本文對測試集的606個(gè)數(shù)據(jù)的預(yù)測誤差進(jìn)行統(tǒng)計(jì),結(jié)果如圖6所示。圖中橫坐標(biāo)表示誤差率,縱坐標(biāo)表示頻率。從上述統(tǒng)計(jì)可知,測試集的預(yù)測誤差主要分布在-0.04到0.05之間,占總樣本量的79.3%。其中,利潤率誤差在約0.05的樣本占9%,利潤率誤差為約0(幾乎沒有誤差)的樣本占比51.0%,利潤率誤差在約-0.04的樣本占19.3%。

        圖6 預(yù)測誤差統(tǒng)計(jì)

        評價(jià)結(jié)果表明,該模型總體差異控制在合理的范圍內(nèi),具有一定的參考價(jià)值。也就是說,該模型已經(jīng)從成功的交易記錄中學(xué)習(xí)到了定價(jià)規(guī)律,可以很好地模仿銷售人員的報(bào)價(jià)思路,從而幫助銷售人員在接到顧客詢價(jià)的時(shí)候快速做出報(bào)價(jià)決策。

        (二)模型原理解釋

        在人工智能應(yīng)用場景中,人們比較容易接受能直觀評價(jià)預(yù)測結(jié)果對錯(cuò)的智能應(yīng)用,如人臉識別、語音識別等。任何人不需要過多的專業(yè)經(jīng)驗(yàn),都可以對機(jī)器的預(yù)測結(jié)果進(jìn)行評估。但對于一些涉及人類主觀判斷且不容易判別結(jié)果對錯(cuò)的場景,人們未必愿意接受機(jī)器的建議。就像商品報(bào)價(jià)就是具有很強(qiáng)主觀性的場景,即使針對同一件商品,每個(gè)人的想法都可能不完全一樣。如果既不能解釋算法這個(gè)“黑盒子”是怎么工作的,又不能直觀地驗(yàn)證它的正確性時(shí),人就容易對智能算法產(chǎn)生懷疑。這時(shí)候,可視化機(jī)器的“思考”過程,打開這個(gè)“黑盒子”,就是常用的一種獲取人類信任的途徑。為了還原計(jì)算機(jī)的“思考”方式,更好地理解模型的推理過程,本文通過模型的內(nèi)置函數(shù)estimators生成一個(gè)可視化的決策樹模型,讓我們可以通過觀察這個(gè)“機(jī)器決策樹”的結(jié)構(gòu),窺探一下機(jī)器的決策“思路”。在實(shí)際應(yīng)用中,企業(yè)銷售人員也可以通過比較機(jī)器的“思路”和自己的思路,進(jìn)一步驗(yàn)證機(jī)器是否學(xué)到了人類師傅的本事。為了方便展示,本文從隨機(jī)森林模型中,隨機(jī)抽取一棵決策樹進(jìn)行展示。

        estimators函數(shù)生成的決策樹結(jié)構(gòu)如圖7所示。從圖7(a)可以看出,模型通過對訓(xùn)練集數(shù)據(jù)的學(xué)習(xí),自動(dòng)生成一個(gè)倒立的樹結(jié)構(gòu)。在每一個(gè)分支節(jié)點(diǎn)上,對某一特定特征值進(jìn)行判斷,并根據(jù)判斷結(jié)果將樣本數(shù)據(jù)劃分到左葉子或右葉子中。假設(shè)某一訂單經(jīng)過最上面三層的判斷落入第四層最右側(cè)節(jié)點(diǎn),如圖7(b)所示,那么模型就會(huì)首先對該訂單的“購買數(shù)量(TotQty)”做進(jìn)一步判斷。此時(shí)共有兩種可能的判斷結(jié)果。第一種,如果該訂單的“購買數(shù)量(TotQty)”小于或等于14,則進(jìn)一步判斷該訂單客戶的“最近一次交易時(shí)間(last)”。如果“最近一次交易時(shí)間”小于或等于18.5天,則落入右邊節(jié)點(diǎn),得出商品利潤率的預(yù)測結(jié)果為0.66。如果“最近交易時(shí)間(la st)”大于18.5天,則落入左邊節(jié)點(diǎn),預(yù)測商品利潤率為0.663。第二種,如果該訂單的“購買數(shù)量(TotQty)”大于14,則將它歸為左節(jié)點(diǎn),進(jìn)一步判斷該訂單的“收款天數(shù)(GathDays)”。如果該訂單的“收款天數(shù)(GathDays)”小于或等于69.5天,則將它歸為右邊的底層葉子節(jié)點(diǎn),推測商品利潤率的預(yù)測結(jié)果為0.528。反之,如果“收款天數(shù)(Gathdays)”大于69.5天,則預(yù)測商品利潤率為0.494。按照以上邏輯,決策樹會(huì)自動(dòng)地為每一個(gè)特征劃分邊界,通過if-else判斷法總結(jié)出機(jī)器的報(bào)價(jià)“思路”。從整體來看,該模型能按客戶購買數(shù)量多少、最近交易時(shí)間遠(yuǎn)近和收款快慢來差別定價(jià),非常像一個(gè)思維縝密、精于計(jì)算的銷售。

        圖7 決策樹可視化模型

        五、結(jié)論

        本文通過一個(gè)企業(yè)的實(shí)際應(yīng)用案例,展示了如何通過定義問題、構(gòu)建特征工程、數(shù)據(jù)分析、模型診斷和參數(shù)調(diào)整四個(gè)步驟,利用機(jī)器學(xué)習(xí)算法,從歷史交易記錄中發(fā)現(xiàn)價(jià)格制定規(guī)律,構(gòu)建一個(gè)產(chǎn)品價(jià)格估算智能輔助決策模型。通過這個(gè)流程構(gòu)建的隨機(jī)森林算法模型,可以較為準(zhǔn)確地模仿銷售人員的決策思路,進(jìn)一步印證了將人工智能方法應(yīng)用在管理會(huì)計(jì)中的可行性。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務(wù)本地化模型
        適用于BDS-3 PPP的隨機(jī)模型
        提煉模型 突破難點(diǎn)
        函數(shù)模型及應(yīng)用
        p150Glued在帕金森病模型中的表達(dá)及分布
        函數(shù)模型及應(yīng)用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        3D打印中的模型分割與打包
        国产在线无码精品无码| 无码视频一区=区| 熟女高潮av一区二区| 99精品久久99久久久久| 免费看黄色电影| 久久av高潮av喷水av无码 | 精品久久中文字幕一区| 欧洲乱码伦视频免费| 欧美巨大巨粗黑人性aaaaaa| 色www亚洲| 久久精品蜜桃美女av| 狠狠躁18三区二区一区| 蜜臀aⅴ国产精品久久久国产老师 国产精品久久婷婷六月丁香 | 毛片无码国产| 国产激情电影综合在线看| 一区二区三区岛国av毛片| 岛国熟女精品一区二区三区| 国产午夜福利100集发布| 久久人妻AV无码一区二区| 国产精品日本中文在线| 国产精品婷婷久久爽一下| 国内精品久久久久久中文字幕| 日韩一二三四精品免费| 国内精品毛片av在线播放| 少妇伦子伦精品无吗| 豆国产95在线 | 亚洲| 厕所极品偷拍一区二区三区视频| 日本一区三区三区在线观看| 久久亚洲私人国产精品va| 一本大道久久精品 东京热| 中文字幕人妻av四季| 午夜时刻免费入口| 风流少妇又紧又爽又丰满| av免费看网站在线观看| 亚洲乱码中文字幕在线| 亚洲av之男人的天堂网站| 日本精品一区二区三本中文| 狼人精品剧情av在线观看| 日韩精品久久久久久久电影蜜臀| 亚洲红怡院| 久久99免费精品国产|