亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

隨機森林算法在消費品召回效果評估中的應(yīng)用

2022-08-16 07:02:44黃國忠高學(xué)鴻

重慶理工大學(xué)學(xué)報(自然科學(xué)) 2022年7期

黃國忠，林琳，高學(xué)鴻

(1.北京科技大學(xué) 土木與資源工程學(xué)院，北京 100083；2.北京科技大學(xué) 大安全科學(xué)研究院，北京 100083)

0 引言

隨著市場競爭日趨激烈，產(chǎn)品創(chuàng)新性以及產(chǎn)品投放周期逐漸縮短，“缺陷產(chǎn)品”造成的傷害事故也越來越頻繁[1]。作為產(chǎn)品安全管理的重要手段，缺陷產(chǎn)品召回制度在國外發(fā)展已經(jīng)較為成熟[2]，且召回立法也明確監(jiān)管部門和專家對召回的效果進行評估[3]，但缺乏一定依據(jù)和理論指導(dǎo)。消費品分類的復(fù)雜性決定了其召回率的不穩(wěn)定，后召回管理階段對于召回工作能否有效地降低或消除缺陷消費品的安全風(fēng)險至關(guān)重要。

國內(nèi)已有學(xué)者從不同角度對影響召回效果的原因展開研究，并提出了相應(yīng)的措施優(yōu)化召回流程。高芳等[4]就生產(chǎn)者召回的內(nèi)外因素和缺乏召回動力的原因展開分析，并對召回行為對生產(chǎn)者產(chǎn)生的影響進行了研究。楊金晶[5]提出對參與缺陷產(chǎn)品召回的消費者進行補償?shù)南敕?，并根?jù)召回成本和補償限額等建立優(yōu)化模型，以提升產(chǎn)品召回率，達到企業(yè)利益最優(yōu)化。徐乾程和錢存華等[6-7]從政府監(jiān)管視角運用模糊層次分析法構(gòu)建評價缺陷消費品召回效果的模型。這些研究多從單一視角對召回效果優(yōu)化進行分析，缺乏對整個召回周期的關(guān)鍵節(jié)點上生產(chǎn)者、消費者和監(jiān)管機構(gòu)的行為和反饋影響的討論，在利用召回率對召回效果進行評定上存在探討空間。

此外，目前效果評估主要運用AHP等依靠專家評分的方法進行重要度分析[8]，而將機器學(xué)習(xí)算法模型應(yīng)用于召回效果評估，可以減小經(jīng)驗性帶來的誤差。因此，筆者擬綜合考慮召回流程中影響消費品召回效果的因素，結(jié)合改良CIRO層級模型建立召回效果指標體系。運用隨機森林算法構(gòu)建消費品召回效果評估模型，為消費品的召回效果評估提供理論依據(jù)。

1 評估指標體系的建立

1.1 影響因素分析

消費品召回效果評估指標體系的建立需要考慮流程中涉及的人為因素、產(chǎn)品特性及召回環(huán)境等外在因素。召回活動整個生命周期包括召回計劃、召回發(fā)起、召回處理和召回效果評估4個階段，缺陷產(chǎn)品的召回分為3個主體部分：生產(chǎn)者是主體、消費者是參與者、監(jiān)管機構(gòu)是召回的監(jiān)管者[9]。召回活動產(chǎn)生的效果包括產(chǎn)品的退回和危險殘留等直接效果以及對召回主體和召回環(huán)境等產(chǎn)生的增益效果。

CIRO評估模型的4項評估活動分別是：背景評估、輸入評估、反應(yīng)評估、輸出評估。背景評估分析和確定培訓(xùn)需求；輸入評估收集培訓(xùn)資源和相關(guān)信息；反應(yīng)評估用于收集和分析培訓(xùn)對象的反饋信息，并進行分析和評估[10]。邏輯框架矩陣通過投入、產(chǎn)出、目的與目標的4個層次描述，實現(xiàn)各層目標的假設(shè)條件，判定項目實施成果的可驗證指標[11]。

CIRO評估模型和邏輯模型與消費品召回整個動作邏輯相吻合，結(jié)合消費品召回評估的特點，將CIRO模型與邏輯模型結(jié)合得到消費品召回效果評估的層級模型，如表1所示。

表1 消費品召回效果評估的層級模型

篩選召回行為中召回完成度、召回后產(chǎn)品的殘余風(fēng)險及各方滿意程度等產(chǎn)出層面影響因素，建立消費品召回效果評估指標體系。

1.2 指標體系構(gòu)建

1.2.1召回效果評估

召回產(chǎn)品退回情況需要根據(jù)背景層面中各方的固有情況進行單獨評估。由于消費品的特性，實際退回率很少超過30%，因此，需通過生產(chǎn)者提供的資料與數(shù)據(jù)，基于具體產(chǎn)品情況、行業(yè)整體召回水平、常規(guī)召回措施及消費者的基本情況等建立基準退回率指標體系。考慮退回這一行為主要來自購買了缺陷產(chǎn)品的消費者，消費者自身對缺陷的判斷能力、日常環(huán)境對參與召回是否便捷及個人對召回活動本身的認可和積極性都對退回率有影響。因此從消費者退回意愿的角度，結(jié)合缺陷產(chǎn)品本身的特性建立判定基準退回率的指標體系，如表2所示。

表2 基準退回率指標體系

“4級評估模型”中產(chǎn)出層面從召回情況、殘余風(fēng)險和各方評價評估召回效果。結(jié)合前2個層面對召回率指標的影響，通過計算實際召回率與理想召回率的比值，綜合判斷一起消費品召回活動的效果。從影響層面來看，消費品的單次召回還會產(chǎn)生增益效果，包括對生產(chǎn)者自身的影響和召回活動的社會性影響。由此，建立由召回效果和增益效果組成的評估指標體系如表3所示。

表3 召回效果和增益效果組成的評估指標體系

2 召回效果評估模型構(gòu)建

隨機森林是一種包含多棵決策樹的機器學(xué)習(xí)模型，結(jié)合了bootstrap采樣和隨機屬性選擇的優(yōu)點[12]，通過分析目標值與各個影響因子之間的復(fù)雜關(guān)系，得出不同影響因子對目標值的重要度，具有調(diào)試參數(shù)少、不易過度擬合和分類速度快的優(yōu)點，可以通過樣本數(shù)據(jù)精確擬合各種復(fù)雜的非線性關(guān)系[13]。

消費品召回效果評估模型是需要利用隨機森林算法將特征值的輸入轉(zhuǎn)化為召回效果的預(yù)測輸出，即需要用隨機森林中的隨機回歸森林?；陔S機森林的消費者召回效果評估模型的建立，首先需要對原始數(shù)據(jù)作歸一化預(yù)處理；其次調(diào)取數(shù)據(jù)，結(jié)合交叉驗證方法求取設(shè)置不同參數(shù)值時的均方誤差(MSE)的變化曲線，以此得出最適合該模型的參數(shù)；利用合適的參數(shù)計算得出不同特征值的權(quán)重，并建立效果評估模型。

2.1 數(shù)據(jù)來源及預(yù)處理

生產(chǎn)者與監(jiān)管者負責(zé)對消費者采集數(shù)據(jù)與資料，主要途徑包括公開發(fā)表的開放數(shù)據(jù)；調(diào)查：可采用查閱檔案、電話訪問、在線調(diào)查、問卷調(diào)查、短信評價、回訪抽查等；現(xiàn)場采集：實時跟蹤召回情況，采集有關(guān)數(shù)據(jù)；生產(chǎn)者通過填寫材料表向監(jiān)管部門提供相關(guān)的數(shù)據(jù)和資料。

不同的特征指標往往具有不同的量綱和單位范圍，所以在進行模型計算前需要對數(shù)據(jù)進行一定的處理，常用的方法即為數(shù)據(jù)標準化(歸一化)[14]，以此來減輕和消除數(shù)據(jù)量綱不同對模型的分析和指標重要性分析的影響。根據(jù)消費品召回的數(shù)據(jù)特點選擇線性函數(shù)歸一化方法。選取來自國家市場監(jiān)督管理總局缺陷產(chǎn)品管理中心的數(shù)據(jù)樣本作為隨機森林算法的樣本集和訓(xùn)練集。

2.2 隨機森林算法確定指標權(quán)重系數(shù)

利用Python語言建立隨機森林參數(shù)選擇函數(shù)，對模型建立過程中的參數(shù)進行調(diào)試。由于在建立召回效果評估模型時已確定需要考慮的特定指標，因此主要考慮n_estimators和max_depth兩個對模型影響比較顯著的參數(shù)，其對模型準確度影響的判斷用MSE數(shù)值大小表示。

2.2.1隨機森林的關(guān)鍵參數(shù)調(diào)試

1)確定最優(yōu)n_estimators值

在確定最優(yōu)n_estimators值時，具體步驟如下：① 將樣本數(shù)據(jù)歸一化。② 初始化訓(xùn)練集/測試集的MSE。③ 從1～500循環(huán)，依次利用交叉驗證和隨機森林訓(xùn)練該模型。輸出結(jié)果如圖1和圖2所示。

圖1 基準退回率模型的最優(yōu)n_estimators值分布圖

根據(jù)圖1和圖2可以看出，測試集和訓(xùn)練集的MSE均方誤差均隨著n_estimastors數(shù)值的增大而先呈現(xiàn)下坡式下降，后呈現(xiàn)平穩(wěn)微上升的態(tài)勢。因為MSE數(shù)值越小，該測試集與訓(xùn)練集之間的誤差越小，該測試模型的準確度越高。因此，將測試集和訓(xùn)練集MSE差值最小點作為最優(yōu)n_estimastors取值點。

圖2 召回效果評估模型的最優(yōu)n_estimators值分布圖

2)確定最優(yōu)max_depth值

參數(shù)max_depth決定隨機森林中樹木的最大深度，是影響隨機森林模型在建立每一個決策樹時準確度的重要參數(shù)。調(diào)試過程參考n_estimators值的確定。輸出結(jié)果如圖3和圖4所示。

圖3 基準退回率模型的最優(yōu)max_depth值分布圖

圖4 召回效果評估模型的最優(yōu)max_depth值分布圖

同樣地，將測試集和訓(xùn)練集MSE差值最小點作為最優(yōu)max_depth取值點。

綜合以上分析，基準退回率模型和召回效果評估模型的參數(shù)最優(yōu)值如表4所示。

表4 隨機森林參數(shù)值

2.2.2基于隨機森林的指標權(quán)重系數(shù)確定

隨機森林具有在生成每一棵樹的過程中，其內(nèi)部節(jié)點在每次分裂時都會從候選的屬性里隨機挑選一定數(shù)量的分裂屬性的特點[15]，利用這一點，在每次迭代中隨機換掉其中的一個屬性，利用換掉之后模型準確度的變化和變化幅度來預(yù)測該屬性對整個模型的預(yù)測結(jié)果之間的影響程度和重要性，完成對每個特征屬性重要度的判斷。在對數(shù)據(jù)歸一化處理并求得最優(yōu)參數(shù)值后，利用 Python中的importance函數(shù)確定指標權(quán)重系數(shù)，結(jié)果如表5和表6所示。

表5 基準退回率指標體系的權(quán)重系數(shù)

表6 召回效果指標體系的權(quán)重系數(shù)

2.3 各項指標數(shù)值的量化標準

指標體系中需要量化的指標包含定量指標、半定量指標及定性指標。定量指標主要利用該指標的隸屬度函數(shù)實現(xiàn)量化分級；半定量指標根據(jù)指標特點、法規(guī)規(guī)定等因素，利用語義賦值法實現(xiàn)量化分級；定性指標利用專家意見、消費者反饋等形式實現(xiàn)量化分級。

2.3.1指標量化原理

1)定量指標量化原理。定量指標的量化主要根據(jù)指標所對應(yīng)的隸屬度函數(shù)，根據(jù)召回效果評估結(jié)果的分級，分為好、較好、一般、差4個等級，即S(x)={S1，S2，S3，S4}。假設(shè)量化指標的指數(shù)為x，量化范圍為[minx，maxx]，其分布函數(shù)為：

(1)

2)半定量指標及定性指標量化原理。對于缺乏數(shù)據(jù)難以量化的指標，如：召回方式等指標，以及評價性指標，如：消費者滿意度等指標，采用語義賦值和專家及消費者評判相結(jié)合的方式完成量化分級。目前已經(jīng)實施的缺陷汽車產(chǎn)品召回效果評估指南[16]中，指標量化分級為10分制，但由于消費品與汽車產(chǎn)品相比，其大部分追溯系統(tǒng)尚未成熟，某些企業(yè)的召回管理過程中部分指標的數(shù)值只能進行模糊統(tǒng)計，因此需要簡化量化分級。根據(jù)董紅磊等[17]基于模糊綜合評價法運用于汽車產(chǎn)品召回領(lǐng)域的方法和標準化研究院相關(guān)專家的意見，將消費品召回效果評價指標量化的評分等級設(shè)置為4級，如表7所示，其中半定量指標還需結(jié)合指標特點確定各等級評估說明。

表7 指標量化評分等級

2.3.2定量指標評級與量化情況說明

1)單值。按照消費品被投入市場時的單體價格，即單值劃分?，F(xiàn)設(shè)定單值a屬于[0，10 000]的區(qū)間內(nèi)，其隸屬度函數(shù)如下：

(2)

式中：a為目標消費品的單值，元。

2)損耗比。損耗比包括固有價值損耗和壽命損耗?，F(xiàn)定實施召回的時間點TA，被召回批次消費品的生產(chǎn)日期為TB(若存在多時間段生產(chǎn)消費品召回，以最遠生產(chǎn)日期為準)，行業(yè)內(nèi)一般認為該消費品的使用周期為TI。此外，若生產(chǎn)者實施召回的時間點超過消費品使用周期時間段，則其損耗比為1。

a)固有價值損耗比。按照生產(chǎn)者實施召回的時間點處于該消費品使用周期時間段內(nèi)固有價值損耗比計算，其隸屬度函數(shù)如下：

(3)

式中：VI為目標消費品的固有價值，元；VA為目標消費品的實際價值，元。

b)壽命損耗比。按照生產(chǎn)者實施召回的時間點處于該消費品使用周期時間段內(nèi)使用壽命損耗比計算，其隸屬度函數(shù)如下：

(4)

式中：LI為行業(yè)內(nèi)一般認為該類消費品的使用壽命，天；LA為實施召回時該消費品的使用壽命，天。

3)實際召回退回率/基準召回退回率。根據(jù)基準召回退回率的評級和量化結(jié)果計算該次召回的基準退回率數(shù)值，并將實際召回退回率與其進行比較。該指標數(shù)值量化如下：

(5)

4)召回后受傷頻次。召回是消除產(chǎn)品因缺陷造成傷害的行為活動，如果一個產(chǎn)品發(fā)生召回后仍出現(xiàn)受傷投訴，根據(jù)召回效果評估最嚴苛原則，可認定其召回效果差，賦值1分，未出現(xiàn)投訴賦值3分。

3 建立召回效果評估模型

3.1 召回效果優(yōu)度值計算

對某一評價對象Oj，若評價指標集是Ei={E1，E2，…，En}，Oj關(guān)于Ei的規(guī)范關(guān)聯(lián)度是kij，Ei的權(quán)重是w(w表示評價指標Ei的相對重要程度)，且0≤w≤1。優(yōu)度是評級指標Ei的權(quán)重值w與對象Oj的規(guī)范關(guān)聯(lián)度kij，即指標賦值的乘積[18]，將優(yōu)度定義為：

(6)

確定召回效果評語V={V1，V2，V3}，利用等級比重法，根據(jù)召回效果優(yōu)度值及殘余風(fēng)險量級分析，將召回效果分為好、一般和差3級，所對應(yīng)的殘余風(fēng)險為低風(fēng)險、可接受風(fēng)險和不可接受風(fēng)險，用數(shù)字1～3依次表示，并對等級由1～3進行區(qū)間賦值，以便召回效果量化評判。其賦值情況如表8所示。

表8 效果評估結(jié)果的賦值情況

由于增益效果評估指標為輔助性指標，其具體效果評定與直接效果相比，需要一段較長的反饋時間。因此，結(jié)合標準化領(lǐng)域相關(guān)專家的意見，使用打分法進行計算，不對指標體系進行權(quán)重確定，僅當(dāng)每個指標的重要度相等。具體評分規(guī)則根據(jù)召回活動對指標產(chǎn)生的效果分為負面影響、無影響和正面影響，分別賦值-1、0和1分(此處賦值僅表示召回是否對該指標產(chǎn)生影響，不代表影響程度)。當(dāng)總賦值得分大于0時，表示該召回活動產(chǎn)生了增益效果。

3.2 模型精確度驗證

通過以上幾節(jié)的分析，在構(gòu)建基準退回率的最優(yōu)模型時，選取參數(shù)如表4所示。目前，對于消費品召回的預(yù)期退回率沒有嚴格的規(guī)定說明其誤差范圍和標準，根據(jù)經(jīng)驗得到一般預(yù)測數(shù)據(jù)與真實數(shù)據(jù)之間相差±10%均可接受。因此對比分析基于隨機森林的評估模型，選取匹配度和相對誤差2個指標對評估模型的準確性進行判斷。

1)匹配度。該指標反映預(yù)測值和實際值之間的匹配情況，匹配度越接近，單個樣本的預(yù)測效果越好，公式如下：

(7)

式中：i表示樣本；Xi表示預(yù)測值；Yi表示真實值；pi表示樣本i的匹配度。

2)相對誤差。實際相對誤差指測量造成的絕對誤差與被測量真值之比，相對誤差更能反映預(yù)測結(jié)果與真實值之間的差異，計算公式如下：

(8)

式中：Δ表示絕對誤差，L表示真值。

采用的案例來源于國家市場監(jiān)督管理總局缺陷產(chǎn)品管理中心提供的2010—2018年消費品召回數(shù)據(jù)，因篇幅原因此處只展示選取15個案例作為預(yù)測集數(shù)據(jù)的基準召回率模型，如表9所示。

通過表9的數(shù)據(jù)可以看到,在展示的預(yù)測集中的15個案例得到的預(yù)測值和真實值匹配度基本均接近1，5個樣本數(shù)據(jù)的相對誤差在±5%以內(nèi)，14個樣本數(shù)據(jù)的相對誤差在±10%以內(nèi)。

表9 基于隨機森林的基準退回率評估預(yù)測結(jié)果

通過完整數(shù)據(jù)分析，隨機森林運用在消費品召回效果評估模型時的擬合預(yù)測值中，93.33%的樣本在合理的誤差范圍內(nèi)。由此得出：隨機森林算法運用于該召回效果評估模型的權(quán)重系數(shù)確定時具有較高的擬合度，可用于召回效果評估領(lǐng)域，解決專家打分主觀性較強的缺點。

4 案例應(yīng)用

4.1 案例信息

某品牌青少年運動夾克在設(shè)計過程中未能充分考慮到調(diào)節(jié)松緊的繩帶在抽出后可能對兒童存在隱患，且無提醒標志和說明，有造成纏繞的風(fēng)險，其召回信息如表10所示。

表10 某品牌青少年運動夾克召回信息

將以上案例應(yīng)用于消費品召回效果評估模型，運用召回效果評估模型進行召回效果優(yōu)度值計算，可得召回效果評估優(yōu)度值為2.063，對應(yīng)評級為好。

青少年運動夾克在召回后價格大幅下跌，可以看出消費者的未來購買意圖不強，但由于該企業(yè)管理有限公司對本次召回活動的挽救較為及時，品牌影響未發(fā)生大幅度下跌，消費者對該品牌仍有較強的購買意圖，且對該品牌聲譽沒有不良影響。同時，在該品牌召回完成后并未引起行業(yè)標準的更改和同類產(chǎn)品生產(chǎn)者的自查，但該消費品的召回結(jié)合監(jiān)管部門對該類產(chǎn)品的消費預(yù)警，一定程度上引起消費者的重視和對同類消費品召回的促進，其召回增益效果評估打分如表11所示。

表11 召回增益效果評估打分

增益效果得分為2，結(jié)合國家市場監(jiān)督管理總局缺陷產(chǎn)品管理中心提供的缺陷總結(jié)報告和召回評價、媒體評價，根據(jù)優(yōu)度值和殘余風(fēng)險量級分析可以得出，當(dāng)召回效果評估優(yōu)度值為2.063時，其對應(yīng)召回評估結(jié)果為“好”，其殘余風(fēng)險為低風(fēng)險，與實際召回效果相符合。因該產(chǎn)品受單值、目標群體對缺陷判斷能力等影響，導(dǎo)致其基準退回率和實際退回率較低，但該品牌及時發(fā)布召回信息、使用方便便捷的召回方式并有效減少甚至消除同一缺陷對消費者帶來的安全隱患和傷害，同時監(jiān)管部門監(jiān)管合理到位，使得其召回效果較好，值得同類召回產(chǎn)品借鑒。

5 結(jié)論

1)結(jié)合改良CIRO層級評估建立召回效果評價分析指標體系，運用隨機森林算法在數(shù)據(jù)案例的基礎(chǔ)上確定指標權(quán)重，建立基于隨機森林的消費品召回效果評估總模型。通過使用模型對案例的預(yù)測基準退回率進行計算，與實際預(yù)測退回率的相對誤差在可接受范圍內(nèi)，證明該評估模型可以有效、準確地評價消費品召回效果。

2)所構(gòu)建的評估指標體系考慮到召回活動參與的各個相關(guān)方的行為后果和影響，采用實際/基準召回率直觀地評估召回效果，隨機森林算法的運用能較好地彌補目前召回效果評估研究中主觀性較強、指標定量化難等問題。

3)采用傳統(tǒng)的隨機森林算法構(gòu)建模型，選擇來自國內(nèi)典型的召回案例，樣本數(shù)據(jù)較為完整，但實際運用過程中，主觀性指標的數(shù)據(jù)往往難以收集。因此，該方法對此類非平衡數(shù)據(jù)的處理仍不夠理想。未來可引入NCL技術(shù)、應(yīng)用代價敏感學(xué)習(xí)等對隨機森林算法進行優(yōu)化。