亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于stacking融合機制的自動駕駛倫理決策模型

        2025-02-28 00:00:00劉國滿盛敬羅玉峰
        計算機應用研究 2025年2期
        關(guān)鍵詞:困境倫理卷積

        摘 要:雖然自動駕駛技術(shù)在線路規(guī)劃和駕駛控制方面取得較大進展,但遇到倫理困境時,當前自動駕駛汽車仍然很難作出確定、合理的決策,導致人們對自動駕駛汽車安全駕駛產(chǎn)生懷疑和擔憂。所以有必要研究自動駕駛倫理決策模型和機制,使得自動駕駛汽車在倫理困境下能夠作出合理決策。針對以上問題,設(shè)計了基于stacking融合機制的倫理決策模型,對機器學習和深度學習進行深度融合。一方面將基于特征依賴關(guān)系的樸素貝葉斯模型(ACNB)、加權(quán)平均一階貝葉斯模型(WADOE)和自適應模糊模型(AFD)作為stacking融合機制上基學習器。依據(jù)先前準確率,設(shè)定各自模型權(quán)重,再運用加權(quán)平均法,計算決策結(jié)果。然后將該決策結(jié)果作為元學習器訓練集,對元學習器進行訓練,構(gòu)建stacking融合模型。最后,運用驗證集分別對深度學習模型和stacking融合模型進行驗證,依據(jù)驗證中平均損失率和準確率以及測試中正確率,評價和比較深度學習模型和stacking融合機制決策效果。結(jié)果表明,深度學習模型平均損失率最小為0.64,最大平均準確率為0.7,最高正確率為0.61。stacking融合機制平均損失率最小為0.35,最大平均準確率為0.90,最高正確率為0.75,說明stacking融合機制相對于深度學習模型,決策結(jié)果準確率和正確率方面有了較大改進。

        關(guān)鍵詞: 自動駕駛汽車; 倫理決策; stacking融合機制; 深度學習

        中圖分類號: U471.15 文獻標志碼: A 文章編號: 1001-3695(2025)02-019-0462-07

        doi: 10.19734/j.issn.1001-3695.2024.07.0280

        Self-driving ethical decision-making model based on

        stacking fusion mechanism

        Liu Guoman1, Sheng Jing1, Luo Yufeng2

        (1.Jiangxi Province Key Laboratory of Precision Drive amp; Equipment, Nanchang Institute of Technology, Nanchang 330099, China; 2.School of Electrical and Automation Engineering, East China Jiaotong University, Nanchang 330013, China)

        Abstract:Although autonomous vehicles(AV) have made great progress in line planning and driving controlling, it is still difficult to make certain and reasonable decision-making in ethical dilemmas, which causes people’s doubts and worry about AV’s safety. Therefore, it is necessary to design a self-driving ethical decision-making model and mechanism to make reaso-nable decision-makings in ethical dilemmas for AV. For them, this paper provided an ethical decision-making model based on stacking fusion mechanism, in which machine learning and deep learning were deeply integrated. Firstly, naive Bayes model based on attribute correlation(ACNB), weighted average first-order Bayes model(WADOE) and adaptive fuzzy model(AFD) were constructed into basis learners of stacking fusion mechanism. According to the accuracy in previous verification, their weights were set in decision-making, and the decision-making results in all dilemmas should be calculated by weighted average method. Then the decision-making data by the basis learner was regarded as training set for the meta-learner in the stacking fusion mechanism to construct stacking fusion decision-making model. Lastly, all dilemmas in verification set were used to verify deep learning model and stacking fusion mechanism respectively. The effect of stacking fusion mechanism was evaluated and compared based on the average loss rate and accuracy in the verification and the correction rate in the testing. The results show that the average loss rate is more 0.64, the maximum average accuracy is 0.7, and the highest correction rate is 0.61 for the deep learning model. However, the lowest average loss rate is 0.35, the maximum average accuracy is 0.9, and the highest correction rate is 0.75 for stacking fusion mechanism, which indicates the stacking fusion mechanism is greatly improved compared with the deep learning model.

        Key words:autonomous vehicles; ethical decision-making; stacking fusion mechanism; deep learning

        0 引言

        隨著人工智能算法和控制技術(shù)發(fā)展,自動駕駛技術(shù)不僅解放人類雙手,減少了操作失誤或不當造成交通事故,還提高了交通運行效率,減少空氣污染等[1,2。但自動駕駛汽車上感知、控制和執(zhí)行模塊都可能存在失效或執(zhí)行延時等問題,很難完全避免自動駕駛汽車與行人或物發(fā)生碰撞。自動駕駛汽車可能遇到“電車困境”似的倫理困境,需要自動駕駛汽車盡量作出合理、透明的決策,才能促進人類對自動駕駛汽車的信任和認可。為此,國內(nèi)外學者和相關(guān)研究機構(gòu)對自動駕駛汽車倫理決策中所遵守的道德原則和決策相關(guān)理論進行探索和研究。如一些學者提出了將功利主義原則運用于自動駕駛汽車倫理決策上,確保傷害結(jié)果最小化和效益最大化[3。自動駕駛汽車若按照功利主義原則,僅考慮決策行為結(jié)果和效用,忽略法律、道德和價值觀等因素影響,往往使得安全保護措施好或遵守交通規(guī)則的行人,成為碰撞對象,這不合理且不科學。于是一些學者將義務(wù)論運用于自動駕駛汽車倫理決策上,要求自動駕駛汽車必須遵照某種道德原則或正當性去決策4。但該原則忽視了行為結(jié)果,使得決策行為很難被人類所接受。同時,又有專家或?qū)W者提出了美德論運用于人工智能倫理決策中,通過強化學習,確保人工智能體決策的道德性和高尚性5,6。雖然按照該種道德原則所作出的結(jié)果,很容易被人類所接受,但透明性較差,人類很難解釋和預測決策的原因和動機。因此自動駕駛汽車倫理決策中遵守一種道德原則很難滿足人類多樣化道德需求。于是Contissa等人[7設(shè)計了用戶選擇的“道德旋鈕”架構(gòu),旋鈕兩端分別對應利他主義和利己主義,旋鈕中央對應完全中立主義。通過這種決策架構(gòu)設(shè)計,將自動駕駛汽車決策權(quán)由設(shè)計者及制造者轉(zhuǎn)移給用戶選擇。但該架構(gòu)可能會導致用戶為了維護自身利益,忽視他人或集體利益,導致“囚徒困境”出現(xiàn)。同時,Geisslinger等人研究了多種道德規(guī)則相結(jié)合的風險倫理(ethics of risk),將貝葉斯規(guī)則、最大最小規(guī)則和公平規(guī)則融入到倫理決策中,既要考慮碰撞結(jié)果,又要兼顧相關(guān)主體權(quán)益,確保行為合理性和公平性[8,9。但各個道德原則所作出決策結(jié)果不一致或存在沖突時,自動駕駛汽車該如何協(xié)調(diào),還需要進一步研究和探索。另外,一些專家針對倫理困境決策問題,提出了一些決策機制和理論,如Wang等人[10提出了自動駕駛汽車倫理困境決策平臺(LO-MPC),依據(jù)種類和車輛性能限制,自動駕駛汽車將優(yōu)先保護人類且不超越汽車性能限制的決策行為。但決策中,僅考慮人類保護和汽車本身性能,未考慮道德、法律以及價值觀等其他因素,使得決策結(jié)果難以滿足人類需求和道德準則。Wu等人[11依據(jù)人類道德行為和高尚品德,通過強化學習,使得智能機器作出符合人類道德和社會要求的決策行為。但決策泛化能力較弱,面對現(xiàn)實中復雜多變倫理困境,很難處理新出現(xiàn)的倫理困境。另外,文獻[12]提出了一種可執(zhí)行倫理決策機制,主要將目標偏差和操作花費代價作為影響因子,構(gòu)建線性決策模型。若用戶注重目標達成,增加目標偏差在決策中權(quán)重。相反,若用戶比較重視駕駛中感覺和舒適度,則增加操作花費代價權(quán)重。但權(quán)重是依據(jù)用戶目的和意愿設(shè)定,使得自動駕駛汽車決策結(jié)果存在主觀性和不確定性。Li等人[13采用T-S模糊神經(jīng)網(wǎng)絡(luò)構(gòu)建自動駕駛汽車決策模型DDM,將道德和法律因素融入了信號燈引起沖突的駕駛決策模型,利用主成分分析法,確定倫理決策中主要因素,建立模糊神經(jīng)網(wǎng)絡(luò)決策模型。但這種模糊神經(jīng)網(wǎng)絡(luò)模型,不能明確說明輸入與輸出之間對應關(guān)系,影響了自動駕駛汽車決策的透明性和可解釋性。

        總之,當前自動駕駛汽車倫理決策道德原則和機制中,由于考慮因素單一或較少、沒有統(tǒng)一原則和泛化能力較弱等問題,影響了自動駕駛汽車倫理決策的合理性、確定性和普適性。所以有必要研究多種模型和算法融合機制,一方面依據(jù)線性和非線性決策模型確保決策結(jié)果的透明性和確定性;另一方面運用深度學習算法,自動提取特征信息,確保決策結(jié)果的客觀性和普適性,提高決策泛化能力。

        1 算法理論

        1.1 stacking集成算法

        stacking集成算法是一種異源集成算法,主要運用不同算法對原始數(shù)據(jù)進行處理和學習。當前主要存在單層stacking、多層stacking和其他技術(shù)與stacking相結(jié)合方式三類。

        1)單層stacking算法

        單層stacking是指運用原始訓練數(shù)據(jù)對多個基學習器進行訓練,依據(jù)基學習器計算結(jié)果融合,作為元學習器訓練集,對元學習器進行訓練,生成元學習器模型[14,15,單層stacking結(jié)構(gòu)如圖1所示。

        2)多層stacking算法

        多層stacking算法結(jié)構(gòu)中,存在多個元學習器分支,通過對基學習器上預測數(shù)據(jù)進行訓練,生成元學習器分支模型。最后將各個元學習器分支所計算的結(jié)果和預測數(shù)據(jù),再作為上面元學習器訓練集,生成元學習器模型[16,17,雙層stacking結(jié)構(gòu)如圖2所示。

        3)其他技術(shù)與stacking結(jié)合

        可以考慮將上面單層或多層stacking方法與其他技術(shù)相結(jié)合,如:無監(jiān)督學習方法等,降低分類決策維度和復雜度[18,19。

        1.2 ACNB

        ACNB是基于特征依賴關(guān)系的樸素貝葉斯算法,傳統(tǒng)樸素貝葉斯算法(NB)必須滿足特征相互獨立假設(shè)前提下,才可以運用單個特征條件下先驗概率求解后驗概率,做好分類和決策。對于自動駕駛汽車倫理決策來說,往往特征之間存在依賴關(guān)系,如傷害和數(shù)量之間,為了避免更多人受到傷害,通常選擇避免碰撞更多行人。若忽略特征間關(guān)系,可能會影響決策結(jié)果的正確性和合理性。因此運用ACNB算法,可以考慮部分特征因素之間關(guān)系。當倫理困境中存在兩種或兩種以上因素,都有利于作出同樣決策結(jié)果,則計算聯(lián)合特征概率時,考慮加入特征間最大相關(guān)系數(shù)[20,如式(1)所示。

        p(x1,x2,…,xn|Cj)=max(corr(xl,xk))∏ p(xi|Cj)(1)

        其中:p表示分布概率;x表示特征屬性;C表示決策結(jié)果類型;corr(xl,xk)表示兩特征屬性xl和xk間相關(guān)系數(shù), 主要以訓練集中倫理困境作為統(tǒng)計對象,利用式(2)求解出特征間相關(guān)系數(shù)。

        corr(xl,xk)=p(xl,xk|ci)p(xl|ci)p(xk|ci)(2)

        求解轉(zhuǎn)向和直行特征間相關(guān)系數(shù)矩陣如表1、2所示,ACNB算法處理過程如算法1所示。

        算法1 ACNB算法

        輸入:待測對象。

        輸出:決策結(jié)果。

        a) 待測對象特征分析和檢測,進行特征量化;

        b) 依據(jù)特征向量,判斷兩種以上特征間是否存在相關(guān)性,若是,搜索最大特征相關(guān)系數(shù)max(corr(xl,xk));

        c) 根據(jù)式(1),計算該對象屬于各個決策結(jié)果的后驗概率;

        d) 依據(jù)式(3)求解最大后驗概率,確定決策結(jié)果。

        CNB=arg maxCj∈C P(Cj)∏ P(xi|Cj)(3)

        1.3 WADOE

        WADOE,稱為基于特征加權(quán)平均一階貝葉斯模型,后驗概率計算如式(4)所示。

        P(c|x)∞1n∑ni=1wiP(c,xi)∏nj=1, j≠iP(xj|c,xi)(4)

        其中:wi表示第i特征因素在模型中權(quán)重系數(shù),通常利用特征因素與決策結(jié)果之間互信息變量求解[21,如式(5)所示。

        wi=I(xi,c)∑ni=1I(xi,c)(5)

        求解各特征因素的權(quán)重系數(shù)如表3所示,WADOE算法處理過程如算法2所示。

        算法2 WADOE算法

        輸入: 訓練集數(shù)據(jù)。

        輸出:WADOE模型。

        a) 計算特征因素xi 和決策結(jié)果Cj之間先驗概率 p(xi|Cj)。

        b) 運用式(5)求解各個特征因素在決策模型中權(quán)重。

        c) 構(gòu)建WADOE模型,求解后驗概率,作出決策。

        1.4 自適應模糊算法

        該算法主要運用模糊算法對訓練集數(shù)據(jù)進行處理,依據(jù)模糊隸屬度,對待測對象作出決策,并根據(jù)決策結(jié)果,更新和優(yōu)化標準樣本空間,其中模糊隸屬函數(shù)如定義1所示。

        定義1 在某一論域X是有限非空集合,則對象x上模糊集A可以用隸屬函數(shù)來表示,見式(6)。

        A:X→[0,1],x→A(x)(6)

        其中:A(x)表示對象x隸屬于模糊集合A程度,其值在[0,1],模糊集合數(shù)學表示方式,可參見式(7)。

        A={(x,A(x))|x∈X},where A(x)∈[0,1](7)

        對于隸屬A(x),通常采用模糊統(tǒng)計試驗方式確定,運用確定性手段研究不確定性問題[22。采用多次試驗方式判斷對象x屬于隨機集合概率,即為隸屬度,如式(8)所示。

        A(x)=x∈A的次數(shù)n(8)

        當n值越大,則x屬于模糊集合A值就越穩(wěn)定,該穩(wěn)定值即為對象x對集合A隸屬度。自適應模糊算法,相對傳統(tǒng)模糊算法來說,標準樣本空間是變化,模糊算法處理過程如算法3所示。

        算法3 自適應模糊算法

        輸入:訓練集樣本。

        輸出:標準樣本空間和模糊隸屬函數(shù)。

        a) 計算歐氏距離。

        計算待測訓練對象u=(u1,u2,…,um)與標準樣本空間ai=(i1,i2,…,im)之間歐氏距離d(u,ai)和標準樣本空間之間歐氏距離d(a1,a2)。

        b) 標準樣本空間更新和優(yōu)化。

        當d(u,a1)lt;d(a1,a2) 和 d(u,a2)lt;d(a1,a2) 且d(u,a1)gt;d(u,a2) 時,將待測訓練對象u加入到a2標準樣本空間中,重新計算a2樣本空間均值向量:2k=1ki+1∑ki+1j=1a2jk,k=1,2,…,m且ki=ki+1;否則,d(u,a1)lt;d(a1,a2) 和d(u,a2)lt;d(a1,a2) 且d(u,a1)lt;d(u,a2)時,將該待測對象u加入到a1標準樣本空間中,重新計算a1樣本空間均值向量

        1k=1ki+1∑ki+1j=1a1jk

        k=1,2,…,m

        且ki=ki+1。然后運用優(yōu)化的標準樣本空間,對訓練集中下一個待測對象進行訓練和處理,轉(zhuǎn)向步驟a)操作。

        c) 建立模糊隸屬函數(shù)。

        訓練完訓練集數(shù)據(jù)后,建立最終標準樣本空間,構(gòu)建模糊隸屬函數(shù):

        Ai(u)=1-di(u,ai)D

        i=1,2,…,k

        其中:D=d(u,a1)+d(u,a2)+…+d(u,ai),對測試樣本進行模糊隸屬度計算,依據(jù)模糊隸屬度,確定待測對象的決策結(jié)果。

        1.5 卷積神經(jīng)網(wǎng)絡(luò)

        卷積神經(jīng)網(wǎng)絡(luò)(CNN)主要通過層與層之間轉(zhuǎn)換,進行前向和反向雙向傳播,實現(xiàn)端到端分類識別和判斷[23,24。主要運用卷積核對待測對象上特征進行卷積運算,自動提取特征信息,卷積運算如式(9)所示。

        yl=∑cl-1i=1wli,c*xl-1i+bli(9)

        其中:xl-1i為l-1層第i個通道輸出信號;c表示卷積神經(jīng)網(wǎng)絡(luò)通道號;c(l-1)第l-1層第c個通道;wli,c為第l層第i輸出通道第c個網(wǎng)絡(luò)通道上權(quán)重矩陣;bli為第l層第i通道上偏置項。其次,為了實現(xiàn)對特征降維和壓縮,通常采用最大池化法和平均池化法對樣本數(shù)據(jù)進行池化操作,提取樣本局部特征和全局特征[25,26,如式(10)(11)所示。

        yl(u,v)=max(v-1)S+1lt;klt;vS{Xl(u,v)}(10)

        yl(u,v)=1S∑vSSxl(u,k)(11)

        其中:S為池化卷積核大小,一般設(shè)為n×n對稱矩陣。l(u,v)指第l層第u通道第v個神經(jīng)元l(u,k)表示第l層上第u通道第k神經(jīng)元。最后,加上全連接層,對提取特征信息進行聚合展開,將其轉(zhuǎn)換為一維特征向量,見式(12),運算結(jié)果為分類決策層提供依據(jù)。

        δj=h(wjpj+bj)(12)

        2 stacking融合機制設(shè)計

        2.1 算法選擇

        自動駕駛汽車倫理決策,主要根據(jù)倫理困境中車道上或車內(nèi)的受害者相對特征差異作出決策,特征值是非連續(xù)離散值,比較適合采用非線性算法對訓練集數(shù)據(jù)進行處理,因此本文選擇了ACNB和WADOE兩種非線性算法處理訓練集數(shù)據(jù),構(gòu)建ACNB和WADOE模型。同時,考慮倫理困境決策結(jié)果的不確定性和模糊性,又選擇自適應模糊算法對訓練集數(shù)據(jù)進行處理,生成了自適應模糊模型,三種模型共同作為stakcing融合機制上基學習器。然后依據(jù)三種非線性模型驗證中平均準確率,設(shè)置各自模型在決策中的權(quán)重。然后采用加權(quán)平均法,計算原始訓練集中倫理困境決策結(jié)果,作為stacking融合機制上元學習器訓練集??紤]各種不同類型和結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型的特點和決策效果,stacking融合機制上元學習器采用了多尺度混合注意力機制的深度學習算法。

        2.2 stacking融合模型構(gòu)建

        為了建立stacking融合模型,選擇463個倫理困境圖片作為訓練集,首先分別運用ACNB、WADOE和自適應模糊算法對訓練數(shù)據(jù)進行處理,計算出決策結(jié)果。然后,依據(jù)這些模型先前決策結(jié)果準確率和測試效果,設(shè)定模型權(quán)重,三者決策結(jié)果準確率如表4所示。最后通過加權(quán)平均法,計算最終決策結(jié)果,再作為stacking融合機制上元學習器上訓練集,對深度學習模型進行訓練和優(yōu)化,構(gòu)建stacking融合決策模型,如圖3所示。依據(jù)表4,三者非線性模型在決策中所占權(quán)重分別設(shè)為0.33,0.34和0.33。

        由于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在處理圖像時,權(quán)重矩陣參數(shù)太多,很容易造成過擬合現(xiàn)象。卷積神經(jīng)網(wǎng)絡(luò)通過局部關(guān)聯(lián)和參數(shù)共享,可以用較少參數(shù),訓練較好模型,避免過擬合發(fā)生[27。另外,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)主要針對具有序列特性數(shù)據(jù),能夠挖掘數(shù)據(jù)中時序信息以及語義信息,比較適合處理語音識別、語言模型、機器翻譯以及時序分析等NLP問題[28,并不適合圖像數(shù)據(jù)處理。因此stacking融合機制上元學習器采用卷積神經(jīng)網(wǎng)絡(luò)。但傳統(tǒng)CNN只能從單一維度提取倫理困境上的特征信息,影響特征提取的完整性和全面性。因此比較適合采用多尺度卷積神經(jīng)網(wǎng)絡(luò),從多個維度提取特征信息[29,30。另外,自動駕駛汽車倫理困境決策主要根據(jù)車道上行人或乘客的特征信息比較進行量化,需要重點關(guān)注車道或車內(nèi)重要區(qū)域和種類、數(shù)量、傷害等主要特征因素。卷積神經(jīng)網(wǎng)絡(luò)有必要加入注意力機制,因此stacking融合機制上元學習器采用成多尺度混合注意力機制卷積神經(jīng)網(wǎng)絡(luò),如圖4所示。

        該深度學習模型,設(shè)計四個層次結(jié)構(gòu),每層采用不同卷積核數(shù),分別為128、64、32、16,從高低維度提取特征信息。其中,第一層卷積分支采用兩個卷積層串聯(lián)和最大卷積核數(shù),獲取倫理困境中高維度特征信息。第二層卷積分支是在兩個卷積層之后各自加入最大池化層(MAX)操作,提取出訓練集中關(guān)鍵特征和重要區(qū)域,并且卷積分支層上加入了混合注意力機制。對于混合注意力機制,是將通道注意力和空間注意力相結(jié)合,先后對訓練對象上關(guān)鍵特征和重要區(qū)域進行空間變換和通道壓縮激勵[31,工作原理如圖5所示。

        若只考慮訓練對象上局部區(qū)域和關(guān)鍵特征,忽略整體因素,可能影響分類決策效果。于是第三層卷積分支層上加入平均池化層(GAP),對對象上整體特征進行提取。最后一層卷積分支采用了卷積核數(shù)最少,從低維度上提取特征信息。另外,為了提高深度學習網(wǎng)絡(luò)性能,每個卷積分支層都加入標準歸一化處理(BN)。最后連接到全連接層FC,將特征信息轉(zhuǎn)換成一維特征向量,進行特征融合和運算,送入分類決策層softmax進行分類和決策,確定最終決策結(jié)果,直行還是轉(zhuǎn)向。

        2.3 實例決策過程

        以圖6所示倫理困境作為實例,描述stacking融合機制決策過程。

        對于圖上倫理困境實例,若自動駕駛汽車選擇直行,直行車道上2位女士、1位嬰兒、1位小孩和1只貓將會碰撞死亡,且該行人和貓都遵守交通規(guī)則。相反,自動駕駛汽車選擇轉(zhuǎn)向,將使得轉(zhuǎn)向車道上不遵守交通規(guī)則2位經(jīng)理、1位醫(yī)生、1位運動員和1位孕婦死亡。直行車道上行人或物相對于轉(zhuǎn)向車道上行人來說,特征差異在于年齡小,遵守交通規(guī)則,行人相對較少。依據(jù)特征量化規(guī)則,1表示直行車道人或物相對轉(zhuǎn)向車道,具有優(yōu)先得到保護特征因素;0表示直行車道人或物與轉(zhuǎn)向車道特征相似或相同;-1表示直行車道上人或物相對轉(zhuǎn)向車道,具有不利于得到保護的特征因素。所以該倫理困境特征向量為:[數(shù)量,年齡,規(guī)則,種類,傷害,自身利益]=[0,1,1,-1,0,0]。

        1)ACNB模型計算

        首先運用先前建立ACNB模型,對該倫理困境實例進行決策和計算。由于直行車道上行人或物具有年齡相對較小和遵守交通規(guī)則的特征因素,所以計算后驗概率時,應將年齡和交通規(guī)則之間相關(guān)系數(shù)加入后驗概率計算公式,依據(jù)表1可知,這兩者特征之間相關(guān)系數(shù)為1.27。對于各個獨立特征屬性下先驗概率,主要根據(jù)Moral Machine平臺所公開調(diào)查數(shù)據(jù)分析和統(tǒng)計,計算出各個特征屬性下選擇直行和轉(zhuǎn)向的先驗概率,統(tǒng)計結(jié)果如表5所示。

        自動駕駛汽車選擇轉(zhuǎn)向C1概率為

        p(c1|x1,x2,x3)=corr(x1,x2)p(x1=1,x2=1,x3=-1|c1)p(c1)p(x1,x2,x3)=

        corr(x1,x2)p(x1=1|c1)p(x2=1|c1)p(x3=-1|c1)p(c1)p(x1,x2,x3)=

        1.27×0.617×0.636×0.121×0.504p(x1,x2,x3)=0.0304p(x1,x2,x3

        另外,對于選擇直行C2概率,由于不存在兩種特征屬性都有利于直行,默認特征屬性之間相互獨立,自動駕駛汽車選擇直行C2概率為

        p(c2|x1,x2,x3)=p(x1=1,x2=1,x3=-1|c2)p(c2)p(x1,x2,x3)=

        p(x1=1|c1)p(x2=1|c1)p(x3=-1|c1)p(c1)p(x1,x2,x3)=

        0.879×0.383×0.364×0.496p(x1,x2,x3)=0.0608p(x1,x2,x3

        由于日常生活中p(x1,x2,x3)聯(lián)合特征概率不便計算,使得計算后驗概率存在困難。所以采用歸一法,對計算結(jié)果作出進一步處理。

        p(C1)=p(c1|x1,x2,x3)p(c1|x1,x2,x3)+p(c2|x1,x2,x3)=

        0.03040.0304+0.0608=0.333

        P(C2)=1-0.333=0.667

        由于P(C1)lt;P(C2),該倫理困境下,自動駕駛汽選擇直行,保護轉(zhuǎn)向車道上更多行人。

        2)WADOE模型計算

        依據(jù)表3、5上各個特征因素權(quán)重和獨立特征屬性先驗概率,運用式(4)分別求解圖6倫理困境實例上直行和轉(zhuǎn)向后驗概率。自動駕駛汽車選擇轉(zhuǎn)向C1近似概率為

        P(c1|x)∞1n∑ni=1wiP(c1,xinj=1, j≠iP(xj|c1,xi)=

        1/3[w1P(c1,x1=1)P(x3=-1|c1,x1=1)P(x2=1|c1,x1=1)+

        w2P(c1,x2=1)P(x3=-1|c1,x2=1)P(x1=1|c1,x2=1)+

        w3P(c1,x3=-1)P(x1=1|c1,x3=-1)P(x2=1|c1,x3=-1)]=

        1/3[0.0597×0.617×0.636×0.121+0.2259×0.617×0.121×

        0.636+0.2725×0.636×0.121×0.617]=0.0088

        無人駕駛汽車選擇直行C2近似概率為

        P(c2|x)∞1n∑ni=1wiP(c2,xinj=1, j≠iP(xj|c2,xi)=

        1/3[w1P(c2,x1=1)P(x3=-1|c2,x1=1)P(x2=1|c2,x1=1)+

        w2P(c2,x2=1)P(x3=-1|c2,x2=1)P(x2=1|c2,x1=1)+

        w3P(c2,x3=-1)P(x1=1|c2,x3=-1)P(x2=1|c2,x3=-1)]=

        1/3[0.0597×0.879×0.383×0.364+0.2259×0.383×0.879×

        0.364+0.2725×0.364×0.383×0.879]=0.0228

        將計算結(jié)果進行歸一化處理:

        P(C1)=p(c1|x)p(c1|x)+p(c2|x)=0.00880.0088+0.0228=0.278

        P(C2)=1-0.278=0.722

        由于P(C1)lt;P(C2),該倫理困境下,自動駕駛汽車仍然選擇直行。

        3)自適應模糊模型計算

        依據(jù)自適應模糊算法對訓練集中所有倫理困境進行處理和訓練后,最終生成轉(zhuǎn)向和直行標準樣本空間及均值向量,轉(zhuǎn)向標準樣本空間均值向量為a1=(0.37,0.018,0.982,0.278,0,-0.125),直行標準樣本空間均值向量為a2 =(0.5,0,0,0,0,-0.001)。對圖6倫理困境實例進行模糊隸屬度計算,依據(jù)模糊隸屬度作出決策和分類,模糊隸屬函數(shù)式(13)。

        Ai(u)=1-d(u,ai)D

        D=d(u,a1)+d(u,a2)(13)

        其中:待測對象u與轉(zhuǎn)向和直行標準樣本空間a1和a2歐氏距離:

        d(u,a1)=

        (0-0.37)2+(1-0.018)2+(1-0.982)2+(-1-0.278)2+(0-0)2+(0+0.125)2=

        1.658

        d(u,a2)=

        (0-0.5)2+(1-0)2+(1-0)2+(-1-0)2+(0-0)2+(0+0.001)2=

        1.5

        該倫理困境下,選擇轉(zhuǎn)向C1模糊隸屬度:

        A1(u)=1-d(u,a1)D=1-1.6581.658+1.5=0.475

        該倫理困境下選擇直行C2模糊隸屬度為A2(u)=1-0.475=0.525,A1(u)lt;A2(u),自適應模糊模型仍然選擇直行。

        4)計算融合結(jié)果

        依據(jù)三種模型計算概率、模糊隸屬度以及各自權(quán)重,運用加權(quán)平均法計算融合結(jié)果,如式(14)所示。

        p(ci)=∑nj=0wjpj(ci)(14)

        其中:Ci表示決策結(jié)果類型;wj表示模型權(quán)重;pj(ci)表示各自模型決策結(jié)果分布概率和模糊隸屬度。

        選擇轉(zhuǎn)向C1概率為

        p(c1)=∑nj=0wjpj(c1)=

        0.33×0.333+0.34×0.278+0.33×0.475=0.361

        選擇直行C2概率為

        p(c2)=∑nj=0wjpj(c2)=

        0.33×0.667+0.34×0.722+0.33×0.525=0.639

        同樣P(C1)lt;P(C2),該倫理困境下,三種模型融合計算結(jié)果仍然直行。對于訓練集其他倫理困境也可以采用同樣方法逐一計算結(jié)果,作出決策數(shù)據(jù)。然后將訓練集中所有決策數(shù)據(jù)作為元學習器上多尺度混合注意力機制的深度學習模型的訓練集,對深度學習模型進行迭代訓練和優(yōu)化,生成深度學習模型,構(gòu)建stacking融合模型。

        3 驗證和測試

        為了驗證stacking融合機制決策效果,分別運用訓練集和測試集中倫理困境圖片對深度學習模型和stacking融合機制進行測試和比較。依據(jù)驗證中平均損失率、準確率和測試結(jié)果正確率,評估stacking融合機制的決策效果。

        首先,運用訓練集數(shù)據(jù)對深度學習模型和stacking融合機制分別進行5輪測試,每批處理數(shù)量為50,共100批。深度學習訓練模型驗證過程中平均損失率變化趨勢如圖7所示,分別用不同顏色區(qū)分5輪測試結(jié)果。

        該圖可知,最小平均損失率約為0.64,平均損失率并沒有隨著迭代次數(shù)增加而減小,生成的深度學習模型的收斂性和穩(wěn)定性較差。其次,5次驗證過程中平均準確率變化趨勢如圖8所示。

        從圖8可知,深度學習模型平均準確率在0.35~0.7,且準確率并沒有隨著迭代次數(shù)增加而提高,訓練效果不太理想。

        反之,運用同樣訓練集數(shù)據(jù)對stacking融合機制進行訓練時,隨著迭代次數(shù)不斷增加,驗證中平均損失率整體上呈遞減趨勢,最低平均損失率為0.35,測試結(jié)果也用不同顏色進行區(qū)分,如圖9所示。

        其次,stacking融合機制平均準確率隨著迭代次數(shù)增加而呈上升趨勢,最大平均準確率接近于90%,說明了stacking融合機制相對于傳統(tǒng)深度學習模型,平均準確率有了明顯提高,如圖10所示。

        為了進一步驗證stacking融合機制決策效果,又運用測試集中倫理困境分別對深度學習模型和stacking融合機制進行測試,共進行5輪測試,測試結(jié)果正確率變化趨勢如圖11所示。

        深度學習模型測試結(jié)果正確率較低,最高為0.61,最低為0.4;stacking融合機制測試結(jié)果正確率最高為0.75,最低也達到了0.48,結(jié)果表明,stacking融合機制倫理決策效果更好。

        4 結(jié)束語

        自動駕駛汽車遇到倫理困境時,運用單一決策模型和算法還不能作出確定、合理的決策結(jié)果,影響了人們對自動駕駛汽車安全駕駛的信任和認可。通過研究基于stacking融合機制的自動駕駛倫理決策模型,一方面通過決策行為模型化,確保自動駕駛倫理決策的確定性和透明性;另一方面通過非線性和深度學習模型融合,避免單一算法和模型所作出決策結(jié)果存在的問題,保證了決策結(jié)果的確定性和合理性,提高自動駕駛汽車決策泛化能力。經(jīng)過測試和驗證,得出以下結(jié)論和展望。

        a)多種模型融合相對于單一模型,在決策結(jié)果的確定性、合理性和泛化性等方面存在優(yōu)勢。如stacking融合模型相對于線性和非線性模型,在合理性和泛化能力等方面具有優(yōu)勢;相對于傳統(tǒng)深度學習模型,在決策結(jié)果透明性和確定性等方面具有優(yōu)勢。

        b)雖然stacking融合機制相對傳統(tǒng)深度學習模型,決策結(jié)果準確率和正確率方面有了提升,但決策結(jié)果正確率還不算理想,最高正確率僅為75%,甚至低于ACNB、WADOE正確率。但考慮到測試集決策結(jié)果也是根據(jù)人類調(diào)查結(jié)果確定,合理性存在偏差。另外,當前所收集訓練集數(shù)據(jù)也有限,也會影響到深度學習模型和stacking融合機制訓練效果,降低了其決策結(jié)果正確率。

        參考文獻:

        [1]Lee K, Kum D. Collision avoidance/mitigation system: motion planning of autonomous vehicle via predictive occupancy map[J]. IEEE Access, 2019, 7: 52846-52857.

        [2]Chen Jiajia, Zhao Pan, Liang Huawei. Motion planning for autonomous vehicle based on radial basis function neural network in unstructured environment[J]. Sensors, 2014, 14(9): 17548-17566.

        [3]古天龍, 李龍. 倫理智能體及其設(shè)計:現(xiàn)狀和展望[J]. 計算機學報, 2021, 44(3): 632-652. (Gu Tianlong, Li Long. Artificial mo-ral agents and their design methodology: retrospect and prospect[J]. Chinese Journal of Computers,2021,44(3):632-652.)

        [4]阮凱. 機器倫理何以可能:現(xiàn)有方案及其改良[J]. 自然辨證法研究, 2018, 34(11): 53-59. (Ruan Kai. How can machine ethics be possible: existing schemes and improvement[J]. Studies in Dialectics of Nature, 2018, 44(3): 632-652.)

        [5]蘇令銀. 能將倫理準則嵌入人工智能機器嗎?[J]. 理論探索, 2018(3): 38-46. (Su Lingyin. Can ethical principles be embedded in AI machines[J]. Theoretical Exploration, 2018(3): 38-46.)

        [6]許宏鑫,吳志周,梁韻逸. 基于強化學習的自動駕駛汽車路徑規(guī)劃方法研究綜述[J]. 計算機應用研究, 2023, 40(11): 3211-3217. (Xu Hongxin, Wu Zhizhou, Liang Yunyi. Review of research on path planning methods for autonomous vehicles based on reinforcement learning[J]. Application Research of Computers, 2023, 40(11): 3211-3217.)

        [7]Contissa G, Lagioia F, Sartor G. The ethical knob: ethically customi-sable automated vehicles and the law[J]. Artificial Intelligence and Law, 2017, 25(6293): 365-378.

        [8]Geisslinger M, Poszler F, Betz J, et.al. Autonomous driving ethics: from trolley problem to ethics of risk[J]. Philosophy amp; Techno-logy, 2021, 4: 78-89.

        [9]Evans K, De Moura N, Chauvier S, et al. Ethical decision making in autonomous vehicles: the ethics project[J]. Science and Enginee-ring Ethics, 2020, 26: 3285-3312.

        [10]Wang Hong, Huang Yanjun, Khajepour A, et al. Ethical decision-making platform in autonomous vehicles with lexicographic optimization based model predictive controller[J]. IEEE Trans on Vehicular Technology, 2020, 69(8): 8164-8175.

        [11]Wu Yuehua, Lin Shoude. A low-cost ethics shaping approach for designing reinforcement learning agents[EB/OL]. (2018-09-10). https://arxiv.org/abs/1712.04172.

        [12]Gerdes J C, Thornton S M. Implementable ethics for autonomous vehicles[M]// Maurer M, Gerdes J, Lenz B, et al. Autonomous dri-ving. Berlin: Springer, 2015: 87-102.

        [13]Li Sixian, Zhang Junyou, Wang Shufeng, et al. Ethical and legal dilemma of autonomous vehicles: study on driving decision-making mode under the emergency situations of redlight running behaviors[J]. Electronic,2018, 10(7): 264-282.

        [14]Mencia E L, Janssen F. Learning rules for multi-label classification: a stacking and a separate and conquer approach[J]. Machine Learning, 2016,105(1):1-50.

        [15]Wang Ruobing. Stacked generalization approach to improve prediction of molecular atomization energies[J]. Eprint, 2018, 45(2): 1-15.

        [16]張笑銘, 王志君, 梁利平. 一種適用于卷積神經(jīng)網(wǎng)絡(luò)的Stacking算法[J]. 計算機工程, 2018, 44(4): 243-247. (Zhang Xiao-ming, Wang Zhijun, Liang Liping. A stacking algorithm for convolution neural network[J]. Computer Engineering, 2018, 44(4): 243-247.)

        [17]馬良玉. 基于Stacking多模型融合的風電機組齒輪箱油池溫度異常預警[J]. 中國電機工程學報, 2023, 43(S1): 242-252. (Ma Liangyu. Anomaly warning of wind turbine gearbox oil pool temperature based on Stacking fusion of multiple models[J]. Proceedings of the CSEE, 2023, 43(S1): 242-252.)

        [18]Tan Zhenqi, Zhang Jing, He Yu, et al. Short-term load forecasting based on integration of SVR and stacking[J]. IEEE Access, 2020, 8: 227719-227728.

        [19]Dong Yingchao, Zhang Hongli, Wang Cong, et al. Wind power forecasting based on stacking ensemble model, decomposition and intelligent optimization algorithm[J]. Neurocomputing, 2021, 462: 169-184.

        [20]Liu Guoman, Luo Yufeng, Sheng Jing. Research on application of naive Bayes algorithm based on attribute correlation to unmanned dri-ving ethical dilemma[J]. Mathematical Problems in Engineering, 2022, 2022: article ID 4163419.

        [21]Zheng Fei, Webb G I. Averaged one-dependence estimators[M]// Sammut C, Webb G I. Encyclopedia of Machine Learning. Boston: Springer, 2017: 63-64.

        [22]Hu B Q. Basis of fuzzy theory[M]. Wuhan: Wuhan University Press, 2010.

        [23]Lex K, Ilya S, Geoffrey E H. Image net classification with deep con-volutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90.

        [24]周飛燕, 金林鵬, 董軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計算機學報, 2017, 40(6): 1229-1252. (Zhou Feiyan, Jin Linpeng, Dong Jun. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1252.)

        [25]司念文, 張文林, 屈丹, 等. 卷積神經(jīng)網(wǎng)絡(luò)表征可視化研究綜述[J]. 自動化學報, 2022, 48(8): 1890-192. (Si Nianwen,Zhang Wenlin, Qu Dan, et al. Representation visualization of convolutional neural networks: a survey[J]. Acta Automatica Sinica, 2022, 48(8): 1890-1920.)

        [26]Zhang Yabo, Ding Wenrui, Liu Chunlei. Summary of convolutional neural network compression technology[C]// Proc of IEEE International Conference on Unmanned Systems. Piscataway, NJ: IEEE Press, 2019: 480-483.

        [27]Howard A G, Zhu Menglong, Chen Bo, et al. MobileNets: efficient convolutional neural networks for mobile vision applications [EB/OL]. (2017-04-17). https://arxiv.org/abs/1704.04861.

        [28]代勇. 關(guān)于文本分類和問答的深度學習算法研究[D]. 成都: 電子科技大學, 2021. (Dai Yong. Research on deep learning algorithms for text classification and question answering[D]. Chengdu: University of Electronic Science and Technology, 2021.)

        [29]卞景藝, 劉秀麗, 徐小力, 等. 基于多尺度深度卷積神經(jīng)網(wǎng)絡(luò)的故障診斷方法[J]. 振動與沖擊, 2021, 40(18): 204-211. (Bian Jingyi, Liu Xiuli, Xu Xiaoli, et al. Fault diagnosis method based on a multi-scale deep convolutional neural network[J]. Journal of Vibration and Shock, 2021, 40(18): 204-211.)

        [30]譚震, 郭新蕾, 李甲振, 等. 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的管道泄露檢測模型研究[J]. 水利學報, 2021, 54(2): 220-232. (Tan Zhen, Guo Xinlei, Li Jiazhen, et al. Multi-scale convolutional neural network model for pipeline leak detection[J]. Journal of Hydraulic Engineering, 2021,54(2):220-232.)

        [31]游忠輝. 卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法研究[D]. 北京: 北京大學,2020.(You Zhonghui. Research on convolutional neural network acceleration and compression methods[D]. Beijing: Peking University, 2020.)

        猜你喜歡
        困境倫理卷積
        《心之死》的趣味與倫理焦慮
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        困境
        文苑(2020年12期)2020-04-13 00:54:08
        護生眼中的倫理修養(yǎng)
        活力(2019年19期)2020-01-06 07:37:00
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標跟蹤算法
        “鄰避”困境化解之策
        必須正視的理論困境
        我國霧霾治理的困境與出路
        醫(yī)改莫忘構(gòu)建倫理新機制
        中国精学生妹品射精久久| 国产在线91精品观看| 欧美怡春院一区二区三区| 国产成人无码一区二区在线播放 | 亚洲日韩成人av无码网站| 国产午夜福利精品| 中文字幕成人乱码亚洲| 调教在线播放黄| 东京道一本热码加勒比小泽| 女人天堂av人禽交在线观看| 午夜理论片yy44880影院| 污污污污污污污网站污| 亚洲国产成人久久综合三区| 亚洲一区二区三区av资源| 久久久无码精品亚洲日韩蜜臀浪潮 | 精品久久久久久久久久久aⅴ| 日韩肥熟妇无码一区二区三区| 日本人妻97中文字幕| 少妇熟女天堂网av| 国语对白做受xxxxx在线中国| 日韩不卡无码三区| 国产亚洲精品在线视频| 大地资源在线观看官网第三页| 日本一区二区不卡视频| 看全色黄大色大片免费久久久| 国产三级黄色免费网站| 三叶草欧洲码在线| 一本大道东京热无码中字| 丰满少妇又紧又爽视频| 亚洲女同精品久久女同| 色久悠悠婷婷综合在线| 又色又爽又高潮免费视频观看| 看黄网站在线| 日本熟女人妻一区二区三区| 中文字幕av高清人妻| 亚洲精品午夜无码电影网| 久久久国产精品福利免费| 日韩av免费在线不卡一区 | 在线一区二区三区视频观看| 亚洲丝袜美腿在线视频| 久久中文精品无码中文字幕下载|