亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進K-means聚類算法行駛工況及油耗研究*

        2021-11-22 08:44:44蘇小會張玉西徐淑萍
        計算機工程與科學(xué) 2021年11期

        蘇小會,張玉西,徐淑萍,尚 煜

        (西安工業(yè)大學(xué)計算機科學(xué)與工程學(xué)院,陜西 西安 710021)

        1 引言

        汽車行駛工況也稱運轉(zhuǎn)周期,是車輛在特定環(huán)境中行駛的速度-時間變化規(guī)律,主要用于評價車輛污染物排放和能耗,對新車型技術(shù)研發(fā)與交通控制風(fēng)險評估等研究具有重要價值[1]?,F(xiàn)有許多學(xué)者對其進行了研究,Nguyen等人[2]提出基于馬爾可夫鏈理論的行駛循環(huán)構(gòu)建過程。丁一鋒等人[3]用主成分與聚類分析等多元統(tǒng)計方法構(gòu)建汽車道路工況。劉應(yīng)吉等人[4]利用運動學(xué)片段聯(lián)系模糊的特點使用組合主成分和模糊C均值聚類構(gòu)建工況。大多數(shù)學(xué)者對行駛工況的研究主要集中在K-means聚類初始中心的選擇上和單一地改進K-means聚類算法,缺乏對主成分分析和聚類組合優(yōu)化以及執(zhí)行算法時耗的研究。若要達到理想的聚類效果和時耗,還是要集中在K-means聚類的改進上,張銳等人[5]為了彌補傳統(tǒng)K-means算法聚類效果嚴(yán)重依賴于初始聚類中心這一不足,提出了OICC(Optimize Initial Cluster Centers)K-means算法。張琳等人[6]采用密度的思想克服傳統(tǒng)初始中心比較敏感的缺陷。羅軍鋒等人[7]引入信息熵和加權(quán)距離,去除孤立點。張琰[8]提出一種基于密度加權(quán)的粗糙K-means聚類改進算法,不僅提高了聚類準(zhǔn)確率,減少了迭代次數(shù),而且還弱化了聚類時噪聲數(shù)據(jù)和離群點對結(jié)果的干擾。但是,該算法是在犧牲效率代價的前提下,提高了聚類準(zhǔn)確率,大多數(shù)的時耗用在運算數(shù)據(jù)對象的密度上,時間復(fù)雜度過高。

        因此,本文提出一種改進K-means聚類優(yōu)化算法,引入最大最小距離和加權(quán)歐氏距離,依據(jù)貢獻因子對聚類特征值增加權(quán)重。實驗結(jié)果表明本文算法聚類效果穩(wěn)定、時耗低,所構(gòu)建的行駛工況適用性強,滿足交通路況的特征。

        2 行駛工況數(shù)據(jù)解析

        2.1 數(shù)據(jù)預(yù)處理

        本文采集的數(shù)據(jù)是來源于城市輕型汽車2019年9月份實際道路行駛狀況(采樣頻率1 Hz),其中,數(shù)據(jù)信息有時間、GPS測速、經(jīng)緯度和瞬時油耗等。利用擬合插值法對受到干擾不連續(xù)的數(shù)據(jù)進行插值擬合,小波分解和重構(gòu)法對污染的數(shù)據(jù)進行平滑處理[9],用Matlab預(yù)處理后的原始數(shù)據(jù)由194 511條減少至164 039條。

        2.2 特征參數(shù)提取及運動學(xué)片段劃分

        汽車由一個怠速開始到下一個怠速開始前的區(qū)間被稱為運動學(xué)片段[10]。在分析相關(guān)資料并進行相關(guān)研究的基礎(chǔ)上,本文定義了12個特征參數(shù)來描述運動學(xué)片段[11],即片段持續(xù)時間T、行駛距離S、平均速度Va、平均行駛速度Vd、怠速時間比Ti、加速時間比Ta、減速時間比Td、巡航時間比Tc、速度標(biāo)準(zhǔn)差Vstd、平均加速度aa、加速度平均標(biāo)準(zhǔn)差astd和平均減速度ad共12個特征參數(shù)。

        本文利用Python開發(fā)了相關(guān)程序,采用堆棧和循環(huán)遍歷數(shù)據(jù)進行處理,從164 039條預(yù)處理數(shù)據(jù)中分割出2 445個運動學(xué)片段。

        3 改進主成分分析

        傳統(tǒng)的主成分分析利用線性技術(shù)對數(shù)據(jù)進行降維,消除數(shù)量級影響的同時也剔除了各特征因子的差異信息,而實際生活中數(shù)據(jù)間的關(guān)系常常是非線性的,采用方差貢獻率為權(quán)重的綜合評價方法不能合理解釋分析結(jié)果,甚至?xí)霈F(xiàn)評價結(jié)果與事實偏差較大的現(xiàn)象[12]。因此,本文采用文獻[13]提出的比重法,改進后的主成分不僅能夠消除量綱的噪聲,還可以在表征較多特征參數(shù)信息的同時實現(xiàn)降維,如式(1)所示:

        (1)

        其中,n為運動學(xué)片段數(shù)量,ti為第i個片段,tij為第i個片段的第j項特征參數(shù),ZTij為第i個片段的第j項特征參數(shù)的標(biāo)準(zhǔn)化比重。

        改進的主成分分析在實現(xiàn)降維的情況下,將求出的實驗數(shù)據(jù)與特征參數(shù)組成矩陣, 選取累積貢獻率達到80%以上的主成分進行降維和去相關(guān)。從圖1可看出,前4個主成分累計貢獻率已達82.76%,基本代表了該片段12個特征參數(shù)的所有信息。

        Figure 1 Contribution rate and cumulative contribution rate圖1 貢獻率與累積貢獻率

        從圖2可以看出,各主成分的特征值呈逐漸減小趨勢,且變化曲線存在明顯拐點。由圖1可知改進的主成分分析結(jié)果中第1主成分包含41.5%的信息,因此達到了用較少主成分表征更多信息的要求。

        Figure 2 Gravel map圖2 碎石圖

        當(dāng)選取參數(shù)的主成分載荷系數(shù)的絕對值越大時,說明某參數(shù)與某主成分的相關(guān)系數(shù)越高[1]。從圖3可以直觀地看出各個特征值相關(guān)性的大小,根據(jù)表1可得第1主成分M1的特征值有行駛距離、平均減速度和平均行駛速度,從圖3可看出特征值的相關(guān)性系數(shù)分別為3.15,2.08和3.69,則M1與行駛距離和平均行駛速度的相關(guān)性較大;第2主成分M2的特征值有平均速度和巡航時間比,從圖3可看出特征值的相關(guān)性系數(shù)分別為2.75和3.84,則M2與巡航時間比的相關(guān)性較大;第3主成分M3的特征值有怠速時間比和減速時間比,從圖3可看出特征值的相關(guān)性系數(shù)分別為3.06和2.85,則M3與怠速時間比的相關(guān)性較大;第4主成分M4的特征值有片段持續(xù)時間,從圖3可看出特征值的相關(guān)性系數(shù)為2.43,則M3與片段持續(xù)時間的相關(guān)性較大。

        Figure 3 Scatter plot of principal component analysis 圖3 主成分分析散點圖

        4 改進的K-means聚類優(yōu)化算法

        4.1 離群點處理

        實際測試中總會有一定的干擾,常常產(chǎn)生孤立點或噪聲,影響聚類效果,本節(jié)利用剩余數(shù)據(jù)點距離均值和的方法來消除噪聲和離群點的影響[14]。每一數(shù)據(jù)點與其他點的距離和為Si,距離均值和為H,當(dāng)Si>H時,則把點i視為孤立點。

        Table 1 Principal component loading matrix表1 主成分載荷矩陣

        (2)

        (3)

        其中,xih和xjh分別為數(shù)據(jù)樣本xi和xj第h維的值,d為數(shù)據(jù)維度,n為樣本數(shù)量。

        4.2 最大最小距離

        最大最小距離法是把距離遠(yuǎn)的實驗數(shù)據(jù)點看作聚類中心,避免了K-means聚類算法選取初始值時與聚類中心太過鄰近的情況,如果只依據(jù)距離做出判斷,初始中心點中很可能包含有離群點,從而影響聚類準(zhǔn)確率。

        最大最小距離法的基本思想:首先,在實驗數(shù)據(jù)中隨機選取數(shù)據(jù)點v1作為聚類中心點;然后,選擇離v1最遠(yuǎn)的數(shù)據(jù)點v2作為聚類中心點;再選擇與之前中心點的歐氏距離最大的數(shù)據(jù)點作為下一個中心點,重復(fù)該過程依次計算剩余所需要的中心點。

        4.3 加權(quán)歐氏距離

        設(shè)有n個實驗數(shù)據(jù)組成聚類數(shù)據(jù)集X={x1,x2,…,xn},其中xi=[xi1,xi2,…,xid]T為d維向量,根據(jù)實驗數(shù)據(jù)中每個分量的特征參數(shù)的影響不同,引入權(quán)值ω=[ω1,ω2,…,ωn]T∈Rn×d來區(qū)分各部分實驗數(shù)據(jù)與聚類中心的關(guān)系。

        (4)

        (5)

        新初始權(quán)重為:

        (6)

        其中,聚類精度為:

        (7)

        其中,ωj=(ωj1,ωj2,…,ωjd)T為d維向量,xj表示第j個實驗數(shù)據(jù),ci表示第i個聚類中心,xjm表示第j個實驗數(shù)據(jù)的第m個分量,cim表示第i個聚類中心的第m個分量,可以看出ω是一個能體現(xiàn)實驗數(shù)據(jù)整體分布特征的權(quán)值[5]。ncor為正確分類實驗數(shù)據(jù)數(shù),n為實驗數(shù)據(jù)數(shù)。

        4.4 特征加權(quán)K-means聚類算法

        (1)處理噪聲和孤立點,得到新的數(shù)據(jù)集,分析得到相關(guān)特征列表。

        (2)用改進的主成分分析計算每個特征的貢獻因子,以此獲得初始權(quán)重。

        ω=(w1X1,…,wiXi,…,wnXn)

        (8)

        其中,Xi為第i個特征的貢獻因子。

        (3)利用最大最小距離法產(chǎn)生經(jīng)過優(yōu)化的聚類中心,以此確定K個初始聚類中心。

        (4)基于加權(quán)特征和初始聚類中心,執(zhí)行K-means以獲得K個簇。

        (5)計算初始聚類精度。

        (6)對于ω中的每個數(shù)據(jù)點i,執(zhí)行沒有該數(shù)據(jù)點時的K-means聚類,并計聚類精度Ai,若Ai

        (7)歸一化權(quán)重,基于新權(quán)重執(zhí)行K-means聚類,并計算聚類精度Ainit;

        若最終聚類精度Afinal>Ainit,則接受該新權(quán)重,并令A(yù)init=Afinal;否則保持舊的權(quán)重不變。

        根據(jù)本文的工況數(shù)據(jù),使用本文改進的K-means算法進行處理,首先對邊緣數(shù)據(jù)、離群點進行檢測,并剔除異常點,如圖4所示,簇1為正常聚類的點,簇2為邊緣數(shù)據(jù)離群點。從圖5可以看出,邊緣數(shù)據(jù)大部分為離群點,可剔除。

        Figure 4 Scatter plot of edge data points of working conditions圖4 工況邊緣數(shù)據(jù)點散點圖

        Figure 5 Relative distance comparison of outliers圖5 離群點相對距離對比

        根據(jù)上述改進主成分分析,使用貢獻因子和相關(guān)性較大的特征值繪制三維圖,如圖6所示,本文選用平均速度、行駛距離和巡航時間比代表聚類的每個點。

        Figure 6 Three-dimensional scatter plot of working conditions圖6 工況三維散點圖

        改進K-means聚類算法把運動學(xué)片段聚成4大類,分別由簇1、簇2、簇3和簇4表示。由圖7可知,第1類為鬧市區(qū),汽車頻繁啟停且車速較低,平均速度、巡航時間比和行駛距離都低;第2類為生活區(qū),較為擁堵,啟停次數(shù)較多,平均速度、巡航時間比和行駛距離都較低;第3類為郊區(qū),路況較為通暢,啟停次數(shù)較少,平均速度、巡航時間比、行駛距離都較高;第4類為高速區(qū),交通順暢,啟停次數(shù)少,平均速度、巡航時間比和行駛距離都高。

        Figure 7 Working condition cluster analysis scatter plot圖7 工況聚類分析散點圖

        5 行駛工況構(gòu)建與油耗分析

        5.1 工況構(gòu)建與驗證

        根據(jù)汽車行駛工況中各類時間片段總時間占所有片段集總時間的比例,可得出各工況在最終構(gòu)建工況中所用的時間[15]。本文截取1 400 s的時間片段合成由低速片段、中速片段、中高速片段和高速片段的車輛行駛工況,如圖8所示。

        Figure 8 Synthetic driving conditions圖8 合成行駛工況

        用速度和加速度驗證所構(gòu)建行駛工況與實驗數(shù)據(jù)之間的差異[11],這是相對標(biāo)準(zhǔn)的驗證方法。 使用Matlab軟件計算所構(gòu)建汽車行駛工況數(shù)據(jù)的速度-加速度聯(lián)合分布矩陣,如圖9所示。

        Figure 9 Difference between experimental data and synthetic conditions圖9 實驗數(shù)據(jù)與合成工況的分布差異值

        由圖9可見,實驗數(shù)據(jù)與本文改進聚類算法構(gòu)建行駛工況的速度-加速度聯(lián)合差異分布在±1.2%范圍內(nèi),因此,本文構(gòu)建的行駛工況滿足輕型汽車的行駛特征,符合車輛行駛工況構(gòu)建的開發(fā)要求,具有較強的實用性。

        Figure 10 Running time of the four algorithms圖10 4種算法運行時間

        本文使用文獻[16,17]的工況構(gòu)建方法和本文方法在本文數(shù)據(jù)上進行20次實驗,結(jié)果如圖10所示。結(jié)果表明,本文改進K-means聚類算法不僅可以弱化噪聲點對初始中心的影響,還在聚類效果穩(wěn)定的基礎(chǔ)上大大縮短了聚類時間。

        表2是在Matlab上運行的結(jié)果,本文算法聚類表現(xiàn)較好,其中平均運行時間比傳統(tǒng)K-means聚類算法縮短了44.2%。

        Table 2 Experimental results comparsion of the four algorithms表2 四種算法對比實驗結(jié)果

        5.2 油耗分析

        如圖11和圖12所示,在低速、中低和高速時瞬時油耗較大,車輛轉(zhuǎn)矩波動較高速區(qū)大,高速區(qū)瞬時油耗比較平穩(wěn),而低速區(qū)、中速區(qū)瞬時油耗率明顯增加。從圖12可觀察到,瞬時油耗除低速時有短暫的升高現(xiàn)象,之后油耗起伏趨勢與行駛速度大致吻合。從圖13可看出,行駛工況發(fā)動機轉(zhuǎn)速主要分布在1 500~2 500 r/min,油門踏板開度集中在0.12~0.18,表明行駛工況為中高速狀態(tài)。

        Figure 11 Relationship between vehicle driving time and instantaneous fuel consumption圖11 車輛行駛時間與瞬時油耗的關(guān)系

        由圖14可觀察到,高瞬時油耗大多集中在轉(zhuǎn)速為1 000~1 500 r/min,扭矩百分比為10%~30%時,說明這部分行駛工況是由高速、中速和低速區(qū)組成。

        Figure 12 Relationship between vehicle speed and instantaneous fuel consumption圖12 車輛行駛速度與瞬時油耗的關(guān)系

        Figure 13 Relationship between vehicle running speed and accelerator pedal opening圖13 車輛行駛轉(zhuǎn)速與油門踏板開度的關(guān)系

        Figure 14 Relationship among vehicle driving time, speed, and instantaneous fuel consumption圖14 車輛行駛時間、速度和瞬時油耗的關(guān)系

        6 結(jié)束語

        本文提出了一種改進的主成分和特征加權(quán)K-means聚類組合的優(yōu)化算法,引入剩余點聚類均值法,剔除離群點,減少聚類時耗。最大最小距離法可優(yōu)化候選初始中心,使K-means避免陷入局部最優(yōu)解,從而達到良好的聚類效果。依據(jù)特征值的貢獻因子對聚類的貢獻率,獲得初始特征權(quán)重,提出一種加權(quán)歐氏距離度量。選出貢獻因子較大的巡航時間比、行駛距離和平均速度等特征值,可加大權(quán)重進行聚類分析,進而構(gòu)建車輛行駛工況。本文提出的改進聚類算法仍有改進空間,可在本文算法的基礎(chǔ)上提出加權(quán)密度K-means聚類算法,還可以考慮在本文數(shù)據(jù)預(yù)處理部分直接剔除孤立點,減少后續(xù)聚類運行時間,也可加入更多維的特征信息。

        欧美精品久久久久久久自慰| av影片在线免费观看| 午夜三级a三级三点在线观看| 欧美大屁股xxxxhd黑色| 亚洲精品国产一二三无码AV| 中文字幕av久久激情亚洲精品 | 中文字幕亚洲一区二区不下| 成人国产精品一区二区视频| 久久aⅴ无码一区二区三区| 久久久精品人妻一区二| av在线免费高清观看| 亚洲欧美日韩在线不卡| 久久天天爽夜夜摸| 成年女人午夜特黄特色毛片免| 久草青青91在线播放| 亚洲av无码专区电影在线观看 | 又白又嫩毛又多15p| 波多野结衣一区二区三区视频 | 成年无码av片在线| 精品视频在线观看免费无码| 精品国模人妻视频网站| 亚洲av色香蕉一区二区三区| 亚洲乱码日产精品bd| 久久国产精品免费一区六九堂| 三级国产高清在线观看| 国产色xx群视频射精| 有码精品一二区在线| 大量老肥熟女老女人自拍| 亚洲综合av一区二区三区蜜桃| 三男一女吃奶添下面| 精品无人区无码乱码大片国产| 成人男性视频在线观看| 男人边做边吃奶头视频| 欧美末成年videos在线观看| 国产中文字幕亚洲综合| 成年美女黄网站色大免费视频| 大香伊蕉国产av| 97无码人妻一区二区三区蜜臀| 亚洲中文字幕久久在线| 日本乱偷人妻中文字幕在线| 中文字幕巨乱亚洲|