亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機(jī)器學(xué)習(xí)的硬盤故障預(yù)測(cè)研究

        2022-06-29 12:37:28喬旭坤茅智慧
        關(guān)鍵詞:故障模型

        喬旭坤,李 順,李 君,吳 鑫,茅智慧

        (浙江萬里學(xué)院,浙江 寧波 315100)

        0 引 言

        隨著云計(jì)算和大數(shù)據(jù)時(shí)代的來臨,數(shù)據(jù)量劇增,存儲(chǔ)系統(tǒng)的重要性更為凸顯。磁盤是云存儲(chǔ)和數(shù)據(jù)中心等存儲(chǔ)系統(tǒng)的核心,超過90%的數(shù)據(jù)存儲(chǔ)在磁盤,磁盤故障是最頻繁出現(xiàn)(約占80%[1]),也是最為嚴(yán)重的硬件故障[2]。雖然單個(gè)磁盤故障發(fā)生概率較低,但對(duì)于磁盤基數(shù)大的存儲(chǔ)系統(tǒng)則帶來很大影響。騰訊公司報(bào)告磁盤月故障率約為0.21%,超過5年服務(wù)期的磁盤月故障率達(dá)到0.7%;Google數(shù)據(jù)中心4~6年期的數(shù)據(jù)統(tǒng)計(jì)表明有20%~57%的磁盤至少有一個(gè)扇區(qū)損壞[3]。磁盤故障不僅造成其上運(yùn)行的業(yè)務(wù)中斷從而降低用戶滿意度,而且存儲(chǔ)在磁盤上的大量數(shù)據(jù)將隨著磁盤損壞而永久丟失,給企業(yè)和個(gè)人帶來不可估量的損失,阻礙了大數(shù)據(jù)、云計(jì)算技術(shù)的廣泛推廣和應(yīng)用。若能對(duì)磁盤故障和磁盤壽命進(jìn)行有效及時(shí)的預(yù)測(cè),適時(shí)做好磁盤的更換或者維護(hù),將會(huì)在保障數(shù)據(jù)安全、防止數(shù)據(jù)丟失、挽救重大數(shù)據(jù)損失帶來的負(fù)面效應(yīng)以及降低數(shù)據(jù)中心等存儲(chǔ)系統(tǒng)運(yùn)營(yíng)成本等方面起到積極的作用。因此,磁盤故障預(yù)測(cè)具有非常重要的應(yīng)用價(jià)值和理論研究?jī)r(jià)值,成為存儲(chǔ)系統(tǒng)的研究熱點(diǎn)。

        目前檢測(cè)磁盤的健康狀態(tài)主要有三種方法。一是利用加速度傳感器和聲發(fā)射傳感器等外部傳感器來監(jiān)測(cè)磁盤運(yùn)行中振動(dòng)信號(hào)的演變[4],但把傳感器安在磁盤外部無法有效得到磁盤退化信息,而安裝在內(nèi)部則會(huì)破壞磁盤結(jié)構(gòu)并增加物理尺寸。二是利用存儲(chǔ)系統(tǒng)的日志文件,由存儲(chǔ)系統(tǒng)中軟硬件的錯(cuò)誤事件來判定磁盤健康狀態(tài),但由于缺乏閉環(huán)監(jiān)測(cè)無法提供磁盤性能的全面信息[5]。三是利用SMART(self-monitoring,analysis and reporting technology,自檢測(cè)、分析和報(bào)告技術(shù))提供的磁盤特征參數(shù),如磁盤加載/卸載周期數(shù)、磁盤啟動(dòng)平均時(shí)間、磁頭尋道出錯(cuò)率等,通過閾值檢測(cè)法實(shí)現(xiàn)無損的磁盤健康狀態(tài)監(jiān)測(cè),并當(dāng)任意一個(gè)屬性值超過預(yù)設(shè)閾值時(shí)發(fā)出警報(bào)。該方法是目前磁盤廠商普遍采用的磁盤故障預(yù)測(cè)方法。但SMART閾值檢測(cè)法僅能實(shí)現(xiàn)簡(jiǎn)單的磁盤故障評(píng)測(cè),在達(dá)到0.1%誤判率FAR(false alarm rate,好盤被誤報(bào)為壞盤的比例)時(shí),其故障檢測(cè)率FDR(failure detection rate,故障磁盤中被準(zhǔn)確檢出的比例)只有3%~10%[6],無法滿足用戶實(shí)際需求。

        1 相關(guān)工作

        統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)的方法廣泛應(yīng)用在磁盤SMART數(shù)據(jù)集上進(jìn)行故障預(yù)測(cè)。Hughes等[7]最早提出兩種統(tǒng)計(jì)方法以提高預(yù)測(cè)性能,在嚴(yán)重不均衡的數(shù)據(jù)集上取得60%的FDR和0.5%的FAR。Wang Yu等[8]基于異常檢測(cè)提出了一種基于滑動(dòng)窗口的廣義似然比檢驗(yàn)方法跟蹤磁盤異常,在均衡的小數(shù)據(jù)集上達(dá)到68%的FDR。除了統(tǒng)計(jì)方法,機(jī)器學(xué)習(xí)方法也大量應(yīng)用到磁盤故障預(yù)測(cè)中。Murray等[6]比較了多種機(jī)器學(xué)習(xí)方法,其中支持向量機(jī)(support vector machine,SVM)在FAR為零時(shí)獲得50.6%的FDR,相對(duì)于樸素貝葉斯等算法具有較好的預(yù)測(cè)性能。樹型樸素貝葉斯算法TAN[9]和隱馬爾可夫模型[10]被相繼提出以進(jìn)一步提升FDR。早期的故障預(yù)測(cè)方法總體上預(yù)測(cè)精度不高。

        隨著機(jī)器學(xué)習(xí)技術(shù)的引入,磁盤故障預(yù)測(cè)準(zhǔn)確性持續(xù)提升。Zhu Bingpeng等[11]采用反向傳播神經(jīng)網(wǎng)絡(luò)與改進(jìn)SVM,取得了0.03%的故障誤報(bào)率和高達(dá)95%的故障檢測(cè)率,并且可提前15天預(yù)測(cè)出硬盤故障。Nicolas Aussel等[12]采用梯度提升決策樹算法模型,達(dá)到了94%的準(zhǔn)確度和67%的召回率,該方法誤報(bào)少,但是漏報(bào)占比大,而故障磁盤的漏報(bào)會(huì)帶來嚴(yán)重的后果。Yang Wenjun等[13]采用邏輯回歸(logistic regression,LR)算法建立硬盤故障預(yù)測(cè)模型,獲得0.3%的FAR和97.82%的FDR。Shen Jing等[14]在硬盤SMART數(shù)據(jù)上建立隨機(jī)森林(random forest,RF)算法模型,取得了97.67%的FDR和 0.017%的FAR。上述研究大部分都能在較低的誤報(bào)率前提下達(dá)到較好的磁盤故障檢測(cè)率,在檢測(cè)精度上有很大的進(jìn)步,極大地提高了存儲(chǔ)系統(tǒng)的可靠性和可用性。國(guó)內(nèi)研究人員段茹[15]和謝偉睿[16]在磁盤故障預(yù)測(cè)方面也進(jìn)行了積極的探索和研究。

        為了對(duì)不同算法模型預(yù)測(cè)效果有統(tǒng)一的比較,該文搭建了基于機(jī)器學(xué)習(xí)的硬盤預(yù)測(cè)實(shí)驗(yàn)平臺(tái),并采用常用算法模型進(jìn)行比較,這些算法模型都是基于機(jī)器學(xué)習(xí)Scikit-learn框架,均在Anaconda上運(yùn)行,使用相同的數(shù)據(jù)集和性能評(píng)估指標(biāo)。

        2 實(shí)驗(yàn)數(shù)據(jù)集

        實(shí)驗(yàn)采用公開數(shù)據(jù)集S.M.A.R.T.dataset,是希捷(Seagate)公司制造的型號(hào)為ST31000524NS的硬盤(記為B1數(shù)據(jù)集)。B1數(shù)據(jù)集包括23 395塊硬盤,其中22 962塊健康盤和433塊故障盤。健康盤數(shù)是故障盤的50多倍。每隔一小時(shí)采集一次,健康盤采集時(shí)長(zhǎng)為一周,故障盤采集時(shí)長(zhǎng)為20天,得到健康盤3 857 616條樣本數(shù),故障盤156 312條樣本數(shù)。從B1中抽出一份較小的數(shù)據(jù)集(記為B2數(shù)據(jù)集)以此來對(duì)比模型在不同數(shù)量級(jí)別樣本下的性能,B2數(shù)據(jù)共包含5 750塊硬盤,其中包括433塊故障盤和5 317塊健康盤,健康盤是故障盤的12倍多。故障盤有156 312條樣本,健康盤有892 264條樣本。數(shù)據(jù)集在公開的時(shí)候就已經(jīng)清洗、處理過,健康盤被標(biāo)記為“+1”,故障盤被標(biāo)記為“-1”,所有的屬性值經(jīng)過歸一化映射到區(qū)間[-1,+1]上。該文選取了11個(gè)特征屬性,加_raw標(biāo)記的特征為屬性的原始值,如表1所示。由于SMART技術(shù)提供的數(shù)據(jù)屬性值值域范圍大,采用公式(1)進(jìn)行數(shù)據(jù)集歸一化,以避免偏向具有較大參數(shù)值的特征而影響預(yù)測(cè)精度:

        (1)

        其中,X是歸一化后的值,x是屬性的當(dāng)前值,xmax和xmin分別是數(shù)據(jù)集所對(duì)應(yīng)特征屬性的最大值和最小值。

        把處理好的數(shù)據(jù)集按7∶3的比例隨機(jī)劃分為訓(xùn)練集和測(cè)試集。訓(xùn)練集和測(cè)試集是互斥的,測(cè)試集的樣本在訓(xùn)練集上未出現(xiàn)過。在訓(xùn)練集上訓(xùn)練出多種預(yù)測(cè)模型,用測(cè)試集作為新樣本來測(cè)試已經(jīng)訓(xùn)練好的預(yù)測(cè)模型。

        表1 數(shù)據(jù)集對(duì)應(yīng)的屬性值

        3 硬盤故障預(yù)測(cè)模型

        該硬盤故障預(yù)測(cè)模型都是基于機(jī)器學(xué)習(xí)算法,包括隨機(jī)森林(random forest,RF)、邏輯回歸(logistic regression,LR)、多層感知神經(jīng)網(wǎng)絡(luò)(multilayer perceptron - artificial neutral network,MLP-ANN)、決策樹(decision tree,DT)、樸素貝葉斯(naive Bayes,NB)、極端梯度提升樹(extreme gradient boosting,XGBoost)、梯度提升決策樹(gradient boosting decision tree,GBDT)以及AdaBoost算法。其中集成學(xué)習(xí)算法XGBoost、GBDT以及AdaBoost均采用CART(classification and regression tree)作為基學(xué)習(xí)器來建立模型,CART學(xué)習(xí)器屬于弱學(xué)習(xí)器,這三種集成學(xué)習(xí)算法分別對(duì)CART進(jìn)行集成,集成后的模型在文中稱為XGBoost模型、GBDT模型和AdaBoost模型。

        4 實(shí)驗(yàn)結(jié)果與分析

        4.1 實(shí)驗(yàn)環(huán)境

        實(shí)驗(yàn)平臺(tái)采用Windows7系統(tǒng),12 GB的RAM內(nèi)存,Intel(R)core(TM)i3-4160CPU@3.60 GHz的處理器。編程環(huán)境為Anaconda Navigator(spyder version 3.0.0)version 4.2.0,編程語言為Python語言,基于機(jī)器學(xué)習(xí)框架Scikit-learn version 0.19.0。

        4.2 模型參數(shù)的設(shè)置

        實(shí)驗(yàn)中random_state均設(shè)為12,以便于后續(xù)驗(yàn)證實(shí)驗(yàn)結(jié)果,對(duì)于其他參數(shù)是采用經(jīng)驗(yàn)調(diào)參的方式。同一個(gè)參數(shù)在不同算法模型中設(shè)置的不一定相同,如學(xué)習(xí)率在XGBoost模型中設(shè)置為0.01,而在AdaBoost模型中設(shè)為0.1。在GBDT模型和AdaBoost模型中n_estimators都設(shè)置為了200。具體的模型調(diào)參流程如圖1所示。

        圖1 模型調(diào)參流程

        4.3 模型性能評(píng)估指標(biāo)

        為了進(jìn)行合理的實(shí)驗(yàn)結(jié)果對(duì)比,該文選擇統(tǒng)一的模型性能度量指標(biāo)即查準(zhǔn)率(precision)、查全率(recall)、故障檢測(cè)率(failure detection rate,F(xiàn)DR)、故障誤報(bào)率(false alarm rate,F(xiàn)AR)和ROC曲線(receiver operating characteristic curve)。

        查準(zhǔn)率(precision)也叫準(zhǔn)確率,簡(jiǎn)稱P,表示預(yù)測(cè)出的健康盤(故障盤)中實(shí)際為健康盤(故障盤)占所用測(cè)試健康盤(故障盤)的比例,具體定義見公式(2):

        (2)

        其中,真正例(true,positive,TP)表示真實(shí)為健康盤(故障盤)預(yù)測(cè)也為健康盤(故障盤),假正例(false,positive,F(xiàn)P)表示真實(shí)為健康盤(故障盤)預(yù)測(cè)為故障盤(健康盤)。

        查全率(recall)也叫召回率,簡(jiǎn)稱R,具體定義見公式(3):

        (3)

        其中,假反例(false,negative,F(xiàn)N)表示實(shí)際故障盤(健康盤)預(yù)測(cè)為健康盤(故障盤)。

        故障檢測(cè)率(FDR)為故障盤的召回率,表示成功預(yù)測(cè)的故障盤占所用測(cè)試故障盤總數(shù)的比例。

        故障誤報(bào)率(FAR)是把健康盤預(yù)測(cè)為故障盤的比例,如公式(4)所示:

        (4)

        其中,真反例(true,negative,TN)表示真實(shí)為健康盤預(yù)測(cè)仍為健康盤。

        4.4 實(shí)驗(yàn)結(jié)果分析

        在樣本數(shù)較少的B2數(shù)據(jù)集上,各種算法模型的預(yù)測(cè)結(jié)果如表2所示,其中“+1”表示健康盤,“-1”表示故障盤。

        表2 在B2數(shù)據(jù)下各種算法模型預(yù)測(cè)結(jié)果

        P和R是precision和recall的簡(jiǎn)稱,(-1)R和FDR相同,只是保留小數(shù)位不同。為了更直觀地對(duì)比預(yù)測(cè)效果,把上述各算法模型的預(yù)測(cè)結(jié)果以條形圖的形式呈現(xiàn)出來,如圖2和圖3所示。故障盤的查準(zhǔn)率和召回率如圖4所示。值得一提的是在P、R條形圖中,隨機(jī)森林算法模型的P、R指標(biāo)趨于“1”,但并沒有達(dá)到“1”。上述各算法模型的ROC曲線如圖5所示,可見在2%的誤報(bào)率情況下,所有算法模型的故障檢測(cè)率都達(dá)到了80%以上。

        圖2 在B2數(shù)據(jù)下各種算法模型的FDR

        圖3 在B2數(shù)據(jù)下各種算法模型的FAR

        圖4 在B2數(shù)據(jù)下故障盤P和R

        圖5 在B2數(shù)據(jù)下各種算法模型的ROC曲線

        從上述結(jié)果可以看出,在數(shù)據(jù)集較小的情況下,RF算法模型預(yù)測(cè)精度最高,GBDT模型次之,DT模型預(yù)測(cè)效果略好于XGBoost模型,而XGBoost模型優(yōu)于AdaBoost模型,AdaBoost模型好于MLP-ANN模型。雖然MLP-ANN模型故障檢測(cè)率高于AdaBoost模型,但是故障誤報(bào)率也高很多,AdaBoost模型要優(yōu)于LR算法模型。NB算法模型故障檢測(cè)率最低,故障誤報(bào)率最高,是最差的算法模型。

        各模型性能差異的原因主要是:RF算法是在集成學(xué)習(xí)算法Bagging基礎(chǔ)上的改進(jìn),Bagging算法是一種集成式并行運(yùn)算算法,RF算法從所有屬性中隨機(jī)選擇m個(gè)屬性,選擇最佳分割屬性作為節(jié)點(diǎn)建立決策樹,從而有很好的分類性能。GBDT和AdaBoost算法是Boosting族的代表算法,AdaBoost算法在上一個(gè)基學(xué)習(xí)器的基礎(chǔ)上來學(xué)習(xí)優(yōu)化下一個(gè)基學(xué)習(xí)器的參數(shù),然后對(duì)這n個(gè)基學(xué)習(xí)器進(jìn)行串行加權(quán)求和。GBDT算法集成了多棵CART回歸樹作為基學(xué)習(xí)器,隨著訓(xùn)練的輪數(shù)更新殘差并使殘差減少,從而提高預(yù)測(cè)的精度。XGBoost算法是對(duì)GBDT算法的改進(jìn),具有很好的預(yù)測(cè)性能。集成算法模型GBDT的預(yù)測(cè)效果優(yōu)于DT模型,而DT模型的預(yù)測(cè)結(jié)果要略好于XGBoost和Adaboost模型,這說明在某些條件下集成模型不一定比單個(gè)學(xué)習(xí)器預(yù)測(cè)效果好。DT算法利用樹狀結(jié)構(gòu)將整個(gè)特征空間進(jìn)行劃分,最終判斷出樣本類別,雖然原理簡(jiǎn)單,但預(yù)測(cè)精度高。MLP-ANN算法是一種簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò),可以根據(jù)分類問題的難易程度添加隱含層數(shù)以及神經(jīng)元的個(gè)數(shù),也取得了較好的結(jié)果。LR模型是線性分類器,非線性表達(dá)能力不足,實(shí)驗(yàn)效果相對(duì)比較差。NB算法假設(shè)屬性之間相互獨(dú)立,但是該文的特征屬性之間具有一定的相關(guān)性,所以NB算法模型的預(yù)測(cè)效果不佳。

        表3 在B1數(shù)據(jù)下各種算法模型預(yù)測(cè)結(jié)果

        圖6 在B1和B2數(shù)據(jù)下的FDR

        圖7 在B1和B2數(shù)據(jù)下的FAR

        由圖6和圖7可見,各種算法模型在B1數(shù)據(jù)集和B2數(shù)據(jù)集上的預(yù)測(cè)結(jié)果走勢(shì)一致。特別地,RF和GBDT具有很高的FDR和很低的FAR,且?guī)缀醪皇軜颖緮?shù)據(jù)集大小影響。XGB算法的FAR雖然在B1和B2數(shù)據(jù)集的變化非常小,但是FDR變化較大。其他的算法模型預(yù)測(cè)結(jié)果FDR和FAR變化較大,說明模型對(duì)樣本集規(guī)模適應(yīng)性較弱。

        結(jié)合RF和GBDT的特點(diǎn)可知以樹為基學(xué)習(xí)器的集成算法對(duì)數(shù)據(jù)的抗噪能力很強(qiáng),然而以樹為基學(xué)習(xí)器并不是唯一決定因素,如XGBoost和Adaboost算法對(duì)數(shù)據(jù)適應(yīng)能力并不強(qiáng),這也與算法其他因素相關(guān),如RF是以Bagging方式集成了決策樹的算法,而GBDT是以Boosting方式集成了回歸樹的算法,同時(shí)從上述在B2數(shù)據(jù)集的分析結(jié)果可知每個(gè)算法的運(yùn)行原理不同,這也在一定程度上影響了算法對(duì)不同數(shù)據(jù)集的泛化能力。

        5 結(jié)束語

        通過建立比較系統(tǒng),對(duì)八種算法模型的預(yù)測(cè)效果對(duì)比可知:RF和GBDT硬盤故障預(yù)測(cè)模型相比其他算法模型具有很好的預(yù)測(cè)效果,都能在0.05%的FAR下達(dá)到93%以上的FDR,另外這兩個(gè)算法模型對(duì)不同規(guī)模樣本數(shù)據(jù)集的適應(yīng)性也很強(qiáng)。由于實(shí)驗(yàn)只是針對(duì)同一公司的同一種型號(hào)硬盤進(jìn)行測(cè)試,硬盤故障預(yù)測(cè)模型對(duì)于其他不同硬盤廠商的不同型號(hào)硬盤的預(yù)測(cè)效果尚不確定,下一步工作將會(huì)致力于研究預(yù)測(cè)精度高且具有更強(qiáng)泛化能力的硬盤故障預(yù)測(cè)模型。

        猜你喜歡
        故障模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        故障一點(diǎn)通
        3D打印中的模型分割與打包
        奔馳R320車ABS、ESP故障燈異常點(diǎn)亮
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        故障一點(diǎn)通
        故障一點(diǎn)通
        故障一點(diǎn)通
        一区二区三区国产免费视频 | 一区二区三区在线日本视频| 精品国产一区二区三区av| 中文字幕在线精品视频入口一区| 国偷自产av一区二区三区| 永久免费毛片在线播放| 亚洲成人一区二区av| 后入到高潮免费观看| 欧美午夜精品久久久久久浪潮| 成人综合亚洲欧美一区h| 日本一区二区三区丰满熟女 | 欧美 丝袜 自拍 制服 另类| 永久无码在线观看| 久久精品国产白丝爆白浆| 人妻少妇中文字幕在线| 最近中文字幕视频完整版在线看| 97人妻视频妓女网| 激情视频在线播放一区二区三区| 亚洲中文字幕午夜精品| 九九99久久精品国产| 不卡国产视频| 亚洲av本道一本二本三区| 国产精品无码人妻在线| 97无码人妻福利免费公开在线视频| 亚洲色四在线视频观看| 不卡一区二区三区国产| 色综合色狠狠天天综合色| 另类亚洲欧美精品久久不卡| 亚洲av一二三四又爽又色又色| 久久99精品久久久久麻豆| 18禁裸男晨勃露j毛免费观看| 亚洲h电影| 国产一区二区三区男人吃奶| 精品人妻少妇嫩草av无码专区| 亚洲精品你懂的在线观看| 亚洲国产精品美女久久久| 人妖一区二区三区四区 | 国产女主播福利一区在线观看| 色婷婷色丁香久久婷婷| 黑人大荫道bbwbbb高潮潮喷| 在线观看精品国产福利片87|