摘" 要: 大壩監(jiān)測數(shù)據(jù)是判斷大壩運(yùn)行安全的主要依據(jù),為了鑒別數(shù)據(jù)優(yōu)劣并選擇出可信度較高的數(shù)據(jù),文中構(gòu)建一個(gè)大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)框架。針對測點(diǎn)之間的相關(guān)性、監(jiān)測項(xiàng)目及儀器的特點(diǎn),利用Kshape算法找出具有強(qiáng)相關(guān)性的測點(diǎn),再通過相對偏移率、相對平滑率、周期波動(dòng)程度和精度修正率等評(píng)價(jià)因子對大壩監(jiān)測數(shù)據(jù)進(jìn)行評(píng)價(jià);其次,結(jié)合混合蝙蝠算法優(yōu)化后的長短期記憶網(wǎng)絡(luò)對大壩監(jiān)測數(shù)據(jù)進(jìn)行分類,構(gòu)建了大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)算法流程。以新疆某大壩監(jiān)測數(shù)據(jù)為研究對象進(jìn)行試驗(yàn),結(jié)果表明所提出的大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)算法的準(zhǔn)確率為94.33%,可為評(píng)價(jià)大壩監(jiān)測數(shù)據(jù)質(zhì)量提供有效的解決方法。
關(guān)鍵詞: 大壩監(jiān)測數(shù)據(jù); 評(píng)價(jià)因子; 數(shù)據(jù)質(zhì)量評(píng)價(jià); 長短期記憶網(wǎng)絡(luò); 測點(diǎn)聚類; 相關(guān)性分析
中圖分類號(hào): TN919.2?34; TV698.2" " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " " 文章編號(hào): 1004?373X(2025)02?0090?07
Research on evaluation factors and algorithms of dam monitoring data quality
FENG Yuyang1, LI Denghua2, 3, FANG Boya4, DING Yong1
(1. School of Science, Nanjing University of Science and Technology, Nanjing 210094, China; 2. Nanjing Hydraulic Research Institute, Nanjing 210029, China;
3. Key Laboratory of Reservoir Dam Safety, Ministry of Water Resources, Nanjing 210029, China; 4. Huashe Testing Technology Co., Ltd., Nanjing 211100, China)
Abstract: Dam monitoring data is the main basis for judging the safety of dam operation. In order to identify the data quality and select the data with high reliability, a dam monitoring data quality evaluation framework is constructed. According to the correlation between measuring points and the features of monitoring items and instruments, Kshape algorithm is used to find out the measuring points with strong correlation, and then the dam monitoring data is evaluated by means of the evaluation factors such as relative offset rate, relative smoothness rate, periodic fluctuation degree and accuracy correction rate. In combination with the LSTM (long short?term memory network) optimized by hybrid bat algorithm, the dam monitoring data is classified, and the algorithm flow of dam monitoring data quality evaluation is constructed. The test is conducted by taking a dam monitoring data in Xinjiang as the research object. The results show that the accuracy of the proposed dam monitoring data quality evaluation algorithm is 94.33%, which can provide an effective solution for evaluating the quality of dam monitoring data.
Keywords: dam monitoring data; evaluation factor; data quality evaluation; long short?term memory network; measuring point clustering; correlation analysis
0" 引" 言
大壩監(jiān)測數(shù)據(jù)是判斷大壩運(yùn)行安全的主要依據(jù),目前在智能化趨勢下,大壩傳統(tǒng)的數(shù)據(jù)質(zhì)量評(píng)價(jià)方法存在效率低下、受主觀影響的缺點(diǎn),為解決上述問題,國內(nèi)外學(xué)者提出新的解決思路。
文獻(xiàn)[1]對現(xiàn)有的隨機(jī)森林進(jìn)行優(yōu)化,提出了6項(xiàng)評(píng)價(jià)因子及相關(guān)評(píng)價(jià)標(biāo)準(zhǔn)構(gòu)成的安全監(jiān)測歷史數(shù)據(jù)質(zhì)量評(píng)價(jià)方法,建立了基于隨機(jī)森林的大壩安全監(jiān)測歷史數(shù)據(jù)質(zhì)量評(píng)價(jià)算法。文獻(xiàn)[2]提出了一種基于格拉姆角場(GAF)的卷積神經(jīng)網(wǎng)絡(luò)算法,實(shí)現(xiàn)了基于卷積神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)圖像處理,以及對實(shí)時(shí)監(jiān)測結(jié)果的自動(dòng)評(píng)估。文獻(xiàn)[3]基于層次分析法的原理, 結(jié)合德爾菲法及模糊評(píng)價(jià)方法,構(gòu)建了多層次的淺剖質(zhì)量評(píng)價(jià)模型,確定了3個(gè)一級(jí)指標(biāo)和14個(gè)二級(jí)指標(biāo),給出了各指標(biāo)在質(zhì)量評(píng)價(jià)中的定量權(quán)重,定出了4個(gè)質(zhì)量評(píng)價(jià)等級(jí)。文獻(xiàn)[4]提出了一種基于多準(zhǔn)則的原油色譜在線監(jiān)控系統(tǒng)異常特征提取方法,該方法可以有效地區(qū)分由于傳感器、設(shè)備狀態(tài)等引起的數(shù)據(jù)問題,也可以用來判斷數(shù)據(jù)自身是否存在異常,提出了完整性、準(zhǔn)確性、一致性、時(shí)效性和唯一性5項(xiàng)數(shù)據(jù)質(zhì)量評(píng)估指標(biāo)。文獻(xiàn)[5]基于云模型理論,研究了大壩監(jiān)測數(shù)據(jù)的定性評(píng)價(jià)方法,通過使用逆向云生成器的方法將大壩的監(jiān)測數(shù)據(jù)轉(zhuǎn)化成云數(shù)字特征值,通過此方法對大壩監(jiān)測數(shù)據(jù)進(jìn)行定性評(píng)價(jià)并驗(yàn)證了該方法的可行性。文獻(xiàn)[6]引入了CI法和 Irstea法,這兩種方法都是由專家確定的評(píng)價(jià)指標(biāo)得到相應(yīng)的權(quán)重,再由多準(zhǔn)則融合得到綜合評(píng)價(jià)結(jié)果。文獻(xiàn)[7]通過分析礦井電阻率法來監(jiān)測典型數(shù)據(jù)的波形特征和頻譜特征,研究礦井監(jiān)測數(shù)據(jù)中干擾噪聲在時(shí)空域的變化特征,最后利用可量化參數(shù)給出礦井電阻率法監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)措施及流程。
目前,針對數(shù)據(jù)質(zhì)量評(píng)價(jià)的研究主要集中在單測點(diǎn)數(shù)據(jù)質(zhì)量評(píng)價(jià),沒有關(guān)注測點(diǎn)與測點(diǎn)之間的聯(lián)系,以及監(jiān)測項(xiàng)目、儀器和數(shù)據(jù)之間的聯(lián)系。因此找到具有相關(guān)性的測點(diǎn)群,建立監(jiān)測項(xiàng)目到儀器再到數(shù)據(jù)的聯(lián)系對大壩數(shù)據(jù)質(zhì)量評(píng)價(jià)十分重要。為解決上述問題,本文以新疆某大壩監(jiān)測數(shù)據(jù)為研究對象,構(gòu)建了大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)框架,并通過大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)算法解決了目前大壩監(jiān)測數(shù)據(jù)篩選問題。
1" 大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)框架
根據(jù)國內(nèi)外對數(shù)據(jù)質(zhì)量評(píng)價(jià)問題的研究成果和2019年實(shí)施的最新標(biāo)準(zhǔn)GB/T 36344—2018《信息技術(shù) 數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)》[8],本文確立了5個(gè)方面共10個(gè)指標(biāo)的大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)框架,如圖1所示。
大壩安全監(jiān)測儀器采集的大壩監(jiān)測數(shù)據(jù)通常是時(shí)間序列,由兩列組成,奇數(shù)列為時(shí)間,偶數(shù)列為數(shù)值。表1給出了大壩監(jiān)測數(shù)據(jù)樣例,圖2給出了大壩安全監(jiān)測歷史數(shù)據(jù)過程線樣例。
大壩安全監(jiān)測儀器實(shí)際采集中也經(jīng)常會(huì)出現(xiàn)不整齊的時(shí)間序列,大壩監(jiān)測數(shù)據(jù)中可能會(huì)出現(xiàn)缺失某一天數(shù)據(jù)的現(xiàn)象,如表1中缺失2022年5月2日數(shù)據(jù)。用圖1大壩數(shù)據(jù)質(zhì)量評(píng)價(jià)框架中的完整性評(píng)價(jià)此類情況。在大壩監(jiān)測儀器實(shí)際采集中,由于測量時(shí)出現(xiàn)的粗差(顯著誤差)以及監(jiān)測對象安全狀態(tài)發(fā)生改變,而導(dǎo)致監(jiān)測數(shù)據(jù)出現(xiàn)超出正常范圍的現(xiàn)象,被稱為監(jiān)測數(shù)據(jù)異常,如表1中2022年5月3日數(shù)據(jù)明顯離群,用圖1大壩數(shù)據(jù)質(zhì)量評(píng)價(jià)框架中的準(zhǔn)確性評(píng)價(jià)此類情況。大壩監(jiān)測數(shù)據(jù)中出現(xiàn)一天不同時(shí)段記錄多個(gè)數(shù)值的現(xiàn)象,如表1中有兩條2022年5月4日的記錄,用圖1大壩數(shù)據(jù)質(zhì)量評(píng)價(jià)框架中的時(shí)效性評(píng)價(jià)此類情況。在對大壩監(jiān)測數(shù)據(jù)質(zhì)量分析時(shí),發(fā)現(xiàn)其中一些測點(diǎn)的過程線展示出了很明顯的相似性,如圖2中的測點(diǎn)A、B。針對這種現(xiàn)象,通過對與其具有強(qiáng)相關(guān)性的測點(diǎn)進(jìn)行整體分析來評(píng)價(jià)監(jiān)測數(shù)據(jù),用圖1大壩數(shù)據(jù)質(zhì)量評(píng)價(jià)框架中的一致性評(píng)價(jià)此類情況。由于不同監(jiān)測項(xiàng)目下儀器所采集的歷史數(shù)據(jù)過程線具有一定的特點(diǎn),如圖2中的測點(diǎn)D具有明顯的周期性,通過分析檢測項(xiàng)目、儀器展示出的不同特征來對監(jiān)測數(shù)據(jù)進(jìn)行評(píng)價(jià),用圖1大壩數(shù)據(jù)質(zhì)量評(píng)價(jià)框架中的規(guī)范性評(píng)價(jià)此類情況。
2" 數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo)
如圖1所示,本文保留文獻(xiàn)[1]包含的6種評(píng)價(jià)因子,將缺失率、連續(xù)缺失率歸為完整性指標(biāo),異常率、連續(xù)異常率歸為準(zhǔn)確性指標(biāo),時(shí)間異常率、時(shí)間波動(dòng)程度歸為時(shí)效性指標(biāo)。
2.1" 一致性指標(biāo)
一致性反映了數(shù)據(jù)與其他上下文中使用數(shù)據(jù)的無矛盾程度[8]。本文中一致性反映了聚類后具有強(qiáng)相關(guān)測點(diǎn)數(shù)據(jù)之間波動(dòng)的偏差程度。圖3所示為一致性指標(biāo)處理流程。
圖3中測點(diǎn)Ⅰ、測點(diǎn)Ⅱ、測點(diǎn)Ⅲ的過程線具有明顯相似的波動(dòng),但是其過程線的粗糙程度和趨勢存在差異性(測點(diǎn)Ⅱ過程線更加粗糙,測點(diǎn)Ⅲ過程線有向上偏移的趨勢),因此通過對強(qiáng)相關(guān)測點(diǎn)的這種差異性進(jìn)行一致性檢查,可以作為大壩監(jiān)測歷史數(shù)據(jù)評(píng)價(jià)的重要補(bǔ)充。本文將一致性作為結(jié)合多測點(diǎn)數(shù)據(jù)質(zhì)量評(píng)價(jià)的重要指標(biāo),用來評(píng)價(jià)具有強(qiáng)相關(guān)數(shù)據(jù)的差異程度。針對圖3中出現(xiàn)的情況,本文提出了相對偏移率、相對平滑率兩種新的評(píng)價(jià)因子反映數(shù)據(jù)間的一致性。圖4所示為降維前后測點(diǎn)過程線及滾動(dòng)平均值。
本文通過Kshape[9]算法找到具有相關(guān)性的測點(diǎn)數(shù)據(jù),并通過計(jì)算出降維前和降維后數(shù)據(jù)的滾動(dòng)平均值,來計(jì)算測點(diǎn)滾動(dòng)平均值的平均斜率與其參與降維后數(shù)據(jù)滾動(dòng)平均值的平均斜率的比值,得到相對偏移率F7。相對偏移率F7越大,則一致性越差。相對偏移率計(jì)算公式如下:
[F7=mim0-1]" " " " " " "(1)
式中:[mi]為降維前待測時(shí)間序列滾動(dòng)平均值的平均斜率;[m0]為強(qiáng)相關(guān)序列降維后數(shù)據(jù)滾動(dòng)平均值的平均斜率。
從圖4中可以看到降維前測點(diǎn)Ⅰ的數(shù)據(jù)過程線與降維后過程線平滑度的差別,本文提出通過計(jì)算降維前和降維后數(shù)據(jù)粗糙程度的比值得到相對平滑率F8。相對平滑率F8的比值越大,則一致性越差。相對平滑率計(jì)算公式如下:
[F8=i=1Nixii+1-xii2i=1N0x0i+1-x0i2]" " " " " (2)
式中:[xii]為待測時(shí)間序列的第i個(gè)數(shù)據(jù);[x0i]為強(qiáng)相關(guān)序列降維后的第i個(gè)數(shù)據(jù);Ni為待測時(shí)間序列的數(shù)據(jù)總數(shù);N0為降維后時(shí)間序列的數(shù)據(jù)總數(shù)。
2.2" 規(guī)范性指標(biāo)
規(guī)范性是指數(shù)據(jù)符合數(shù)據(jù)標(biāo)準(zhǔn)、數(shù)據(jù)模型的程度[8]。本文中規(guī)范性是針對檢測項(xiàng)目的特征和儀器本身的特點(diǎn)提出來的評(píng)價(jià)指標(biāo)。圖5所示為大壩常見監(jiān)測儀器測值過程線。
規(guī)范性可以用來評(píng)價(jià)監(jiān)測項(xiàng)目—儀器—數(shù)據(jù)之間的相關(guān)程度。從圖5可以看到,不同的大壩監(jiān)測項(xiàng)目,其監(jiān)測數(shù)據(jù)具有各自的特征,其中周期性是大壩監(jiān)測數(shù)據(jù)中常見特征,通常是由于大壩所處的環(huán)境呈現(xiàn)周期性變化下所導(dǎo)致。常見的具有周期性的監(jiān)測儀器有:面板固定式測斜儀(圖中IN1?06)、單向測縫計(jì)(圖中J11)、鋼筋計(jì)(圖中R01),無周期性的監(jiān)測儀器如水平位移計(jì)(圖中EX1?1)。本文提出用周期波動(dòng)程度[F9]反映監(jiān)測歷史數(shù)據(jù)的周期性是否符合監(jiān)測項(xiàng)目的特征。F9=0時(shí),規(guī)范性好;F9=1時(shí),規(guī)范性差。周期波動(dòng)程度F9公式如下:
[F9=0, 周期性一致1, 周期性不一致] (3)
式中當(dāng)測點(diǎn)的安全監(jiān)測歷史數(shù)據(jù)過程線與檢測項(xiàng)目周期性一致時(shí)F9=0,否則F9=1。
圖5中EX1?1水平位移計(jì)采用南瑞電位器式NDW?150 W傳感器,量程為150 mm,精度≤ 0.3%F.S.。水平位移計(jì)接入自動(dòng)化系統(tǒng),自動(dòng)化觀測頻次為1次/天,觀測方法和頻次滿足規(guī)范要求。圖6所示為大壩水平位移計(jì)傳感器圖像。本文提出精度修正率F10來反映儀器本身精度對監(jiān)測歷史數(shù)據(jù)的影響。其中,F(xiàn)10越大,規(guī)范性越差。精度修正率F10公式如下:
[F10=FSMax xi]" " " " " " (4)
式中:[FS]代表監(jiān)測儀器精度;[Maxxi]代表待測序列中數(shù)據(jù)絕對值后的最大值。
2.3" 數(shù)據(jù)質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)
本文將大壩監(jiān)測數(shù)據(jù)劃分為四個(gè)等級(jí),如:儀器監(jiān)測數(shù)據(jù)變化合理且過程線規(guī)律明顯為A級(jí)(可靠),可排除儀器問題;儀器監(jiān)測數(shù)據(jù)變化較為合理且過程線具有一定規(guī)律為B級(jí)(基本可靠),可以對數(shù)據(jù)進(jìn)行處理;儀器監(jiān)測數(shù)據(jù)變化不合理且過程線無明顯規(guī)律為C級(jí)(不可靠),難以對數(shù)據(jù)進(jìn)行處理;儀器監(jiān)測數(shù)據(jù)無測值或測值明顯異常為D級(jí)(損壞)[10?12]。
3" 混合蝙蝠算法優(yōu)化循環(huán)神經(jīng)網(wǎng)絡(luò)分類模型
長短期記憶(LSTM)網(wǎng)絡(luò)是為解決循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)存在的長期依賴問題而專門設(shè)計(jì)的一種時(shí)間循環(huán)神經(jīng)網(wǎng)絡(luò)?;旌向鹚惴ㄊ轻槍掘鹚惴ù嬖谑諗克俣嚷⒁紫萑刖植孔顑?yōu)、求解精度低等缺陷進(jìn)行的改進(jìn),主要用于求解無約束優(yōu)化問題。圖7給出了長短期記憶網(wǎng)絡(luò)示意圖。
基于多測點(diǎn)聚類的大壩安全監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)算法的具體流程如圖8所示。
大壩安全監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)算法的步驟如下。
1) 依據(jù)Kshape[9]算法對大壩監(jiān)測數(shù)據(jù)集進(jìn)行聚類,得到具有強(qiáng)相關(guān)性的測點(diǎn)數(shù)據(jù)集。
2) 對聚類后的安全監(jiān)測數(shù)據(jù)集進(jìn)行預(yù)處理,依據(jù)第2節(jié)中10項(xiàng)評(píng)價(jià)因子,計(jì)算出安全監(jiān)測數(shù)據(jù)評(píng)價(jià)因子集并與其數(shù)據(jù)質(zhì)量等級(jí)對應(yīng)。
3) 將安全監(jiān)測數(shù)據(jù)評(píng)價(jià)因子集與數(shù)據(jù)質(zhì)量等級(jí)輸入到LSTM模型,利用混合蝙蝠算法進(jìn)行參數(shù)尋優(yōu),建立安全監(jiān)測數(shù)據(jù)評(píng)價(jià)因子集與大壩安全監(jiān)測歷史數(shù)據(jù)質(zhì)量等級(jí)的對應(yīng)關(guān)系。
4) 輸入待測數(shù)據(jù),使用LSTM模型對其進(jìn)行分類評(píng)價(jià),輸出待測數(shù)據(jù)的質(zhì)量等級(jí)。
4" 工程實(shí)例
為了驗(yàn)證多測點(diǎn)大壩安全監(jiān)測歷史數(shù)據(jù)質(zhì)量評(píng)價(jià)方法的實(shí)用性,本次試驗(yàn)采用新疆某面板堆石壩2015?12?08—2020?12?08的安全監(jiān)測歷史數(shù)據(jù)作為試驗(yàn)樣本數(shù)據(jù),混凝土面板砂礫石堆石壩壩高為110 m(覆蓋層深46 m),壩頂高程為1 654.00 m,壩頂長為352 m,壩底最大寬度約為400 m。該試驗(yàn)樣本數(shù)據(jù)共247個(gè),其中包括40支面板固定式測斜儀、40支水管式沉降儀、31支水平位移計(jì)、69支三向測縫計(jì)、52支鋼筋計(jì)、10支溫度計(jì)、5支無應(yīng)力計(jì),數(shù)據(jù)類型主要為變形監(jiān)測數(shù)據(jù)、滲壓監(jiān)測數(shù)據(jù)和應(yīng)力監(jiān)測數(shù)據(jù)。試驗(yàn)將數(shù)據(jù)以8∶2的比例隨機(jī)劃分為訓(xùn)練集與試驗(yàn)集。
4.1" 評(píng)價(jià)因子計(jì)算
首先用Kshape[9]算法對大壩安全監(jiān)測歷史數(shù)據(jù)進(jìn)行聚類,得到具有強(qiáng)相關(guān)性的大壩安全監(jiān)測歷史數(shù)據(jù)集。以鋼筋計(jì)為例,通過Kshape[9]算法將52支鋼筋計(jì)劃分為8類(其中5支鋼筋計(jì)無測值不參與聚類,評(píng)級(jí)為D)。表2給出了大壩監(jiān)測數(shù)據(jù)集聚類區(qū)域樣例,圖9給出了區(qū)域Ⅵ的大壩監(jiān)測數(shù)據(jù)過程線。
根據(jù)聚類后大壩安全監(jiān)測歷史數(shù)據(jù)集計(jì)算出大壩安全監(jiān)測歷史數(shù)據(jù)評(píng)價(jià)因子。其中:[F1]代表缺失率;[F2]代表連續(xù)缺失率;[F3]代表異常率;[F4]代表連續(xù)異常率;[F5]代表時(shí)間異常率;[F6]代表時(shí)間波動(dòng)程度[1]。表3給出了大壩歷史數(shù)據(jù)評(píng)價(jià)因子集樣例。
4.2" 評(píng)價(jià)因子相關(guān)性分析
繪制Pearson相關(guān)性分析熱力圖,對10個(gè)評(píng)價(jià)因子進(jìn)行相關(guān)性分析,可以直觀地顯示每個(gè)特征因子之間的相關(guān)性。相關(guān)性分析熱力圖中數(shù)值越大則相關(guān)性越強(qiáng),正值為正相關(guān),負(fù)值為負(fù)相關(guān)。圖10給出了評(píng)價(jià)因子相關(guān)性分析熱力圖。其中:[F1]~[F6]同表3;[F7]為相對偏移率;[F8]為相對平滑率;[F9]為周期波動(dòng)程度;[F10]為精度修正率。
由圖10可知:[F1]、[F2]相關(guān)性結(jié)果為0.88,具有較強(qiáng)的相關(guān)性;[F3]、[F4]相關(guān)性結(jié)果為0.88,具有較強(qiáng)的相關(guān)性;[F5]、[F6]相關(guān)性結(jié)果為0.92,具有較強(qiáng)的相關(guān)性;[F7]~[F10]之間無明顯相關(guān)性。故本文制定的大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)框架能很好地反映出評(píng)價(jià)指標(biāo)與評(píng)價(jià)因子之間的關(guān)聯(lián)。
4.3" 評(píng)價(jià)結(jié)果
通過混合蝙蝠優(yōu)化算法尋找到最優(yōu)參數(shù),在units=188、Epochs=130時(shí)得到最優(yōu)參數(shù)模型。圖11為最優(yōu)參數(shù)模型訓(xùn)練集、測試集的損失和準(zhǔn)確率曲線。
圖12為大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)結(jié)果。其中:A代表可靠;B代表較可靠;C代表不可靠;D代表損失。表4為模型評(píng)價(jià)指標(biāo)及結(jié)果。
圖12中,對50個(gè)測點(diǎn)監(jiān)測歷史數(shù)據(jù)進(jìn)行質(zhì)量評(píng)價(jià),其中:實(shí)際評(píng)價(jià)結(jié)果為A(可靠)而不為A的數(shù)量為0個(gè);實(shí)際評(píng)價(jià)結(jié)果為B(較可靠)而不為B的數(shù)量為2個(gè);實(shí)際評(píng)價(jià)結(jié)果為C(不可靠)而不為C的數(shù)量為1個(gè);實(shí)際評(píng)價(jià)為D(損壞)而不為D的為0個(gè)。由表4可知,測試數(shù)據(jù)分類的準(zhǔn)確率穩(wěn)定在94.33%,查準(zhǔn)率為95.24%,查全率為90.91%,F(xiàn)1為93.02%。優(yōu)化后的LSTM分類模型在最優(yōu)參數(shù)下表現(xiàn)出了很高的性能,準(zhǔn)確率、查準(zhǔn)率、召回率和F1都超過了90%,這說明該模型在執(zhí)行大壩安全監(jiān)測歷史數(shù)據(jù)質(zhì)量評(píng)價(jià)分類任務(wù)上具有很好的泛化能力。
5" 結(jié)" 論
本文考慮到具有強(qiáng)相關(guān)性測點(diǎn)的大壩安全監(jiān)測歷史數(shù)據(jù)之間的關(guān)聯(lián),結(jié)合檢測項(xiàng)目、儀器、數(shù)據(jù)之間的內(nèi)在聯(lián)系,確立了完整性、準(zhǔn)確性、時(shí)效性、一致性、規(guī)范性5項(xiàng)指標(biāo)共10個(gè)評(píng)價(jià)因子的大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)框架;其次通過Kshape算法和混合蝙蝠算法優(yōu)化LSTM模型來構(gòu)建大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)算法流程。實(shí)驗(yàn)結(jié)果表明,本文算法測試數(shù)據(jù)分類準(zhǔn)確率穩(wěn)定在94.33%。說明該方法能夠適用于大壩監(jiān)測自動(dòng)化、智能化、不間斷數(shù)據(jù)采集的特點(diǎn),對大壩安全監(jiān)測歷史數(shù)據(jù)的質(zhì)量評(píng)價(jià)具有重要意義。
參考文獻(xiàn)
[1] 潘宇,李登華,丁勇.基于改進(jìn)隨機(jī)森林的大壩監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)算法[J].人民長江,2024,55(2):231?237.
[2] DENG Y, JU H, ZHONG G, et al. A general data quality evaluation framework for dynamic response monitoring of long?span bridges [J]. Mechanical systems and signal processing, 2023, 200: 110514.
[3] 孔敏,王風(fēng)帆,耿姍姍,等.模糊層次分析法在淺剖數(shù)據(jù)質(zhì)量評(píng)價(jià)中的應(yīng)用[J].海洋科學(xué),2023,47(10):65?75.
[4] 劉文君,賀馨儀,王彬,等.基于異常檢測集成算法的油色譜在線監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)體系[J].電網(wǎng)與清潔能源,2022,38(8):16?23.
[5] WANG T J, YANG B, YANG H Y. Dam deformation monitoring and data analysis based on cloud model [J]. AMR, 2012, 459: 479?482.
[6] CURT C, GERVAIS R. Approach to improving the quality of data used to analyze dams?Illustrations by two methods [J]. European Journal of environmental and civil engineering, 2018: 1: 87?105.
[7] 崔偉雄,袁博.礦井電阻率法監(jiān)測數(shù)據(jù)質(zhì)量評(píng)價(jià)方法探討[J].煤田地質(zhì)與勘探,2023,51(4):143?151.
[8] 國家標(biāo)準(zhǔn)化管理委員會(huì).信息技術(shù)數(shù)據(jù)質(zhì)量評(píng)價(jià)指標(biāo):GB T36344—2018[S].北京:中國標(biāo)準(zhǔn)出版社,2018.
[9] PAPARRIZOS J, GRAVANO L. K?shape: efficient and accurate clustering of time series [C]// Proceedings of the 2015 ACM SIGMOD International Conference on Management of Data. Melbourne, Australia: ACM, 2015: 1855?1870.
[10] 電力行業(yè)大壩安全監(jiān)測標(biāo)準(zhǔn)化技術(shù)委員會(huì).差動(dòng)電阻式監(jiān)測儀器鑒定技術(shù)規(guī)程:DL/T 1254—2013[S].北京:中國電力出版社,2013.
[11] 中華人民共和國水利部.土石壩安全監(jiān)測技術(shù)規(guī)范:SL 551—2012[S].北京:中國水利水電出版社,2012.
[12] 國家能源局.鋼弦式監(jiān)測儀器鑒定技術(shù)規(guī)程:DL/T 1271—2013[S].北京:中國電力出版社,2013.
[13] 李正欣,郭建勝,毛紅保,等.多元時(shí)間序列相似性度量方法[J].控制與決策,2017,32(2):368?372.
[14] ZHOU F, TORRE F D L, HODGINS J K. Hierarchical aligned cluster analysis for temporal clustering of human motion [J]. IEEE transactions on pattern analysis and machine intelligence, 2012, 35(3): 582?596.
[15] 張鵬,黃長強(qiáng),魏政磊,等.基于L?Kshape?HACA的空戰(zhàn)態(tài)勢分割聚類[J].空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,22(3):15?22.
[16] 中國人民共和國國家發(fā)展和改革委員會(huì).大壩安全監(jiān)測自動(dòng)化技術(shù)規(guī)范:DLT 5211—2005[S].北京:中國電力出版社,2005.
[17] HOCHREITER S, SCHMIDHUBER J. Long short?term me?mory [J]. Neural computation, 1997, 9(8): 1735?1780.
[18] 曾衍偉,龔健雅.空間數(shù)據(jù)質(zhì)量控制與評(píng)價(jià)方法及實(shí)現(xiàn)技術(shù)[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2004(8):686?690.
[19] 劉桂鋒,聶云貝,劉瓊.數(shù)據(jù)質(zhì)量評(píng)價(jià)對象、體系、方法與技術(shù)研究進(jìn)展[J].情報(bào)科學(xué),2021,39(11):13?20.