賴龍偉,冷用斌,閻映炳,陳之初
(中國科學院 上海應用物理研究所,上海 201800)
?
上海光源全局束流診斷數(shù)據倉庫開發(fā)
賴龍偉,冷用斌*,閻映炳,陳之初
(中國科學院 上海應用物理研究所,上海 201800)
上海光源已建成的束流診斷系統(tǒng)可滿足光源的日常運行和機器研究需要。但由于缺少有效的事件觸發(fā)處理機制,無法保存并分析運行期間突發(fā)的全局軌道擾動、BPM故障和DCCT噪聲等異?,F(xiàn)象。為解決以上問題,本文在現(xiàn)有束測系統(tǒng)的基礎上開發(fā)了基于Soft IOC的全局束流診斷數(shù)據倉庫。數(shù)據倉庫通過在線監(jiān)測加速器和束測系統(tǒng)的運行狀況,在發(fā)現(xiàn)異?,F(xiàn)象時及時發(fā)出觸發(fā)信號并存儲相關數(shù)據進行分析。運行結果表明,數(shù)據倉庫能有效檢測加速器和束測系統(tǒng)異常,并可用于生成束測設備置信度指標,為進一步優(yōu)化束測系統(tǒng)和提高光源運行性能提供有效依據。
上海光源;數(shù)據倉庫;束流診斷;異常檢測
上海光源束測系統(tǒng)包含200多個測量設備,包括束流位置測量、流強測量、束斑尺寸測量、填充模式測量、束團長度測量等,可提供機器運行和加速器物理研究所需的束流和機器參數(shù)[1]。束測系統(tǒng)每秒在線發(fā)布超過2萬個變量參數(shù),數(shù)百個包含兩千點的波形記錄。如此大量的數(shù)據包含巨大的潛在價值,若能對其進行有效處理并加以利用,將會有較好的應用前景。
在過去幾年的運行中,束測系統(tǒng)發(fā)生了數(shù)次硬件和軟件的異常,導致束測數(shù)據的可靠性和真實性無法保證。主要的異?,F(xiàn)象有:束測系統(tǒng)維護期間,BPM電纜連接突然中斷;全環(huán)軌道擾動;個別BPM數(shù)據出現(xiàn)脈沖擾動和平移跳變;DCCT數(shù)據脈沖噪聲;填充模式檢測器由于軌道擾動出現(xiàn)較大的測量誤差等。
由于無有效工具,異常發(fā)生時無法通知運行人員,發(fā)生后亦無法進行故障分析。已有的BPM 10 Hz窄帶數(shù)據無法完成此類處理,必須使用寬帶歷史數(shù)據,如694 kHz的逐圈BPM數(shù)據或10 kHz的DCCT數(shù)據等。但每秒實時采集如此大量的寬帶數(shù)據并不現(xiàn)實,可行的方案是建立全局束流診斷數(shù)據倉庫,在線進行關聯(lián)數(shù)據分析并存儲異常發(fā)生時的有用數(shù)據用于故障診斷?;谝陨戏治?,本文開展全局束流診斷數(shù)據倉庫的開發(fā)和應用研究。
圖1 數(shù)據倉庫硬件結構Fig.1 Hardware structure of data warehouse
數(shù)據倉庫硬件結構如圖1所示,在現(xiàn)有的儲存環(huán)束測系統(tǒng)控制網絡的基礎上配置1臺IBM System x3550 M4服務器,被檢測對象包括束流位置檢測、流強檢測設備、束斑尺寸檢測設備、填充模式檢測設備??刂葡到y(tǒng)基于EPICS構建,在被檢測對象上配置了EPICS IOC,數(shù)據通過網絡傳輸至服務器,在服務器上開發(fā)Soft IOC實現(xiàn)全局束流診斷數(shù)據倉庫。數(shù)據倉庫采用開源的分布式數(shù)據庫Couchbase進行數(shù)據管理。
數(shù)據倉庫主要實現(xiàn)以下功能:提供一套束流診斷系統(tǒng)自檢工具,快速排查所有設備的硬件連接和電子學配置;故障發(fā)生時產生事件觸發(fā)信號,保存可進行離線故障分析的寬帶數(shù)據;維護動態(tài)BPM信任度列表,軌道反饋系統(tǒng)和機器研究等可依據該表決定使用哪些BPM;設置加速器運行狀態(tài)標志,指示加速器的運行可靠度和穩(wěn)定度;為每個診斷設備設置置信度標志,幫助用戶對束測數(shù)據進行取舍?;谏鲜鲂枨?,設計了包含6個數(shù)據分析引擎、1個基準數(shù)據庫、1個故障分析歷史數(shù)據庫、5類運行數(shù)據、1個置信度表和1個高速Matlab-EPICS接口的全局束流診斷數(shù)據倉庫[2]。
1) 數(shù)據分析引擎
數(shù)據分析引擎是數(shù)據倉庫的核心,現(xiàn)有6個數(shù)據分析引擎協(xié)同工作。
(1) 基準管理引擎。采集系統(tǒng)正常運行時的歷史數(shù)據,建立各設備和加速器的基準。
(2) BPM逐圈數(shù)據分析引擎[3]。利用MIA方法對全環(huán)140個BPM的逐圈數(shù)據進行時域和頻域的相關性分析,實現(xiàn)對Lattice參數(shù)在線監(jiān)測、BPM故障診斷、加速器運行異常時的報警,并對BPM系統(tǒng)進行性能分析且提供BPM的置信度。
(3) BPM慢獲取數(shù)據(SA)分析引擎。通過對10 Hz的BPM四通道數(shù)據SA進行相關性分析,可進行如電纜連接異常等BPM故障診斷;通過計算并記錄SA短時間標準差,可分析儲存環(huán)掉束原因;通過記錄SA可觀察束流軌道長時間漂移;通過對全環(huán)BPM的SA進行相關性分析可監(jiān)測全環(huán)軌道參數(shù)和評估各BPM性能,為每個BPM計算置信度。
(4) 束流流強分析引擎。通過對填充模式的和信號與DCCT進行相關運算,評估DCCT和填充模式測量的性能,記錄光源的運行情況,同時可進行束流平均壽命和逐束團壽命校驗;通過計算全環(huán)BPM和信號與DCCT的相關函數(shù),評估BPM的性能。
(5) 束斑尺寸分析引擎。通過計算束斑截面尺寸和束流位置頻譜的關聯(lián)性,進行干涉儀或X射線針孔相機的可靠性分析;通過計算束斑截面尺寸和束流壽命的關聯(lián)性,進行托歇克壽命測量及應用研究,觀察束流不理想度。
(6) 置信度計算引擎。綜合以上幾個分析引擎的計算結果,生成一張包括所有設備和整個加速器置信度的表格,并在故障發(fā)生時發(fā)出觸發(fā)信號并存儲運行數(shù)據到歷史數(shù)據庫中。
2) 基準數(shù)據庫
基準數(shù)據庫包含所有束測設備和加速器的基準數(shù)據,數(shù)據來源于歷史運行數(shù)據,且在每種運行模式下均重新建立。
3) 運行數(shù)據庫
運行數(shù)據庫綜合控制網絡的所有實時束測數(shù)據,包括兩個在線環(huán)形緩存器。第1個緩存器以1 Hz采集速率存儲100 s的數(shù)據。第2個緩存器存儲以0.01 Hz采集速率存儲24 h的數(shù)據。每幀的數(shù)據結構和第1個緩存器相同,但帶寬降到0.005 Hz。每天存儲緩存器中的數(shù)據,用作長期運行狀態(tài)的評估。
4) 置信度表
由置信度計算引擎生成置信度表,該表包括每個診斷系統(tǒng)和整個機器的狀態(tài)評估結果,并以EPICS PV的形式按1 Hz速率在控制網絡更新發(fā)布。用戶可在線獲取該數(shù)據,并決定相關數(shù)據的取舍。
5) 故障分析歷史數(shù)據庫
故障分析歷史數(shù)據庫的內容來自運行數(shù)據庫,每個記錄都和故障事件相關聯(lián),通過該數(shù)據庫可在事后進行精細分析并確定故障原因。
6) 高速Matlab-EPICS接口
為實現(xiàn)以上功能,LCA或MCA已不能滿足對數(shù)據的訪問速度要求,因此,參考LabVIEW內存共享IOCcore接口的方法,設計速度更高的Matlab-EPICS接口[4]。
數(shù)據倉庫自2012年下半年投入運行以來,累積了大量束流運行數(shù)據,目前主要通過離線分析對用于上海光源的運行性能評估、束測系統(tǒng)運行狀態(tài)監(jiān)測及一些隨機事件的輔助機器進行研究。
2.1 上海光源運行性能評估
利用數(shù)據倉庫對加速器主要的幾個參數(shù)進行監(jiān)測以評估機器性能,包括軌道穩(wěn)定性、流強穩(wěn)定性、填充均勻度、工作點穩(wěn)定性等,評估主要基于SA。上海光源2013年的運行情況如下:軌道穩(wěn)定性在單個運行周期內好于0.5 μm,不同周期間軌道跳變嚴重,上半年達到200 μm,下半年約30 μm;流強的穩(wěn)定度短時間內保持在1 mA(0.5%)范圍內,但不穩(wěn)定,長時間在2 mA(1%)范圍內,尚有優(yōu)化空間;填充均勻度上半年在3%~6%,下半年下降至4%~10%,注入過程的重復性還有優(yōu)化空間;水平方向工作點上半年在0.20~0.25間漂移,24 h穩(wěn)定度在0.001內,不同運行周期內阻尼時間不同,暑期排除電源波動影響后,下半年的24 h內穩(wěn)定度好于0.000 1。
2.2 束測系統(tǒng)運行狀態(tài)監(jiān)測
利用MIA算法對全環(huán)140個DBPM處理器的逐圈數(shù)據進行分析,可快速進行BPM系統(tǒng)故障診斷。如圖2所示,對注入期間的逐圈數(shù)據進行MIA分解,獲得束流中包含的β振蕩(第1、2個模式)、能量振蕩(第3個模式)和電子學噪聲(第9個模式)。利用分解的各物理模式的幅度可進行BPM的性能評估,發(fā)現(xiàn)可能有問題的BPM,并有助于查找影響系統(tǒng)性能的噪聲來源。類似分析還可用于對BPM的分辨率進行在線評估[5]。
圖2 β振蕩(a)、能量振蕩(b)和電子學噪聲(c)Fig.2 Betatron oscillation mode (a), energy oscillation mode (b) and electronics noise mode (c)
通過長期記錄BPM故障情況,定位出置信度高的BPM用于快反饋和軌道反饋,提高系統(tǒng)性能。圖3為2012年10月14日至11月3日期間BPM故障統(tǒng)計情況。從圖3中可直觀地找出經常發(fā)生故障的BPM,如20#、85#、123#、128#,也易于發(fā)現(xiàn)性能良好的BPM。
圖3 BPM運行故障記錄Fig.3 BPM failure record
2.3 隨機事件的數(shù)據記錄及輔助機器研究
上海光源目前計劃將流強提高到240 mA,但在240 mA穩(wěn)定運行一段時間后有時會丟失10 mA束流變?yōu)?30 mA。利用數(shù)據倉庫對掉束前后相關的束流數(shù)據進行分析,可幫助定位掉束原因并解決該問題。圖4a為流強從240 mA掉至230 mA后再次注入的過程;圖4b為掉束前后束團電荷量,掉束過程中疑似發(fā)生多束團不穩(wěn)定性(束團串尾部被刮掉)。同時,在掉束后垂直方向β振幅增大,而水平、垂直工作點未見明顯變化。通過分析時域波形可知,掉束前橫向反饋穩(wěn)定工作,掉束過程中及掉束后均不能有效抑制橫向振蕩。補注束流至240 mA后,橫向反饋系統(tǒng)恢復正常工作。綜合上述分析結果和該時刻儲存環(huán)真空度數(shù)據,可初步判定是由于真空放氣引起的快離子不穩(wěn)定性導致的束團串尾部刮束。
圖4 掉束前后流強(a)和束團電荷量(b)Fig.4 Current (a) and bunch charge (b) before and after beam loss
本文通過綜合所有在線束測設備和相關機器運行參數(shù),基于高速EPICS-Matlab接口,在服務器上開發(fā)了EPICS Soft IOC實現(xiàn)各類信號處理算法,建立了能有效進行系統(tǒng)運行狀態(tài)監(jiān)控、異常診斷、提供系統(tǒng)置信度指標等功能在內的全局束流診斷數(shù)據倉庫。利用該數(shù)據倉庫可長時間監(jiān)測加速器運行過程中的軌道、流強、工作點、填充模式等參數(shù),對光源運行性能進行評估。并對運行中的束測系統(tǒng)故障和掉束問題進行了診斷研究,為問題的解決提供了有效手段。
[1] LENG Yongbin, YE Kairong, ZHOU Weimin, et al. SSRF beam diagnostics system commissioning[C]∥DIPAC2009. Basel: DIPAC, 2009.
[2] LENG Yongbin, YAN Yingbing, CHEN Zhichu, et al. Beam diagnostics global data warehouse implementation and application at SSRF[C]∥IPAC2011. San Sebastian: IPAC, 2011.
[3] CHEN Zhichu, LENG Yongbin, YUAN Ren-xian, et al. BPM Troubleshooting by using PCA in SSRF[J]. Nuclear Science and Techniques, 2014, 25(2): 020102.
[4] YAN Yingbing, LENG Yongbin. Soft IOC application in SSRF beam diagnostics system[C]∥IPAC2010. Kyoto: IPAC, 2010: 2 707-2 709.
[5] CHEN Zhichu, LENG Yongbin, YAN Yingbing, et al. Performance evaluation of BPM system in SSRF using PCA method[J]. Chinese Physics C, 2014, 38(8): 087004.
Development of Global Data Warehouse for Beam Diagnostics at SSRF
LAI Long-wei, LENG Yong-bin*, YAN Ying-bing, CHEN Zhi-chu
(ShanghaiInstituteofAppliedPhysics,ChineseAcademyofSciences,Shanghai201800,China)
The beam diagnostic system is adequate during the daily operation and machine study at the Shanghai Synchrotron Radiation Facility (SSRF). Without the effective event detecting mechanism, it is difficult to dump and analyze abnormal phenomena such as the global orbital disturbance, the malfunction of the BPM and the noise of the DCCT. The global beam diagnostic data warehouse was built in order to monitor the status of the accelerator and the beam instruments. The data warehouse was designed as a Soft IOC hosted on an independent server. Once abnormal phenomena happen it will be triggered and will store the relevant data for further analysis. The results show that the data warehouse can detect abnormal phenomena of the machine and the beam diagnostic system effectively, and can be used for calculating confidential indicators of the beam instruments. It provides an efficient tool for the improvement of the beam diagnostic system and accelerator.
SSRF; data warehouse; beam diagnostics; abnormal detection
2014-01-24;
2014-06-30
國家自然科學基金資助項目(11075198,11305253,11105211);中國科學院知識創(chuàng)新工程新銳計劃項目資助(Y45501306)
賴龍偉(1985—),男,江西寧都人,助理研究員,博士,核技術及應用專業(yè)
*通信作者:冷用斌,E-mail: lengyongbin@sinap.ac.cn
TL506
A
1000-6931(2015)06-1149-04
10.7538/yzk.2015.49.06.1149