殷來明
(中石化石油工程地球物理有限公司裝備管理中心 江蘇 南京 211100)
近年來隨著地震勘探的深入推進,勘探裝備設(shè)備技術(shù)也日漸提高,而法國Sercel公司生產(chǎn)的428XL儀器,由于硬件老化、施工條件多變等因素,在施工過程中經(jīng)常出現(xiàn)死機、卡頓、重啟后不響應(yīng)等問題,導(dǎo)致儀器操作過程極度緩慢甚至無法開工。這樣單炮采集所需時間明顯增加,嚴(yán)重加大了地質(zhì)勘探成本,制約了震源施工工程的順利開展。鑒于此,筆者結(jié)合自身的儀器操作實踐與思考,論述了428XL儀器硬盤故障的排查及解決過程,從而為可控震源生產(chǎn)操作中的相關(guān)技術(shù)難題的解決提供有益參考。
工區(qū)處在沙漠腹地,地形復(fù)雜,條件惡劣。沙丘落差大,道路崎嶇不平,斜坡處沙坑遍布,且經(jīng)常有強沙塵暴天氣,沙塵等細小顆粒物極易進入儀器操作間內(nèi)。二維施工中儀器經(jīng)常搬家,途中顛簸嚴(yán)重,對儀器硬件設(shè)備的考驗非常大。
故障初期階段,在施工過程中發(fā)現(xiàn)428XL儀器經(jīng)常突然死機、卡頓。正常放炮的每一步操作過程都變得非常緩慢,不夠流暢,且單炮采集所消耗的時間明顯變長,平均單炮時間是正常情況下的好幾倍。經(jīng)過對儀器的參數(shù)設(shè)置、硬件連接等檢查也未發(fā)現(xiàn)問題,在服務(wù)器重啟過后又恢復(fù)正常。后期情況越發(fā)嚴(yán)重,儀器死機、卡頓頻率提高,且重啟過程也變得緩慢,比正常情況下重啟時間更長,最后甚至需要重啟好幾次才能啟動成功。
綜合以上問題情況,判斷該故障原因可能是:服務(wù)器主機內(nèi)存松動[1];儀器電源等線路接觸不良[2];單線接收道數(shù)超過428XL單線帶道能力設(shè)計,造成非實時傳輸;系統(tǒng)軟件崩潰;服務(wù)器硬盤故障。
在初步判定可能的問題原因后,采用排除法進一步檢查分析。
首先,檢查除服務(wù)器外的各配套硬件是否工作正常,尤其是可能會引起死機、數(shù)據(jù)傳輸?shù)牟考?,比如網(wǎng)絡(luò)交換機,網(wǎng)線連接,VE464箱體與服務(wù)器之間的連接等。系統(tǒng)能夠啟動時,在服務(wù)器上打開一個終端,輸入“ping”命令,檢查網(wǎng)絡(luò)連接情況。經(jīng)過檢查發(fā)現(xiàn),系統(tǒng)間各硬件之間網(wǎng)絡(luò)連接情況良好。且通過對硬件的檢查,發(fā)現(xiàn)各部件外觀良好,沒有破損、斷線、短路情況。
其次,在帶道能力方面,現(xiàn)場實際單線采集為420道@1 ms@ 8 Mbp,不影響實時傳輸。如果單線超過428XL硬件設(shè)計的最大實時采集能力[3](大線數(shù)傳輸率:1 000 道@ 2 ms@ 8 Mbp)的話,428XL表現(xiàn)是不能實時傳輸,在數(shù)據(jù)采集過程中傳輸較慢,與目前的情況存在明顯區(qū)別。
排除以上兩點情況之后,進一步檢查428XL服務(wù)器內(nèi)部硬件情況。將儀器關(guān)機、斷電,將服務(wù)器從固定架上取下檢查,檢查外觀無誤后,逐一對各種連線接口及內(nèi)存條檢查,并用橡皮擦拭干凈,重新裝好。啟動時開機畫面正常,開機硬件檢測正常,內(nèi)存工作正常。在畫面跳轉(zhuǎn)到Liunx紅帽子系統(tǒng)啟動時,服務(wù)器又卡住。再次重啟,在出現(xiàn)“Press any key for Option ROM Massages”畫面時,摁任意一鍵,進入硬件信息界面,在硬盤狀態(tài)信息中發(fā)現(xiàn),正常應(yīng)該顯示3塊硬盤(如圖1)的狀態(tài)信息,此時只有2塊硬盤(如圖2)的狀態(tài)信息顯示(即只顯示設(shè)備ID:0、1,沒有2)。再次斷電,對服務(wù)器硬盤檢查、重接、重啟。啟動過程中留意服務(wù)器運行情況,發(fā)現(xiàn)某硬盤發(fā)出異常響聲,硬件狀態(tài)信息正常,啟動過程又停在紅帽子系統(tǒng)啟動界面,如此反復(fù)多次。
圖1 硬盤正常狀態(tài)信息
圖2 硬盤異常狀態(tài)信息
在多年施工經(jīng)驗中,428XL問題大多由軟件引起,硬件方面一般以固件松動較多。出現(xiàn)如此情況,推斷問題原因有兩點:一是系統(tǒng)崩潰,需要重裝;二是某塊硬盤故障。進行進一步排查,先重裝系統(tǒng)。重裝系統(tǒng)過程中發(fā)現(xiàn),每一步操作變得異常緩慢,需要的時間非常長,每兩步操作之間的時間達到了十幾二十分鐘之久。加上服務(wù)器啟動時的硬盤異響情況,推斷服務(wù)器某塊硬盤有故障。
經(jīng)過初步檢查發(fā)現(xiàn)是硬盤問題后,進一步確定是具體哪塊硬盤故障。因為小隊設(shè)備有限,缺乏相應(yīng)的專業(yè)人員和硬盤檢測設(shè)備??紤]到上述情況,決定將硬盤逐塊拔下,分別重裝系統(tǒng),以裝機時速度反應(yīng)情況判斷哪塊硬盤有問題。經(jīng)進一步檢測,最終將有問題的那塊硬盤找出。
428XL服務(wù)器主機有3塊硬盤,分別對應(yīng)不同的用途[4],而且硬盤接口有別于普通硬盤,此時1塊硬盤損壞、無法使用。根據(jù)現(xiàn)場實際情況,提出以下3個解決方案。
1)重新調(diào)撥一臺新的428XL服務(wù)器主機,但耗時較長。
2)購買新的硬盤。但有2點難處:一是采購適配硬盤困難;二是耗時較長。
3)在缺少硬盤的情況下,對428XL服務(wù)器進行重裝系統(tǒng)。
排除前2個方案后,計劃采用第3個方案。此方案也存在一定的風(fēng)險,屬于非正常裝機,428XL安裝手冊也沒有相應(yīng)的操作過程。先固定好428XL服務(wù)器硬件,準(zhǔn)備系統(tǒng)重裝。這里以SERCEL REDHAT Enterprise V5.8 (64 bit)為例(具體安裝版本以現(xiàn)場實際為準(zhǔn)),操作步驟如下:
前期步驟參照《428XL安裝手冊》進行[5]。
在第11步“In the partitioning window”中,對于“- Make sure the sda, sdb and sdc partitions are selected”一項,此時應(yīng)該是確保sda,sdb兩項被選中,因為沒有第3塊硬盤,其他參照手冊。
第19步“Select /dev/sdc1. Click Edit. In the Edit Partitions: /dev/sdc1”窗口中,此時安裝過程中應(yīng)該沒有此項設(shè)置,那么應(yīng)該操作如下:
Click New. In the Add Partition window:
- Unselect sda.Only sdb should be selected.
- From the File System Type pull-down menu, select “ext3”.
- Type /var/dump0 in the Mount Point field.
- Choose the Fill To Maximum Allowable Size option.
- Make sure “Encrypt” is unticked.
- Click OK.
其他步驟參照《428XL安裝手冊》繼續(xù)進行。
428XL系統(tǒng)重裝完成后聯(lián)機放炮測試,儀器工作正常,順利解決難題。
428XL儀器作為地震勘探的核心設(shè)備,要及時做好儀器的檢修、維護工作,生產(chǎn)中更是需要做好保護工作,在操作中嚴(yán)格按照規(guī)范進行。大致來說,儀器的操作注意事項主要包括儀器車的停放、儀器的使用及維護。
1)儀器車的停放 儀器車停放要求平穩(wěn),盡量遠離建筑物、高壓線等具有干擾性的物體,保持儀器周圍空曠開闊,儀器車停好后使用三角木防止溜車,接地線插好并澆水保證接地良好。
2)儀器的使用及維護 儀器的使用及維護須嚴(yán)格按照操作規(guī)范進行。428XL儀器是精密電子設(shè)備,使用還需做好防塵、防靜電措施。儀器故障檢查時為防止次生災(zāi)害發(fā)生,需對人體進行防靜電措施。拆卸、檢查儀器內(nèi)部電子設(shè)備時手不能直接觸摸電路,要持電路板的側(cè)部。此次檢查打開服務(wù)器箱體后發(fā)現(xiàn)內(nèi)部布滿灰塵,對內(nèi)部器件散熱及運行有一定的影響。尤其是進入硬盤內(nèi)部的灰塵,在長時間運行后會對硬件造成不可恢復(fù)的損害。因此,要經(jīng)常打掃儀器操作間,保證操作間干凈整潔,禁止吸煙。
本文通過對故障現(xiàn)象的分析,從儀器的帶道能力設(shè)計、硬件連接等方面逐一排查,確定為硬盤故障,并在缺少1塊硬盤的情況下重裝系統(tǒng),解決問題,并給出此類儀器的使用注意事項,減少使用過程中的故障率。文中解決方案為臨時方案,對服務(wù)器性能會有一定的影響,對于高精度三維等大型地震勘探可能會限于硬盤容量問題難以實施,最終仍得及時更換壞硬盤。