郭晶磊,顧 吉
(中國電子科技集團(tuán)公司第58研究所,江蘇 無錫 214035)
P5000設(shè)備由全球著名半導(dǎo)體設(shè)備廠商美國應(yīng)用材料公司(Applied Materials)生產(chǎn),P5000系統(tǒng)是世界上第一臺成功的以單晶片、多反應(yīng)室理念而設(shè)計(jì)的量產(chǎn)與研發(fā)均適用的半導(dǎo)體制程設(shè)備。P5000系統(tǒng)具有絕佳的制程整合、量產(chǎn)制造等優(yōu)點(diǎn),并在不破真空的狀況下,最多有四個相同或不相同的制程反應(yīng)室同時進(jìn)行生產(chǎn),更富有彈性和整合能力。反應(yīng)原理為:材料源以氣體形式進(jìn)入工藝腔體內(nèi),在RF加功率的情況下,材料源(反應(yīng)氣體)從輝光放電(Plasma:等離子場)中獲得激活能,激活并增強(qiáng)化學(xué)反應(yīng),從而實(shí)現(xiàn)化學(xué)氣象淀積。在實(shí)際使用過程中,P5000平臺經(jīng)常會出現(xiàn)各種各樣的死機(jī)現(xiàn)象,本文就針對具體的各種死機(jī)現(xiàn)象進(jìn)行分析,并提供相關(guān)的解決方案。
P5000系統(tǒng)軟件能夠自動保存最后一次死機(jī)信息,具體查看方法為:
(1)在主界面用光筆點(diǎn)擊Service菜單,如圖1;
(2)在Service下拉菜單中選擇Diagnostics菜單,如圖2;
(3)在Diagnostics下拉菜單中選擇Last Exception Report菜單,如圖3。
圖1 死機(jī)代碼查詢界面1
圖2 死機(jī)代碼查詢界面2
圖3 死機(jī)代碼查詢界面3
圖4 死機(jī)代碼查詢界面4
該死機(jī)信息同時被保存在FAULT.LOG文件中,從死機(jī)信息報告界面中我們可以得到相關(guān)信息,見圖4和表1。
在表1所述信息中,最重要的是第4條(Exception number),根據(jù)該代碼可以對死機(jī)原因進(jìn)行分析排查,最終解決死機(jī)問題。
表1 死機(jī)信息報告內(nèi)容
例如Exception number 2,Bus error-FFFF4818,此類死機(jī)原因一般是因?yàn)橛布栴}引起(典型的是DIO或AIO板故障),但偶爾也會是軟件、VME電壓和VME接地問題引起。其中FFFF4818是導(dǎo)致死機(jī)硬件的內(nèi)存地址,從表2硬件內(nèi)存地址表中我們可以查出引起此次死機(jī)的是AIO#3電路板,更換AIO #3電路板即可解決此次死機(jī)問題。
如果每次出現(xiàn)Exception number 2,Bus error的硬件內(nèi)存地址都不相同,那么最大的可能就是VME電壓被瞬間拉低,此時應(yīng)該著重檢查VME電壓。
Exception 3-Address Error,軟件、硬件、接地、電磁干擾均會引起地址錯誤死機(jī),出現(xiàn)該死機(jī)問題時一般先從防電磁干擾方面著手:
(1)檢查VME總線架上所有板卡上下螺釘是否擰緊;
(2)空余的插槽是否用鋁合金盲板封??;
將資產(chǎn)管理和預(yù)算管理進(jìn)行相互結(jié)合,能夠?qū)Y產(chǎn)增量和資產(chǎn)存量進(jìn)行有效結(jié)合,實(shí)現(xiàn)資產(chǎn)相關(guān)信息的共享。能夠避免出現(xiàn)資源浪費(fèi)現(xiàn)象,可以對資源進(jìn)行最佳配置,有效降低資產(chǎn)配置不合理現(xiàn)象,構(gòu)建鴿鴿合理高效的社會保障。
(3)設(shè)備各部件之間EMC接地線(P/N:1390-01554)是否安裝;
(4)EMC接地線與設(shè)備地線間阻值是否小于2Ω。
如果電磁干擾檢查沒有問題,那么再從軟件方面著手(格式化硬盤、重新安裝系統(tǒng)軟件等)。
Exception 4-Illegal Instruction,非法指令引起的死機(jī)原因(如系統(tǒng)軟件執(zhí)行了680X0機(jī)器代碼之外的指令),與Exception 3相似,參照其解決方案。
表2 硬件內(nèi)存地址表
Exception 5-Divide by Zero,引起該死機(jī)的原因是系統(tǒng)軟件BUG,所以,從軟件方面著手(如格式化硬盤、重新安裝系統(tǒng)軟件等)可以解決該死機(jī)問題。
Exception 7-TrapCC,該死機(jī)類型具體又分為三小類,分別是Exception 7-TRAPCC(Instruction)、Exception 7-TRAPCC(Failed to Send Software Heartbeat)和Exception 7-TRAPCC(Other)。
Exception 7-TRAPCC(Instruction),引起該死機(jī)的原因是日期或時間沖突,一般指千年蟲問題,可通過系統(tǒng)升級的方法來解決該問題。
Exception 7-TRAPCC(Other),一般可通過重啟解決該問題。
Exception 24-Spurious Interrupt,引起該死機(jī)的原因是VME系統(tǒng)總線IACK信號跳線設(shè)置錯誤,檢查每個VME系統(tǒng)總線插槽,如果有板卡那么插上的IACK信號跳線應(yīng)該為斷開,如果沒有板卡那么插上的IACK信號跳線應(yīng)該為短路。
該死機(jī)類型具體又分為三小類,分別是Exception 31-Sys-Fail、Exception 31-Abort Unknown和Exception 31-Memory Parity Error。
Exception 31-Sys-Fail,引起該死機(jī)問題一般比較典型的是VME系統(tǒng)總線電源系統(tǒng)和接地問題,可以從以上兩方面去解決問題。
Exception 31-Abort Unknown,引起該死機(jī)問題一般比較典型的是VME系統(tǒng)總線接地問題或不小心碰了SBC主板上的“abort”按鈕,對于后者,只需重新啟動系統(tǒng)就行了。
Exception 31-Memory Parity Error,引起該死機(jī)問題一般是由于V440型號的SBC主板運(yùn)算時奇偶校驗(yàn)錯誤,對于此問題,必須將SBC主板升級至MA3版本。
該死機(jī)類型具體又分為三小類,分別是Exception 39-Failed to Send Software Heartbeat、Exception 39-Message Pool Full和Exception 39-Memory Pool Full。
Exception 39-Failed to Send Software Heartbeat,引起該死機(jī)問題的類似于Exception 7-TRAPCC(Failed to Send Software Heartbeat),可參照其解決方案。
Exception 39-Message Pool Full,引起該死機(jī)問題的原因是系統(tǒng)執(zhí)行兩個任務(wù)的時候信息量過載,當(dāng)信息量大于255條時會導(dǎo)致死機(jī),重新啟動系統(tǒng)可解決該問題。
Exception 39-Memory Pool Full,一般系統(tǒng)軟件會自動填充和清空內(nèi)存地址,當(dāng)系統(tǒng)只填充不清空內(nèi)存地址時就會導(dǎo)致該內(nèi)存池出錯死機(jī),一般重啟可解決。3.9 Exception 46
Exception 46-Array Range Error,一般是因?yàn)檐浖栴}引起的死機(jī),可參照Exception 5-Divide by Zero解決該問題。
除上述死機(jī)代碼之外,有些機(jī)臺可能還會出現(xiàn)一些其他類型的死機(jī)代碼,也需要用相應(yīng)的方法來解決,在一時查不出問題的時候可以嘗試著從接地、電源、硬盤、軟件等方面入手,往往可以取得意想不到的效果。