黃天太
(南京康尼電子科技有限公司,江蘇 南京 210046)
在我國制造業(yè)升級轉型的背景下,產品的可靠性越來越受到開發(fā)方和使用方的重視。電子產品的可靠性有其自身的特點,產品失效率符合浴盆曲線的規(guī)律,其設計可靠性從很大程度上決定了曲線的走向,討論、總結電子產品的可靠性設計方法、管理流程是提高產品可靠性的基礎工作[1]。
產品可靠性管理體系是一套幫助產品設計工程師和其他人員在產品的全生命周期中管理產品可靠性的制度性保障,用于跟蹤、記錄產品的設計驗證過程的可靠性數據和信息,規(guī)范面向高可靠性產品設計的流程和方法[2-4]。產品的可靠性設計必須以強有力的可靠性管理體系作為保障,在此基礎上,統計分析既有產品的可靠性數據、制定可靠性設計準則、建立可靠性設計的分析方法和流程以及設計驗證測試方案,從而系統地提高產品的設計可靠性。
產品可靠性定義為產品在規(guī)定的時間內,在規(guī)定的條件下,完成預定功能的能力,因此,要設計出高可靠性的產品,首先必須收集和分析產品環(huán)境信息,即定義中“規(guī)定的條件”,也可以稱為可靠性需求。主要思路是建立產品的典型任務剖面、提取環(huán)境特征、挖掘隱性的使用條件,從而形成產品可靠性設計技術要求以及對產品樣機的驗證測試大綱,為產品的可靠性設計和驗證確認提供依據[5-8]。
電子元器件是構成電子產品的最基本要素,其選型直接關系到產品整體的可靠性。元器件的可靠性需要從以下幾個方面進行控制:
(1)元器件優(yōu)選。首先需對現有的元器件進行分類篩選,按照類別將經過產品長期應用考驗的元器件納入優(yōu)選器件庫,供設計人員在產品設計中選用,制定出庫、入庫管理規(guī)范,嚴格控制新物料的種類。對于新選物料,在條件允許情況下可開展如下工作。
① 定制物料選型技術規(guī)格清單。一般情況下盡量不使用定制物料,如需使用,必須制定詳盡的技術規(guī)格清單,從關鍵電氣參數、主要電性能、機械參數、工藝參數、工藝輔料、原材料、出廠測試要求、相關標準化等方面進行明確的規(guī)定,將所有顯性和隱性需求向供方明確,確保定制件的批量一致性和可靠性。
② 器件物理可靠性分析。如條件允許,對于新選型的元器件,可進行物理可靠性分析,通過X-RAY、超音波掃描、能譜測試、DECAP、切片等分析方法和手段,評估其物理可靠性,從其固有可靠性上進行控制。
③ 器件級的電性能測試。根據元器件的種類不同,對其關鍵電氣參數和應用敏感參數,搭建測試電路進行電性能測試,有些器件還需要做耐候性測試,如鹽霧、振動沖擊等。
④ 制定元器件進貨檢驗標準。元器件進貨檢驗的核心是制定各類元器件的進貨檢驗標準和進貨檢驗實驗室的搭建。采用合適的檢驗設備,對元器件包裝、外觀、尺寸、電性能等制定檢驗操作方法和檢驗標準。
(2)建立元器件通用可靠性要求
① 結合產品的生產、存儲和使用條件,從元器件的運輸、存儲、組裝、測試、使用等角度制定每類器件的通用可靠性要求,如芯片類器件的潮敏等級、靜電等級等;
② 建立每類元器件的可選制造商名錄;
③ 建立每類器件降額設計準則和禁用條件。
(1)電路可靠性設計準則。不同產品其使用環(huán)境和可靠性要求不同,電路可靠性設計準則由兩個方面組成:
一是根據產品的可靠性需求,制定滿足該類產品的可靠性設計準則,作為企業(yè)可靠性設計標準,這部分設計要求是對可靠性設計需求的閉環(huán)。比如產品的應用環(huán)境存在持續(xù)的振動和沖擊,對應在設計中必須從結構設計、接插件選型、大型元器件的安裝等方面制定要求。
二是根據現有的技術積累、可靠性理論、試驗形成的通用的可提高產品可靠性的設計方法和原則,主要有以下幾個方面:
① 電路基本通用設計要求:主要指電路的防反接、上電涌流抑制、過流保護、上電復位、看門狗等基本的電路設計要求。
② 熱設計:熱應力是導致電子產品失效的最為常見因素,電子器件的工作溫度是影響產品壽命和可靠性的關鍵因素,在減小功率損耗的基礎上,必須合理通過熱的傳導、輻射和對流設計降低其工作溫度。
③ 電磁兼容設計:提高電路的抗擾度水平可提高電子產品在復雜電磁環(huán)境中的可靠性,主要包括靜電、浪涌、快速瞬變脈沖群、電壓中斷跌落和變化、傳導抗擾度、輻射抗擾度、工頻磁場抗擾度等。需要在設計階段從電路結構和參數、器件選擇、電路板設計以及軟件等多個方面著手,并通過對樣機的電磁兼容測試檢驗。
④ 安規(guī)設計:電子電氣產品的安規(guī)設計主要包括安全間隙和爬電距離、絕緣耐壓、接地、防電擊、防燃防爆、防電磁輻射等,對電子元器件的選擇和電路設計有較為成熟的參考和標準要求。
⑤ 可制造性設計:根據現有的生產工藝條件關注產品的可制造性設計可有效避免產品在生產、測試過程中受到損傷,降低質量隱患,在PCB設計過程中遵循可制造性的規(guī)則,PCB設計完成后還可通過相關軟件工具進行DFM檢查,生成報告并優(yōu)化修改。
⑥ 結構和防護設計:主要指電路板的安裝結構和防護,需要避免機械應力對電路板和元器件的損傷,防水防塵等級以及電路板的三防設計。
(2)失效模式及影響分析。失效模式影響分析(FMEA——Failure Mode and Effect Analysis)是一種重要的可靠性設計方法,可以對各種可能的風險進行評價、分析,在現有技術的基礎上消除這些風險或將這些風險減小到可接受的水平內,目前在各個行業(yè)中得到廣泛的運用。FEMA認識評價產品或者生產過程中的潛在失效及其產生的后果,尋找解決消除或減少潛在失效發(fā)生的措施,最終將全部過程以文件形式存檔。由此提高產品的可靠性,降低批量質量問題,降低設計、生產、制造的質量風險。
FMEA是利用表格方式協助工程師進行工程分析,使其在工程設計早期發(fā)現潛在缺陷及其影響程度,及早謀求解決之道,以避免失效的發(fā)生或降低其發(fā)生時產生的影響。
第一,失效模式分析。由下而上分析,即由零、組件至系繞,確定在系統內不同結構屢成功能層次的失效模式。
第二,失效效應分析。對每一個失效模式,確定其失效對其上一層模組及最終系統的失效影響,了解其組件界面失效關聯性,作為改進的依據。
第三,關鍵性分析,對每一個失散模式,依其嚴重等級和發(fā)生幾率綜合評估并予以分類,以便確定預防或改正措施的內容和優(yōu)先順序。
如圖1所示,為某控制器輸入信號接口電路示例,I0輸入信號,經過光耦U1隔離,再經RC濾波和非門后出輸給軟件。
圖1 某控制器信號輸入接口電路Fig.1 Signal input circuit of a controller as an example
如表1所示,對圖1的電路進行FMEA分析,僅對其中的光耦、晶圓電阻、貼片電阻三個器件作分析作為示例。嚴重度由高至低分為3、2、1三個等級,頻次根據時效模式的占比分為4、3、2、1四個等級。
(3)最壞情況分析。分析電路組成部分器件參數的容差范圍,找出最壞組合情況,從而得到電路可能出現的性能參數偏差。它利用已知零部件參數的變化極限來預計系統性能參數變化是否超過了允許范圍,可以預測某個系統是否發(fā)生漂移故障,并提供改進方向,從而提高產品在惡劣工況下的可靠性和可用性。
(4)冗余設計。對影響控制器關鍵功能或安全性的模塊進行冗余設計是提高系統可靠性的有效手段,因此,首先要識別控制器的關鍵功能部件和安全相關功能模塊,再通過上述FMEA識別其失效帶來的影響,最后確定冗余設計的方案。需要重點最關注以下問題:
第一,主電路模塊和冗余電路模塊最好采用不同的硬件實現方案,避免由于相同的失效機理或模式的發(fā)生,導致冗余失效。
第二,主電路模塊和冗余電路模塊在設計階段需要充分地進行FMEA,冗余度盡可能深,即源端和終端盡可能延伸得更深入,消除共因故障導致主電路模塊失效時冗余電路模塊也發(fā)生失效。
第三,主電路模塊和冗余電路模塊的工作模式選取,合理選擇熱備份、交替工作、冷備份的冗余工作模式,熱備份即二者同時處于工作狀態(tài),任意一個模塊失效后另一個模塊單獨工作,其最大的缺點在于可能存在不確定性應力導致二者同時失效,優(yōu)點在于無切換間斷;交替工作即二個電路模塊按照一定的周期交替性單獨工作,只在交替瞬間二者同時工作,可有效避免同時失效和切換間斷問題,其缺點在于引入的軟件對交替工作的控制的不可靠性因素;冷備份即正常情況下主電路模塊工作,只有在檢測到其失效后,冗余電路模塊才替代工作,其缺點在存在切換間斷。
第四,主電路模塊和冗余電路模塊必須有獨立、可靠的自診斷功能,確保冗余電路模塊的可用性。
如圖2所示為某控制器的輸出驅動模塊冗余設計,虛線框內的電路相互冗余,從源端CPU至終端負載的控制和反饋檢測帶來路完全獨立,有效地避免了共因故障,各環(huán)節(jié)的電路采用不同實現方案,避免了相同失效機理和模式的失效。
電路板是電子電路和元器件的載體,其裸板材料及加工工藝、電路板設計、組裝工藝三個方面是決定其可靠性的關鍵。
表1 某控制器信號輸入接口電路FMEA分析示例Table1 FMEA for signal input circuit of a controller as an example
(1)印制線路板材料及加工工藝。印制線路板的原材料、性能要求和驗收標準均有完備IPC標準、國家標準以及行業(yè)標準,但要獲取良好可靠性的印制線路板,需要在上述標準的基礎上,結合產品的可靠性需求,從一般性要求(如板材、介質厚度、阻焊、塞孔等)、焊接或組裝工藝要求(如可焊性、離子污染度等)、關鍵電氣參數(如阻抗、絕緣耐壓等)、環(huán)境試驗要求(熱沖擊、電遷移等)、機械試驗要求(抗剝離強度、附著力等)、安規(guī)要求、包裝運輸存儲要求等方面形成具體的技術規(guī)范。
(2)印制線路板的布局布線設計。合理的電路板布局布線設計才能使電路設計和元器件的可靠性得到最大限度的實現,因此,需要從可靠性的角度制定設計規(guī)范,包括對電路板尺寸外形、器件布局規(guī)范、走線規(guī)則、各類孔的使用進行規(guī)范,從熱應力、機械應力、信號完整性、電磁兼容、可制造性、可測試性的角度提供優(yōu)化的設計規(guī)則。
(3)電路板的生產組裝工藝設計。根據現有生產條件,制定合理的生產組裝、測試工藝路線可有效避免該過程對產品的損傷和潛在質量隱患,包括焊接工藝(如焊料、阻焊劑等工藝材料的選取存儲、焊接溫度設置等),清洗工藝(清洗材料的選取、清洗方法等),三防工藝,在線測試設備和方法。由于生產工藝對產品可靠性的影響具有潛伏期,因此,這些工藝參數的確定需要大量調研借鑒現有的成熟應用,在此基礎上制定自身的工藝路線,進行大量的工藝驗證試驗后方可實施。
構建可靠性設計的準則、方法論和管理流程,是建立電子產品的可靠性管理體系的重要組成部分,為產品開發(fā)者提供技術支持和制度保障,可以有效的提升產品的設計可靠性。