關于電源產品可靠性問題
MTBF,即平均無故障時間,英文全稱是Mean Time Between Failures。是衡量一個產品(尤其是電器產品)的可靠性指標。單位為小時。它反映了產品的時間質量,是體現(xiàn)產品在規(guī)定時間內保持功能的一種能力。具體來說,是指相鄰兩次故障之間的平均工作時間,也稱為平均故障間隔。它僅適用于可維修產品。同時也規(guī)定產品在總的使用階段累計工作時間與故障次數(shù)的比值為MTBF。磁盤陣列產品一般MTBF不能低于50000小時。MTBF值是產品設計時要考慮的重要參數(shù),目前主流產品的平均無故障時間(MTBF)達到了100000小時以上。可靠度工程師或設計師經常使用各種不同的方法與標準來估計產品的MTBF值。
失效時間是指上一次設備恢復正常狀態(tài)(圖中的up time)起,到設備此次失效那一刻(圖中的down time)之間間隔的時間。
隨著服務器的廣泛應用,對服務器的可靠性提出了更高的要求。所謂“可靠性”,就是產品在規(guī)定條件下和規(guī)定時間內完成規(guī)定功能的能力;反之,產品或其一部分不能或將不能完成規(guī)定的功能是出故障。概括地說,產品故障少的就是可靠性高,產品的故障總數(shù)與壽命單位總數(shù)之比叫“故障率”(Failure rate),常用λ表示。例如正在運行中的100只硬盤,一年之內出了2次故障,則每個硬盤的故障率為0.02次/年。當產品的壽命服從指數(shù)分布時,其故障率的倒數(shù)就叫做平均故障間隔時間(Mean Time Between Failures),簡稱MTBF。即:MTBF=1/λ
筆者看到一款可用于服務器的WD Caviar RE2 7200 RPM 硬盤,MTBF 高達 120萬小時,保修 5年。120萬小時約為137年,并不是說該種硬盤每只均能工作137年不出故障。由MTBF=1/λ可知λ=1/MTBF=1/137年,即該硬盤的平均年故障率約為0.7%,一年內,平均1000只硬盤有7只會出故障。
下圖所示為著名的浴盆曲線,左邊斜線部分為早期故障率,其故障率一般較高且隨著時間推移很快下降。曲線中部為使用壽命期,其故障率一般很低且基本固定。最右部為耗損期,失效率急速升高。電子產品制造商一般通過測試、老煉、篩選等手段將早期故障盡量剔除,然后提供給客戶使用。當使用壽命期將盡,產品也即將進入故障高發(fā)期,需要報廢或更新?lián)Q代了。
電子產品的壽命一般都符合浴盆曲線,可分為三個階段:
早夭期:由于設計,原材料,生產等可能出現(xiàn)的原因而導致一個較高失效率的階段,也稱失效率遞減階段,可通過環(huán)境應力篩選加以剔除,保證產品的可靠性。
穩(wěn)定器:這一階段產品失效率近似一個常數(shù),只有隨機失效產生,MTBF即要得到這一階段的壽命。
耗損期:硬件故障期,產品這時已達到設計壽命,進入報廢階段。
明白了MTBF和“浴盆”曲線的基本概念,我們對評估產品的使用壽命有了一定的掌握。在合適工作條件下器件使用壽命期內的故障率很低。廣大電子愛好者都知道電子元器件的壽命,與工作溫度是有密切關系的。以電腦主板上常用的也常出故障的電解電容器為例,其壽命會受到溫度的影響。因此,應盡可能使電容器在較低的溫度之下工作,如果電容器的實際工作溫度超過了其規(guī)格范圍,不僅其壽命會縮短,而且電容器會受到嚴重的損毀(例如電解液泄漏)。因此,在分析電腦主板上電容器的工作溫度時,不僅要考慮機箱內整體環(huán)境溫度及電容器自身的發(fā)熱,還要考慮機箱內其他發(fā)熱元件的熱輻射(特別是CPU、穩(wěn)壓器、電源供應器等)。
根據(jù)測試,通常2.0G的CPU消耗功率達56.7W,生成溫度達70℃;而當頻率提高至3.0G時, CPU溫度往往超過90℃。在這樣的高溫烘烤下,主板上的電容器壽命會發(fā)生什么變化?
為簡化起見,不考慮紋波、頻率、ESR等因素,電容器的估計壽命可用下述公式表示:
其中,L0表示最高工作溫度下的壽命,Tmax表示最高工作溫度,Ta表示實際環(huán)境溫度。由此可見,如果環(huán)境溫度每升高10℃,電容器壽命將下降一倍!
由上圖右面的曲線可明顯看出,隨著電容器工作環(huán)境溫度的上升,其有效壽命急劇縮短。其中有效壽命(Useful life)是指該種電容器達到給定故障率的時間。
計算方法/MTBF
MTBF值是產品設計時要考慮的重要參數(shù),可靠度工程師或設計師經常使用各種不同的方法與標準來估計產品的MTBF值。相關標準包括MIL-HDBK-217F、TelcordiaSR332、SiemensNorm、Fides或UTEC80-810(RDF2000)等。不過這些方法估計到的值和實際的平均故障間隔仍有相當?shù)牟罹唷S嬎闫骄收祥g隔的目的是為了找出設計中的薄弱環(huán)節(jié)。
故障時間/MTBF
浴盆曲線圖冊
