摘要
UPS越來越廣泛地應(yīng)用于各個領(lǐng)域,越來越多非電氣專業(yè)的客戶也常常面臨著UPS選型、配置以及維護問題,而在這些過程中,會出現(xiàn)很多不熟悉的概念,如UPS壽命、MTBF、可靠性、可用性以及浴盆曲線等。而熟悉這些概念及其應(yīng)用對這些人員更好地選擇、配置、維護設(shè)備有非常重要的意義。本文闡述了這些概念并分析了日常配置及維護方案背后的邏輯跟這些概念的關(guān)系,并用圖形化的方式表達了UPS設(shè)備的選型邏輯及維護目的,對UPS相關(guān)人員有一定的指導(dǎo)性意義。
關(guān)鍵詞:UPS、MTBF、浴盆曲線、可靠性
一、 UPS使用過程中的幾個概念
1.1 UPS壽命(Expected Life)
經(jīng)常在一些UPS招標(biāo)文件中,明確寫著對UPS壽命的要求,如UPS壽命應(yīng)該達到10年、15年甚至20年,做客戶工作的銷售人員或者服務(wù)工程師也經(jīng)常面對客戶類似的提問。那UPS壽命到底是一個什么概念,它背后的意義是什么?
壽命有可靠壽命以及使用壽命兩個概念。下文中,我們對可靠性壽命和使用壽命兩個概念做一個簡單闡述。
1)可靠壽命
可靠壽命是指在一定的可靠性要求下所對應(yīng)的壽命單位,如下圖(一)所示,當(dāng)可靠性要求為R1時對應(yīng)的壽命是T1,當(dāng)可靠性要求是R2時對應(yīng)的壽命是T2,即可靠性要求越高,壽命越短。
圖(一)壽命跟可靠性的關(guān)系示意圖2)使用壽命產(chǎn)品使用無論從技術(shù)上還是經(jīng)濟上考慮都不宜再使用,而必須大修或者報廢時的使用年限稱為使用壽命。跟可靠壽命類似,在使用該概念的時候,要有允許的故障率指標(biāo),否則對于可維修的UPS,很難確定其使用壽命(當(dāng)然對于不可維修的器件,如電池等,相關(guān)標(biāo)準(zhǔn)中是有壽命指標(biāo)的)。此外,UPS的使用壽命跟機房環(huán)境,負(fù)載大小、負(fù)載特性、日常維護等關(guān)系巨大,我們在后面的章節(jié)中會詳細闡述。
綜上,壽命參數(shù)不是一個絕對概念,而是一個相對概念,同一臺UPS,壽命參數(shù)可長可短,取決于客戶對于可靠性的要求。此外,對于可靠性指標(biāo)要求一致的UPS系統(tǒng),UPS配置方式也大大影響其使用壽命。圖下圖(二)所示,對于單機系統(tǒng)、冗余系統(tǒng),其可靠性要求一致的前提下,產(chǎn)品的壽命顯然是不同的。
圖(二)單機配置及并機冗余配置
1.2 MTBF(Mean Time Between Failure)
MTBF即平均故障間隔時間這個概念經(jīng)常和產(chǎn)品的使用壽命混淆,比如某UPS標(biāo)稱MTBF是20年,某些客戶即認(rèn)為該UPS的壽命是20年,更甚者認(rèn)為該UPS應(yīng)該20年不壞。在清楚MTBF的定義之后,我們知道這種理解是不對的。那MTBF是怎么定義的,這個參數(shù)的含義是什么?MTBF的度量方法為:在規(guī)定的條件下和規(guī)定的時間內(nèi)產(chǎn)品的壽命單位總數(shù)跟故障次數(shù)的比值,為更好地理解,我們舉個簡單的例子來說明:某一批次型號UPS在運行100年.臺(運行臺次和運行年數(shù)的乘積)中,出現(xiàn)了5次故障,則該UPS:MTBF=100年/5=20年。故MTBF是一個可靠性參數(shù),是衡量設(shè)備故障率的一個重要指標(biāo),而不是一個壽命參數(shù),它是一個統(tǒng)計數(shù)據(jù),可以通過不同統(tǒng)計方法統(tǒng)計和計算。此外,MTBF其適用的對象是可修復(fù)的產(chǎn)品,如UPS。對于不可修復(fù)的產(chǎn)品,如熔斷器、電燈泡,相應(yīng)的,我們用MTTF(Mean Time to Failure)來衡量其可靠性。比如對某種不可修復(fù)的產(chǎn)品進行壽命試驗,其失效前運行的時間分別為1000H,1150H,1200H,1300,1250H則該產(chǎn)品:MTTF=(1000 1150 1200H 1300H 1250)H=1180H。對于不可修復(fù)的產(chǎn)品,其MTTF就是其平均壽命。當(dāng)產(chǎn)品的壽命服從指數(shù)分布時(一個由較多單元組成的復(fù)雜產(chǎn)品,不論單元的壽命是什么分布,發(fā)生故障修復(fù)后,其運行參數(shù)和修復(fù)前一致,則一定時間后,產(chǎn)品的壽命也漸近于指數(shù)分布),產(chǎn)品的故障率為常數(shù)λ,則MTBF=1/λ。目前MTBF計算的計算方法主要有基于器件歷史故障率數(shù)據(jù)的估計方式和整機壽命測試方式兩種。第一方式,行業(yè)內(nèi)最知名和應(yīng)用最廣的美國國防部1991年發(fā)布的MIL-HDBK-217F以及兩個分別發(fā)布于1992年的Notice 1和1995年的 Notice 2。此外,Bellcore/Telcordia的《Reliability Prediction Procedure for Electronic Equipment》也廣泛應(yīng)用于電信行業(yè)內(nèi)的電子產(chǎn)品可靠性預(yù)測。而國內(nèi)的計算方法及軟件,很大一部分基于GJB/Z 299C-2006《電子設(shè)備可靠性預(yù)測手冊》。不同于基于歷史數(shù)據(jù)的可靠性預(yù)測,整機可靠性預(yù)測采用把整機作為一個黑盒子,通過采集黑盒子的測試數(shù)據(jù)和歷史樣本數(shù)據(jù),使用一些數(shù)學(xué)方法如Weibull函數(shù),預(yù)測產(chǎn)品故障率的方式。
1.3 可靠性(Reliability)
對于某種表現(xiàn)好的商品,很多人贊譽時都會說一句“這個產(chǎn)品質(zhì)量可靠”,即一般人把可靠性作為質(zhì)量的一個重要度量。實際上質(zhì)量包含比可靠性更多內(nèi)涵,如在《質(zhì)量管理體系基礎(chǔ)和術(shù)語》GB/T19000:2016(等同于ISO9001:2015)定義質(zhì)量為“客體(包含產(chǎn)品、服務(wù)或者組織)的一組固有特性滿足要求的程度”,這種要求包含明示的、隱含的或者必須履行的需求和期望,而可靠性是這許許多多需求和期望的一種??煽啃允侵府a(chǎn)品在規(guī)定條件下和規(guī)定時間段內(nèi),完成規(guī)定功能的能力,它是該產(chǎn)品在某時間段內(nèi)完成規(guī)定功能的可能性和。與MTBF不一樣,它是一個關(guān)注產(chǎn)品滿足規(guī)定功能的能力隨著時間推移的保持力,如下圖三所示:
圖(三)可靠性比較
A產(chǎn)品的比B產(chǎn)品的保持力更強,我們就稱產(chǎn)品A的可靠性更高。那怎么從數(shù)學(xué)上度量可靠性呢?如下所示,R是產(chǎn)品的可靠性,t表示運行時間,MTBF是平均無故障時間,當(dāng)產(chǎn)品的故障率基本接近常數(shù)(產(chǎn)品生命周期處于浴盆曲線的中段時),其對應(yīng)的故障分布函數(shù)是指數(shù)分布,可靠性則表達為如下公式:R = e- t / MTBF通過簡單的計算,假設(shè)一套MTBF是20年的UPS,連續(xù)運行10年,它不出問題的概率是R=60.6%;當(dāng)運行時間t=20年時,它不出問題的概率只有36.8%。其曲線如圖(四)所示。
圖(四)可靠性跟時間關(guān)系
1.4 可用性(Availability)
可用性被定義為產(chǎn)品能發(fā)揮其固有功能的程度(美國國防部DoD 3235.1-H,TEST & EVALUATION of SYSTEM RELIABILITY AVAILABILITY and MAINTAINABILITY)。它可以用平均故障間隔時間MTBF和平均故障維修時間MTTR來表達:Availability=UP TIME/(UP TIME DOWN TIME)=MTBF/(MTBF MTTR)如下圖(五)所示,Down Time=TMT ALDT,其中:
圖(五)可用性示意圖
TMT=合計維修時間ALDT=Administrative and logistics down time即用于等待合同、流程、人員、備件的非維修時間。很顯然地,若要提高系統(tǒng)的可用性,一方面要提高系統(tǒng)的MTBF(品牌、口碑、使用),另一方面也要提高維護人員的技術(shù)能力和維護管理水平(培訓(xùn)、維護策略、備件管理、維護管理),減少維修等待時間。UPS行業(yè)中提到的“5個9”,”6個9”,一般就是指其可用性(IEC 62040-3-2011)。
1.5 浴盆曲線(Bathtub Curve)
一般產(chǎn)品生命周期內(nèi)的瞬時故障率分布可以分為三個時期,這三個時期分別為早期失效期、穩(wěn)定運行期以及加速損壞期。這三個時期從時間先后的角度把產(chǎn)品的生命周期分為三個階段。如圖(六)所示,第一個階段T1是一個故障率下降的階段,英文叫Infant Mortality Period,在這個階段,缺陷產(chǎn)品故障頻繁暴露,產(chǎn)品或被維修或被淘汰,故總體故障率成下降趨勢。第二個階段T2,是故障穩(wěn)定階段,英文叫Normal Life Period,在這個階段,故障隨機出現(xiàn),但故障率總體保持一個恒定值,MTBF評估的就是這個階段的故障率。第三個階段T3,是故障率快速上升的階段,英文叫Wear-out Period,是由于器件損耗(老化、疲勞、磨損等)造成的故障加速。如UPS的風(fēng)扇磨損造成UPS過熱,電容老化造成整流器或者逆變器停止運行,這些都會造成UPS故障率加速提高。
圖(六)理論浴盆曲線
1.6概念匯總及維護的目的
我們針對UPS的壽命、平均故障時間MTBF、可靠性Reliability、可用性Availability以及浴盆曲線Bathtub Curve進行了概念描述,為更好地讓大家理解這些概念,為下部分我們的內(nèi)容做好準(zhǔn)備,我們對這幾個概念進行匯總。
序號
概念名稱
表達公式
概念意義
1
壽命 Life time
廠家建議、經(jīng)驗下約定成俗
一定故障率要求下產(chǎn)品運行時間,一般為浴盆曲線中的T2
2
平均故障時間MTBF
運行時間/故障次數(shù)=1/λ
產(chǎn)品可靠性指標(biāo),為理論計算數(shù)據(jù)
3
可靠性Reliability
R = e- t / MTBF
產(chǎn)品完成規(guī)定功能而不出問題的可能之和
4
可用性Availability
A=MTBF/(MTBF MTTR)
產(chǎn)品完成規(guī)定功能的程度,如UPS正常逆變帶載的時間占比
5
浴盆曲線Bathtub Curve
生命周期的三個故障率表現(xiàn)階段
三個階段的劃分對產(chǎn)品設(shè)計、生產(chǎn)、維護的質(zhì)量管理提供指導(dǎo)
綜上,從可靠性角度,我們維護的目的是提高系統(tǒng)的可用性,即提高MTBF,減少MTTR。從整個UPS的生命周期看,UPS維護目的可以概括為如下:1) 保證用電設(shè)備的供電不間斷,確保供電質(zhì)量符合標(biāo)準(zhǔn)。2) 提高UPS系統(tǒng)可靠性,減少平均維修時長。3) 保證UPS系統(tǒng)達到或超過預(yù)期壽命,減少TCO。從浴盆曲線上看,維護的目的可以概括如下,即減小故障率λ(增加MTBF,減少MTTR),增加Δt1(更早進入服務(wù)狀態(tài))和Δt2(推遲退服時間)。如圖(七)所示:
圖(七)維護目的的浴盆曲線表達
那如何應(yīng)用這些圖表及概念呢,我們將在如下章節(jié)中一一闡述。
那如何應(yīng)用這些圖表及概念呢,我們將在
UPS配置及維護背后的邏輯 ——幾個常用概念的應(yīng)用(下)中一一闡述。