中心議題:
- UPS電源的可靠性
- UPS系統的可靠性
- 配電系統的可用性
解決方案:
- 采用旁路與市電獨立的電源
- 加入多CPU監控及電池監控
- 系統選擇模塊化結構
UPS電源的可靠性
從單個UPS的設計來說,可以把整個產品按照模塊進行劃分,下面圖中是一個典型的UPS系統結構圖
從圖中可以看到,UPS各個模塊之間的依賴關系比較復雜,但是還是可以分出串并聯的關系如下
輔助電源與所有其他模塊都是串聯的,因此輔助電源的可用性直接限制了系統能夠達到的最高可用性等級;
控制模塊與除輔助電源之外的其他模塊也都是串聯的,因此控制模塊的可用性也會直接影響到系統總體可用性設計;
對于負載端來說,能夠直接相連的只有旁路模塊與逆變模塊,而這兩個模塊是并聯的;
PFC/整流模塊與電池升壓模塊是并聯的,之后再與逆變模塊串聯;
從能源提供者來講,這里旁路電源與市電電源是兩路獨立的電源,而電池能源是由市電經過充電模塊提供的。如果充電模塊故障的話電池就沒有能量存儲,實際上也無法實現正常的UPS功能,因此市電-充電模塊-電池也是串聯的。這樣可以畫出整個UPS系統的可用性串并聯路徑圖
從這一路徑關系里可以看到,總共存在3條并聯的路徑,而每一條路徑各自又是由數個模塊串聯起來的。正與前面分析的一樣,輔助電源與控制模塊的可用性是串聯在所有通路上的,因此如果這兩者設計有缺陷的話UPS的可用性是無法做的很高的。電池回路串聯有最多的模塊數量,也是可用性最低的一條路徑。
要提升系統的可用性首先要提升關鍵路徑的可用性。從路徑圖上可以看到就是控制模塊與輔助電源。輔助電源是整個UPS的關鍵點,如果輔助電源不工作整個UPS都將癱瘓。提升輔助電源可用性的方式可以有很多種方案:一種是改進設計,提升MTBF;一種是對輔助電源也適用并聯冗余設計,提升可用性;再一種是對UPS的三條可用性路徑分別使用不同的輔助電源,相當于把原來完全串聯的路徑改成并聯。在UPS設計中可以混合使用這幾種方式,由于上面三條可用性通路是并聯的,而旁路通路本身是可用性最高的一條,因此最為推薦的設計就是優先提升旁路的可用性,對旁路單獨使用一套輔助電源供電,并且這套電源的盡量采用簡單的設計,以擁有高的MTBF。
控制模塊同樣也是影響到所有路徑的關鍵點,也必須擁有高的可用性。參照輔助電源的處理方法,也可以給相對獨立的旁路路徑配備單獨的控制模塊,并且通過與其余控制功能協調工作來達到高可用性的目的。同樣,旁路上的控制模塊也要盡量簡單,以提升可靠性。一種推薦的做法是旁路控制模塊不斷的檢測UPS主控制模塊的狀態,如果發現主控制模塊,則自動切換到旁路方式。此外,對于主控制模塊來說也可以通過冗余的方式來提升可用性,比如采用雙MCU結構,當一個MCU檢測到另外一個MCU發生故障時可以接管另一個MCU的功能,或者采取緊急措施如轉旁路來保證負載不斷電。
[page]
對于UPS來說,電池是保證UPS能夠在市電或者旁路斷電發生時繼續維持供電的關鍵,但是串聯環節最多,也恰恰是可用性最為薄弱的環節。一般電池規格書里面會說明充電電流不要超過0.15CC,這就意味著電池在UPS滿載放電放完之后要用數倍的時間才能重新充滿,從這個意義上講其可用性一般都在20%以下。但是由于電池并不是連續工作的,只要在電池放完前市電恢復,在重新充電的過程中也沒有再發生斷電,那么負載仍然不會受到影響。從這方面來看,電池的可用性在只會發生短時間的斷電情況下還是很高的。
再重新來審視電池回路的可靠性,在電池與市電之間還有一個充電器模塊環節。如果充電器損壞則電池在一次放完電之后就無法再充回,導致下一次市電停電時負載斷電。但是充電器只是在電池需要充電時才會工作,因此如果能夠及時對充電器的狀態進行監控,在發現充電器異常時及時報警,就能夠避免充電器故障帶來的問題,從而提升整個UPS的可用性。對于電池也有一樣的手段。電池在使用多次之后也會面臨容量下降和失效的問題,但是如果能夠通過電池狀態監控發現電池失效并及時更換,也能夠有效提升UPS的可用性。
UPS系統的可靠性
使用UPS電源系統時,不僅要定期對各主要元件進行檢查,還要對UPS電池組的各個電池單元端電壓與內阻進行檢測。若發現其電池組的某個電池單元的端電壓差值>0.4 V或者內阻>0.08Ω的時候,就應該斷開工作異常的電池單元與電池組的連接導線,使用外置的獨立充電器對工作異常的電池單元進行單獨充電,將其充電電壓(對12V蓄電池而言)保持在13.5~13.8 V之間,充電時間控制在10~12h.需要注意的是,UPS電源在使用過程中,電池組內的各個電池單元的充電會不一致,可能產生電池單元端電壓以及電池內阻的不平衡。這些是無法依靠UPS電源系統內部充電回路對其充電而得到消除和校正的,若不及時對不平衡電池單元進行脫機均衡充電的話,可能導致上述問題更加嚴重。
為了解決這一瓶頸,可以在UPS系統中加入一個特性和電池互補的備用電源:在市電斷電時的不需要很快反應,但是在長時間停電條件下能夠持續提供電力,燃油發電機組就是最為合適的一個選擇。因此在UPS系統配置上可以加入一個自動切換裝置,在市電停電后切換到發電機組。這樣一來能夠極大的提升長時間斷電條件下UPS系統的可用性。如此則UPS系統的可用性路徑就成為
雖然在可用性路徑里面多串聯了一個市電與發電機切換用的ATS,增加了單調路徑發生故障的概率,但是相對長時間斷電帶來的可用性問題來說還是值得的。
在UPS應用的另外一個分支是目前正在興起的直流UPS系統。直流系統的思路是出于提高效率的目的,減少電源系統中間的轉換環節,電力分配部分由原來的交流轉換成直流。一個理想的直流UPS系統服務器應用從市電到12V終端的應用結構見下圖。
可以看出,理想的直流UPS系統由于把交流系統中UPS的逆變環節與服務器電源中的PFC環節使用一個隔離型DC/DC環節來取代,從而可以改善效率。不過在直流UPS系統里面由于電池電壓的變動范圍是比較大的,為了取得更優化的效率曲線,在后級的服務器電源中也有可能使用兩級結構。也就是通過一個簡單的轉換,減小服務器電源隔離DC/DC轉換級的輸入范圍,以得到更好的節能效果。此時的結構見下圖
在這種直流UPS體系里面,不存在交流UPS中的旁路回路了,只存在一個市電到電池回路,這個回路也兼有充電器的作用。因此從單個UPS的可用靠性角度考慮,直流UPS可靠性鏈路只有兩條,其中一條是兩級變換加上輔助電源與控制板,另外一條是電池,見下圖所示
與交流UPS相比,直流UPS供電少了交流UPS的旁路回路,少了一個提升可用性的回路。但是電池是直接給負載供電的,可用性要高于交流UPS。因此在可用性的方面直流供電系統有得有失。但是另一個方面直流系統比交流UPS更容易進行并聯,從而可以利用增加并聯臺數的方式增加可用性。
[page]
配電系統的可用性
對于一般的UPS系統應用來說,存在兩種常見的配置方式,一種是雙機熱備份,見下圖所示
這種配置方式下兩臺UPS是完全并聯工作的。基于前面可用性的原理,第二種配置方式比第一種會有更高的可用性。
這里就反映了可用性與可靠性的一個明顯不同。對于兩臺并聯冗余配置的UPS,由于器件多了一倍,那么出現故障的概率也會增高,因此從統計意義上來講整個系統的MTBF會下降。但是由于其中一臺出現故障之后仍然有一臺在工作,只要出故障的UPS能夠很快修復,負載就仍然處在有效的保護之中,可用性是提升的。從負載的角度衡量,評估系統的可用性比可靠性更加有意義。
在可用性的定義中,電源系統恢復的時間越短,則可用性也會越好。因此把電源系統設計為模塊化易更換的結構,可以大大減小維護時間,從而使得可用性顯著改善。
對于機房應用的場合,雙總線的概念應用十分廣泛。對于關鍵的服務器負載,一般都提供兩組電源輸入。相應的,在配電部分就也可以對應采用兩組獨立的電源總線。結合UPS本身就支持雙總線輸入,實際上可以構造出很多種組合形式。對不同方式進行比較后,比較推薦的一種典型的結構見下圖所示
這里把兩組獨立市電都供給兩套UPS系統,然后每一套UPS系統作為一條總線來使用,可以充分發揮市電雙總線,UPS內部雙總線以及負載雙總線高可用性的優勢。