數據中心假負載驗證測試實戰指導方案
轉載:原網址https://cloud.tencent.com/developer/article/1063952
前言
數據中心作為一個由多個系統高度結合的復雜工程,在基礎設施建設全部完成,各系統調試結束后,就具備了開展假負載驗證測試的基本條件。一場規模宏大的數據中心規劃、建設的質量檢測就此拉開了帷幕。
一 數據中心假負載驗證測試前提條件
1
完成數據中心各系統建設、調試
開展假負載測試要求項目團隊確認各系統已經按要求完成建設、調試工作,亦即數據中心各系統已經達到投產前的各項設計要求及開展運行的基本條件。
2
建立驗證測試項目團隊
項目團隊成員 | 職責分工 |
---|---|
項目經理(項目團隊,含監理) | 組織開展驗證測試,推動測試問題整改 |
第三方測試公司 | 準備測試資源,按計劃開展驗證測試,及問題項復測 |
數據中心運營團隊 | 熟悉數據中心系統,從運營角度把關驗證測試,梳理運維手冊 |
設備廠商和建設總包單位 | 配合開展驗證測試,及測試問題整改 |
3
確認最終測試方案
通常在項目招標環節將加入測試要求,并與各方初步確認假負載驗證測試方案。在數據中心各系統具備基本運行條件后,各方仍需根據項目建設實際情況,梳理數據中心系統架構及設計要求,并確認最終測試方案。
4
假負載驗證測試工具
磨刀不誤砍柴工。測試前,必須對測試工具進行嚴格的檢查,以確保驗證測試的準確性和可靠性。通常由第三方測試公司提供測試工具合格報告,同時現場抽查測試工具是否正常和準確。
4.1 假負載
為了盡可能模擬機房實際運行情況,通常采用機架式假負載。機架式假負載由發熱電阻和散熱風扇及控制電路組成。每臺功率4-6KW ,每臺分1-1.5KW可調;可高度模擬服務器的電熱轉換效率和散熱風量,提供完整配電鏈路的壓力測試和制冷系統熱負荷的模擬測試。

圖1 機架式假負載
4.2 測試工具(儀器、儀表等)
假負載測試期間主要使用的儀表有熱成像儀、電能質量分析儀等。

圖2 測試儀器、儀表
二 假負載驗證測試
1
空載測試
空載測試是指,第三方測試公司對各系統實施目視檢查、通電檢查及單機開機測試,確認各系統是否具備帶載測試的條件。
(1) 各系統目視檢查:核實各系統設備型號規格,并對其外觀、標識、安裝方式、線纜連接、接地方式以及運維模式等進行詳細的梳理和排查。
(2) 各系統空載測試參數采集:對各系統進行通電檢查,確保各系統空載運行參數是否正常。例如,配電系統需要關注末端電壓(線電壓、相電壓、零地電壓)是否正常等。
2
半載測試
半載測試是指按照設計容量的50%加載假負載,用以檢驗配電系統、制冷系統是否可以正常帶載運行,初步確認是否具備滿載測試的條件。
在半載測試過程中,可以初步驗證各系統設備是否具備各項設計功能。同時,可以根據半載運行情況初步排除部分系統隱患,為滿載測試做準備。例如,根據配電系統各級連接點溫升初步排查系統配電系統設備容量、質量、施工工藝是否合格;根據制冷系統各節點溫升、壓強以及設備運行參數初步確認制冷系統是否正常。
3
滿載測試
當半載測試正常后,就可以按照設計容量進行100%帶載測試。在滿載測試環節,需要驗證配電系統、制冷系統各級設備容量是否滿足設計需求;需要驗證配電系統、制冷系統各級設備運行性能是否符合設計規范;需要驗證群控系統、動環系統、管控系統是否準確滿足設計要求。

圖3 MDC滿載測試
以微模塊滿載測試為例,我們主要關注:
微模塊滿載測試 | ||
---|---|---|
測試項 | 關鍵設備 | 測試內容 |
1 | 列頭柜 | 滿載性能測試,電量參數采集 |
2 | PDU | 零地電壓測試、熱成像儀掃描 |
3 | HVDC | 加載性能測試、熱成像儀掃描 |
4 | 電池 | 放電測試、熱成像儀掃描 |
5 | 末端空調 | 加載性能測試,0-100%負荷下的性能參數采集;冗余性測試;熱成像儀掃描 |
以蓄冷罐測試為例,在滿載測試期間,需要驗證蓄冷罐放冷時間是否符合運營需求,放冷模式是否符合設計要求。

圖4 蓄冷罐放冷測試
除了滿載測試,有條件的情況下,我們還推薦開展過載測試。例如,對柴發系統進行短時110%帶載測試。
4
BA群控系統測試
BA群控系統測試,主要驗證冷機系統是否能按照設計要求自動執行:停電自保持、來電自啟、加減機及故障跳轉等功能。另外,還要關注主機、水泵、冷卻塔開關機時間、順序是否符合設計要求。

圖5 群控DDC測試
5
故障測試及監控測試(動環及管控)
滿載測試期間,實際已經涵蓋了各系統設備功能測試、性能測試。動環系統、管控系統、群控系統能夠達到機房正常運行期間的各項要求。我們仍需要驗證發生常見運維故障時,配電系統、空調系統的冗余性;同時驗證群控系統的可靠性,以及動環、管控系統故障告警的準確性。
常見故障測試場景 | |||
---|---|---|---|
測試項 | 設備 | 故障場景 | 驗證 |
1 | 冷水系統 | 模擬冷機、水泵、冷卻塔、末端精密空調故障等 | 驗證系統群控系統可靠性,驗證冷水系統冗余性。 |
2 | 配電系統 | 模擬低壓柜故障、列頭柜跳閘、PDU故障等 | 驗證動環系統、管控系統可靠性,驗證配電系統冗余性。 |
3 | 柴發系統 | 模擬市電停電故障,或帶載時一臺柴發故障 | 驗證柴發啟動邏輯及冗余備份功能。 |
4 | 消防系統 | 模擬火警 | 驗證消防設備報警功能及聯動功能。 |
【注】消防系統,通常由消防局抽驗,對于未抽中的情況我們仍推薦邀請消防局進行驗收。假負載測試期間,主要測試消防設備報警及聯動功能。

圖6 群控系統效果圖
6
極限溫升測試
極限溫升測試主要是模擬滿載運行狀態下,中斷測試單元制冷,采集測試單元溫升情況以及達到極限溫度所需的時長;之后再恢復制冷,采集測試單元內溫度變化情況以及恢復至正常運行溫度所需時長。以采用水冷+MDC(微模塊)的數據中心為例,通常有兩種測試方案:
水冷微模塊數據中心極限溫升測試方案 | ||
---|---|---|
方案 | 最小測試單元 | 測試方法 |
1 | 一個MDC | 在整個機房滿載運行情況下,中斷一個MDC的冷凍水供水,采集并記錄該MDC溫度變化情況以及達到極限溫度的時長;再恢復其冷凍水供水,采集并記錄該MDC溫度變化情況以及恢復至溫度的時長。 |
2 | 一個機房單元 | 在整個機房滿載運行情況下,中斷整個機房單元的冷凍水供水,采集并記錄該機房單元溫度變化情況以及達到極限溫度的時長;再恢復其冷凍水供水,采集并記錄該機房單元溫度變化情況以及恢復至溫度的時長。 |
通常,我們先對單個MDC開展極限溫升測試,在有條件的情況下再對整個機房單元進行整體極限溫升測試。這些數據將為數據中心運營團隊制定應急保障策略提供最為直觀的參考,具有十分重要的意義。
7
系統聯調測試
在完成上述驗證測試環節后,數據中心各系統獨立運行的可靠性已經得到了初步的驗證。然而我們仍需要關注系統之間的聯動關系,這就是系統聯調測試的不可或缺之處。系統聯調測試主要是通過模擬滿載運行下,驗證市電中斷后各系統能否正常運行。
測試項 | 場景 | 系統聯調測試要求 |
---|---|---|
1 | 模擬滿載運行時,一路市電中斷 | 另一路市電是否可以順利承載整個機房負載;配電系統、制冷系統是否能夠正常運行。 |
2 | 模擬滿載運行時,兩路市電中斷 | 柴發系統能否順利帶載整個機房負載;配電系統、制冷系統是否能夠正常運行。 |

圖7 系統聯調測試
三 結束語
數據中心假負載驗證測試,為新建數據中心提供了一次真刀真槍的試運行,將前期各環節遺留的隱患盡可能暴露出來,可以最大限度降低后續運營風險。
后續我們將為大家帶來數據中心假負載驗證測試過程中各類問題的分析,敬請期待。