智算弱电学习系统
课程概览电气系统M2-02 UPS系统完整解析

M2-02 UPS系统完整解析

模块定位:UPS是数据中心供电链路的"心脏"。上一章我们从全局视角看到了UPS在供电链路中的位置,本章将深入UPS内部——理解它的工作原理、关键参数、冗余架构、容量计算,以及弱电工程师如何通过动环监控系统管理UPS。

学习目标

  • 理解三种UPS类型的工作原理和区别
  • 掌握在线式UPS的四种工作模式
  • 能解释UPS关键参数的含义及相互关系
  • 理解N+1/2N/2(N+1)冗余架构的区别
  • 能完成UPS容量计算
  • 掌握UPS与动环监控系统的接口配置方法

目录

  1. 为什么需要UPS
  2. 三种UPS类型完整对比
  3. 在线式UPS深度解析
  4. UPS关键参数详解
  5. 铅酸电池 vs 锂电池完整对比
  6. 冗余架构详解
  7. 模块化UPS vs 塔式UPS
  8. UPS容量计算完整示例
  9. 主流品牌产品线
  10. UPS与动环监控接口
  11. 速记卡
  12. 2sigma诊断题

1. 为什么需要UPS

1.1 市电并非完美

你可能会问:既然有两路独立市电加柴发后备,为什么还需要UPS?

答案在于市电质量问题切换间隙。市电看似稳定,实际上存在大量不可控的质量问题。这些问题对照明和一般设备影响不大,但对服务器等精密IT设备可能造成严重后果。

1.2 市电九大质量问题

序号问题类型表现持续时间对IT设备的影响UPS如何解决
1断电(Outage)电压降为0秒-小时设备直接停机,数据丢失电池立即接管,零切换
2电压下陷(Sag/Dip)电压瞬间降低(低于标称值80%以下)毫秒-秒设备重启、磁盘写入错误逆变器输出稳定电压
3电压浪涌(Surge)电压瞬间升高(高于标称值110%以上)毫秒-秒烧毁电源模块或主板整流器吸收浪涌
4持续欠压(Under-voltage)电压长期偏低(如降到200V以下)分钟-小时电源效率下降、过热逆变器输出标准电压
5持续过压(Over-voltage)电压长期偏高(如升到250V以上)分钟-小时加速元件老化、烧毁逆变器输出标准电压
6频率偏差(Frequency Variation)频率偏离50Hz持续磁盘驱动器异常逆变器输出标准频率
7谐波畸变(Harmonic Distortion)电压波形偏离正弦波持续电源发热、效率降低逆变器输出纯正弦波
8电气噪声(Noise)高频干扰叠加在电源上持续数据传输错误双变换隔离噪声
9瞬态尖峰(Transient/Spike)极短时间的高压尖峰(可达数千伏)微秒-毫秒击穿半导体元件整流器+SPD吸收尖峰

1.3 UPS的三大核心功能

基于上述问题,UPS的核心功能可以概括为三点:

功能一:不间断供电(Uninterruptible) 当市电中断时,UPS电池组立即接管供电,输出不中断(在线式UPS切换时间为0ms)。电池供电持续到市电恢复或柴发启动接载。

功能二:电压/频率调节(Regulation) UPS将不稳定的市电经过整流→逆变的"双变换"过程,输出稳定的电压(220V±1%)和频率(50Hz±0.1%),消除市电的欠压、过压、频率偏差等问题。

功能三:电能净化(Power Conditioning) 双变换过程同时消除了市电中的谐波、噪声、瞬态尖峰等污染,输出纯净的正弦波电源。这对精密IT设备的稳定运行至关重要。

一句话总结:UPS = 不间断 + 稳压稳频 + 净化电源。它是市电和IT设备之间的"翻译官"——把"粗糙的"市电翻译成"精致的"IT用电。

1.4 没有UPS会怎样?

假设平谷项目不装UPS:

  • 市电A路中断,ATS切换到柴发(需要10-60秒)——在这10-60秒内,9120个机柜全部断电
  • 服务器异常断电导致:文件系统损坏、数据库不一致、正在执行的AI训练任务丢失数天的计算结果
  • 即使有两路市电,同时中断的概率虽小但不为零(如雷击、电网故障)
  • 日常的电压波动和谐波会加速服务器电源老化,增加故障率

所以,UPS不是可选项,而是必需品


2. 三种UPS类型完整对比

UPS按工作原理分为三种类型:在线式(Online/Double Conversion)、后备式(Offline/Standby)、在线互动式(Line-Interactive)。数据中心几乎只使用在线式,但理解另外两种有助于全面掌握UPS技术体系。

2.1 后备式UPS(Offline / Standby UPS)

工作原理

后备式UPS是最简单、成本最低的UPS类型。其核心设计思路是:正常时市电直接供给负载,UPS只在市电异常时"出场"

正常模式:
市电输入 ──→ 旁路(直通)──→ 输出到负载
              │
              └──→ 充电器 ──→ 电池组(待命状态)

电池模式:
市电中断 ──✕
电池组 ──→ 逆变器 ──→ 输出到负载

详细工作过程

  1. 正常情况下,市电通过一个继电器或接触器直接连接到输出端,负载使用的就是原始市电。同时,一个小型充电器持续为电池组充电
  2. UPS内部有一个电压检测电路,实时监测市电电压。当检测到市电电压超出设定范围(通常±15%-20%)或完全中断时,触发切换
  3. 继电器动作,断开市电直通路径,同时启动逆变器。逆变器将电池的直流电转换为交流电输出给负载
  4. 这个切换过程需要时间——继电器的机械动作时间 + 逆变器启动时间,通常5-12ms
  5. 市电恢复后,再切换回市电直通,同时恢复充电

关键缺陷

  • 有5-12ms的切换间隙(部分敏感设备可能受影响)
  • 正常运行时市电直通,不提供电压调节和电能净化功能
  • 市电的谐波、噪声、电压波动全部直接传递给负载
  • 输出波形通常为修正正弦波(方波近似),非纯正弦波

适用场景:家用电脑、小型办公设备。绝不用于数据中心

容量范围:通常 500VA-2000VA(小功率)

2.2 在线互动式UPS(Line-Interactive UPS)

工作原理

在线互动式UPS是后备式的"升级版"。它在后备式的基础上增加了一个关键组件——自耦变压器(或双向逆变器),实现了基本的电压调节功能,同时保留了"市电直通"的高效率特点。

正常模式(含稳压):
市电输入 ──→ 自耦变压器/双向逆变器 ──→ 输出到负载
              │(电压调节±15%左右)
              └──→ 双向逆变器同时充电 ──→ 电池组

电池模式:
市电中断 ──✕
电池组 ──→ 双向逆变器(逆变模式)──→ 输出到负载

详细工作过程

  1. 正常情况下,市电通过一个自耦变压器(或双向逆变器)连接到输出。自耦变压器可以根据输入电压的高低,自动调节抽头(或PWM占空比),使输出电压维持在正常范围内
  2. 当输入电压偏低时,变压器升压输出;当输入电压偏高时,变压器降压输出。这个调节范围通常为±15%-20%
  3. 双向逆变器在正常模式下同时承担充电器的角色,为电池充电
  4. 当市电完全中断或电压偏差超出调节范围时,双向逆变器切换为逆变模式,将电池电能转换为交流电输出
  5. 切换时间约2-4ms,比后备式更短(因为逆变器已经在工作,只需改变功率方向)

相比后备式的改进

  • 增加了自动稳压功能(AVR, Automatic Voltage Regulation)
  • 切换时间更短(2-4ms vs 5-12ms)
  • 输出波形更好(通常为纯正弦波)
  • 效率较高(正常模式97%-98%,因为不经过全双变换)

仍然存在的不足

  • 仍有2-4ms的切换间隙(虽然很短,大部分设备可以承受)
  • 电压调节范围有限(超出范围仍需切换到电池)
  • 无法完全消除谐波和噪声(市电仍在"直通"路径中)
  • 不能调节频率

适用场景:中小型服务器机房、网络机柜、重要办公区域。大型数据中心通常不使用

容量范围:通常 1kVA-20kVA

2.3 在线式UPS(Online / Double Conversion UPS)

工作原理

在线式UPS是数据中心的标准选择。其核心设计思路是:市电始终经过"整流→逆变"的双变换过程,负载使用的始终是UPS逆变器输出的电源,而不是原始市电。这实现了真正的"零切换"和"全隔离"。

正常模式(双变换):
市电输入 ──→ 整流器 ──→ 直流母线 ──→ 逆变器 ──→ 输出到负载
              (AC→DC)    │        (DC→AC)
                           └──→ 电池组(浮充状态)

电池模式:
市电中断 ──✕
电池组 ──→ 直流母线 ──→ 逆变器 ──→ 输出到负载
            (电池放电到     (DC→AC)
              直流母线)

详细工作过程

  1. 整流器将输入的交流市电(380V/50Hz三相或220V/50Hz单相)转换为直流电。现代大功率UPS通常采用IGBT有源整流器(也叫PFC整流器),功率因数可达0.99以上,输入谐波THDi<3%
  2. 整流后的直流电送到直流母线(DC Bus)。直流母线电压通常为380-800VDC(取决于UPS设计)
  3. 电池组并联在直流母线上,处于浮充状态。当市电正常时,整流器同时为电池充电并供给逆变器
  4. 逆变器将直流母线上的直流电转换回交流电(220V/50Hz),使用IGBT进行PWM调制,输出纯净的正弦波。输出电压精度±1%,频率精度±0.1%
  5. 当市电中断时,整流器停止工作,电池组自动放电到直流母线,逆变器继续正常工作——输出完全不中断(0ms切换)。因为在市电正常和中断两种状态下,逆变器的工作状态没有任何变化,它始终从直流母线取电并逆变输出
  6. 市电恢复后,整流器重新启动,接管直流母线供电并恢复电池充电。全程对负载零影响

为什么叫"双变换"? 因为电经过了两次变换:AC→DC(整流)→AC(逆变)。这个"双变换"过程虽然牺牲了一定效率(5%-8%的电能在变换中损耗为热量),但获得了三大好处:

  1. 零切换时间:逆变器始终在工作,不需要切换
  2. 完全电气隔离:市电的任何问题(谐波、噪声、电压波动)在整流环节被"消化",不会传递到输出
  3. 电压/频率精确调节:逆变器独立生成输出波形,不受市电影响

适用场景所有大型数据中心的标准选择。从几十kVA到数MW的容量段都有产品。

容量范围:10kVA-数MW(模块化UPS可通过并联扩展至更大容量)

2.4 三种类型完整对比表

维度后备式在线互动式在线式
工作原理市电直通+电池后备市电+自耦变压器+电池后备全双变换(AC-DC-AC)
正常模式市电直通市电+稳压整流-逆变
切换时间5-12ms2-4ms0ms
电压调节±15%-20%持续精确调节(±1%)
频率调节有(独立生成频率)
谐波抑制部分完全隔离
噪声抑制部分完全隔离
输出波形修正正弦波/方波正弦波纯正弦波
正常效率95%-98%95%-98%92%-97%(双变换)
成本最低中等最高
体积最小中等最大
容量范围500VA-2kVA1kVA-20kVA10kVA-数MW
适用场景家用/小型办公中小型机房数据中心(唯一选择)
典型产品APC Back-UPSAPC Smart-UPS施耐德Galaxy/华为UPS5000

鸿才必记:数据中心UPS = 在线式。不要在方案文件中推荐其他类型。如果在招标文件中看到"在线式双变换UPS",那就是标准要求。


3. 在线式UPS深度解析

3.1 四种工作模式

在线式UPS有四种工作模式,弱电工程师必须能从动环监控系统中识别每种模式,并理解其含义和风险。

模式一:正常模式(Normal / Double Conversion Mode)

市电 ──→ [整流器] ──→ 直流母线 ──→ [逆变器] ──→ 输出
                        │
                   [电池组](浮充)

状态描述

  • 整流器正常工作,将市电AC转换为DC
  • 逆变器正常工作,将DC转换为AC输出
  • 电池组处于浮充状态(充满电,小电流维持)
  • 输出电源质量最佳
  • 这是数据中心期望的正常运行状态

动环监控显示

  • 运行模式:正常/在线
  • 输入状态:正常
  • 输出状态:正常
  • 电池状态:浮充
  • 负载率:xx%(根据实际负载)

弱电工程师关注

  • 确认负载率在合理范围内(建议40%-70%)
  • 确认输入输出参数在正常范围
  • 电池SOC应为100%(浮充满电)

模式二:电池模式(Battery / Stored Energy Mode)

市电 ──✕(中断)
              直流母线 ──→ [逆变器] ──→ 输出(不中断)
                │
           [电池组](放电)

状态描述

  • 市电中断(或异常严重,整流器无法工作)
  • 整流器停止
  • 电池组开始放电,维持直流母线电压
  • 逆变器继续正常工作,输出不中断
  • 倒计时开始——电池放电时间有限

切换过程(0ms): 为什么能实现零切换?因为在正常模式下,电池组本来就并联在直流母线上。当整流器停止时,直流母线电压会略有下降,电池自然开始放电。逆变器感受到的只是直流母线电压的微小波动,完全不影响其输出。这个过程是物理上的自然过渡,不需要任何切换动作。

动环监控显示

  • 运行模式:电池模式(高优先级告警)
  • 输入状态:异常/中断
  • 输出状态:正常
  • 电池状态:放电中
  • 电池SOC:xx%(逐渐下降)
  • 预估剩余时间:xx分钟(逐渐减少)

弱电工程师关注

  • 这是紧急状态! 必须立即确认柴发是否已经启动
  • 关注电池SOC下降速度和预估剩余时间
  • 如果柴发迟迟不能接载,需要启动负载卸载预案(关闭非关键设备以延长电池后备时间)
  • 记录进入电池模式的时间和原因

模式三:旁路模式(Bypass Mode)

市电 ──→ [旁路开关] ──→ 直接输出
         (绕过整流器和逆变器)

[整流器]  [逆变器](未参与供电)

状态描述

  • 市电通过UPS内部的旁路开关直接输出给负载
  • 整流器和逆变器不在供电回路中
  • 输出等于市电(无稳压、无净化、无不间断保护)
  • 负载失去UPS保护

为什么会进入旁路模式?

  1. 自动旁路:UPS逆变器故障、UPS严重过载(超过额定功率的125%持续数秒或150%以上)、UPS内部过温等异常情况下,UPS自动切换到旁路以保证负载不断电
  2. 手动旁路(维护旁路):运维人员需要维修UPS时,手动切换到旁路供电,然后安全地断开UPS进行维修

旁路切换的条件: UPS能成功切换到旁路有一个前提——旁路输入电源必须正常(电压和频率在允许范围内),且旁路输入与逆变器输出必须同步(相位差在允许范围内,通常±3°)。否则切换会导致输出电压相位突变,可能损坏负载。

动环监控显示

  • 运行模式:旁路模式(严重告警)
  • 旁路状态:已激活
  • 逆变器状态:未工作/故障
  • 输出状态:旁路供电

弱电工程师关注

  • 旁路模式是半保护状态! 虽然有电,但失去了UPS的三大核心功能
  • 如果此时市电中断,负载将直接断电
  • 必须立即通知电气工程师处理UPS故障
  • 评估风险等级:2N架构中只有一路在旁路,风险可控(另一路UPS正常工作);如果两路都在旁路,则为最高风险

模式四:ECO模式(Economy Mode / 经济运行模式)

正常时(ECO模式):
市电 ──→ [旁路开关] ──→ 直接输出(效率99%+)
         │
         └──→ [整流器]──→[逆变器](空载运行/跟踪同步,随时待命)
                           │
                      [电池组](浮充)

市电异常时:
市电 ──✕
[整流器停止] ──→ [逆变器立即接管] ──→ 输出
                   │
              [电池组]

状态描述

  • 正常时市电通过旁路直接供电(类似在线互动式),效率高达99%以上
  • 逆变器保持空载运行状态,与市电保持同步,随时准备接管
  • 当市电异常时,在极短时间内(通常2-4ms)切换到逆变器供电
  • 这是效率与保护之间的折中方案

ECO模式的争议: ECO模式通过牺牲少量保护能力(2-4ms切换间隙、正常时无电能净化)来换取2%-5%的效率提升。在大功率UPS场景下,这个效率差距意味着可观的电费节省。例如:

平谷项目UPS总容量约70MW
双变换效率96% → 损耗 = 70MW × 4% = 2.8MW
ECO效率99% → 损耗 = 70MW × 1% = 0.7MW
节省 = 2.1MW
年节省电费 = 2.1MW × 8760h × 0.8元/kWh ≈ 1470万元/年

但在A级数据中心中,ECO模式的2-4ms切换间隙被认为是不可接受的风险。大多数关键业务客户不会选择ECO模式。近年来一些UPS厂商推出了VMMS(Virtual Machine Mode with Smart)eConversion等改进的ECO模式,声称切换时间可以缩短到<1ms,试图兼顾效率和保护。

动环监控显示

  • 运行模式:ECO/经济模式
  • 旁路状态:激活(正常供电路径)
  • 逆变器状态:待命/同步跟踪
  • 效率:99%+

弱电工程师关注

  • 确认客户/运维团队是否批准使用ECO模式
  • 确认逆变器处于同步跟踪状态(如果逆变器与旁路失去同步,切换时间会大幅增加)
  • 监控ECO→双变换的切换事件(每次切换都需要记录分析)

3.2 四种模式的保护等级对比

维度正常模式电池模式旁路模式ECO模式
不间断供电有(0ms)有(0ms)部分(2-4ms)
稳压功能
频率调节
电能净化
电池保护正在使用
效率92-97%N/A~100%99%+
风险等级最低中(电池时限)最高中低
持续运行正常临时临时可长期

简记:正常模式 = 满血保护 → 电池模式 = 保护不变但有时限 → ECO模式 = 保护稍弱但省电 → 旁路模式 = 基本裸奔

3.3 UPS内部核心组件

┌──────────────────────────────────────────────────────┐
│                     UPS系统内部                        │
│                                                      │
│  市电输入 ──→ [输入滤波] ──→ [整流器/PFC] ──→ DC Bus  │
│                              (AC→DC)        │        │
│                                             │        │
│                                        [电池组] ←→ DC Bus
│                                             │        │
│              [旁路输入] ──→ [旁路开关] ──┐   │        │
│                            (SCR/接触器)  │   │        │
│                                          │   │        │
│              DC Bus ──→ [逆变器] ──→ [输出切换] ──→ 输出
│                         (DC→AC)      (逆变/旁路)     │
│                                                      │
│  [控制器/DSP]:监测所有参数,控制切换逻辑             │
│  [通信模块]:SNMP/Modbus/干接点输出                   │
│  [显示面板]:本地LCD显示和操作                        │
│  [风扇系统]:散热                                     │
│                                                      │
└──────────────────────────────────────────────────────┘

4. UPS关键参数详解

4.1 功率与容量

kVA vs kW:最容易混淆的概念

**kVA(千伏安)**是视在功率,**kW(千瓦)**是有功功率。两者的关系:

kW = kVA × 功率因数(Power Factor, PF)

什么是功率因数?

在交流电路中,电压和电流不一定同步变化。如果电压和电流完全同步(波形完全重合),功率因数=1,所有的电能都被有效利用。如果电压和电流存在相位差,或者电流波形发生畸变,部分电能以"无功功率"的形式在电源和负载之间来回流动,并不做有用功。

功率因数(PF) = 有功功率(kW) / 视在功率(kVA)
PF范围:0-1.0

例如:一台UPS标称500kVA,功率因数0.9
实际可输出有功功率 = 500 × 0.9 = 450kW

为什么UPS用kVA标称?

传统上UPS的功率因数<1(早期为0.7-0.8),kVA标称看起来"更大"。但更重要的原因是:UPS的输出受两个因素限制——逆变器的电流容量(决定kVA上限)和散热/效率(决定kW上限)。两者可能先后达到限制。

现代趋势:越来越多的UPS功率因数做到了1.0(如华为UPS5000-H系列),此时kVA=kW,简化了容量计算。

额定功率与实际可用功率

参数说明
额定容量(kVA)UPS的视在功率上限
额定有功功率(kW)额定容量 × 功率因数
建议负载率40%-70%(最佳运行区间)
实际可用功率额定有功功率 × 建议负载率上限
示例:施耐德Galaxy VX 500kVA,PF=1.0
额定有功功率 = 500kW
建议负载率上限70%时的可用功率 = 500 × 0.7 = 350kW

4.2 效率(Efficiency)

UPS效率 = 输出功率 / 输入功率 × 100%

效率不是一个固定数字,而是随负载率变化的曲线

效率(%)
  98 ┤                              ╭─────── ECO模式
  97 ┤                         ╭────╯
  96 ┤                    ╭────╯
  95 ┤               ╭────╯──────────────── 双变换模式
  94 ┤          ╭────╯
  93 ┤     ╭────╯
  92 ┤╭────╯
  91 ┤╯
  90 ┤
     └──┬──┬──┬──┬──┬──┬──┬──┬──┬──
        10 20 30 40 50 60 70 80 90 100  负载率(%)

关键规律

  1. 低负载时效率低:因为UPS自身的固定损耗(风扇、控制电路、磁性元件铁损等)在任何负载下都存在。低负载时这些固定损耗占比高,效率就低
  2. 中高负载时效率高:固定损耗被大功率负载"稀释",效率达到最高(通常在50%-75%负载率时达到峰值)
  3. 满载时效率略降:大电流导致的铜损(I²R)增加
  4. ECO模式效率:几乎不受负载率影响,始终在99%以上

弱电工程师实用知识:在动环系统中监控UPS效率(输出功率/输入功率),如果效率突然下降,可能意味着UPS内部出现了异常损耗(如风扇转速增加、整流器部分模块故障等),这是一个早期预警指标。

4.3 输入谐波(Input THD)

UPS的整流器在将AC转换为DC时,会在输入侧产生谐波电流。谐波会导致:

  • 上游变压器过热
  • 中性线电流增大
  • 断路器误跳闸
  • 电能质量下降

不同整流器类型的谐波水平

整流器类型输入THDi说明
6脉冲(传统SCR)25-35%老旧UPS,谐波严重
12脉冲(两组6脉冲+移相变压器)8-12%通过移相抵消部分谐波
有源前端/IGBT整流(PFC)<3-5%现代UPS标配,接近正弦波输入

鸿才注意:在UPS招标时,输入THDi指标非常重要。现代数据中心应要求THDi<5%。如果现场UPS输入THDi过高,会影响同一母线上其他设备的正常工作,也会导致变压器降容使用。

4.4 输出电压精度与瞬态响应

参数说明典型值
静态电压精度稳态负载下输出电压偏差±1%
动态电压偏差负载阶跃变化时的瞬时电压偏差0→100%负载阶跃时±5%以内
恢复时间从动态偏差恢复到静态精度的时间<20ms
输出频率精度自由运行时频率偏差±0.1%
电压波形失真输出THDv线性负载<1%,非线性负载<5%
过载能力逆变器承受过载的能力125%负载10min,150%负载1min

4.5 其他重要参数

参数说明数据中心关注点
输入功率因数UPS输入侧的功率因数≥0.99(有源前端),减少对上游变压器的影响
噪音UPS运行时的声压级≤65dB@1m(考虑机房内工作人员的舒适度和听力保护)
工作温度UPS允许的环境温度范围0-40℃(电池最佳温度20-25℃)
海拔降容高海拔运行时需降额使用海拔>1000m,每升高100m降容约1%
MTBF平均故障间隔时间≥200,000小时(理论值)
电池充电功率给电池充电的功率大小影响电池充满时间(通常4-8小时)

5. 铅酸电池 vs 锂电池完整对比

5.1 为什么电池选型很重要

UPS电池组是UPS系统中占地面积最大、重量最重、维护成本最高、生命周期最短的组件。在大型数据中心中,电池的投资成本可以占到UPS系统总投资的30%-50%。电池类型的选择直接影响TCO(总拥有成本)、占地面积、安全性和运维工作量。

5.2 铅酸电池(VRLA, Valve Regulated Lead Acid)

传统选择。 数据中心UPS最常用的电池类型是VRLA(阀控式密封铅酸电池),也叫免维护铅酸电池(虽然并非完全免维护)。

工作原理

  • 正极:二氧化铅(PbO2)
  • 负极:海绵状铅(Pb)
  • 电解液:稀硫酸(H2SO4)
  • 放电时:PbO2 + Pb + 2H2SO4 → 2PbSO4 + 2H2O
  • 充电时:反向反应
  • 单体电压:2V(标称)

两种子类型

  • AGM(Absorbed Glass Mat,吸附式玻璃纤维):电解液被吸附在玻璃纤维隔板中。最常用,5-10年设计寿命
  • GEL(胶体):电解液添加硅凝胶形成胶体。寿命更长(10-20年),但成本更高

5.3 锂电池(Lithium-ion)

新兴选择。 近年来磷酸铁锂(LiFePO4/LFP)电池在数据中心UPS领域快速普及。

工作原理

  • 正极:磷酸铁锂(LiFePO4)或三元锂(NMC)
  • 负极:石墨
  • 电解液:有机溶剂+锂盐
  • 通过锂离子在正负极之间的嵌入/脱嵌实现充放电
  • 单体电压:3.2V(LFP)/ 3.7V(NMC)

数据中心锂电池首选LFP(磷酸铁锂),因为其热稳定性远优于NMC(三元锂)。NMC在过充过热时有热失控风险,不适合数据中心场景。

5.4 九维度对比表

维度铅酸电池(VRLA-AGM)锂电池(LFP)对弱电工程师的影响
1. 设计寿命5-10年(标准型5年,长寿命型10年)10-15年(可与UPS同寿命)锂电池减少电池更换次数,减少项目变更管理
2. 循环次数200-500次(80%DOD)3000-5000次(80%DOD)锂电池在频繁停电地区优势明显
3. 能量密度30-50 Wh/kg100-160 Wh/kg(约为铅酸的3-4倍)锂电池占地面积和承重要求大幅减少
4. 重量重(同容量约为锂电的3-4倍)影响电池室楼板承重设计(弱电工程师需确认楼板承载力是否满足)
5. 占地面积大(需独立电池室)小(约为铅酸的1/3)锂电池可能内置于UPS机柜,减少布线距离和监控点
6. 温度敏感性极敏感(每超过25℃ 10度,寿命减半)相对不敏感(-20~55℃可工作)铅酸电池室需严格温控(25±2℃),监控温度更关键
7. 安全性过充可能产生氢气(需通风)需BMS管理,LFP热稳定性好铅酸需监控氢气浓度;锂电需监控BMS状态和每节电芯电压
8. 初始成本较低(约为锂电的1/2-1/3)较高(但价格逐年下降)影响项目预算
9. TCO(总成本)15年TCO可能更高(需更换2-3次)15年TCO通常更低(不需更换或更换1次)锂电池的长期经济性更好

5.5 电池监控要点(弱电工程师必知)

铅酸电池监控

监控项方法告警阈值说明
总电压UPS内部采集±10%标称值反映整组电池总体状态
单体电压电池巡检仪<1.75V/单体(放电末期警告)发现落后单体
充放电电流UPS内部采集过流告警判断充放电状态
环境温度电池室温度传感器>28℃告警,>35℃紧急温度每升高10℃寿命减半
单体内阻电池巡检仪超过初始值25%告警内阻增大是电池老化的核心指标
放电测试定期执行容量低于额定80%需更换每年至少一次完整放电测试

锂电池监控

监控项方法告警阈值说明
总电压BMS采集按BMS设定通过BMS通信接入
每节电芯电压BMS采集单芯>3.65V或<2.5V告警BMS实时均衡管理
每节电芯温度BMS采集>50℃告警,>60℃断开BMS自动保护
SOC/SOHBMS计算SOH<80%告警SOH(健康度)反映电池剩余寿命
绝缘电阻BMS采集<500kΩ告警高压直流系统绝缘监测
BMS通信状态动环系统通信中断告警BMS断联是严重告警

关键区别:铅酸电池的监控主要靠外部设备(电池巡检仪),锂电池自带BMS(电池管理系统),监控能力更强,弱电工程师需要学会读懂BMS的数据。BMS通常通过CAN总线或RS485(Modbus)与UPS通信,再由UPS的SNMP/Modbus接口转发给动环系统。

5.6 温度对铅酸电池寿命的影响(Arrhenius定律)

温度(℃)    寿命倍率    举例(10年设计寿命)
  20         1.25x      实际寿命 ≈ 12.5年
  25         1.0x       设计寿命 = 10年(标准条件)
  30         0.7x       实际寿命 ≈ 7年
  35         0.5x       实际寿命 ≈ 5年(寿命减半!)
  40         0.35x      实际寿命 ≈ 3.5年
  45         0.25x      实际寿命 ≈ 2.5年

这就是为什么弱电工程师必须认真对待电池室温度监控。温度传感器布点要合理(每组电池架至少一个),告警阈值要准确。如果空调故障导致电池室温度持续升高到35℃,相当于电池在"加速死亡"。


6. 冗余架构详解

6.1 为什么需要冗余?

单台UPS的可靠性再高(MTBF > 200,000小时),也不可能保证永不故障。为了满足数据中心A级99.995%的可用性要求,需要在系统层面引入冗余。

冗余的核心思想:任何单个设备故障时,其他设备能够接管,系统不中断。

6.2 N系统(无冗余)

[UPS 1] ─→ 负载组1
[UPS 2] ─→ 负载组2
[UPS 3] ─→ 负载组3
  • 每台UPS各自独立供电给一组负载
  • 任何一台UPS故障,对应的负载组断电
  • 无冗余,不适用于数据中心
  • 通常只用于对可靠性要求不高的场所

6.3 N+1冗余

[UPS 1] ──┐
[UPS 2] ──┤──→ 并联输出总线 ──→ 全部负载
[UPS 3] ──┤
[UPS 4] ──┘(冗余)

N=3(满足负载需求的最少台数)
+1=1台冗余
总计4台UPS并联运行

工作方式

  • 4台UPS并联运行,共同供给负载
  • 每台UPS承担25%的负载(总负载/4台)
  • 当任何1台UPS故障,自动退出并联系统
  • 剩余3台各承担33.3%的负载(总负载/3台)
  • 负载不受影响

关键参数

  • 正常运行:每台负载率 = 100% / (N+1)
  • 容错后:每台负载率 = 100% / N
  • 例如3+1配置:正常25%,容错后33.3%

优点

  • 相比无冗余,可靠性大幅提高
  • 成本增加相对有限(只多一台UPS)
  • 效率较高(负载分散,每台UPS工作在中等负载率)

缺点

  • 只能容忍1台UPS同时故障
  • 维护时需要在线维护(不能直接断开一台进行维修,除非有维护旁路)
  • A路B路是同一个并联系统,如果并联总线发生短路等公共故障,所有负载都受影响

适用场景:B级数据中心

6.4 2N冗余

系统A(独立)                    系统B(独立)
[UPS A1] ──┐                   [UPS B1] ──┐
[UPS A2] ──┤→ A路输出          [UPS B2] ──┤→ B路输出
[UPS A3] ──┘                   [UPS B3] ──┘
     │                              │
     └──→ 服务器A电源  服务器B电源 ←──┘
              └──────┬──────┘
                  服务器
               (双电源模块)

工作方式

  • 两套完全独立的UPS系统(A路和B路)
  • 每套系统都能独立承担100%的负载
  • 服务器配双电源模块,分别接A路和B路
  • 正常运行时,A路B路各承担约50%的负载
  • 任何一路完全故障(包括所有UPS全部故障),另一路自动接管全部负载

关键参数

  • 正常运行:每路负载率约50%
  • 一路完全故障:另一路负载率100%
  • 设备总量 = 所需容量 × 2

优点

  • 最高可靠性:A路B路完全物理隔离,无公共故障点
  • 支持在线维护:可以完全关闭一路进行维修,另一路正常供电
  • 容错能力极强:可以容忍一路中所有设备同时故障

缺点

  • 成本最高(设备量翻倍)
  • 空间需求大
  • 效率相对较低(每台UPS工作在较低负载率)

适用场景:A级数据中心的标准选择,如平谷项目

6.5 2(N+1)冗余

系统A(N+1内部冗余)             系统B(N+1内部冗余)
[UPS A1] ──┐                   [UPS B1] ──┐
[UPS A2] ──┤→ A路输出          [UPS B2] ──┤→ B路输出
[UPS A3] ──┤                   [UPS B3] ──┤
[UPS A4] ──┘(A路冗余)         [UPS B4] ──┘(B路冗余)
     │                              │
     └──→ 服务器A电源  服务器B电源 ←──┘

工作方式

  • 两套独立的UPS系统(2N),每套内部还有N+1冗余
  • 这是"双重保险":即使一路中有一台UPS故障(N+1内部容错),同时另一路也整体故障(2N系统容错),系统仍然能正常供电

关键参数

  • A路内部有冗余:A路中一台UPS故障,A路仍能承担全部负载
  • B路内部有冗余:同理
  • 即使A路整体故障,B路的N+1也能独立承担
  • 设备总量 = (N+1) × 2 = 2N + 2

优点

  • 可靠性最高(超越Tier IV要求)
  • 支持在线维护的同时还有冗余余量

缺点

  • 成本最高
  • 占地面积最大
  • 设备管理复杂

适用场景:最高等级的金融、政府数据中心

6.6 三种冗余架构总结对比

维度N+12N2(N+1)
可靠性极高最高
容错能力1台UPS整路系统整路+路内1台
设备数量N+12N2N+2
成本(相对N)1.33x2x2.67x
正常负载率75%(3+1)50%37.5%(2×(3+1))
在线维护受限支持完全支持
公共故障风险有(并联总线)
适用等级B级A级(主流)超A级
空间需求最大

鸿才实用判断法

  • 看到"2N"就知道是两套独立系统 + 双电源服务器
  • 看到"N+1"就知道是多台UPS并联 + 多一台备用
  • 看到"2(N+1)"就知道是两套系统各自内部还有备用
  • 平谷项目9120机柜A级 → 2N架构

7. 模块化UPS vs 塔式UPS

7.1 塔式UPS(传统UPS)

形态:一台独立的柜式设备,内部整流器、逆变器、控制器、旁路等全部集成在一个柜体中。通常为落地式安装,外观像一个大型机柜。

典型容量:100kVA-800kVA(单机)

代表产品

  • 施耐德 Galaxy VX / Galaxy VM
  • 伊顿 93PR / 93PM(塔式版本)
  • 维谛 Liebert EXL S1

特点

  • 单台功率大,减少设备台数
  • 内部组件定制化程度高,整体效率可以做到最优
  • 维修通常需要专业工程师,备件周期长
  • 扩容需要整柜增加,灵活性差
  • 适合初始就确定了最终容量的项目

7.2 模块化UPS

形态:UPS主机是一个空柜框架(类似模块化服务器机箱),里面插入多个标准化的功率模块。每个功率模块都是一个完整的小型UPS(包含整流器、逆变器、控制器等),可以热插拔(带电插拔)。

单模块容量:25kW-100kW(常见50kW)

系统容量:通过并联多个模块实现,单框架通常支持4-20个模块。

代表产品

  • 华为 UPS5000-H(50kW/100kW模块)
  • 施耐德 Galaxy VX(50kW模块)
  • 维谛 Liebert APM(30kW/50kW模块)
  • 科华 YTG33系列(50kW模块)
  • 伊顿 93PM(50kW模块)

特点

  • 按需扩容:初期只装满足当前负载的模块,后期增加负载时插入新模块即可
  • 热插拔维护:故障模块可以在线更换(拔出故障模块、插入新模块),全程不影响供电
  • 平均修复时间短:更换模块通常只需5-10分钟(vs塔式可能需要数小时)
  • 冗余灵活:N+1冗余通过多装一个模块实现
  • 高密度:单位面积输出功率高于塔式

7.3 完整对比表

维度塔式UPS模块化UPS
外观形态单体大柜框架+可插拔模块
典型单机/单模块容量100-800kVA25-100kW(模块)
扩容方式增加整台UPS插入新模块
扩容停机通常需要停机接线热插拔,不停机
维修方式专业工程师现场维修更换模块(运维人员可操作)
MTTR(平均修复时间)4-24小时5-15分钟
初始投资较高(需一次性购买满配置)较低(按需配置)
单位面积功率较低较高
效率略高(优化设计)略低(模块间通信和分配损耗)
可靠性依赖单机质量模块级冗余,系统可靠性更高
适用场景容量确定、追求极致效率分期建设、追求灵活性和可维护性
市场趋势逐渐减少主流选择,市场占比逐年增加

7.4 模块化UPS的N+1冗余示例

一个模块化UPS框架(支持最多8个50kW模块)

总负载需求:300kW

配置方案(N+1 = 6+1):
┌─────────────────────────────┐
│  模块化UPS框架               │
│  ┌──────┐ ┌──────┐ ┌──────┐ │
│  │模块1 │ │模块2 │ │模块3 │ │  正常时每模块负载
│  │50kW  │ │50kW  │ │50kW  │ │  = 300/7 ≈ 43kW
│  └──────┘ └──────┘ └──────┘ │
│  ┌──────┐ ┌──────┐ ┌──────┐ │  一台故障后每模块负载
│  │模块4 │ │模块5 │ │模块6 │ │  = 300/6 = 50kW
│  └──────┘ └──────┘ └──────┘ │
│  ┌──────┐ ┌──────┐          │  空槽位(可未来扩容)
│  │模块7 │ │(空)  │          │
│  │冗余  │ │      │          │
│  └──────┘ └──────┘          │
└─────────────────────────────┘

模块化UPS是当前数据中心的主流选择。华为、维谛、施耐德等主要厂商都在力推模块化产品。弱电工程师在方案设计中,需要了解模块化UPS的特点,特别是其通信接口和监控方式。模块化UPS通常能提供更细粒度的监控数据(每个模块的独立参数),动环系统需要能够展示模块级的状态信息。


8. UPS容量计算完整示例

8.1 容量计算方法论

UPS容量计算的核心流程:

Step 1:确定IT负荷总功率(kW)
Step 2:确定UPS功率因数 → 计算kVA需求
Step 3:确定冗余架构 → 计算每路/每组UPS需承担的负荷
Step 4:确定目标负载率 → 计算UPS额定容量
Step 5:选择UPS型号和数量
Step 6:计算电池配置
Step 7:验算

8.2 平谷项目UPS容量计算

Step 1:确定IT负荷

机柜数量:9,120个
单机柜设计功率:6kW
IT总负荷 = 9,120 × 6 = 54,720 kW

Step 2:考虑UPS功率因数

选用华为UPS5000-H系列,功率因数PF = 1.0
此时 kVA = kW
UPS输出需求 = 54,720 kW = 54,720 kVA

如果选用PF=0.9的UPS:

UPS输出需求(kVA) = 54,720 / 0.9 = 60,800 kVA

以PF=1.0继续计算,简化演示。

Step 3:确定冗余架构

A级数据中心 → 2N架构
每路UPS需独立承担全部IT负荷

A路UPS总容量需求 ≥ 54,720 kW
B路UPS总容量需求 ≥ 54,720 kW

Step 4:确定目标负载率

建议目标负载率(2N架构中单路满载率):不超过80%
即每路UPS额定容量 = 54,720 / 0.8 = 68,400 kW

注意:在2N正常运行时(两路均正常),每路实际负载率约为40%
     (因为负载在A/B两路之间分配)
当一路完全故障时,另一路承担全部负载,负载率升至80%

Step 5:选择UPS型号和数量

方案一:模块化UPS

选用华为UPS5000-H,单模块100kW,每框架最多6个模块(框架容量600kW)

每路需要的框架数 = 68,400 / 600 = 114个框架
每框架配置5+1模块(N+1冗余,5个工作模块+1个冗余模块)
每框架有效容量 = 5 × 100 = 500kW

重新计算:
每路需要框架数 = 54,720 / 500 = 109.44 → 取整110个框架

两路合计:220个框架,每框架6个100kW模块
总模块数 = 220 × 6 = 1,320个模块

验算:
单路最大输出 = 110 × 6 × 100 = 66,000 kW(考虑N+1冗余后为110 × 500 = 55,000 kW > 54,720 ✓)
正常两路分担时每框架负载 = 54,720 / 2 / 110 = 248.7 kW
每框架负载率 = 248.7 / 600 = 41.5% ✓
一路故障时每框架负载 = 54,720 / 110 = 497.5 kW
每框架负载率 = 497.5 / 600 = 82.9%(略超80%但在允许范围内) ✓

方案二:塔式UPS

选用施耐德Galaxy VX 1500kVA/1500kW(PF=1.0)

每路需要台数 = 68,400 / 1500 = 45.6 → 取整46台

两路合计:92台Galaxy VX

验算:
单路最大输出 = 46 × 1500 = 69,000 kW > 68,400 ✓
正常时每台负载 = 54,720 / 2 / 46 = 594.8 kW
每台负载率 = 594.8 / 1500 = 39.7% ✓

Step 6:电池配置计算

以铅酸电池(VRLA)为例,设计电池后备时间15分钟:

Step 6.1:确定电池需要供给的功率
电池供电功率 = 每路UPS满载功率 = 54,720 kW(最恶劣情况)

Step 6.2:考虑逆变器效率
实际电池放电功率 = 54,720 / 0.96(逆变器效率)= 57,000 kW

Step 6.3:计算电池能量需求
能量 = 功率 × 时间 = 57,000 kW × (15/60)h = 14,250 kWh(每路)

Step 6.4:考虑电池老化余量(通常增加25%)
电池配置容量 = 14,250 × 1.25 = 17,812 kWh(每路)

Step 6.5:选择电池规格
假设使用12V/100Ah铅酸电池组
单组能量 = 12V × 100Ah = 1.2 kWh
需要电池组数(每路)= 17,812 / 1.2 = 14,843组

实际设计中会按UPS直流母线电压配置电池串数:
假设UPS直流母线电压480VDC
每串电池 = 480V / 12V = 40节(12V电池串联)
每串能量 = 480V × 100Ah = 48 kWh
每路需要串数 = 17,812 / 48 = 371串

两路合计约742串电池
总电池数 = 742 × 40 = 29,680节12V电池

这就是为什么大型数据中心的电池室规模惊人。如果改用锂电池(能量密度提高3-4倍),电池室面积可以减少约60%-70%。

Step 7:汇总

项目方案一(模块化)方案二(塔式)
UPS型号华为UPS5000-H 100kW模块施耐德Galaxy VX 1500kVA
每路数量110框架(660模块)46台
两路合计220框架(1320模块)92台
电池后备时间15分钟15分钟
电池类型锂电(推荐)或铅酸锂电(推荐)或铅酸
UPS机房面积估算约3,300m²(每框架约15m²含维护通道)约3,680m²(每台约40m²含维护通道)
电池室面积估算锂电:约1,100m² / 铅酸:约3,300m²锂电:约1,100m² / 铅酸:约3,300m²

鸿才注意:以上计算是简化示例,实际项目中还需要考虑:

  • 分期建设(一期可能只建设30%的机柜)
  • UPS输入电缆和配电的容量限制
  • 电池室的承重限制(铅酸电池非常重)
  • 空调制冷对UPS散热的配套要求
  • 消防要求对电池室的特殊设计

9. 主流品牌产品线

9.1 施耐德电气(Schneider Electric / APC)

产品系列类型容量范围特点数据中心应用
Galaxy VX模块化/塔式500-1500kWPF=1.0,效率97%,模块化架构大型数据中心首选
Galaxy VM塔式160-225kVA紧凑型中型UPS中型机房
Galaxy VS塔式20-150kW入门级三相UPS小型机房/边缘
Symmetra PX模块化16-500kW经典模块化产品逐步被Galaxy VX替代
Smart-UPS在线互动/在线0.5-20kVA单相,机架式/塔式网络机柜/小型IT

弱电监控接口:施耐德UPS通过**网络管理卡(NMC,Network Management Card)**提供SNMP、Modbus TCP、HTTP接口。NMC是一块插入UPS的网卡,需要单独配置IP地址。施耐德的MIB文件(PowerNet MIB)是行业内最完善的。

9.2 华为(Huawei)

产品系列类型容量范围特点数据中心应用
UPS5000-H模块化50-800kW(模块50/100kW)PF=1.0,效率97%,AI节能大型数据中心
UPS5000-S模块化25-800kVA(模块25/50kVA)适中容量中型数据中心
UPS5000-A塔式30-800kVA传统塔式中小型机房
UPS5000-E模块化50-800kW支持锂电直连新一代数据中心
SmartLi锂电池配合UPS5000系列磷酸铁锂,智能BMS替代铅酸方案

弱电监控接口:华为UPS提供SNMP v1/v2c/v3、Modbus TCP/RTU、干接点。华为有自己的数据中心管理平台(DCIM),可以深度集成。第三方动环系统接入主要使用SNMP或Modbus。

9.3 维谛技术(Vertiv,原艾默生网络能源)

产品系列类型容量范围特点数据中心应用
Liebert EXL S1塔式100-1200kVA高效率,大容量大型数据中心
Liebert APM模块化30-600kW(模块30/50kW)灵活扩展,热插拔中大型数据中心
Liebert ITA2模块化6-20kVA机架式网络机柜
Liebert GXT5在线式0.75-10kVA单相在线式小型IT设备
Trinergy Cube模块化200-3600kVA超大容量模块化超大型数据中心

弱电监控接口:维谛UPS通过Liebert IntelliSlot通信卡提供SNMP、Modbus、BACnet等接口。维谛也有自己的监控平台Trellis/LIFE。

9.4 伊顿(Eaton)

产品系列类型容量范围特点数据中心应用
93PR塔式25-200kVA紧凑型中型机房
93PM模块化/塔式30-600kW(模块50kW)高效,灵活中大型数据中心
93E塔式80-800kVA经典系列各类数据中心
Blade Module模块化12-60kW刀片模块边缘/小型
9395P塔式250-1200kVA大容量大型数据中心

弱电监控接口:伊顿通过网络卡(Gigabit Network Card)提供SNMP、Modbus TCP、BACnet。伊顿的IPM(Intelligent Power Manager)软件可集中管理多台UPS。

9.5 科华数据(KSTAR)

产品系列类型容量范围特点数据中心应用
YTG33模块化50-600kW(模块50kW)国产主流模块化中大型数据中心
YTR33塔式10-600kVA传统塔式各类机房
FR-UK33模块化25-600kW新一代模块化新建数据中心

弱电监控接口:科华UPS支持SNMP、Modbus RTU/TCP、干接点。国内项目中使用较多。

9.6 品牌选择参考

选型考虑推荐品牌原因
大型A级数据中心(万柜级)华为、施耐德产品线完整,大容量方案成熟
追求性价比的国内项目华为、科华、维谛国产品牌本地服务好,价格有优势
外资客户/国际标准施耐德、伊顿、维谛国际品牌认知度高,通过Uptime认证
需要锂电配套华为、施耐德华为SmartLi方案成熟;施耐德与多家锂电厂合作

10. UPS与动环监控接口

10.1 SNMP接入详解

SNMP是UPS接入动环监控系统最常用的协议。以下以施耐德(APC)UPS为例,展示具体的接入过程和关键OID。

10.1.1 硬件配置

UPS ──[网络管理卡(NMC)]──[RJ45网线]──[监控专用交换机]──[动环监控服务器]
  1. 在UPS内安装网络管理卡(NMC),如APC AP9641/AP9643
  2. 为NMC配置IP地址(通过NMC的串口或LCD面板进入配置界面)
  3. 将NMC网口接入监控VLAN的交换机端口
  4. 在NMC上配置SNMP参数:
    • SNMP版本:v2c或v3
    • Community String(v2c):自定义只读字符串(不要使用默认的"public"!)
    • SNMP Trap接收地址:填写动环监控服务器的IP地址

10.1.2 关键SNMP OID(施耐德PowerNet MIB)

以下是弱电工程师在配置动环系统时最常用的OID列表:

# 企业OID前缀:1.3.6.1.4.1.318 (318是APC的企业编号)
# 完整路径前缀:1.3.6.1.4.1.318.1.1.1

# ============= UPS基本信息 =============
upsBasicIdentModel           .1.1.1.0    # UPS型号(字符串)
upsBasicIdentName            .1.1.2.0    # UPS名称(可自定义)
upsAdvIdentFirmwareRevision  .1.2.1.0    # 固件版本
upsAdvIdentSerialNumber      .1.2.3.0    # 序列号

# ============= 输入参数 =============
upsAdvInputLineVoltage       .3.2.1.0    # 输入电压(0.1V,如2200=220.0V)
upsAdvInputFrequency         .3.2.4.0    # 输入频率(0.1Hz)
upsAdvInputMaxLineVoltage    .3.2.2.0    # 自上次复位以来最高输入电压
upsAdvInputMinLineVoltage    .3.2.3.0    # 自上次复位以来最低输入电压

# ============= 输出参数 =============
upsAdvOutputVoltage          .4.2.1.0    # 输出电压
upsAdvOutputFrequency        .4.2.2.0    # 输出频率
upsAdvOutputLoad             .4.2.3.0    # 输出负载百分比(%)
upsAdvOutputCurrent          .4.2.4.0    # 输出电流(0.1A)
upsAdvOutputActivePower      .4.2.8.0    # 输出有功功率(W)
upsAdvOutputApparentPower    .4.2.9.0    # 输出视在功率(VA)

# ============= 电池参数 =============
upsBasicBatteryStatus        .2.1.1.0    # 电池状态(1=未知,2=正常,3=低电量)
upsAdvBatteryCapacity        .2.2.1.0    # 电池容量百分比(%)
upsAdvBatteryTemperature     .2.2.2.0    # 电池温度(℃)
upsAdvBatteryRunTimeRemaining .2.2.3.0   # 预估剩余时间(百分秒,如 30000=300秒=5分钟)
upsAdvBatteryReplaceIndicator .2.2.4.0   # 电池需更换指示(1=不需要,2=需要)
upsAdvBatteryNominalVoltage  .2.2.7.0    # 电池标称电压
upsAdvBatteryCurrent         .2.2.8.0    # 电池电流

# ============= UPS状态 =============
upsBasicOutputStatus         .4.1.1.0    # UPS输出状态
  # 1=未知, 2=在线(正常), 3=电池, 4=智能调压,
  # 5=定时休眠, 6=软件旁路, 7=关机, 8=休眠中,
  # 9=硬件故障旁路, 10=值班休眠, 11=ECO, 12=热备

# ============= 告警/诊断 =============
upsAdvTestDiagnosticSchedule .7.2.1.0    # 诊断测试计划
upsAdvTestDiagnosticsResults .7.2.3.0    # 上次诊断结果
  # 1=OK, 2=失败, 3=无效, 4=进行中

# ============= 配置参数 =============
upsAdvConfigHighTransferVolt .5.2.2.0    # 高压转电池阈值
upsAdvConfigLowTransferVolt  .5.2.3.0    # 低压转电池阈值
upsAdvConfigAlarm            .5.2.4.0    # 告警延迟设置

10.1.3 SNMP Trap配置

UPS可以主动向动环系统发送告警(SNMP Trap),无需轮询。常见Trap类型:

TrapOID后缀含义
upsOnBattery.11.1.0.6UPS切换到电池供电
powerRestored.11.1.0.9市电恢复
lowBattery.11.1.0.7电池电量低
returnFromLowBattery.11.1.0.10电池电量恢复
upsOverload.11.1.0.8UPS过载
upsDiagnosticsFailed.11.1.0.15诊断测试失败
upsBatteryNeedsReplacement.11.1.0.13电池需要更换
upsTurnedOff.11.1.0.14UPS关机
communicationLost.11.1.0.3通信中断
communicationEstablished.11.1.0.4通信恢复

10.1.4 动环系统配置步骤

1. 导入MIB文件
   - 获取UPS厂商的MIB文件(如APC的powernet.mib)
   - 在动环系统中导入MIB文件

2. 添加设备
   - 输入UPS的IP地址
   - 选择SNMP版本(推荐v2c或v3)
   - 配置认证信息(Community String或v3用户名密码)

3. 配置监控项
   - 选择需要监控的OID
   - 设置采集周期(通常30-60秒)
   - 配置单位转换(如0.1V→V)

4. 配置告警
   - 设置各参数的告警阈值
   - 配置SNMP Trap接收
   - 设置告警通知方式(短信、邮件、微信等)

5. 测试验证
   - 使用SNMP工具(如MIB Browser、iReasoning)手动查询OID,确认数据正确
   - 模拟告警事件,确认Trap能正确接收和处理

10.2 Modbus接入详解

部分UPS(特别是国产品牌)主要使用Modbus通信。以华为UPS5000为例:

通信接口:RS485或以太网(Modbus TCP)
波特率:9600bps(RS485默认)
数据格式:8数据位,1停止位,无校验
从站地址:1-247(出厂默认通常为1)

关键寄存器示例(华为UPS5000,保持寄存器,功能码03读取):

| 寄存器地址 | 参数名称 | 数据类型 | 单位 |
|-----------|----------|---------|------|
| 40001 | UPS运行状态 | UINT16 | 编码 |
| 40010 | A相输入电压 | UINT16 | 0.1V |
| 40011 | B相输入电压 | UINT16 | 0.1V |
| 40012 | C相输入电压 | UINT16 | 0.1V |
| 40013 | 输入频率 | UINT16 | 0.01Hz |
| 40020 | A相输出电压 | UINT16 | 0.1V |
| 40021 | B相输出电压 | UINT16 | 0.1V |
| 40022 | C相输出电压 | UINT16 | 0.1V |
| 40023 | A相输出电流 | UINT16 | 0.1A |
| 40024 | B相输出电流 | UINT16 | 0.1A |
| 40025 | C相输出电流 | UINT16 | 0.1A |
| 40030 | 输出有功功率 | UINT32 | W |
| 40032 | 负载百分比 | UINT16 | 0.1% |
| 40040 | 电池电压 | UINT16 | 0.1V |
| 40041 | 电池电流 | INT16 | 0.1A |
| 40042 | 电池温度 | INT16 | 0.1℃ |
| 40043 | 电池SOC | UINT16 | % |
| 40044 | 剩余放电时间 | UINT16 | min |
| 40050 | 告警代码1 | UINT16 | 位编码 |
| 40051 | 告警代码2 | UINT16 | 位编码 |

注意:以上寄存器地址为示例。实际项目中必须以厂商提供的官方通信协议文档为准。不同型号、不同固件版本的寄存器定义可能不同。

10.3 干接点接入

对于不需要详细数据、只需要关键状态的场景,可以使用UPS的干接点输出。典型的UPS干接点信号:

干接点编号信号含义类型接线方式
DO1市电正常常闭市电正常闭合,中断断开
DO2电池模式常开电池供电时闭合
DO3电池低电量常开电池电量低时闭合
DO4UPS故障常开UPS故障时闭合
DO5旁路模式常开旁路运行时闭合
DO6过载常开过载时闭合

干接点方式的优点是简单可靠,不依赖通信协议;缺点是只能获取开关量状态,无法获取具体的电压、电流、功率等模拟量数据。

在实际项目中,通常SNMP/Modbus为主,干接点为辅。SNMP/Modbus用于日常监控和数据采集,干接点作为"最后防线"——即使通信网络故障,干接点信号仍然能到达监控系统(走独立的硬接线通道)。


11. 速记卡

卡片1:三种UPS类型

类型原理切换时间数据中心用?
后备式市电直通+电池后备5-12ms不用
在线互动式市电+稳压+电池后备2-4ms不用
在线式全双变换AC-DC-AC0ms唯一选择

卡片2:在线式UPS四种模式

正常模式 → 满血保护(整流-逆变双变换)
电池模式 → 保护不变但有时限(电池放电)
旁路模式 → 基本裸奔(市电直通,无UPS保护)
ECO模式  → 省电但切换有间隙(2-4ms)

卡片3:kW vs kVA

kW = kVA × 功率因数(PF)
PF = 1.0 → kW = kVA(现代UPS趋势)
PF = 0.9 → 500kVA UPS实际输出 = 450kW

卡片4:冗余架构

N+1:多台并联+1台备用 → B级
2N :两套独立系统 → A级(平谷项目)
2(N+1):两套各自N+1 → 超A级

卡片5:铅酸 vs 锂电

铅酸锂电(LFP)
寿命5-10年10-15年
重量重(3-4倍)
面积小(1/3)
初始成本
TCO高(多次更换)
温度敏感极敏感相对不敏感

卡片6:UPS效率

双变换模式:92%-97%(负载率40%-70%最优)
ECO模式:99%+
低负载效率低(固定损耗占比高)
效率突降 = 可能有内部异常

卡片7:SNMP关键概念

MIB = 管理信息库(参数定义文件)
OID = 参数的唯一标识(一串数字)
GET = 主动查询
TRAP = 设备主动上报告警
Community = v2c版本的"密码"

卡片8:平谷UPS关键数字

IT负荷:54.72MW
架构:2N
每路UPS容量需求:~68MW(80%负载率)
UPS台数估算:220框架(模块化) 或 92台(塔式)
电池后备时间:15分钟

12. 2sigma诊断题

题目1:UPS模式判断

场景:凌晨3点,你值班时动环监控系统先后弹出以下告警:

  • 03:00:15 UPS-A3 输入电压异常(低于170V)
  • 03:00:16 UPS-A3 切换到电池模式
  • 03:00:45 柴发A机组1#启动
  • 03:01:30 柴发A机组1#-5#并机成功
  • 03:01:35 ATS-A3 切换到柴发供电
  • 03:01:40 UPS-A3 恢复到正常模式

问题

  1. 描述这1分25秒内发生了什么
  2. 在03:00:16到03:01:40期间,IT设备有没有断电?为什么?
  3. 如果UPS-A3的电池只有8分钟后备时间,这次事件有风险吗?

参考答案

  1. 市电A路电压下降至170V(低于UPS正常工作范围的下限,通常约176V/80%标称值),UPS-A3的整流器无法正常工作,UPS自动切换到电池供电模式。同时ATS/柴发控制系统检测到市电异常,启动柴发机组。约75秒后柴发并机成功并通过ATS向UPS供电,UPS检测到稳定输入电源后恢复正常双变换模式。

  2. IT设备全程无断电。 因为UPS-A3是在线式UPS,电池模式下逆变器持续工作输出不中断(0ms切换)。即使A路整个过程中有约85秒处于电池模式,逆变器输出始终稳定——IT设备感受不到任何变化。而且这是2N架构,B路UPS全程正常,即使A路UPS完全失败,B路也能独立供电。

  3. 风险可控但需要关注。 电池模式持续了约85秒(1分25秒),远低于8分钟(480秒)的后备时间。但如果柴发启动失败(例如需要重试),或者并机时间更长,风险就会增加。建议:(a) 确认电池后备时间是否为最新测试数据(电池老化后实际后备时间可能低于设计值);(b) 建议至少配置15分钟后备时间以应对柴发多次启动失败的极端情况。


题目2:容量计算验证

场景:某项目使用施耐德Galaxy VX 500kW(PF=1.0)模块化UPS,每个框架最多装5个100kW模块。采用2N架构,IT负荷为3000kW。设计要求UPS负载率不超过70%(一路故障时)。

问题:需要多少个UPS框架?每个框架装几个模块?

参考答案

2N架构,每路需独立承担全部3000kW负荷

每路UPS额定容量 = 3000kW / 0.7 = 4285.7kW

每框架最大容量 = 5 × 100 = 500kW
每路需要框架数 = 4285.7 / 500 = 8.57 → 取整9个框架

考虑框架内N+1冗余(4+1模块配置):
每框架有效容量 = 4 × 100 = 400kW
每路需要框架数 = 3000 / 400 = 7.5 → 取整8个框架

方案:每路8个框架,每框架5模块(4+1冗余)
两路合计:16个框架,80个100kW模块

验算:
一路故障时,另一路输出 = 8 × 400 = 3200kW > 3000kW ✓
负载率 = 3000 / (8×500) = 75%(略高于70%目标)

如果严格要求≤70%:
每路9个框架,每框架5模块(4+1冗余)
有效容量 = 9 × 400 = 3600kW
负载率 = 3000 / (9×500) = 66.7% ✓
两路合计:18个框架,90个模块

题目3:电池选型分析

场景:客户在考虑平谷项目的电池方案,有两个选项:

  • 选项A:铅酸电池(VRLA-AGM),10年设计寿命,单价X
  • 选项B:磷酸铁锂电池,15年设计寿命,单价3X

项目设计使用周期20年。铅酸电池需要每10年更换一次(含安装费用每次0.2X),锂电池需要每15年更换一次。

问题:从TCO(总拥有成本)角度分析哪个选项更经济。

参考答案

假设初始电池投资为1000万元(以铅酸为基准1X=1000万)

选项A(铅酸)20年TCO:
- 第0年:初始采购 1000万(1X)
- 第10年:第一次更换 1000万 + 安装200万(1.2X)
- 总计:2200万元

选项B(锂电)20年TCO:
- 第0年:初始采购 3000万(3X)
- 第15年:第一次更换 3000万 + 安装200万(假设同比例安装费)
- 但15年后锂电池价格可能已大幅下降(预计降至1.5X-2X)
  假设15年后锂电价格降至2X:2000万 + 200万 = 2200万
- 总计:5200万元

纯采购成本看,铅酸更便宜。

但还需考虑:
1. 占地面积成本:锂电占地约为铅酸的1/3
   假设电池室3000m²(铅酸)vs 1000m²(锂电)
   节省2000m²机房面积,按10万元/m²建造成本 = 节省2亿元

2. 制冷成本:铅酸对温度更敏感,需要更精确的制冷
   锂电电池室可以适当提高温度设定,节省空调能耗

3. 运维成本:铅酸需要更频繁的巡检和维护

4. 项目中断风险:更换电池期间的风险成本

综合分析:虽然锂电初始投资高,但在大型项目中,考虑占地面积节省和长寿命优势,锂电的综合TCO通常更优。平谷项目这样的万柜级数据中心,电池室面积节省带来的价值远超电池本身的价差。

题目4:SNMP配置排错

场景:你在动环系统中添加了一台施耐德Galaxy VX UPS(IP: 10.1.1.100),SNMP版本v2c,Community String设为"monitor2024"。但系统显示"设备离线",无法获取任何数据。

问题:列出你的排查步骤。

参考答案

Step 1:网络连通性检查

ping 10.1.1.100
  • 如果ping不通:检查物理网线连接、NMC网口指示灯、IP地址配置是否正确、是否在同一VLAN、交换机端口是否启用
  • 如果ping通:继续下一步

Step 2:SNMP服务验证 使用SNMP工具(如snmpget/snmpwalk)从监控服务器直接测试:

snmpget -v 2c -c monitor2024 10.1.1.100 1.3.6.1.2.1.1.1.0

(查询sysDescr,这是任何SNMP设备都支持的标准OID)

  • 如果超时无响应:

    • 检查NMC上的SNMP是否启用(登录NMC web界面查看)
    • 检查NMC上配置的Community String是否与动环系统中配置的一致(区分大小写!)
    • 检查NMC上是否有访问控制列表(ACL),是否限制了监控服务器的IP地址
    • 检查防火墙是否放行了UDP 161端口(SNMP默认端口)
  • 如果返回数据:说明SNMP通信正常,问题在动环系统配置端

Step 3:动环系统端排查

  • 确认动环系统中配置的IP地址正确无误
  • 确认SNMP版本选择正确(v1/v2c/v3)
  • 确认Community String完全匹配(包括大小写、前后空格)
  • 确认采集周期设置合理
  • 确认MIB文件已正确导入
  • 查看动环系统日志,是否有SNMP通信错误信息

Step 4:端口冲突检查

  • 确认监控服务器上没有其他进程占用UDP 161端口
  • 确认不存在IP地址冲突

Step 5:NMC版本兼容性

  • 某些旧版NMC固件可能不支持某些SNMP功能或OID
  • 确认NMC固件是最新版本

题目5:冗余架构选择

场景:你的客户有三个数据中心项目需要设计UPS冗余方案:

  • 项目A:市政务云平台,200个机柜,B级
  • 项目B:某银行核心交易系统,500个机柜,A级
  • 项目C:某互联网公司内容缓存节点(CDN),50个机柜,可容忍短暂中断

问题:为每个项目推荐UPS冗余架构,并说明理由。

参考答案

项目A(政务云,B级,200柜): 推荐 N+1冗余

  • B级标准要求N+1冗余即可满足
  • 200柜规模适中,N+1配置成本合理
  • 例如:4+1配置(5台UPS并联,4台工作+1台冗余)
  • 配合双路市电+柴发后备

项目B(银行核心,A级,500柜): 推荐 2N冗余(甚至可考虑2(N+1))

  • 银行核心交易系统是金融行业最关键的IT系统,年可用性要求极高
  • A级标准要求2N或2(N+1)
  • 两套完全独立的UPS系统,配合服务器双电源
  • 如果预算允许,2(N+1)提供额外的安全裕度
  • 即使一路UPS完全故障+同时另一路有一台UPS维护,系统仍然可用

项目C(CDN节点,50柜,可容忍中断): 推荐 N系统或N+1冗余(最低配置)

  • CDN节点的特点是可替代——一个节点故障,流量可以自动调度到其他节点
  • 50柜规模小,成本敏感
  • 可以考虑N系统(无冗余UPS)+柴发后备
  • 或者简单的N+1以提供基本冗余
  • 甚至可以考虑不配置柴发,只靠UPS电池桥接短暂市电中断

关键思维:冗余架构选择的核心是业务可用性需求vs成本的平衡。不是所有项目都需要2N。弱电工程师在做方案时,需要理解客户的业务等级需求,避免过度设计或设计不足。


附录A:UPS运维检查清单(弱电工程师版)

日常巡检(每日)

  • 检查动环系统中所有UPS状态是否"正常/在线"
  • 检查是否有未处理的UPS告警
  • 检查UPS负载率是否在合理范围(40%-70%)
  • 检查电池SOC是否为100%(浮充满电)
  • 检查UPS机房温度是否正常(<35℃)

周检

  • 查看UPS运行日志,分析一周内的切换事件和告警事件
  • 检查UPS效率数据,是否有异常波动
  • 检查电池温度趋势,是否有异常升高

月检

  • 记录UPS关键运行参数(输入电压、输出电压、负载率、效率、电池电压)
  • 与上月数据对比分析
  • 检查SNMP/Modbus通信是否稳定(有无通信中断记录)

年度维保配合

  • 配合电气工程师进行UPS维护保养时的监控系统操作
  • 配合进行电池放电测试时的数据记录
  • 更新动环系统中的设备信息(固件版本、电池更换记录等)

本章小结

  1. UPS解决市电的九大质量问题,核心功能是不间断+稳压+净化
  2. 数据中心只用在线式UPS(双变换,0ms切换)
  3. 四种工作模式中,正常模式是最佳状态,旁路模式风险最高
  4. 理解kW vs kVA、功率因数、效率曲线等关键参数
  5. 锂电池是趋势,但需要关注BMS监控
  6. 2N是A级数据中心标配,平谷项目使用2N架构
  7. 模块化UPS是市场主流,热插拔和按需扩容是核心优势
  8. SNMP是UPS接入动环最常用的协议,掌握OID是关键

下一章预告:M2-03 HVDC与柴发系统——另一条供电技术路线和最后的保障