M2-01 供电架构全景与弱电接口
模块定位:本章是电气系统学习的起点。作为弱电工程师,你不需要能设计供配电系统,但你必须能"读懂"它——知道每一个节点是什么、干什么、跟你的动环监控系统之间有哪些接口。本章将从供电链路的第一个节点(市电引入)讲到最后一个节点(服务器电源),逐一拆解。
学习目标:
- 能画出A级数据中心完整供电链路图
- 理解每个供电节点的功能和关键参数
- 明确弱电工程师需要从电气系统获取的全部信息
- 掌握动环监控与电气设备的通信接口类型
- 能对平谷项目的供电架构进行基本分析
目录
1. 数据中心供电与普通建筑供电的本质区别
1.1 为什么要单独学数据中心供电?
你在做弱电项目时,可能接触过写字楼、医院、酒店等建筑的弱电系统。这些建筑的供配电相对简单——市电进来,变压器降压,配电箱分配,照明和插座用电。偶尔有应急电源(EPS)给消防设备供电。但数据中心完全不同。
一句话概括区别:普通建筑的供电是"能用就行",数据中心的供电是"绝对不能断"。
1.2 八个本质区别
| 维度 | 普通建筑 | 数据中心 | 弱电工程师关注点 |
|---|---|---|---|
| 可靠性要求 | 允许短暂停电(分钟级) | A级要求99.995%可用性(年停电≤26分钟) | 动环监控必须实时监测所有供电链路状态 |
| 冗余设计 | 通常无冗余或简单冗余 | 2N或2(N+1)全链路冗余 | 监控系统需覆盖每一条冗余路径 |
| 切换时间 | ATS切换允许秒级中断 | UPS保证零中断(0ms切换) | 切换事件必须被监控系统捕获和记录 |
| 供电密度 | 50-100 W/m² | 传统:1-3 kW/m²;AI算力:5-20 kW/m² | 高密度区域温度、电流监控点更密集 |
| 电能质量 | 对谐波、电压波动容忍度高 | 对电能质量有严格要求(UPS整流滤波) | 需监控THD(总谐波畸变率)、功率因数等 |
| 后备电源 | EPS(应急电源)覆盖消防 | 柴油发电机+UPS电池组,覆盖全部IT负荷 | 柴发启动状态、燃油液位、电池SOC均需监控 |
| 配电层级 | 2-3级(变压器→配电箱→终端) | 5-7级(市电→高配→ATS→UPS→列头柜→PDU→服务器) | 每一级都需要独立监控点 |
| 管理精度 | 楼层级或区域级 | 机柜级甚至服务器级 | 需要精确到每个机柜的用电量计量 |
1.3 等级划分(GB 50174-2017)
中国国家标准《数据中心设计规范》GB 50174-2017将数据中心分为A、B、C三级:
A级(容错级):
- 电子信息系统运行中断将造成重大经济损失或社会影响
- 要求2N或2(N+1)冗余供电
- 至少两路独立市电引入
- 柴油发电机组后备
- UPS不间断供电
- 年可用性 ≥ 99.995%(年停电时间 ≤ 26.28分钟)
B级(冗余级):
- 电子信息系统运行中断将造成较大经济损失或社会影响
- 要求N+1冗余供电
- 至少一路可靠市电 + 柴发后备
- UPS不间断供电
- 年可用性 ≥ 99.99%(年停电时间 ≤ 52.56分钟)
C级(基本级):
- 基本需求
- 单路市电 + 柴发可选
- UPS可选
- 年可用性 ≥ 99.9%(年停电时间 ≤ 8.76小时)
鸿才笔记:你做的平谷智算数据中心(9120个机柜),毫无疑问是A级。两路独立市电引入 + 柴发后备 + 2N UPS,这是标配。动环监控系统需要覆盖所有冗余链路的每个节点。
1.4 Uptime Institute Tier等级与国标的对应关系
国际上常用Uptime Institute的Tier分级,与国标的大致对应关系:
| Uptime Tier | 对应国标 | 特点 | 年可用性 |
|---|---|---|---|
| Tier I | C级 | 基本 | 99.671% |
| Tier II | B级偏低 | 冗余组件 | 99.741% |
| Tier III | B级偏高 | 可并行维护 | 99.982% |
| Tier IV | A级 | 容错 | 99.995% |
关键概念:Tier III的"可并行维护"(Concurrently Maintainable)意味着任何设备维护时不需要停机;Tier IV的"容错"(Fault Tolerant)意味着单点故障不会导致停机。这两个概念直接影响弱电监控系统的设计——你的监控系统本身也需要冗余。
2. A级供电链路完整解析
2.1 供电链路全景图
下面是A级数据中心典型的2N供电链路。请仔细研读,这是本模块最核心的知识框架:
┌─────────────┐
│ 电网A路 │
│ (110kV/35kV) │
└──────┬──────┘
│
┌──────▼──────┐ ┌─────────────┐
│ 高压开关站 │ │ 电网B路 │
│ (110kV GIS) │ │ (110kV/35kV) │
└──────┬──────┘ └──────┬──────┘
│ │
┌──────────┴────────┐ ┌───────┴─────────┐
│ 变压器A │ │ 变压器B │
│ (110kV→10kV) │ │ (110kV→10kV) │
└──────────┬────────┘ └───────┬─────────┘
│ │
┌──────────▼────────┐ ┌───────▼─────────┐
│ 高压配电柜A │ │ 高压配电柜B │
│ (10kV) │ │ (10kV) │
└──────────┬────────┘ └───────┬─────────┘
│ │
┌──────────▼────────┐ ┌───────▼─────────┐
│ 变压器A │ │ 变压器B │
│ (10kV→0.4kV) │ │ (10kV→0.4kV) │
└──────────┬────────┘ └───────┬─────────┘
│ │
┌──────────▼────────┐ ┌───────▼─────────┐
│ ATS/STS A │ │ ATS/STS B │
│ (双路切换) │ │ (双路切换) │
└──────────┬────────┘ └───────┬─────────┘
│ │
┌────────────┤ ├────────────┐
│ │ │ │
┌──────▼──────┐ │ ┌──────▼──────┐ │
│ 柴油发电机 │ │ │ 柴油发电机 │ │
│ 机组A │ │ │ 机组B │ │
└─────────────┘ │ └─────────────┘ │
│ │
┌──────────▼────────┐ ┌───────▼─────────┐
│ UPS系统A │ │ UPS系统B │
│ (含电池组) │ │ (含电池组) │
└──────────┬────────┘ └───────┬─────────┘
│ │
┌──────────▼────────┐ ┌───────▼─────────┐
│ 低压配电柜A │ │ 低压配电柜B │
│ (UPS输出柜) │ │ (UPS输出柜) │
└──────────┬────────┘ └───────┬─────────┘
│ │
┌──────────▼────────────────────▼─────────┐
│ 列头柜/精密配电柜 │
│ (A路输入 + B路输入,双路汇聚) │
└──────────────────┬───────────────────────┘
│
┌────────▼────────┐
│ PDU │
│ (机柜配电单元) │
└────────┬────────┘
│
┌────────▼────────┐
│ 服务器/ │
│ IT设备电源 │
│ (双电源模块) │
└─────────────────┘
注意:上图是简化的2N架构。实际项目中A路和B路是完全独立的两套系统,从市电引入到UPS输出,任何一路的任何节点故障,都不会影响IT设备供电。这就是"容错"的含义。
2.2 节点1:市电引入
功能说明
市电引入是数据中心供电的起点。对于A级数据中心,需要从不同变电站引入至少两路独立的高压电源。"独立"是关键词——两路电必须来自不同的上级变电站,最好来自不同的电网线路,以确保一路故障不会影响另一路。
在中国,大型数据中心通常从110kV或35kV电压等级引入。超大型数据中心(如平谷项目这种万柜级别)通常从110kV引入,因为35kV在大容量下电流过大,线损和设备成本反而更高。
市电引入的物理形态通常是架空线路或电缆沟。架空线路成本低但可靠性稍差(受雷击、台风、覆冰等影响);电缆沟(地埋电缆)可靠性更高但成本较大。A级数据中心通常两路市电中至少有一路采用电缆引入。
关键参数
| 参数 | 说明 | 典型值 |
|---|---|---|
| 电压等级 | 市电引入的电压级别 | 110kV / 35kV / 10kV |
| 引入路数 | 独立电源路数 | A级≥2路,来自不同变电站 |
| 供电容量 | 每路市电的最大供电能力 | 根据总负荷计算,需留余量 |
| 供电可靠性 | 市电的统计可用率 | 一线城市 ≥ 99.9% |
| 电能质量 | 电压偏差、频率偏差、谐波 | 电压偏差±7%,频率偏差±0.2Hz |
弱电工程师关注点
- 市电状态监控:需要在高压进线处安装电力监测仪表,通过通信接口(通常是Modbus RTU/TCP)将电压、电流、功率、频率、功率因数等数据上传至动环监控系统
- 市电中断告警:市电中断是最高级别告警之一,必须第一时间推送给值班人员
- 电能质量监控:长期记录电压偏差、频率偏差、谐波含量等数据,为供电质量评估提供依据
- 电度计量:用于能耗统计和PUE计算,需要在市电引入处安装智能电表
2.3 节点2:高压开关站 / 高压配电室
功能说明
高压开关站是市电引入后的第一个配电节点。其核心功能是接收、分配和保护高压电源。高压开关站内的主要设备包括高压断路器(真空断路器或SF6断路器)、隔离开关、电流互感器(CT)、电压互感器(PT)、避雷器、母线等。
在110kV等级,通常采用GIS(Gas Insulated Switchgear,气体绝缘开关设备),体积紧凑、可靠性高、维护量小,非常适合数据中心这种对供电可靠性要求极高的场景。GIS设备将断路器、隔离开关、接地开关、电流互感器、电压互感器等集成在一个密封的SF6气体腔体内。
高压配电室通常采用环网柜或中置柜的形式。环网柜用于10kV/35kV电缆环网接线,中置柜用于终端变电站配电。每个出线回路都配有保护装置(微机综合保护),可实现过流保护、速断保护、零序保护、过压保护、欠压保护等功能。
关键参数
| 参数 | 说明 | 典型值 |
|---|---|---|
| 额定电压 | 设备的额定工作电压 | 12kV / 40.5kV / 126kV |
| 额定电流 | 母线和开关的额定通过电流 | 630A-4000A |
| 短路耐受电流 | 能承受的最大短路电流 | 25kA-50kA |
| 断路器类型 | 灭弧介质类型 | 真空(10kV)/ SF6(35kV以上) |
| 保护配置 | 微机保护的功能配置 | 过流、速断、零序、重合闸等 |
弱电工程师关注点
- 微机保护装置通信接口:现代综合保护装置(如南瑞继保PCS-9000系列、许继WGB系列)通常支持RS485/以太网通信,协议为IEC 61850或Modbus。动环系统需读取保护动作信息、开关位置状态
- SF6气体密度监测:GIS设备需监测SF6气体密度/压力,低于阈值告警(SF6气体泄漏影响绝缘和灭弧性能)
- 温度监测:高压开关柜内母线接头、断路器触头等部位需安装无线测温传感器,预防因接触电阻增大导致的过热
- 开关状态(分/合):通过辅助触点或保护装置通信获取每个开关的分合状态,在动环系统中实时展示一次接线图
2.4 节点3:变压器
功能说明
变压器是供电链路中最关键的设备之一,其功能是电压变换。数据中心通常需要至少两级变压:第一级将110kV/35kV降至10kV(在高压开关站或户外变电站完成),第二级将10kV降至400V(0.4kV)供UPS和其他低压设备使用。
数据中心常用的变压器类型有两种:油浸式变压器和干式变压器。油浸式变压器效率高、散热好、容量大,但需要独立的变压器室和消防设施(因为变压器油是可燃物)。干式变压器不含油,防火性能好,可与低压配电设备同室布置,但散热性能较油浸式差,通常用于室内和对防火要求高的场景。
A级数据中心的变压器配置遵循2N原则:两路市电各配独立的变压器组,任何一台变压器故障或维护时,另一路变压器组能承担全部负荷。这意味着正常运行时每台变压器只工作在50%左右负载率——这也是变压器效率最优的工作点附近。
变压器的容量选择需要考虑:IT负荷、制冷负荷、照明动力负荷、损耗、未来扩容余量等因素。通常按最终满载容量的110%-130%选型。
关键参数
| 参数 | 说明 | 典型值 |
|---|---|---|
| 额定容量 | 变压器的视在功率容量 | 1000kVA-2500kVA(单台) |
| 变比 | 一次/二次电压比 | 10kV/0.4kV 或 35kV/10kV |
| 阻抗电压 | 短路阻抗百分比 | 4%-6%(影响短路电流大小) |
| 联结组标号 | 绕组连接方式 | Dyn11(最常用) |
| 温升限值 | 允许的温度上升值 | 干式F级100K/H级125K |
| 空载损耗 | 无负荷时的铁芯损耗 | 依容量,1000kVA约1.7kW |
| 负载损耗 | 满载时的铜损 | 依容量,1000kVA约10kW |
| 效率 | 输出功率/输入功率 | 97%-99% |
弱电工程师关注点
- 温度监测:干式变压器通常配有温控器(如BWD系列),通过RS485输出三相绕组温度。油浸式变压器需监测油温和绕组温度。温度是变压器健康状态的核心指标——绕组温度过高直接影响绝缘寿命
- 负载率监控:通过在低压侧安装智能电表或电力仪表,实时计算变压器负载率。一般建议日常负载率不超过70%-80%
- 风机运行状态:干式变压器在负载率超过一定值时会启动强制风冷(AN→AF),需监控风机的运行/停止/故障状态
- 油位/油温/瓦斯(油浸式):油浸式变压器需监测油位(油位计)、油温(温度传感器)、瓦斯继电器状态(轻瓦斯告警、重瓦斯跳闸——指变压器内部故障产生气体)
2.5 节点4:高压配电柜(10kV)
功能说明
高压配电柜(也称中压配电柜,因为10kV在国际标准中属于中压范畴)是10kV电能分配的核心设备。其功能是将变压器输出的10kV电源,通过母线分配到各个出线回路——每个回路通常对应一台10kV/0.4kV降压变压器。
数据中心10kV配电柜通常采用中置式开关柜(如ABB UniGear、施耐德PIX、国产KYN28系列),柜内配置真空断路器。中置式开关柜的特点是断路器安装在柜体中部的手车上,可以方便地推进(工作位置)、拉出(试验位置)、完全脱离(检修位置),实现带电检修和维护。
在2N架构中,10kV配电通常采用单母线分段接线方式:每路市电各供一段母线,两段母线之间设联络开关(母联)。正常运行时母联断开,两段母线独立运行;当一路市电故障时,母联可以合闸,由另一路市电同时供两段母线。但在严格的2N设计中,通常不设母联或母联常开不自投,以保持两路的完全独立性。
关键参数
| 参数 | 说明 | 典型值 |
|---|---|---|
| 额定电压 | 系统标称电压 | 10kV(12kV设备电压) |
| 额定电流 | 母线/出线额定电流 | 母线2000-3150A,出线200-630A |
| 防护等级 | 外壳防护 | IP4X(前面板)/ IP2X(操作面) |
| 开关柜类型 | 结构形式 | 中置式(KYN28/ABB UniGear) |
| 五防联锁 | 防误操作措施 | 机械联锁+电气联锁 |
弱电工程师关注点
- 开关位置状态:每个断路器的分/合/试验位置,通过辅助触点采集或综保通信读取
- 保护动作记录:每次保护动作(过流、速断、接地等)都需要记录时间戳、动作类型、故障电流值等信息,用于事后分析
- 母线电压/电流:实时监测每段母线的电压和电流,通过PT/CT接电力仪表
- 柜内环境:温湿度、凝露状况。高压柜内凝露会导致绝缘事故,需在柜内安装温湿度传感器并配合除湿加热器
2.6 节点5:ATS/STS(自动转换开关)
功能说明
ATS(Automatic Transfer Switch,自动转换开关)是实现双路电源自动切换的关键设备。当首选电源(常用电源)出现故障时,ATS自动切换到备用电源;当首选电源恢复正常后,可以自动或手动切回。
在数据中心供电链路中,ATS/STS通常出现在以下位置:
- 低压侧(0.4kV):在UPS输入前,实现两路低压市电的自动切换
- 市电与柴发之间:当市电中断时,自动切换到柴油发电机供电
- 在UPS旁路输入:为UPS旁路提供双路选择
ATS是机械切换设备,内部有两组接触器或断路器,通过机械联锁保证同一时刻只有一路接通。切换时间通常在100ms-500ms之间(包含检测延时和机械动作时间)。对于UPS前端的ATS,这个切换时间是可以接受的,因为UPS电池会在切换期间接管供电。
STS(Static Transfer Switch,静态转换开关)是电子切换设备,使用SCR(可控硅/晶闸管)替代机械触点,切换时间可以做到2-4ms,甚至更短。STS通常用于UPS输出之后、对切换时间极其敏感的场合。
注意:ATS和STS的详细对比见下一节(第3节)。
关键参数
| 参数 | 说明 | ATS典型值 | STS典型值 |
|---|---|---|---|
| 额定电流 | 最大通过电流 | 100-6300A | 100-4000A |
| 切换时间 | 从检测到故障到完成切换 | 100-500ms | 2-4ms |
| 机械寿命 | 机械部件的切换次数 | 数千至上万次 | 无机械磨损 |
| 电气寿命 | 带负荷切换次数 | 数千次 | 理论上无限 |
| 转换方式 | 开路转换/闭路转换 | 开路转换(先断后合) | 可闭路转换(先合后断) |
| 效率 | 正常运行时的损耗 | ≈100%(触点损耗极小) | 99.5%-99.8%(SCR导通损耗) |
弱电工程师关注点
- 当前工作路数:A路/B路,正常应工作在首选电源
- 切换动作记录:每次切换的时间、原因(欠压/过压/缺相/频率异常)、切换耗时
- 通信接口:多数ATS/STS控制器支持Modbus RTU(RS485)或干接点输出。需在动环系统中显示当前供电路径
- 切换失败告警:切换不成功是严重告警,需立即通知运维人员
2.7 节点6:UPS(不间断电源)
功能说明
UPS是数据中心供电链路中最核心的保护设备,其功能是确保IT设备供电的连续性和电能质量。UPS将市电交流电整流为直流电,为电池充电,同时通过逆变器将直流电转换回交流电输出给负载。当市电中断时,电池提供直流电,逆变器继续输出交流电,实现"不间断"供电。
UPS的工作原理、类型、参数、冗余架构等内容非常丰富,将在下一章(M2-02)详细展开。本节仅从供电链路角度概述其位置和作用。
在A级数据中心中,UPS系统通常采用2N冗余配置:两路完全独立的UPS系统分别供电给IT设备的A电源和B电源。每路UPS系统内部还可能采用N+1冗余(例如4+1模块并联,其中1台为冗余模块)。
UPS的后备时间(电池放电时间)通常设计为10-30分钟。这个时间不是为了长时间支撑负荷,而是为了桥接市电中断到柴油发电机启动的时间窗口(柴发从冷态启动到稳定接载通常需要10-60秒,但考虑启动失败重试等异常情况,电池后备时间需要留有足够余量)。
关键参数
| 参数 | 说明 | 典型值 |
|---|---|---|
| 额定容量 | UPS的输出能力 | 200kVA-800kVA(单机/单模块) |
| 功率因数 | kW/kVA比值 | 0.9-1.0(现代UPS趋向1.0) |
| 效率 | 输出功率/输入功率 | 双变换模式94%-97%,ECO模式99%+ |
| 电池后备时间 | 市电中断后电池可支撑的时间 | 10-30分钟(按设计需求配置) |
| 输入谐波电流 | UPS输入侧产生的谐波 | THDi < 3%(12脉冲或有源前端) |
| 输出电压精度 | 输出电压的稳定性 | ±1%(静态),±5%(100%阶跃负载) |
| 切换时间 | 从市电到电池的切换时间 | 在线式:0ms |
弱电工程师关注点
- 运行模式:正常/电池/旁路/ECO/维护旁路,每种模式变化都需要告警或记录
- 电池状态:SOC(荷电状态)、电池电压、充放电电流、电池温度、预估剩余时间
- 负载率:当前负载占UPS额定容量的百分比
- 输入/输出参数:电压、电流、频率、功率、功率因数
- 告警信息:UPS故障类型繁多(整流器故障、逆变器故障、风扇故障、过温、过载等),需全部接入动环系统
- 通信接口:主流UPS支持SNMP(网络管理协议)、Modbus(RS485/TCP)、干接点。SNMP是最常用的接入方式
2.8 节点7:低压配电柜(UPS输出柜 / 精密配电柜 / 列头柜)
功能说明
低压配电柜是UPS输出之后的电能分配设备。在数据中心中,低压配电通常有2-3级:
第一级:UPS输出柜 位于电力室,直接接收UPS的输出电源,通过断路器分配到各个机房或区域。这一级配电柜通常容量较大(如3200A母线),每个出线回路配有塑壳断路器(MCCB)或框架断路器(ACB),供给下一级配电。
第二级:列头柜(RPP,Remote Power Panel)/ 精密配电柜(PDC) 位于机房内,通常安装在每列机柜的端头(所以叫"列头柜")。列头柜接收来自UPS输出柜的电源,再分配到该列的每个机柜。列头柜是弱电工程师最常打交道的电气设备,因为:
- 它位于机房内,物理上容易接触
- 它是"精密配电",配有智能监控模块,可以监测每个出线回路的电流
- 它的通信接口通常直接接入动环监控系统
列头柜内部通常包含:
- 主进线断路器(MCCB或ACB)
- 多路出线微型断路器(MCB)或MCCB
- 智能电力仪表(如施耐德PM系列、安科瑞系列)
- SPD(电涌保护器)
- 智能监控模块(带通信接口)
关键参数
| 参数 | 说明 | 典型值 |
|---|---|---|
| 额定电流 | 主母线/进线额定电流 | UPS输出柜:1600-6300A;列头柜:250-630A |
| 出线回路数 | 可供给的下级回路数 | 列头柜通常24-48路 |
| 监测精度 | 电力参数测量精度 | 0.5级或1.0级 |
| 通信接口 | 与监控系统的通信方式 | RS485(Modbus RTU)、以太网(Modbus TCP) |
| 防护等级 | 外壳防护 | IP30-IP54 |
弱电工程师关注点
- 每回路电流监测:这是列头柜最重要的功能之一。通过监测每个出线回路的电流,可以推算每个机柜的用电量,进而计算PUE、发现负载不均衡等问题
- 总电量计量:用于能耗统计和PUE计算
- 断路器状态:进线和出线断路器的分合状态
- 告警阈值设置:过载告警(如80%/90%/100%)、欠压告警、过压告警
- 通信协议配置:需要了解列头柜智能模块使用的通信协议和寄存器地址,以正确接入动环系统。最常见的是Modbus RTU over RS485
2.9 节点8:PDU(机柜配电单元)
功能说明
PDU(Power Distribution Unit,电源分配单元)是供电链路的倒数第二个节点,安装在机柜内部,将列头柜送来的电源分配给机柜内的各台IT设备。PDU本质上就是一个"高级插排",但其功能远不止插排那么简单。
PDU按功能分为四类:
基础型PDU(Basic PDU): 最简单的形式,就是将一路输入电源分配为多个输出插座。无监控、无控制功能。适用于对成本敏感的小型数据中心。
计量型PDU(Metered PDU): 在基础型的基础上增加了电力参数监测功能,可以显示总输入的电压、电流、功率、电度等信息。通常配有LED显示屏和通信接口(网口或串口),可以将数据上传给动环系统。
监控型PDU(Monitored PDU): 在计量型的基础上增加了每个插座级别(outlet-level)的电流监测。可以知道每台服务器具体用了多少电。同时可能集成温湿度传感器接口。
管控型PDU(Switched PDU): 在监控型的基础上增加了远程控制每个插座通断的能力。可以通过网络远程开关某个插座的电源,实现远程重启服务器等操作。这是功能最全的PDU类型。
在A级数据中心中,每个机柜通常配置2台PDU(A路PDU + B路PDU),分别接入两路独立的UPS电源。服务器的双电源模块分别接入两台PDU。
关键参数
| 参数 | 说明 | 典型值 |
|---|---|---|
| 输入电压/相数 | 电源输入规格 | 单相220V / 三相380V |
| 输入电流 | 最大输入电流 | 16A/32A/63A(取决于机柜功率密度) |
| 插座类型 | 输出插座规格 | IEC C13(10A)/ IEC C19(16A) |
| 插座数量 | 总输出口数 | 通常24-42个C13 + 4-6个C19 |
| 监测精度 | 电力参数测量精度 | ±1% |
| 通信接口 | 与监控系统的通信方式 | RJ45(SNMP/HTTP)、RS485 |
| 安装方式 | 在机柜中的安装方式 | 垂直(0U安装)/ 水平(1U/2U安装) |
弱电工程师关注点
- PDU是弱电工程师在电气系统中"最亲密"的设备。因为它直接安装在机柜内,与弱电线缆(网络、光纤)共处同一空间
- SNMP接入:智能PDU通常通过SNMP协议接入动环监控。需要配置PDU的IP地址、SNMP Community字符串、SNMP版本(v2c或v3)。v3版本支持加密和认证,安全性更好
- 级联/菊花链:一些PDU支持通过RS485菊花链连接,多台PDU共用一个IP地址(网关),减少IP地址消耗和网络端口占用
- 环境监测集成:智能PDU通常支持外接温湿度探头、门禁传感器、漏水传感器等,将这些环境量一并通过SNMP上传,减少了单独布线的工作量
- 容量规划:需要确保PDU的输入电流能满足机柜内设备的总功率需求。在高密度场景下(如AI服务器),可能需要更大规格的PDU或多条进线
2.10 节点9:服务器电源(最终用电设备)
功能说明
服务器电源是供电链路的终点。现代数据中心服务器通常配置冗余电源模块(PSU,Power Supply Unit),典型配置是1+1或2+1冗余。每个电源模块独立连接到不同的PDU(进而连接不同的UPS路径),实现"双路"供电到服务器层面。
服务器电源的功能是将交流220V(或380V三相,如高端GPU服务器)转换为服务器内部所需的直流电压(12V为主,再由主板上的VRM模块转换为CPU/GPU/内存所需的各种电压:如1.0V、1.1V、1.8V、3.3V、5V等)。
现代服务器电源的效率认证遵循80 PLUS标准:
| 等级 | 20%负载效率 | 50%负载效率 | 100%负载效率 |
|---|---|---|---|
| 80 PLUS | 80% | 80% | 80% |
| Bronze铜牌 | 82% | 85% | 82% |
| Silver银牌 | 85% | 88% | 85% |
| Gold金牌 | 87% | 90% | 87% |
| Platinum铂金 | 90% | 92% | 89% |
| Titanium钛金 | 92% | 94% | 90% |
关键认知:服务器电源效率直接影响数据中心PUE。9120个机柜,如果将电源效率从Gold提升到Titanium,在50%负载下效率从90%提升到94%,意味着减少约4%的电源损耗。对于总功率54.72MW的项目,这是约2.19MW的功率节省——一年的电费节省约1500万元(按0.8元/kWh估算)。
弱电工程师关注点
- BMC/IPMI接口:服务器的基板管理控制器(BMC)通常通过IPMI协议或Redfish API暴露电源状态信息(电源模块在位状态、输入电压、输出功率、温度、风扇转速等)。弱电工程师需要了解这些接口存在,但通常由IT运维团队管理
- 电源冗余状态:需要确认服务器是否正常工作在冗余模式(两个电源模块都在工作)。任何一个电源模块故障都应产生告警
- 布线注意:服务器电源线必须分别走A路和B路PDU,不能接错。这是弱电工程师在机柜部署时需要检查的关键项
3. ATS vs STS 区别详解
3.1 工作原理对比
ATS(Automatic Transfer Switch)- 机械式切换
ATS内部有两组机械触点(通常是两台接触器或两台断路器),通过机械联锁机构确保同一时刻只有一组触点闭合。工作流程如下:
- 控制器持续监测两路输入电源的电压、频率
- 当检测到首选电源异常(欠压/过压/缺相/频率偏差超标),启动计时延时(通常2-5秒,避免误动作)
- 延时到达后确认首选电源确实故障,发出转换指令
- 首选电源侧触点断开(先断)
- 经过短暂的中间过渡时间(死区时间,通常20-80ms)
- 备用电源侧触点闭合(后合)
- 总切换时间:检测延时 + 机械动作时间 ≈ 2-5秒 + 100-500ms
ATS采用开路转换(Open Transition)方式,即先断后合,中间有短暂的断电间隙。这种方式安全可靠,不会出现两路电源短路并联的风险。部分高端ATS支持闭路转换(Closed Transition),在切换瞬间短暂地同时接通两路电源(通常<100ms),但前提是两路电源必须同步(电压和相位一致)。
STS(Static Transfer Switch)- 电子式切换
STS使用两组反并联的SCR(可控硅/晶闸管)替代机械触点。SCR是电力电子器件,导通和关断速度极快(微秒级)。工作流程如下:
- 控制器持续监测两路输入电源的电压、频率、相位
- 当检测到首选电源异常,立即发出转换指令(延时极短或无延时)
- 在首选电源电流过零点时关断首选侧SCR
- 几乎同时导通备用侧SCR
- 总切换时间:2-4ms(不到半个工频周期)
STS可以实现闭路转换——在切换瞬间短暂地同时导通两组SCR,确保负载供电不中断。但这要求两路电源的电压和相位基本同步。
3.2 全维度对比表
| 维度 | ATS | STS |
|---|---|---|
| 切换原理 | 机械触点 | SCR(可控硅)电子切换 |
| 切换时间 | 100-500ms(含检测延时可达数秒) | 2-4ms |
| 切换方式 | 通常开路转换(先断后合) | 可闭路转换(零中断) |
| 效率 | ≈100%(接触电阻极小) | 99.5%-99.8%(SCR导通压降约1.5-2V) |
| 发热量 | 极小 | 较大(SCR导通损耗产生热量,需散热) |
| 机械磨损 | 有(触点磨损、弹簧疲劳) | 无(全电子元件) |
| 维护量 | 需定期检查触点、机械部件 | 极少维护 |
| 成本 | 较低(同容量下约为STS的1/3-1/2) | 较高 |
| 体积重量 | 较大(机械结构) | 较小(紧凑电子设计) |
| 过载能力 | 强(机械触点可承受大电流冲击) | 较弱(SCR有严格的电流/温度限制) |
| 适用位置 | UPS输入前(市电/柴发切换)、非关键负载 | UPS输出后、对切换时间敏感的关键负载 |
| 故障模式 | 触点粘连/机械卡死(可预见,可维修) | SCR击穿(可能导致两路短接,较严重) |
3.3 数据中心中的典型应用
位置1:市电A路 ←→ 柴发A →→→ 适合用ATS
(切换时间要求:秒级即可,因为UPS电池桥接)
位置2:市电B路 ←→ 柴发B →→→ 适合用ATS
(同上)
位置3:UPS A路输出 ←→ UPS B路输出 →→→ 适合用STS
(切换时间要求:毫秒级,因为后面直接是IT设备)
(但在2N架构中通常不需要STS,因为IT设备自带双电源)
位置4:单电源设备(如只有一个PSU的设备)
A路UPS ←→ B路UPS →→→ 必须用STS
(切换时间要求极高,设备无法自行冗余切换)
鸿才关键认知:在严格的2N架构中(如平谷项目),服务器配双电源,A路B路完全独立,实际上很少需要STS。ATS主要用于市电和柴发之间的切换。只有当存在单电源设备时才需要STS来弥补设备本身不具备双路输入的缺陷。
3.4 弱电监控要点
不管是ATS还是STS,动环监控系统需要采集的信息基本一致:
| 监控项 | 通信方式 | 说明 |
|---|---|---|
| 当前工作电源路数(A路/B路) | 干接点/Modbus | 最基本的状态信息 |
| A路输入电压/频率 | Modbus/SNMP | 判断电源质量 |
| B路输入电压/频率 | Modbus/SNMP | 判断电源质量 |
| 输出电压/电流/功率 | Modbus/SNMP | 负载情况 |
| 切换事件记录 | Modbus/SNMP | 含时间戳、切换原因、切换耗时 |
| 设备故障告警 | 干接点/Modbus/SNMP | 控制器故障、通信故障等 |
| 同步状态(仅STS) | Modbus/SNMP | 两路输入是否同步(同步才能快速切换) |
4. 弱电工程师从电气系统获取的信息清单
4.1 总览
作为弱电工程师,你的动环监控系统需要从电气系统获取大量数据。以下是一份完整清单,按设备类型分类。这份清单也是你在做弱电方案设计时,与电气工程师对接的"需求列表"。
4.2 按设备分类的信息清单
4.2.1 高压配电系统
| 信息项 | 数据类型 | 通信方式 | 重要性 |
|---|---|---|---|
| 开关位置(分/合) | 状态量 | 综保装置Modbus/IEC61850 | 高 |
| 母线电压(A/B/C三相) | 模拟量 | 综保装置Modbus | 高 |
| 各回路电流 | 模拟量 | 综保装置Modbus | 高 |
| 保护动作事件 | 事件/SOE | 综保装置Modbus/IEC61850 | 高 |
| 装置故障告警 | 状态量 | 综保装置Modbus | 中 |
| SF6气体压力/密度 | 模拟量 | 专用传感器RS485 | 高 |
| 母线/触头温度 | 模拟量 | 无线测温RS485 | 中 |
| 柜内温湿度 | 模拟量 | 温湿度传感器RS485 | 中 |
4.2.2 变压器
| 信息项 | 数据类型 | 通信方式 | 重要性 |
|---|---|---|---|
| 三相绕组温度 | 模拟量 | 温控器RS485(Modbus) | 高 |
| 环境温度 | 模拟量 | 温控器RS485 | 中 |
| 超温告警/跳闸 | 状态量 | 温控器干接点/RS485 | 高 |
| 风机运行状态 | 状态量 | 温控器干接点 | 中 |
| 油温(油浸式) | 模拟量 | 温度传感器4-20mA | 高 |
| 油位(油浸式) | 模拟量 | 油位计干接点 | 中 |
| 瓦斯状态(油浸式) | 状态量 | 瓦斯继电器干接点 | 高 |
| 负载电流 | 模拟量 | 低压侧电力仪表Modbus | 高 |
4.2.3 ATS/STS
| 信息项 | 数据类型 | 通信方式 | 重要性 |
|---|---|---|---|
| 当前供电路数 | 状态量 | 干接点/Modbus | 高 |
| A路/B路电压 | 模拟量 | Modbus | 高 |
| A路/B路频率 | 模拟量 | Modbus | 中 |
| 输出电流 | 模拟量 | Modbus | 高 |
| 切换事件 | 事件 | Modbus/干接点 | 高 |
| 设备故障 | 状态量 | 干接点/Modbus | 高 |
| 手动/自动模式 | 状态量 | Modbus | 中 |
4.2.4 UPS系统
| 信息项 | 数据类型 | 通信方式 | 重要性 |
|---|---|---|---|
| 运行模式(正常/电池/旁路/ECO) | 状态量 | SNMP/Modbus | 高 |
| 输入电压/电流/频率 | 模拟量 | SNMP/Modbus | 高 |
| 输出电压/电流/频率/功率 | 模拟量 | SNMP/Modbus | 高 |
| 负载百分比 | 模拟量 | SNMP/Modbus | 高 |
| 电池电压/电流/温度 | 模拟量 | SNMP/Modbus | 高 |
| 电池SOC/剩余时间 | 模拟量 | SNMP/Modbus | 高 |
| 各模块状态(模块化UPS) | 状态量 | SNMP/Modbus | 高 |
| 告警信息(过载/过温/故障等) | 状态量/事件 | SNMP Trap/Modbus | 高 |
| 电池测试结果 | 事件 | SNMP/Modbus | 中 |
| 电度量(输入/输出) | 模拟量 | SNMP/Modbus | 中 |
4.2.5 低压配电柜 / 列头柜
| 信息项 | 数据类型 | 通信方式 | 重要性 |
|---|---|---|---|
| 每回路电流 | 模拟量 | Modbus(RS485) | 高 |
| 总输入电压/电流/功率/电度 | 模拟量 | Modbus(RS485) | 高 |
| 开关状态 | 状态量 | Modbus(RS485)/干接点 | 中 |
| 过载告警 | 状态量 | Modbus(RS485) | 高 |
| 温度 | 模拟量 | Modbus(RS485) | 中 |
4.2.6 PDU
| 信息项 | 数据类型 | 通信方式 | 重要性 |
|---|---|---|---|
| 输入电压/电流/功率/电度 | 模拟量 | SNMP(网口) | 高 |
| 每插座电流(监控型/管控型) | 模拟量 | SNMP | 高 |
| 温湿度(外接探头) | 模拟量 | SNMP | 中 |
| 插座开关状态(管控型) | 状态量 | SNMP | 中 |
| 告警(过载/过温) | 状态量 | SNMP Trap | 高 |
4.2.7 柴油发电机
| 信息项 | 数据类型 | 通信方式 | 重要性 |
|---|---|---|---|
| 运行状态(停机/待机/运行) | 状态量 | Modbus/干接点 | 高 |
| 输出电压/电流/频率/功率 | 模拟量 | Modbus | 高 |
| 发动机转速 | 模拟量 | Modbus | 高 |
| 冷却水温度 | 模拟量 | Modbus/4-20mA | 高 |
| 机油压力 | 模拟量 | Modbus/4-20mA | 高 |
| 机油温度 | 模拟量 | Modbus | 中 |
| 燃油液位 | 模拟量 | 4-20mA | 高 |
| 电池(启动电池)电压 | 模拟量 | Modbus | 中 |
| 累计运行时间 | 模拟量 | Modbus | 中 |
| 告警信息(高水温/低油压/超速等) | 状态量/事件 | Modbus/干接点 | 高 |
| 并机状态/负载分配 | 状态量/模拟量 | Modbus | 高 |
4.3 通信接口详解
弱电工程师需要深入理解以下四种通信接口,因为它们是动环监控系统与电气设备"对话"的语言:
4.3.1 SNMP(Simple Network Management Protocol,简单网络管理协议)
原理:SNMP是一种基于UDP/IP的网络管理协议,最初用于网络设备(交换机、路由器)管理,后来被广泛应用于UPS、PDU、精密空调等智能设备的监控。
三个版本:
- SNMPv1:最早版本,安全性差(Community String明文传输),但兼容性最好
- SNMPv2c:改进了性能(支持GetBulk批量获取),但安全性仍差。目前最常用
- SNMPv3:增加了用户认证(USM)和数据加密(DES/AES),安全性大幅提升。推荐使用
关键概念:
- MIB(Management Information Base):管理信息库,定义了设备可被管理的所有参数及其OID
- OID(Object Identifier):每个可管理参数的唯一标识符,用一串数字表示层级关系。例如:
1.3.6.1.4.1.318.1.1.1.2.2.1表示APC UPS的电池剩余容量 - Community String:v1/v2c版本的"密码",分为只读(read-only,通常默认为"public")和读写(read-write,通常默认为"private")
- GET:监控系统主动查询设备参数
- SET:监控系统向设备写入参数(如远程控制PDU插座开关)
- TRAP:设备主动向监控系统发送告警信息(事件驱动,无需轮询)
在数据中心的应用:
- UPS监控(施耐德、华为、维谛等主流品牌均支持)
- 智能PDU监控
- 精密空调监控
- 网络设备监控
# SNMP工作示意
动环监控主站 UPS设备
│ │
│──── SNMP GET ────────────→│ (主动查询:你的电池电量是多少?)
│←─── SNMP Response ────────│ (回答:85%)
│ │
│←─── SNMP Trap ────────────│ (设备主动上报:我切到电池模式了!)
│ │
4.3.2 Modbus协议
原理:Modbus是一种串行通信协议,由Modicon公司于1979年发明(最初用于PLC通信),因其简单、开放、可靠,成为工业领域最广泛使用的通信协议之一。
三种传输模式:
- Modbus RTU:基于RS485串行总线,数据以二进制编码传输,效率高。使用CRC校验。这是数据中心电力设备最常用的Modbus模式
- Modbus ASCII:基于RS485串行总线,数据以ASCII编码传输,可读性好但效率低。使用LRC校验。较少使用
- Modbus TCP:基于以太网TCP/IP,将Modbus帧封装在TCP报文中传输。适用于需要远距离传输或集成到IP网络的场景
关键概念:
- 从站地址:每个设备一个地址(1-247),同一RS485总线上不能重复
- 功能码:指定操作类型
- 01:读线圈(读开关状态)
- 02:读离散输入(读干接点状态)
- 03:读保持寄存器(读模拟量参数,最常用)
- 04:读输入寄存器
- 05:写单个线圈(控制单个开关)
- 06:写单个寄存器
- 16:写多个寄存器
- 寄存器地址:每个参数存储在特定的寄存器地址。设备厂家会提供寄存器地址表(也叫Modbus Points List),这是弱电工程师配置动环系统时必需的文档
RS485总线要点:
- 两线制(A/B线,半双工)或四线制(全双工)
- 通信距离最远1200m(9600bps时)
- 同一总线最多挂32个设备(标准驱动器);增强型驱动器可达128个或256个
- 必须在总线末端接120欧姆终端电阻
# Modbus RTU通信示意(RS485总线)
动环采集器 RS485总线
├──A线──────────────────────┐
├──B线──────────────────────┤
│ │
│ ┌───────┴───────┐
│ │ 电力仪表#1 │(地址=1)
│ │ 电力仪表#2 │(地址=2)
│ │ 温控器#3 │(地址=3)
│ │ ATS控制器#4 │(地址=4)
│ │ ... │
│ │ 终端电阻120Ω │
│ └───────────────┘
4.3.3 干接点(Dry Contact / 无源触点)
原理:干接点是最简单、最可靠的信号传递方式。一个干接点就是一对金属触点,只有"闭合"(通/ON)和"断开"(断/OFF)两种状态。它不提供电源(因此叫"干"接点,区别于带电的"湿"接点),由监控系统提供检测电压。
工作方式: 监控系统的采集模块提供一个低压直流电源(通常12V或24V),通过检测回路来判断干接点是闭合还是断开。干接点闭合时回路导通,采集模块检测到电流通过;干接点断开时回路断开,无电流。
两种类型:
- 常开触点(NO, Normally Open):正常状态下断开,动作时闭合。例如:设备故障时触点闭合发出告警
- 常闭触点(NC, Normally Closed):正常状态下闭合,动作时断开。例如:设备正常时触点闭合,故障时断开发出告警
最佳实践:在数据中心监控中,通常推荐使用常闭触点来传递告警信号。原因是:如果使用常开触点,当连接线断了(断线),监控系统会认为"没有告警"(因为正常状态也是断开的),从而错过真正的告警。而使用常闭触点,连接线断了等同于"触点断开",监控系统会识别为"告警状态",反而更安全。这叫**"断线即告警"**原则。
在数据中心的应用:
- 设备运行/停止状态
- 故障告警
- 门禁状态(门开/门关)
- 水浸检测
- 消防联动信号
- UPS旁路/电池模式指示
4.3.4 4-20mA模拟量信号
原理:4-20mA电流环是一种经典的工业模拟量传输标准。传感器将被测物理量(温度、压力、液位等)转换为4-20mA的电流信号,通过两根导线传输给采集设备。
为什么用4-20mA而不是0-20mA?
- 4mA代表量程下限(0%),20mA代表量程上限(100%)
- 使用4mA而非0mA作为下限,是为了区分"信号下限"和"断线"。如果使用0-20mA,当检测到0mA时无法区分是"信号为0"还是"线断了"。使用4-20mA,检测到0mA就一定是断线故障
- 这与干接点的"断线即告警"原则类似,都是工业监控领域的安全设计思维
计算公式:
物理量 = 量程下限 + (电流值 - 4) / (20 - 4) × (量程上限 - 量程下限)
示例:燃油液位传感器,量程0-3m,当前电流12mA
液位 = 0 + (12 - 4) / (20 - 4) × (3 - 0) = 1.5m
在数据中心的应用:
- 柴发燃油液位
- 柴发冷却水温度
- 柴发机油压力
- 油浸变压器油温
- 某些温湿度传感器
弱电工程师注意事项:
- 4-20mA是电流信号,抗干扰能力强,传输距离可达数百米(远优于电压信号)
- 采集模块需要在输入端接一个精密电阻(通常250欧姆),将电流转换为电压信号(4mA×250Ω=1V,20mA×250Ω=5V),再由ADC转换为数字量
- 需要在动环软件中配置量程映射(4mA对应什么物理量,20mA对应什么物理量)
4.4 通信接口选择决策树
需要监控的设备
│
├── 有网口(RJ45/以太网)?
│ ├── 是 → 优先使用 SNMP 或 Modbus TCP
│ │ 适用:UPS、智能PDU、精密空调、网络设备
│ └── 否 → 继续判断
│
├── 有RS485接口?
│ ├── 是 → 使用 Modbus RTU
│ │ 适用:电力仪表、列头柜、温控器、ATS控制器
│ └── 否 → 继续判断
│
├── 只有干接点输出?
│ ├── 是 → 使用干接点采集模块
│ │ 适用:老旧设备、简单状态信号
│ └── 否 → 继续判断
│
└── 模拟量传感器(温度/液位/压力)?
├── 是 → 使用 4-20mA 模拟量采集
│ 适用:柴发传感器、液位计等
└── 否 → 需要加装转换网关或升级设备
5. 平谷项目供电架构分析
5.1 基本参数回顾
| 参数 | 数值 |
|---|---|
| 项目名称 | 北京平谷智算数据中心 |
| 机柜数量 | 9,120个 |
| 单机柜设计功率 | 6kW |
| IT总负荷 | 9,120 × 6kW = 54,720kW ≈ 54.72MW |
| 等级 | A级 |
| 供电架构 | 2N |
5.2 总容量估算
以下是从IT负荷出发,逐级反推整个供电系统容量的计算过程:
第一步:IT总负荷
IT负荷 = 9,120 × 6 kW = 54,720 kW
第二步:UPS输出容量
考虑UPS功率因数(假设0.9)和预留余量(负载率不超过80%):
UPS总输出容量(kVA)= IT负荷 / 功率因数 / 目标负载率
= 54,720 / 0.9 / 0.8
= 76,000 kVA(约)
2N架构下,每路UPS容量 = 76,000 kVA
(因为2N要求每路都能独立承担全部负荷)
假设使用600kVA模块化UPS:
每路UPS系统数量 = 76,000 / 600 ≈ 127台
两路总计 ≈ 254台 UPS模块
实际设计中会按UPS系统进行分组:
例如每个UPS系统由5+1个200kW模块组成(系统容量1000kW/1200kVA)
每路需要 54,720 / 1000 ≈ 55个UPS系统
考虑N+1冗余,加上备用模块
注意:现代UPS功率因数趋向1.0(如华为UPS5000-H系列功率因数=1),此时kW=kVA。按功率因数1.0计算: UPS总容量 = 54,720 / 0.8 = 68,400 kW,每路68,400 kW
第三步:变压器容量
变压器需要承担的总负荷 = IT负荷 + UPS损耗 + 制冷负荷 + 照明动力 + 其他
UPS损耗:假设UPS效率96%,损耗 = 54,720 × (1/0.96 - 1) ≈ 2,280 kW
制冷负荷:假设PUE=1.3,制冷 ≈ IT负荷 × (PUE - 1 - 其他) ≈ 54,720 × 0.2 ≈ 10,944 kW
照明动力及其他:约IT负荷的5% ≈ 2,736 kW
总负荷 ≈ 54,720 + 2,280 + 10,944 + 2,736 ≈ 70,680 kW
按功率因数0.9转换为视在功率:70,680 / 0.9 ≈ 78,533 kVA
2N架构下,每路变压器总容量 ≥ 78,533 kVA
假设使用2000kVA干式变压器:
每路需要 78,533 / 2000 ≈ 40台
两路总计约80台 10kV/0.4kV变压器
第四步:市电引入容量
总用电负荷(含所有损耗和辅助设备):
假设PUE = 1.3
总用电 = 54,720 × 1.3 = 71,136 kW
考虑变压器损耗(约2%)和线损(约1%):
市电引入总需求 ≈ 71,136 × 1.03 ≈ 73,270 kW ≈ 73.3 MW
按110kV引入计算,每路引入电流:
I = P / (√3 × U × cosφ) = 73,300 / (1.732 × 110 × 0.9) ≈ 428 A
(每路110kV进线电流约430A)
第五步:柴发容量
柴发需要覆盖的负荷 = 全部用电负荷(市电完全中断时)
每路柴发总容量 ≥ 73.3 MW
假设使用2000kW柴油发电机组:
每路需要 73,300 / 2000 ≈ 37台(含N+1冗余约38-40台)
两路总计约76-80台柴发机组
实际项目中可能使用更大容量机组(如2500kW/3000kW)以减少台数
5.3 平谷项目供电架构示意
110kV电网A路 110kV电网B路
│ │
┌────▼────┐ ┌────▼────┐
│110kV GIS│ │110kV GIS│
│ 开关站 │ │ 开关站 │
└────┬────┘ └────┬────┘
│ │
┌───────▼───────┐ ┌───────▼───────┐
│110kV/10kV变压器│ │110kV/10kV变压器│
│ (多台并联) │ │ (多台并联) │
└───────┬───────┘ └───────┬───────┘
│ │
┌───────▼───────┐ ┌───────▼───────┐
│ 10kV高压配电 │ │ 10kV高压配电 │
│ (多面中置柜) │ │ (多面中置柜) │
└───────┬───────┘ └───────┬───────┘
│ │
┌───────────┼───────────┐ ┌───────────┼───────────┐
│ │ │ │ │ │
┌──────▼──────┐ │ ┌──────▼──────┐ ┌──────▼──────┐ │
│10kV/0.4kV │ ... │10kV/0.4kV │ │10kV/0.4kV │ ...
│变压器×40台 │ │变压器 │ │变压器×40台 │
└──────┬──────┘ └──────┬──────┘ └──────┬──────┘
│ │ │
┌──────▼──────┐ ┌──────▼──────┐ ┌──────▼──────┐
│ ATS │ │ ATS │ │ ATS │
│(市电/柴发) │ │(市电/柴发) │ │(市电/柴发) │
└──────┬──────┘ └──────┬──────┘ └──────┬──────┘
│ │ │
┌──────▼──────┐ ┌──────▼──────┐
│ UPS系统A │ ... │ UPS系统B │
│ ×55+台 │ │ ×55+台 │
└──────┬──────┘ └──────┬──────┘
│ │
┌──────▼──────┐ ┌──────▼──────┐
│UPS输出配电A │ │UPS输出配电B │
└──────┬──────┘ └──────┬──────┘
│ │
┌──────▼──────────────────────────────────────────▼──────┐
│ 列头柜(A路+B路) │
│ (每列机柜端头,约数百台) │
└───────────────────────┬────────────────────────────────┘
│
┌────────▼────────┐
│ PDU (A+B) │
│ (每柜2台,共18240台) │
└────────┬────────┘
│
┌────────▼────────┐
│ 服务器(双电源) │
└─────────────────┘
柴发机组A路(40台左右) 柴发机组B路(40台左右)
并联→通过ATS在市电中断时接入 并联→通过ATS在市电中断时接入
5.4 弱电监控规模估算
基于平谷项目的供电架构,动环监控系统需要管理的电气设备数量估算:
| 设备类型 | 估算数量 | 主要通信方式 | 监控点数(每台) | 总监控点 |
|---|---|---|---|---|
| 高压开关柜 | ~200面 | Modbus/IEC61850 | ~20 | ~4,000 |
| 变压器 | ~80台 | Modbus(RS485) | ~10 | ~800 |
| ATS | ~80台 | Modbus/干接点 | ~15 | ~1,200 |
| UPS系统 | ~110套 | SNMP/Modbus | ~50 | ~5,500 |
| 列头柜 | ~600台 | Modbus(RS485) | ~30 | ~18,000 |
| PDU | ~18,240台 | SNMP | ~15 | ~273,600 |
| 柴发机组 | ~80台 | Modbus/4-20mA | ~30 | ~2,400 |
| 合计 | ~305,500 |
鸿才必知:仅电气系统一项,动环监控就有约30万个监控点。加上暖通空调、环境监测、安防等系统,整个动环系统的监控点数量可能超过50万。这对监控平台的性能、网络带宽、数据存储都是巨大挑战。在做弱电方案设计时,必须充分评估这个规模。
5.5 关键数据接口需求汇总
在平谷项目的弱电方案编制中,与电气专业对接时需明确的接口需求:
| 接口类型 | 数量估算 | 线缆要求 | 注意事项 |
|---|---|---|---|
| RS485(Modbus) | ~1000条总线 | 屏蔽双绞线RVSP 2×1.0mm² | 每条总线最多32个设备,需规划总线拓扑 |
| 以太网(SNMP) | ~18,500个IP | Cat6以太网线 | 需规划独立的监控VLAN和IP地址段 |
| 干接点 | ~500对 | 多芯控制电缆RVVP | 每对干接点占一个AI/DI通道 |
| 4-20mA | ~200路 | 屏蔽双绞线 | 需配4-20mA采集模块 |
6. 速记卡
卡片1:供电链路九节点
市电 → 高压开关站 → 变压器(降压) → 高压配电柜(10kV)
→ 变压器(10kV/0.4kV) → ATS/STS → UPS → 低压配电/列头柜
→ PDU → 服务器
口诀:市高变配变,ATS/UPS,列PDU到终端
卡片2:A级数据中心关键指标
- 年可用性 ≥ 99.995%(年停电 ≤ 26分钟)
- 至少2路独立市电
- 2N或2(N+1)冗余
- UPS + 柴发后备
- 对应Uptime Tier IV
卡片3:ATS vs STS
| ATS | STS | |
|---|---|---|
| 原理 | 机械触点 | SCR电子 |
| 速度 | 100-500ms | 2-4ms |
| 效率 | ~100% | 99.5-99.8% |
| 成本 | 低 | 高 |
| 位置 | UPS前(市电/柴发间) | UPS后(关键负载前) |
卡片4:四大通信接口
| 接口 | 介质 | 距离 | 适用设备 |
|---|---|---|---|
| SNMP | 以太网 | 无限 | UPS、PDU、空调 |
| Modbus RTU | RS485 | 1200m | 电力仪表、列头柜 |
| 干接点 | 控制线 | 数百米 | 简单状态信号 |
| 4-20mA | 屏蔽线 | 数百米 | 传感器(温度/液位) |
卡片5:干接点设计原则
断线即告警:用常闭触点传递告警信号
- 正常时触点闭合(回路通)
- 告警时触点断开(回路断)
- 断线时也等于断开 → 安全侧
卡片6:4-20mA计算公式
物理量 = 下限 + (mA - 4) / 16 × (上限 - 下限)
- 4mA = 量程0%
- 20mA = 量程100%
- 0mA = 断线故障
卡片7:平谷项目关键数字
- 9,120机柜 × 6kW = 54.72MW IT负荷
- PUE 1.3 → 总用电 ~71MW
- 2N架构:每路独立承载全部负荷
- 约30万电气监控点
- 约18,240台PDU
7. 2sigma诊断题
题目1:供电链路分析
场景:你正在巡检平谷项目的动环监控系统,发现某台UPS的SNMP告警显示"旁路模式运行"。
问题:
- UPS处于旁路模式意味着什么?对IT设备有什么影响?
- 此时供电链路是怎样的?电经过了哪些环节?
- 作为弱电工程师,你应该做什么?
参考答案:
- 旁路模式意味着UPS的逆变器未工作,市电(或柴发)直接通过UPS内部的旁路开关供给负载。此时IT设备仍有电,但失去了UPS的不间断保护——如果此时市电中断,负载将直接断电(因为逆变器和电池均未在工作回路中)。
- 供电链路变为:市电 → 变压器 → ATS → UPS(旁路通道) → 列头柜 → PDU → 服务器。电直接穿过UPS的旁路开关,不经过整流器和逆变器。
- 弱电工程师应:(a) 立即确认告警信息的准确性(排除误报);(b) 升级告警为严重级别;(c) 通知电气值班工程师处理;(d) 记录事件时间和持续时长;(e) 检查该UPS所供电的所有IT设备是否正常运行;(f) 在事件关闭后更新运维记录。
题目2:通信接口选择
场景:你需要将以下设备接入动环监控系统:
- A:一台新采购的华为UPS5000-H(带网卡)
- B:20台老旧的列头柜(只有RS485接口)
- C:一个柴发燃油箱的液位传感器(输出4-20mA)
- D:一个消防系统的联动信号(消防报警触发时输出一对干接点)
问题:为每个设备选择合适的通信接口和接入方式。
参考答案:
- A(华为UPS5000-H):通过SNMP v2c或v3协议接入。UPS网卡接入监控VLAN网络,在动环系统中配置UPS的IP地址和Community String,导入华为UPS的MIB文件,配置需要监控的OID。
- B(20台老旧列头柜):通过Modbus RTU协议接入。使用RS485总线(屏蔽双绞线)将20台列头柜串联(如果同一区域可以共用总线的话,按每条总线最多32台设备的限制分组)。每台列头柜设置不同的Modbus从站地址(1-20)。RS485总线末端接120Ω终端电阻。总线连接到动环采集器的RS485端口。在动环系统中根据厂家提供的寄存器地址表配置各参数。
- C(燃油液位传感器):通过4-20mA模拟量采集。将传感器的4-20mA输出接入动环采集模块的AI(模拟量输入)通道。在动环系统中配置量程映射(例如4mA=0m,20mA=3m,对应油箱高度)。
- D(消防联动干接点):通过干接点采集。将消防系统输出的干接点(建议使用常闭触点)接入动环采集模块的DI(数字量输入)通道。正常时触点闭合(信号为1),消防报警时触点断开(信号为0),同时断线也会触发告警(断线安全原则)。
题目3:容量计算
场景:某数据中心项目,计划部署2000个机柜,每机柜10kW。采用2N架构,UPS功率因数为1.0,效率95%,要求UPS负载率不超过70%。
问题:计算每路UPS系统需要的总容量(kW)。
参考答案:
IT总负荷 = 2,000 × 10 kW = 20,000 kW
功率因数 = 1.0,所以 kW = kVA
2N架构下,每路需独立承担全部IT负荷:
每路IT负荷 = 20,000 kW
考虑UPS负载率不超过70%:
每路UPS额定容量 = 20,000 / 0.7 = 28,571 kW ≈ 28,600 kW
验算:28,600 kW × 70% = 20,020 kW > 20,000 kW ✓
如果使用800kW模块化UPS:
需要 28,600 / 800 = 35.75 → 36台UPS模块/每路
两路合计72台
题目4:ATS/STS判断
场景:你在审查一个B级数据中心的供电方案,发现设计师在每台服务器(双电源)前面都加了一台STS,将两路UPS输出合为一路再供给服务器。
问题:这个设计合理吗?请从技术和经济两个角度分析。
参考答案:
不合理,主要问题如下:
技术角度:
- 服务器已经配备双电源模块,本身就能实现双路输入自动切换,不需要外部STS
- STS反而将两路独立电源合并为一路,增加了单点故障风险——STS本身故障就会导致该服务器失去供电
- STS的SCR有导通损耗,增加了不必要的电能浪费和散热负担
- 如果STS内部SCR击穿,可能导致两路UPS输出短路
经济角度:
- 每台服务器前加一台STS,成本巨大(STS单台价格数万至数十万元)
- 增加了运维复杂度和维护成本
- STS的损耗增加了电费成本
正确做法:
- 双电源服务器直接接两路PDU(A路和B路),不需要STS
- STS只用于单电源设备,且应在机柜级或列级部署,而非每台设备一个
题目5:监控系统故障排查
场景:动环监控系统显示某列10台列头柜的数据全部中断(显示"通信超时"),但现场确认这些列头柜的指示灯正常、设备本身在正常运行。
问题:
- 最可能的原因是什么?
- 排查思路是什么?
参考答案:
-
最可能的原因:RS485通信总线故障。因为10台列头柜同时通信中断,但设备本身正常运行,几乎可以排除10台设备同时故障的可能,最可能是它们共用的通信总线出了问题。
-
排查思路(从近到远):
(a) 检查采集器端:
- 动环采集器的RS485端口是否正常(指示灯是否闪烁)
- 采集器本身是否死机或重启
- 软件配置是否被修改(串口参数:波特率、数据位、校验位、停止位)
(b) 检查RS485总线:
- 检查A线、B线是否断线(用万用表测量线路导通性)
- 检查线路接头是否松动或接触不良
- 检查是否有施工等外力导致线缆损坏
- 检查终端电阻(120Ω)是否脱落或损坏
- 检查是否有强电干扰(RS485线缆是否与强电线缆平行走线过近)
(c) 检查列头柜通信模块:
- 逐台检查列头柜通信模块是否正常上电
- 确认Modbus地址设置是否正确(是否冲突)
- 尝试单独连接一台列头柜测试通信
(d) 使用工具诊断:
- 使用Modbus调试工具(如Modscan、Modbus Poll)直接连接RS485总线,逐一查询各从站地址,确认哪些从站有响应
- 使用示波器或协议分析仪检查RS485信号波形
附录A:供电链路中的弱电工程师检查清单
在项目实施阶段,弱电工程师与电气系统相关的检查项:
A.1 施工配合阶段
- 确认电气图纸中所有需要弱电监控的设备位置
- 与电气工程师确认每台设备的通信接口类型和协议
- 获取所有智能设备的通信参数(Modbus地址表、SNMP MIB文件等)
- 规划RS485总线走线路由,避免与强电线缆平行近距离敷设
- 预留监控VLAN的网络端口和IP地址
- 确认干接点信号的类型(常开/常闭)和含义
- 确认4-20mA传感器的量程和精度
A.2 设备安装阶段
- 确认电力仪表、温控器等设备的RS485接线正确(A线对A线、B线对B线)
- 确认RS485总线终端电阻安装正确
- 确认智能PDU的网络连接正常(IP可达)
- 确认UPS网卡安装并接入监控网络
- 确认干接点接线无误(区分NO/NC)
- 确认4-20mA传感器接线极性正确
A.3 系统调试阶段
- 逐台设备测试通信连通性
- 验证采集数据的准确性(与设备本地显示对比)
- 配置告警阈值和告警通知方式
- 测试告警推送功能(模拟告警事件)
- 编写设备点表文档(每个设备的监控参数、通信地址、告警阈值等)
附录B:常用术语速查
| 缩写 | 全称 | 含义 |
|---|---|---|
| ATS | Automatic Transfer Switch | 自动转换开关(机械式) |
| STS | Static Transfer Switch | 静态转换开关(电子式) |
| UPS | Uninterruptible Power Supply | 不间断电源 |
| PDU | Power Distribution Unit | 电源分配单元(机柜级) |
| RPP | Remote Power Panel | 远程配电面板(列头柜) |
| PDC | Power Distribution Cabinet | 精密配电柜 |
| GIS | Gas Insulated Switchgear | 气体绝缘开关设备 |
| MCCB | Moulded Case Circuit Breaker | 塑壳断路器 |
| ACB | Air Circuit Breaker | 空气断路器(框架断路器) |
| MCB | Miniature Circuit Breaker | 微型断路器 |
| CT | Current Transformer | 电流互感器 |
| PT | Potential Transformer | 电压互感器 |
| SPD | Surge Protective Device | 电涌保护器 |
| SCR | Silicon Controlled Rectifier | 可控硅(晶闸管) |
| PSU | Power Supply Unit | 电源模块(服务器) |
| BMC | Baseboard Management Controller | 基板管理控制器 |
| IPMI | Intelligent Platform Management Interface | 智能平台管理接口 |
| SOC | State of Charge | 荷电状态(电池电量) |
| PUE | Power Usage Effectiveness | 电能使用效率 |
| MIB | Management Information Base | 管理信息库(SNMP) |
| OID | Object Identifier | 对象标识符(SNMP) |
| THD | Total Harmonic Distortion | 总谐波畸变率 |
| EPS | Emergency Power Supply | 应急电源(消防) |
| SNMP | Simple Network Management Protocol | 简单网络管理协议 |
| VRM | Voltage Regulator Module | 电压调节模块 |
本章小结:
- 数据中心供电与普通建筑的本质区别在于可靠性要求和冗余设计
- A级供电链路从市电到服务器共9个节点,每个节点都是弱电监控的关注对象
- ATS用机械触点实现秒级切换,STS用SCR实现毫秒级切换,各有适用场景
- 四大通信接口(SNMP/Modbus/干接点/4-20mA)是动环系统与电气设备"对话"的桥梁
- 平谷项目IT总负荷54.72MW,电气监控点约30万个——规模决定了方案设计的复杂度
下一章预告:M2-02 UPS系统完整解析——深入理解数据中心供电链路的"心脏"设备