模块6-02:平谷项目完整方案复盘(Day 26)
学习目标:将全课程所学知识整合为一份完整的平谷项目技术方案,掌握方案编写全流程,并学会在面试中展示项目经验。 学习时长:全天(8小时) 核心产出:一份可用于面试展示的完整技术方案大纲 + 面试演讲脚本
第一部分:平谷项目完整技术方案
北京平谷智算数据中心 基础设施技术方案
第一章 项目概述
1.1 项目背景
北京平谷智算数据中心项目是响应国家"东数西算"战略布局和北京市算力基础设施建设规划而建设的大型智算中心。项目定位为服务京津冀地区的人工智能训练和推理需求,承担大模型训练、智能计算、大数据分析等核心算力任务。
平谷区位于北京东北部,年均温度约11°C,冬季气温-15°C~0°C,夏季最高温度约38°C,全年有约5-6个月可利用自然冷源。区位优势包括:距北京核心区约80km,电力资源充足(华北电网),土地成本相对较低,且处于北京市数据中心产业规划的承接区域。
项目由我方(弱电智能化系统集成商)负责弱电智能化部分的方案编制和系统集成,涵盖综合布线、动环监控、安防系统、消防系统、DCIM等全部弱电子系统的深化设计和施工集成。
1.2 建设规模
| 参数 | 数值 |
|---|---|
| 建筑数量 | 6栋数据中心楼 |
| 总机柜数 | 9,120个标准机柜 |
| 单柜设计功率 | 6kW(预留8kW扩展能力) |
| IT总功率 | 9,120 × 6kW = 54.72MW |
| 每栋机柜数 | 约1,520个 |
| 每栋IT功率 | 约9.12MW |
| 标准机柜规格 | 600mm(W) × 1200mm(D) × 2000mm(H),42U |
| 园区总建筑面积 | 约180,000m²(含配套) |
| 单栋机房面积 | 约5,000-6,000m²(纯机房区) |
规模定位:属于超大型数据中心(>10,000机柜级别接近),单体建筑规模为大型。
1.3 技术等级定位
| 标准体系 | 等级 | 选择依据 |
|---|---|---|
| GB50174 | A级 | 智算中心承载AI训练等关键业务,需最高等级保障 |
| Uptime Tier | Tier III(并发可维护) | 满足不停机维护需求,Tier IV成本过高且非必要 |
| TIA-942 | Rating 3 | 与Tier III对应的布线等级 |
选择理由:
- 为什么选A级而非B级:智算中心是核心算力基础设施,GPU训练任务中断会导致巨大算力浪费和时间损失,必须具备最高级别的可靠性保障。
- 为什么选Tier III而非Tier IV:Tier IV要求2N或2(N+1)的全路径容错,投资成本增加约50-80%。本项目6kW/柜的密度属于中等,通过2N UPS + N+1柴发 + 双路市电已能达到极高可靠性。Tier IV的边际可靠性提升(0.013%)不足以justify额外投资。
- A级 + Tier III组合是目前国内超大型商业数据中心的主流选择。
1.4 设计依据
国家标准:
| 标准编号 | 标准名称 | 应用范围 |
|---|---|---|
| GB50174-2017 | 数据中心设计规范 | 总体设计依据 |
| GB50462-2015 | 数据中心基础设施施工及验收规范 | 施工验收 |
| GB50311-2016 | 综合布线系统工程设计规范 | 综合布线 |
| GB50116-2013 | 火灾自动报警系统设计规范 | 消防探测 |
| GB50370-2005 | 气体灭火系统设计规范 | 气体灭火 |
| GB50057-2010 | 建筑物防雷设计规范 | 防雷接地 |
| GB50052-2009 | 供配电系统设计规范 | 电气系统 |
行业标准:
| 标准编号 | 标准名称 |
|---|---|
| YD/T 2441-2016 | 互联网数据中心技术及分级要求 |
| TIA-942-B | 数据中心电信基础设施标准 |
| Uptime Tier Standard | 数据中心Tier等级标准 |
| ASHRAE TC9.9 | 数据中心热环境指南 |
地方标准:
| 标准编号 | 标准名称 |
|---|---|
| 京发改规〔2021〕5号 | 北京市数据中心统筹发展实施方案 |
| 北京市PUE管控要求 | 新建大型数据中心PUE≤1.25 |
第二章 总体方案
2.1 总体架构
平谷智算数据中心采用园区级集群架构,6栋数据中心楼围绕中心运维楼呈对称布局,共享柴发站房、变电站、冷却塔等公共设施。
园区架构特点:
- 模块化设计:每栋楼为独立运行模块,可分期交付(一期3栋,二期3栋)
- 共享基础设施:柴发、变配电所、冷却塔集中设置,减少冗余投资
- 独立运维:每栋楼内部系统独立,单栋故障不影响其他栋
- 统一管理:园区级DCIM+安防+消防统一管控
核心网络架构:
- 园区核心交换:MDA设于运维楼,400G核心交换
- 楼内汇聚:每栋楼设HDA,100G上联至MDA
- 列级接入:每列ToR交换机,25G/100G接入
2.2 功能分区
单栋建筑功能分区方案(以典型栋为例):
| 功能区 | 位置 | 面积 | 荷载 | 说明 |
|---|---|---|---|---|
| IT机房区 | 2-4层 | 约5,000m² | ≥10kN/m² | 1,520个机柜,热通道封闭 |
| UPS/电池室 | 1层/地下 | 约800m² | ≥16kN/m² | 2N UPS + 蓄电池组 |
| 低压配电室 | 1层 | 约600m² | ≥10kN/m² | 低压配电柜、列头柜 |
| 高压配电室 | 1层 | 约400m² | ≥10kN/m² | 10kV开关柜、变压器 |
| 制冷机房 | 屋顶/1层 | 约400m² | ≥8kN/m² | 间接蒸发冷却设备 |
| 网络机房(HDA) | 2层 | 约200m² | ≥8kN/m² | 楼内汇聚交换/ODF |
| 监控室 | 1层 | 约100m² | ≥4kN/m² | 楼内动环监控分站 |
| 备件库 | 1层 | 约80m² | ≥4kN/m² | 常用备件存放 |
| 门厅/走廊 | 各层 | 约600m² | ≥3.5kN/m² | 人员通行/设备搬运 |
园区公共设施:
| 设施 | 面积 | 说明 |
|---|---|---|
| 运维中心(NOC) | 约500m² | 园区级监控大屏/值班/调度 |
| 柴发站房 | 约2,000m² | 集中柴发机组+储油 |
| 110kV/10kV变电站 | 约1,500m² | 园区供电枢纽 |
| 冷却塔区 | 约3,000m² | 室外冷却设备 |
2.3 机柜布局
机柜排列方案:
- 采用面对面/背对背排列,形成冷热通道交替布局
- 实施热通道封闭方案(选择理由见M6-01易混淆点6)
- 冷通道宽度:1,800mm(满足人员操作和设备搬运需求)
- 热通道宽度:1,200mm(封闭热通道,直接对接精密空调回风口)
每层机柜布局参数(以单层500柜为例):
- 每列机柜数:20个
- 列间距(冷通道):1,800mm
- 列间距(热通道):1,200mm
- 总列数:25列
- 行间主通道宽度:2,400mm(设备搬运通道)
- 机柜前走线桥架高度:地板上方2,400mm
- 架空地板高度:600mm
第三章 电气系统
3.1 供配电架构
供电总体架构:双路110kV市电引入→园区110kV/10kV变电站→10kV双路至各栋楼→栋内10kV/400V变压器→低压配电→UPS→PDU→机柜。
详细架构描述:
- 高压引入:从不同变电站引入两路110kV市电(物理路由分离),经110kV/10kV园区变电站降压后,以10kV双总线(A/B路)分送至各栋楼。
- 栋内变配电:每栋楼设独立10kV开关柜,经干式变压器(10kV/400V,每台2000kVA)降压至低压400V。变压器采用2N配置。
- 低压配电:400V母联柜分为A、B两段母线,正常运行时母联开关断开,各路独立供电。母线段间设ATS自动切换。
- UPS供电:A路UPS和B路UPS分别从A、B母线取电,形成2N冗余。UPS输出经STS静态切换开关后送至列头柜。
- 末端配电:列头柜/智能PDU双路输入,逐路监控到位,A+B双路至服务器双电源。
3.2 UPS系统
选型方案:模块化在线式UPS
| 参数 | 数值 |
|---|---|
| UPS类型 | 在线式(双变换) |
| 冗余配置 | 2N |
| 每栋IT功率 | 9.12MW |
| 功率因数 | 0.9 |
| 建议负载率 | 60% |
| 每路UPS容量需求 | 9,120 ÷ 0.9 ÷ 0.6 = 16,889kVA |
| 单台UPS模块 | 200kW/250kVA模块 |
| 每路UPS机组 | 多台并联,总容量≥17,000kVA |
| 2N总设备 | A路+B路各≥17,000kVA |
| 蓄电池后备 | ≥15min满载 |
| 蓄电池类型 | 磷酸铁锂电池(体积小/寿命长/安全) |
选用模块化UPS的理由:
- 按需扩容:初期部分部署,随IT负载增长逐步增加模块
- 维护便捷:热插拔模块更换,维护时不影响其他模块运行
- 效率优化:部分负载时关闭多余模块,ECO模式效率>99%
- 占地紧凑:单柜可集成400-800kW,节省机房面积
3.3 柴油发电机
配置方案:
| 参数 | 数值 |
|---|---|
| 园区柴发总容量 | 覆盖全部IT+制冷+辅助负载 |
| 单栋需求 | IT 9.12MW + 制冷约3MW + 辅助约1MW ≈ 13MW |
| 全园区需求 | 6栋×13MW ≈ 78MW |
| 柴发单机容量 | 2000kW/2500kVA |
| 柴发数量 | N+1配置:约40台+4台备用 = 44台 |
| 冗余方式 | N+1(每8-10台为一组,组内+1) |
| 启动时间 | ≤15s |
| 燃油储备 | ≥12h满载运行 |
| 储油量估算 | 78MW × 12h × 0.21kg/(kW·h) ÷ 0.84kg/L ≈ 235,000L |
柴发切换时序:
T0:市电中断
T+0~3s:ATS检测确认双路市电失电
T+3s:柴发接收启动信号,开始启动
T+3~15s:柴发启动完成,电压/频率稳定
T+15~20s:柴发ATS切换,柴发带载
全程:UPS蓄电池桥接,IT负载零中断
3.4 配电系统
A+B双总线架构:
- A路:市电A → 变压器A → 低压A母线 → UPS A路 → 列头柜A → PDU A路 → 服务器电源A
- B路:市电B → 变压器B → 低压B母线 → UPS B路 → 列头柜B → PDU B路 → 服务器电源B
- 柴发经ATS并入高压母线,两路均可切换至柴发供电
智能PDU选型:
- 双路输入(A+B),每路可独立承载100%负载
- 逐路电流/电压/功率监测
- SNMP v2c/v3远程监控
- C13/C19混合插座,支持6kW负载
- 每柜2个PDU(A+B各1个)
第四章 制冷系统
4.1 制冷方案选型
主方案:间接蒸发冷却(Indirect Evaporative Cooling)
| 参数 | 数值 |
|---|---|
| 制冷方式 | 间接蒸发冷却 + 辅助冷冻水 |
| PUE设计目标 | ≤1.25 |
| 自然冷却时数 | 约5,000h/年(北京平谷) |
| 全年自然冷却比例 | 约55-60% |
| 冷冻水辅助比例 | 约40-45%(夏季高温时段) |
选型理由:
- 平谷年均温度约11°C,冬季有充足的自然冷源
- 间接蒸发冷却在北方气候条件下PUE可达1.2-1.25
- 单柜6kW属于中密度,空气冷却完全满足散热需求
- 间接蒸发冷却较冷冻水系统占地更大,但平谷项目用地充裕
- 运行成本远低于传统冷冻水方案(节省40-60%制冷能耗)
冗余设计:制冷系统N+1冗余,每列机柜的制冷单元可独立维护不影响其他列。
4.2 冷热通道方案
热通道封闭方案详述:
实施方式:
- 机柜背靠背排列形成热通道
- 热通道顶部安装密封顶板(阻燃材料,带检修口)
- 热通道两端安装自动门(人员通过时开启/消防联动开启)
- 机柜之间间隙用密封条封堵
- 未安装设备的U位用盲板封堵
- 地板下空间作为冷空气静压箱,冷风从穿孔地板送入冷通道
- 热通道顶部连接回风管道,直接对接制冷设备回风口
补偿措施(针对消防兼容性):
- 热通道内安装线型感温探测器(作为VESDA的补充)
- 热通道顶板设置消防喷头接口(气体灭火管道)
- 热通道端门消防联动常开(确保灭火剂均匀分布)
4.3 液冷预留
当前状态:本期6kW/柜采用全风冷方案,暂不部署液冷设备。
预留措施(为未来GPU密度升级做准备):
- 空间预留:每列末端预留CDU安装位(2个机柜位宽度)
- 管路预留:机房内预埋液冷供回水主管(DN100),每列预留支管接口
- 承重预留:CDU位置楼面荷载按≥12kN/m²设计
- 电力预留:CDU供电回路预留在配电柜中
- 机柜兼容:选用兼容液冷的机柜(底部预留管线入口,背板可更换)
- 控制预留:动环监控系统预留液冷设备监控接口
第五章 弱电智能化系统(核心章节)
5.1 综合布线系统
5.1.1 布线拓扑
采用ToR(Top of Rack)架构:每个机柜顶部安装ToR交换机,服务器通过短铜缆连接至ToR交换机,ToR交换机通过光纤上联至列头/行端汇聚交换机(HDA),再上联至楼内核心(MDA)。
拓扑结构:
[服务器] --Cat6A铜缆(<5m)-- [ToR交换机]
|
| OM4多模光纤(列内,<100m)
|
[列头汇聚交换机(HDA)]
|
| OM4/OS2光纤(栋内,<300m)
|
[楼内核心交换机(MDA)]
|
| OS2单模光纤(建筑间,<2km)
|
[园区核心交换机(园区MDA)]
ToR选择理由:
- 大规模项目(9120柜)的首选拓扑,光纤用量最少
- 铜缆短距离(柜内<5m),施工和维护简便
- 光纤汇聚在列头,管理集中
- 适合Spine-Leaf网络架构
5.1.2 介质选型
| 区域 | 介质 | 速率 | 用途 |
|---|---|---|---|
| 柜内(服务器→ToR) | Cat6A | 10G/25G | 业务接入 |
| 管理网(服务器BMC→管理交换机) | Cat6A | 1G/10G | 带外管理/BMC |
| 列内上联(ToR→HDA) | OM4 12芯 | 100G/400G | 汇聚上联 |
| 栋内主干(HDA→MDA) | OM4 24/48芯 | 100G/400G | 楼内主干 |
| 建筑间主干(MDA→园区MDA) | OS2 144芯 | 100G/400G | 园区主干 |
| 动环监控网络 | Cat6A | 1G | 监控数据传输 |
| 安防网络 | Cat6A | 1G | 视频/门禁 |
5.1.3 规模估算
| 材料 | 单栋用量 | 园区总量(6栋) |
|---|---|---|
| Cat6A铜缆(业务) | 1,520柜×2根×5m = 15,200m | 91,200m |
| Cat6A铜缆(管理) | 1,520柜×2根×30m = 91,200m | 547,200m |
| Cat6A铜缆(动环/安防) | 约20,000m | 120,000m |
| OM4多模光缆(12芯) | 约150条×50m = 7,500m | 45,000m |
| OM4多模光缆(24芯) | 约30条×100m = 3,000m | 18,000m |
| OS2单模光缆(144芯) | - | 约5km(建筑间环网) |
| 铜缆配线架(48口) | 约130个 | 780个 |
| 光纤配线架(ODF) | 约20个 | 120个 |
| 铜缆跳线 | 约9,120条 | 54,720条 |
| 光纤跳线(LC/MPO) | 约3,000条 | 18,000条 |
| 桥架 | 约3km | 约18km |
5.2 动环监控系统
5.2.1 系统架构
采用三级分布式架构:
第一级:园区监控中心(NOC)
├── 监控服务器集群(冗余部署)
├── 大屏显示系统(3×6拼接屏)
├── 值班工作站(4台)
├── 短信/语音告警网关
└── 与DCIM集成接口
第二级:栋级监控分站(每栋1套)
├── 栋级采集服务器
├── 协议转换网关
├── 栋级显示终端
└── 就地值班工位
第三级:现场采集层
├── 智能PDU(SNMP采集)
├── UPS通信卡(SNMP采集)
├── 精密空调控制器(Modbus TCP采集)
├── 电力仪表(Modbus RTU采集)
├── 温湿度传感器(Modbus RTU采集)
├── 漏水检测控制器(干接点采集)
├── 柴发控制器(Modbus TCP采集)
└── 消防主机(协议对接)
5.2.2 监测点清单(单栋,1520柜)
| 监测对象 | 监测参数 | 数量 | 协议 | 告警阈值 |
|---|---|---|---|---|
| 机柜前温度 | 温度 | 1,520 | Modbus RTU | >27°C预警/>30°C告警 |
| 机柜后温度 | 温度 | 1,520 | Modbus RTU | >40°C预警/>45°C告警 |
| 环境湿度 | 湿度 | 152(每10柜1个) | Modbus RTU | >60%/<20%告警 |
| 漏水检测 | 漏水 | 约80处 | 干接点 | 触发即告警 |
| UPS输入参数 | 电压/电流/频率 | 每台3相×2路 | SNMP v2c | ±10%标称值 |
| UPS输出参数 | 电压/电流/功率 | 每台3相 | SNMP v2c | ±5%标称值 |
| UPS电池 | 电压/温度/内阻 | 每组 | SNMP v2c | 温度>35°C/电压低 |
| UPS负载率 | 百分比 | 每台 | SNMP v2c | >70%预警/>85%告警 |
| PDU输入 | 电压/电流/功率 | 3,040个(每柜2) | SNMP v2c | >额定80%预警 |
| PDU分路 | 电流 | 约18,240路 | SNMP v2c | >额定80%预警 |
| 精密空调 | 运行状态/供回水温 | 约80台 | Modbus TCP | 故障/停机/温度异常 |
| 配电开关 | 分合状态 | 约300个 | Modbus RTU | 状态变化 |
| 电力仪表 | 电压/电流/功率/谐波 | 约150个 | Modbus RTU | 过载/谐波超标 |
| 柴发 | 运行状态/油量/温度 | 约8台(栋分配) | Modbus TCP | 启动失败/油低/温高 |
| 门禁状态 | 开关/认证 | 约60个 | TCP/IP | 异常开门/强制闯入 |
| 消防状态 | 探测器/灭火系统 | 约200个 | 协议对接 | 任何告警 |
| VESDA | 烟雾浓度 | 约40个 | Modbus TCP | Alert/Fire1/Fire2 |
单栋监测点总计:约26,000个 园区总计:约156,000个监测点
5.2.3 通信协议接口方案
IT设备层(SNMP v2c/v3):
UPS → SNMP网管卡 → 以太网 → 采集服务器
PDU → SNMP网管卡 → 以太网 → 采集服务器
工控设备层(Modbus):
温湿度传感器 → RS485总线 → Modbus网关 → 以太网 → 采集服务器
电力仪表 → RS485总线 → Modbus网关 → 以太网 → 采集服务器
精密空调 → Modbus TCP → 以太网 → 采集服务器
消防系统(专有协议):
消防主机 → 协议转换模块 → 以太网 → 采集服务器
数据汇聚:
栋级采集服务器 → 千兆以太网 → 园区监控中心 → DCIM
5.3 门禁与安防系统
5.3.1 分区认证方案
采用四级递进认证体系:
| 安全级别 | 区域 | 认证方式 | 设备 |
|---|---|---|---|
| 一级(园区) | 园区大门/车闸 | IC卡+车牌识别 | 道闸系统/IC读卡器 |
| 二级(楼栋) | 数据中心楼入口 | IC卡+密码 | 双重认证门禁 |
| 三级(机房层) | 机房入口 | IC卡+生物识别(指纹/虹膜) | 生物识别门禁+双门互锁 |
| 四级(机柜级) | 单个机柜 | 电子锁(远程授权+IC卡) | 智能机柜锁 |
关键安防措施:
- 双门互锁:机房入口设前室,两道门不能同时打开,防尾随
- 防尾随检测:红外对射感应器,检测到多人通过时报警
- 应急开门:消防联动时自动释放门禁(疏散方向常开)
- 离线策略:断网时门禁维持最后状态(常闭),断电时电磁锁释放(消防安全优先)
- 来访管理:访客需提前登记,临时卡有时间/区域限制,全程陪同
5.3.2 视频监控部署
| 区域 | 摄像机类型 | 分辨率 | 数量(单栋) | 存储要求 |
|---|---|---|---|---|
| 园区出入口 | 枪式+人脸抓拍 | 400W像素 | 6台(园区共享) | ≥90天 |
| 园区周界 | 红外枪式 | 200W像素 | 约40台(园区共享) | ≥30天 |
| 楼栋入口 | 半球+人脸抓拍 | 400W像素 | 4台 | ≥90天 |
| 楼层走廊 | 红外半球 | 200W像素 | 约20台 | ≥30天 |
| 机房内部 | 红外半球 | 200W像素 | 约40台 | ≥30天 |
| 配电室/UPS室 | 红外半球 | 200W像素 | 约10台 | ≥30天 |
| 电梯厅/楼梯间 | 半球 | 200W像素 | 约8台 | ≥30天 |
单栋约82台,园区总计约540台(含公共区域)
存储计算(单栋82台摄像机):
平均码率:4Mbps(200W)/ 6Mbps(400W)
按平均5Mbps计算:
日存储量 = 82台 × 5Mbps × 3600s × 24h ÷ 8bit = 4,428GB/天
30天存储 = 4,428 × 30 = 132,840GB ≈ 133TB
重点区域90天 = 约20台 × 90天额外60天 ≈ +40TB
每栋NVR存储:约180TB(含冗余)
5.4 消防系统
5.4.1 气体灭火选型
| 参数 | 选型方案 |
|---|---|
| 灭火剂 | 七氟丙烷(FM200) |
| 设计浓度 | 8% |
| 喷放时间 | ≤10s |
| 浸渍时间 | ≥10min |
| 系统类型 | 组合分配式(一套钢瓶服务多个防护区) |
选型理由:
- 七氟丙烷技术最成熟,国内应用最广泛,备件和维保资源丰富
- 灭火速度快(≤10s),适合数据中心快速灭火需求
- 无残留、不导电、对设备友好
- 成本适中(相比全氟己酮更经济)
IG-541备选方案:如甲方对环保要求特别高,可改用IG-541惰性气体。但喷放时间≤60s较长,且高压钢瓶占地大。
5.4.2 探测方案
采用双重探测 + 极早期预警:
第一道防线:VESDA极早期烟雾探测
- 每个防护区安装VESDA系统
- 主动空气采样,通过采样管网抽取机房空气
- 灵敏度0.005%obs/m(比普通感烟敏感100倍以上)
- 四级报警:Alert → Action → Fire1 → Fire2
- 主要作用:极早期预警,给运维人员处置时间
第二道防线:点型感烟探测器
- 天花板安装,保护面积60-80m²/个
- 光电感烟型
- 双回路布线(一个探测器故障不影响整个回路)
- 主要作用:确认火警信号,触发灭火联动
联动逻辑:
VESDA Fire1 AND 任一点型感烟确认 → 双信号确认 → 启动灭火程序
(避免单一信号误报导致误喷)
探测器数量估算(单栋):
- VESDA系统:约8套(每个防护区1套,每层2个防护区,共4层)
- VESDA采样管:约3,200m(覆盖所有机柜通道)
- 点型感烟探测器:约300个(5,000m² ÷ 60m²/个 × 4层 ≈ 300+)
- 手动报警按钮:约20个(每层每个出入口1个)
- 声光报警器:约40个(每层约10个)
5.4.3 联动时序
T0:VESDA达到Alert级别
→ 动环监控弹窗提示
→ 值班人员排查
T1:VESDA达到Fire1级别
→ 第一信号:声光报警启动
→ 通知值班人员确认
T2:任一点型感烟探测器报警(或VESDA达到Fire2)
→ 第二信号确认(双信号联动)
→ 自动执行以下联动动作:
① 切断防护区内非消防电源
② 关闭防护区空调系统
③ 关闭防火阀(切断通风管道)
④ 释放门禁(疏散方向开锁)
⑤ 启动语音疏散广播
⑥ 热通道封闭端门自动打开
T2+0~30s:人员疏散延时
→ 语音持续播报疏散指令
→ 出口指示灯闪烁
→ 倒计时显示
T2+30s:气体灭火自动喷放
→ 七氟丙烷电磁阀开启
→ 灭火剂喷放≤10s完成
→ 防护区浓度达到8%
T2+30s~T2+10min30s:浸渍保持
→ 保持灭火剂浓度≥10min
→ 禁止开门
→ 全程数据记录
T2+10min30s:浸渍结束
→ 启动排风系统
→ 待浓度降至安全值后方可入内检查
5.5 DCIM系统
5.5.1 功能需求
| 功能模块 | 具体功能 | 优先级 |
|---|---|---|
| 资产管理 | U位级资产台账、设备生命周期、二维码标签、变更记录 | 高 |
| 容量管理 | 电力/空间/制冷容量实时监测、使用率趋势、容量预测 | 高 |
| 能效管理 | PUE实时计算、分项能耗分析、能效趋势、优化建议 | 高 |
| 运维管理 | 告警管理、工单流程、巡检管理、值班管理 | 高 |
| 3D可视化 | 园区→建筑→楼层→机房→机柜五级穿透、热力图 | 中 |
| 变更管理 | 上下架流程、网络变更、电力变更、审批工单 | 中 |
| 报表管理 | 可用性报表、容量报表、能效报表、自动生成 | 中 |
| 数字孪生 | 气流仿真、容量仿真、故障模拟 | 低(二期) |
5.5.2 集成接口
向下集成(数据采集):
├── 动环监控 → RESTful API(5min同步)+ SNMP Trap(实时告警)
├── BA系统 → BACnet/IP(暖通空调数据)
├── 安防系统 → API(门禁记录/视频联动)
├── 消防系统 → 干接点/API(报警状态)
└── 智能PDU → SNMP v2c(电力数据)
向上集成(数据输出):
├── ITSM系统 → API(工单对接)
├── CMDB → API(资产信息同步)
├── 运维大屏 → WebSocket(实时推送)
└── 移动APP → RESTful API
接口技术规范:
├── 数据格式:JSON
├── 认证方式:OAuth 2.0
├── 接口文档:OpenAPI 3.0
├── 传输加密:TLS 1.2+
└── 数据频率:实时告警(<5s) / 性能数据(5min) / 统计数据(1h)
5.5.3 选型建议
| 选型维度 | 建议 |
|---|---|
| 部署方式 | 园区私有化部署(安全性考虑) |
| 架构 | B/S架构,支持集群部署 |
| 数据库 | 时序数据库(监控数据)+ 关系数据库(资产/工单) |
| 可扩展性 | 支持10万+监测点接入 |
| 品牌参考 | 国际:Nlyte/Sunbird/Schneider;国内:动力源/优锘/科华 |
第六章 机房规划
6.1 空间布局方案
单栋建筑面积分配:
| 功能区 | 面积(m²) | 占比 | 说明 |
|---|---|---|---|
| IT机房区 | 5,200 | 43% | 4层,每层约1,300m²/380柜 |
| 电力设备区 | 1,800 | 15% | UPS室+电池室+配电室 |
| 制冷设备区 | 600 | 5% | 室内冷冻水泵/管道(主机室外) |
| 网络机房(MDA/HDA) | 300 | 2.5% | 核心交换/光纤配线 |
| 监控/运维区 | 200 | 1.7% | 动环分站+值班室 |
| 交通/走廊 | 2,400 | 20% | 走廊+货梯+楼梯间 |
| 其他辅助 | 1,500 | 12.5% | 门厅/备件库/卫生间/管道井 |
| 单栋总计 | 12,000 | 100% |
园区总面积:6栋×12,000 + 运维中心3,000 + 柴发站房2,000 + 变电站1,500 + 冷却区3,000 + 道路/绿化 ≈ 85,000m²建筑 + 95,000m²室外 = 180,000m²
6.2 承重核算
| 功能区 | 设计荷载 | 计算依据 |
|---|---|---|
| IT机房区 | 10kN/m² | 42U机柜满载≈800kg,机柜间距2.4m×1.2m≈2.88m²,800kg÷2.88m²≈2,778N/m²+地板+设备余量→10kN/m² |
| UPS室 | 10kN/m² | 模块化UPS单柜≈1,500kg,占地约2m² |
| 电池室 | 16kN/m² | 铅酸电池柜极重(已改锂电可降至12kN/m²) |
| 配电室 | 10kN/m² | 高低压开关柜+变压器 |
| 柴发室 | 10kN/m² | 柴发机组+减震基础+日用油箱 |
| 制冷机房 | 8kN/m² | 冷冻水泵/阀门/管路 |
| 网络机房 | 8kN/m² | 网络机柜较轻,但需考虑布线桥架 |
| 走廊 | 5kN/m² | 设备搬运通道,需考虑运输荷载 |
关键提醒:锂电池替代铅酸电池后,电池室荷载可从16kN/m²降至10-12kN/m²,结构成本可优化。平谷项目选用磷酸铁锂电池,电池室按12kN/m²设计。
6.3 PUE测算
分项PUE测算:
| 能耗项 | 功率(单栋) | 占IT功率比 |
|---|---|---|
| IT设备功率 | 9,120kW | 100%(基准) |
| 制冷系统(间接蒸发冷却) | 1,824kW | 20% |
| UPS损耗(效率96%) | 380kW | 4.2% |
| 配电损耗(变压器+线损) | 182kW | 2% |
| 照明及辅助 | 91kW | 1% |
| 非IT总能耗 | 2,477kW | 27.2% |
| 总能耗 | 11,597kW | 127.2% |
PUE = 11,597 ÷ 9,120 = 1.272 ≈ 1.27
达标分析:
- 北京东部地区要求PUE ≤ 1.3 → 达标 ✅
- 项目目标PUE ≤ 1.25 → 接近但未达标 ⚠️
优化措施(降至1.25以下):
- 提高自然冷却利用率(优化AHU控制策略):制冷占比从20%降至17%
- 采用ECO模式UPS(效率>99%时段):UPS损耗降50%
- 智能照明(LED + 人感控制):照明能耗降40%
- 优化后PUE ≈ 1.22-1.24 → 达标 ✅
第七章 工程量清单
弱电各子系统工程量估算清单
7.1 综合布线系统
| 序号 | 项目 | 规格 | 单位 | 数量 |
|---|---|---|---|---|
| 1 | Cat6A网线 | 4对UTP | m | 760,000 |
| 2 | OM4光缆 | 12芯 | m | 45,000 |
| 3 | OM4光缆 | 24芯 | m | 18,000 |
| 4 | OS2光缆 | 144芯 | m | 5,000 |
| 5 | 铜缆配线架 | 48口 | 个 | 780 |
| 6 | 光纤配线架(ODF) | 96芯 | 个 | 120 |
| 7 | Cat6A跳线 | 1m/2m/3m | 条 | 55,000 |
| 8 | OM4光纤跳线 | LC-LC/MPO | 条 | 18,000 |
| 9 | 金属桥架 | 300×150mm | m | 12,000 |
| 10 | 金属桥架 | 600×200mm | m | 6,000 |
| 11 | 地板下线槽 | 各规格 | m | 8,000 |
| 12 | 网络机柜 | 42U标准 | 个 | 50 |
7.2 动环监控系统
| 序号 | 项目 | 规格 | 单位 | 数量 |
|---|---|---|---|---|
| 1 | 温度传感器 | 高精度±0.5°C | 个 | 18,240 |
| 2 | 湿度传感器 | ±3%RH | 个 | 912 |
| 3 | 漏水检测绳 | 感应线缆 | m | 6,000 |
| 4 | 漏水控制器 | 4路/8路 | 个 | 480 |
| 5 | Modbus网关 | RS485-TCP | 台 | 360 |
| 6 | 栋级采集服务器 | 工业服务器 | 台 | 12(每栋2台冗余) |
| 7 | 园区监控服务器 | 机架式服务器 | 台 | 4(集群) |
| 8 | 大屏显示系统 | 55寸/3×6拼接 | 套 | 1 |
| 9 | 值班工作站 | 含双屏 | 套 | 8 |
| 10 | 动环监控软件 | 含授权 | 套 | 1 |
| 11 | 手机告警网关 | 短信/语音 | 套 | 2 |
7.3 安防系统
| 序号 | 项目 | 规格 | 单位 | 数量 |
|---|---|---|---|---|
| 1 | IC卡门禁控制器 | 4门控制器 | 台 | 120 |
| 2 | IC卡读卡器 | Mifare | 个 | 300 |
| 3 | 生物识别终端 | 指纹+虹膜 | 台 | 60 |
| 4 | 电磁锁 | 280kg吸力 | 把 | 300 |
| 5 | 智能机柜锁 | 电子锁 | 套 | 9,120 |
| 6 | 红外枪式摄像机 | 200W/红外50m | 台 | 40 |
| 7 | 半球摄像机 | 200W/红外30m | 台 | 400 |
| 8 | 人脸抓拍摄像机 | 400W/AI | 台 | 60 |
| 9 | 全景摄像机 | 400W/180° | 台 | 40 |
| 10 | NVR存储 | 64路/96TB | 台 | 24 |
| 11 | 视频管理平台 | 含授权 | 套 | 1 |
| 12 | 道闸系统 | 车牌识别 | 套 | 4 |
| 13 | 门禁管理软件 | 含授权 | 套 | 1 |
7.4 消防系统
| 序号 | 项目 | 规格 | 单位 | 数量 |
|---|---|---|---|---|
| 1 | 七氟丙烷灭火系统 | 组合分配式 | 套 | 24(每栋4个防护区) |
| 2 | 七氟丙烷钢瓶 | 150L | 个 | 约480 |
| 3 | VESDA探测系统 | VESDA-E VEA | 套 | 48 |
| 4 | VESDA采样管 | 红色ABS | m | 20,000 |
| 5 | 点型感烟探测器 | 光电型 | 个 | 1,800 |
| 6 | 手动报警按钮 | 带电话插孔 | 个 | 120 |
| 7 | 声光报警器 | DC24V | 个 | 240 |
| 8 | 消防广播 | 壁挂式扬声器 | 个 | 180 |
| 9 | 消防主机 | 壁挂/落地 | 台 | 7(每栋1+园区1) |
| 10 | 气体灭火控制盘 | 每防护区1 | 台 | 24 |
| 11 | 防火阀 | 70°C熔断 | 个 | 120 |
| 12 | 排烟风机 | 按需配置 | 台 | 24 |
7.5 DCIM系统
| 序号 | 项目 | 规格 | 单位 | 数量 |
|---|---|---|---|---|
| 1 | DCIM软件平台 | 企业版/含全模块授权 | 套 | 1 |
| 2 | DCIM服务器 | 应用服务器 | 台 | 4(集群) |
| 3 | 数据库服务器 | 时序+关系数据库 | 台 | 4 |
| 4 | 3D建模服务 | 园区+6栋建模 | 项 | 1 |
| 5 | 接口开发 | API定制开发 | 项 | 1 |
| 6 | 大屏终端 | 4K显示+渲染主机 | 套 | 2 |
| 7 | 移动端授权 | APP/50用户 | 套 | 1 |
| 8 | 二维码标签 | 耐高温标签 | 个 | 20,000 |
第二部分:方案设计自检清单
用这份清单逐条检查你的方案是否完整,标注✅已覆盖/⚠️需补充/❌遗漏
合规性检查
| 序号 | 检查项 | 标准依据 | 状态 |
|---|---|---|---|
| 1 | 主机房温度设计18-27°C | GB50174 A级 | ✅ |
| 2 | 相对湿度<60% | GB50174 A级 | ✅ |
| 3 | 双路市电引入 | GB50174 A级 | ✅ |
| 4 | UPS后备≥15min | GB50174 A级 | ✅ |
| 5 | UPS 2N冗余 | GB50174 A级/Tier III | ✅ |
| 6 | 柴发启动≤15s | GB50174 A级 | ✅ |
| 7 | 燃油储备≥12h | GB50174 A级 | ✅ |
| 8 | 主机房承重≥8kN/m² | GB50174 | ✅(设计10kN/m²) |
| 9 | 接地电阻≤1Ω | GB50174 | ✅ |
| 10 | PUE ≤1.25(北京) | 北京市政策 | ✅(优化后1.22-1.24) |
| 11 | 气体灭火浸渍≥10min | GB50370 | ✅ |
| 12 | 视频存储≥30天/重点≥90天 | GA/T 367 | ✅ |
| 13 | 桥架填充率≤50% | GB50311 | ✅ |
| 14 | 强弱电桥架间距≥300mm | GB50311 | ✅ |
| 15 | VESDA+点型双重探测 | GB50116 | ✅ |
容易遗漏的检查项
| 序号 | 经常遗漏的内容 | 建议 |
|---|---|---|
| 1 | 液冷预留措施未写 | ⚠️ 即使本期不用液冷,也要写明预留方案 |
| 2 | 热通道封闭的消防补偿 | ⚠️ 需要说明热通道内如何保证消防探测有效 |
| 3 | 门禁断电/断网策略 | ⚠️ 容易忘记写明异常状态下的门禁行为 |
| 4 | 柴发燃油量具体计算 | ⚠️ 不能只写"≥12h",要给出具体升数 |
| 5 | DCIM与动环的接口协议 | ⚠️ 方案中要明确数据接口方式和频率 |
| 6 | 分期建设方案 | ⚠️ 超大型项目必须说明分期策略 |
| 7 | 运维通道宽度和层高 | ⚠️ 容易忽略机房净高和设备搬运通道 |
| 8 | 消防联动时序具体写法 | ⚠️ 不能只写"联动",要写清楚每一步的触发和动作 |
| 9 | 接地系统(TN-S、等电位) | ⚠️ 弱电方案容易忽略接地系统描述 |
| 10 | 环境参数控制策略 | ⚠️ 不只写设计参数,还要写监控/调控措施 |
第三部分:从"做方案"到"讲方案"——面试展示指南
版本一:3分钟电梯演讲
使用场景:面试官问"简单介绍一下你做过的最大项目"
"我在前公司负责北京平谷智算数据中心的弱电智能化方案编制和系统集成工作。这是一个6栋建筑、9120个机柜、总IT功率约55兆瓦的超大型智算中心项目。
我负责的核心工作包括综合布线、动环监控、安防、消防和DCIM五大弱电子系统的方案设计。等级定位为GB50174 A级 + Uptime Tier III,PUE目标1.25。
几个技术亮点:第一,采用热通道封闭方案优化气流组织,配合间接蒸发冷却实现低PUE;第二,动环监控全园区约15万个监测点的三级分布式架构设计;第三,四级递进门禁认证体系(从园区到机柜级);第四,VESDA极早期探测 + 点型感烟双重探测的消防方案。
项目成果:我们的技术方案在竞标中得到甲方认可,最终中标。这个项目让我对超大型数据中心弱电系统有了从方案到落地的完整认知。"
版本二:5分钟面试自我介绍(嵌入项目亮点)
使用场景:面试开始时"请做一下自我介绍"
"面试官您好,我是王鸿才,从事弱电智能化行业近5年。我的经历可以分为两个阶段:
第一阶段:轨道交通弱电(2年)
在天津地铁11号线项目中,我负责6个车站的弱电系统设计和实施,主导BAS(环境与设备监控系统)。这段经历让我建立了对大型弱电系统的整体认知——架构设计、协议选型、联动逻辑、施工管理,这些能力直接迁移到了后来的数据中心工作。
第二阶段:数据中心弱电(近3年)
重点项目是北京平谷智算数据中心。这是一个6栋楼、9120机柜、55兆瓦级别的超大型智算中心。我负责全部弱电智能化子系统的方案编制。
在这个项目中,有几个我认为做得比较好的点:
第一是动环监控方案。全园区约15万个监测点,我设计了三级分布式架构,园区中心—栋级分站—现场采集层。SNMP和Modbus双协议体系,IT设备用SNMP,工控设备用Modbus,通过协议网关统一接入。
第二是消防方案。数据中心消防和普通建筑很不一样,我采用了VESDA极早期探测加点型感烟的双重探测方案,七氟丙烷气体灭火,并设计了完整的联动时序——从VESDA预警到确认到疏散到喷放,每个环节都有明确的触发条件和时间节点。
第三是成本管控。在方案编制过程中,我负责了弱电部分的工程量估算和招标清单编制,对各子系统的造价构成比较了解,做过采购比价分析。
此外,我还参与了芜湖数据中心、马来西亚和泰国海外数据中心的投标支持工作,对不同地区数据中心的差异化设计有一定理解。
选择贵公司的原因:我对智算中心这个方向非常看好,也希望在更核心的技术团队中深入发展。我的弱电方案编制能力、项目管理经验和成本控制意识,应该能为团队带来直接的贡献。"
版本三:15分钟技术答辩深度讲解
使用场景:面试官要求"详细讲一下你的项目方案"或技术答辩环节
开场(1分钟):项目概述 + 我的角色
"平谷智算数据中心,6栋建筑,9120个机柜,单柜6kW,总IT功率约55兆瓦。定位A级+Tier III。我负责弱电智能化方案的整体编制,覆盖五大子系统。"
模块一:综合布线(3分钟)
"布线拓扑选择了ToR架构,这是超大型数据中心的主流选择。每柜内服务器用Cat6A短铜缆接ToR交换机,ToR用OM4多模上联到列头HDA,楼内MDA用OM4/OS2汇聚,建筑间用144芯OS2环网。
选ToR的核心原因是9120柜规模下光纤用量最优——如果用EoR方案,每柜到列末端的铜缆会很长,而且在密度增长时扩展不灵活。
管理网络用Cat6A单独组网,用于服务器BMC管理和动环监控。业务网和管理网物理隔离。
整个园区的布线规模大约是76万米铜缆、5万米OM4光缆、5千米OS2光缆、780个配线架。桥架填充率控制在50%以内,强弱电间距300毫米以上。"
模块二:动环监控(3分钟)
"动环监控采用三级分布式架构。第三级是现场采集层,温湿度传感器、UPS、PDU、空调、电力仪表这些设备的数据,通过SNMP和Modbus两种协议采集。
为什么不统一用一种协议?因为IT设备(UPS、PDU、交换机)天生支持SNMP,工控设备(电力仪表、传感器、空调控制器)天生支持Modbus。强制统一反而增加转换成本。我在每列末端部署Modbus网关,将RS485总线上的Modbus RTU设备转为Modbus TCP,统一接入IP网络。
第二级是栋级采集服务器,每栋2台冗余部署,负责本栋约26,000个监测点的数据汇聚和初步处理。
第一级是园区监控中心NOC,4台服务器集群,部署监控软件平台,承担全园区15万+监测点的统一告警管理、历史数据存储和大屏展示。
告警策略分四级:提示→预警→告警→紧急,通过声光、邮件、短信、电话多种通道分级通知。"
模块三:安防系统(2分钟)
"安防做了四级递进认证:园区IC卡+车牌、楼栋IC卡+密码、机房生物识别+IC卡+双门互锁、机柜电子锁远程授权。
视频监控全园区约540个摄像机,重点区域400万像素人脸抓拍,普通区域200万像素。存储30-90天,单栋约180TB存储。"
模块四:消防系统(3分钟)
"消防是数据中心弱电中最关键也最容易出问题的子系统。我的方案有三个核心设计点:
第一,双重探测。VESDA极早期采样作为预警手段,灵敏度是普通感烟探测器的100倍以上,可以在肉眼看不到烟雾的阶段就发出Alert。点型感烟探测器作为确认手段,双信号联动才会触发灭火。这样可以最大限度避免误喷——一次误喷的损失可能是几十万甚至上百万。
第二,完整联动时序。从VESDA Alert到Fire1到双信号确认,再到切非消防电源、关空调、关防火阀、释放门禁、启动疏散广播,30秒延时后自动喷放七氟丙烷,10秒内完成喷放,保持浸渍10分钟以上。每个环节的触发条件和时间节点都在方案中明确定义。
第三,热通道封闭的消防兼容。封闭热通道可能影响烟雾探测器的感知效果,所以我在热通道内增设了线型感温探测器作为补偿,端门消防联动时自动开启确保灭火剂均匀分布。"
模块五:DCIM(2分钟)
"DCIM在这个项目中定位为全局资源管理平台,与动环监控形成上下级关系。动环监控负责实时数据采集和告警,DCIM整合动环数据加上资产、容量、能效信息,提供管理级的决策支持。
核心功能包括U位级资产管理、电力和空间容量管理、PUE实时计算和趋势分析、工单流程管理、3D可视化。
集成方案是动环监控通过RESTful API 5分钟推送汇总数据,SNMP Trap实时推送告警。DCIM同时向上对接ITSM和CMDB系统。"
收尾(1分钟):成果 + 反思
"这个方案最终中标,从方案编制到投标答辩,我全程参与。回头看,如果有机会改进,我会在以下几个方面做得更好:一是液冷预留方案可以更细致,当时行业对智算中心液冷需求的认识还不够充分;二是DCIM选型阶段可以做更详细的POC测试,而不只是文档评审。"
学习检验
完成本节学习后,你应该能够:
- 能脱稿讲出平谷项目方案的七个章节核心内容
- 3分钟版本能在时间内完整、流畅地讲完
- 能回答面试官对方案任何章节的追问
- 了解方案设计中容易遗漏的10个检查点
下一节预告:M6-03 将聚焦薄弱环节突破,针对你在各模块诊断中暴露的盲区进行专项强化。
本文件为模块6第2天学习内容,共约1050行。 编写标准:完整方案+面试演讲脚本+自检清单,实战导向。