智算弱电学习系统
课程概览规范体系M1-04:TIA-942 布线详解与 ASHRAE 热管理指南

M1-04:TIA-942 布线详解与 ASHRAE 热管理指南

模块1 / Day 5 学习目标:深入掌握TIA-942布线拓扑体系的工程落地方法(铜缆选型、光纤选型、冗余路由设计、标签管理),理解ASHRAE TC 09.09热管理指南对数据中心制冷设计的指导意义。这些内容是弱电工程师在方案设计中的核心输出物。


一、TIA-942 布线拓扑完整讲解

M1-01已经介绍了TIA-942布线拓扑的基本概念(ER→MDA→HDA→EDA→ZDA)。本章将从工程落地的角度深入展开:每层设备怎么选、线缆怎么布、冗余怎么做。

1.1 布线拓扑层级深入解析

1.1.1 ER(Entrance Room)进线间 —— 深入设计

ER的工程设计要点

设计要素Rating 1-2Rating 3Rating 4
ER数量1个≥2个≥2个
入楼路由1条2条(不同方向)2条(完全独立,不同管井)
运营商接入≥1家≥2家≥2家(不同运营商)
ER之间N/A应有冗余互联必须有冗余互联

ER内部典型设备清单

1. 运营商光纤配线架(ODF)
   - 每家运营商独立的ODF
   - 熔接盘/尾纤管理
   - 入楼光缆终端

2. 铜缆配线架
   - 如果有铜缆引入(如E1线路、电话线路)
   - 110型配线架或RJ45配线架

3. 防雷保护设备
   - 光纤不需要防雷(非导电介质)
   - 铜缆需要安装SPD(信号浪涌保护器)
   - 光缆金属加强芯需要接地

4. 运营商设备(托管)
   - 运营商提供的光端机、路由器
   - 需要独立的电源和监控

5. 光纤跳线/铜缆跳线
   - 从运营商ODF到MDA光缆的连接

平谷项目ER设计参考

设置2个ER(ER-A和ER-B),分别位于园区的东侧和西侧
  - ER-A:从东侧引入运营商A和运营商B的光缆
  - ER-B:从西侧引入运营商C和运营商B的光缆(运营商B双路由)
  - ER-A和ER-B之间通过园区内部光缆互联(冗余)
  - 每个ER面积:≥30m²
  - 每个ER配备独立的门禁、视频监控、温湿度监控、UPS供电

1.1.2 MDA(Main Distribution Area)主配线区 —— 深入设计

MDA的工程设计要点

MDA是整个布线系统的"大脑"——所有进出数据中心的数据流量都在这里汇聚和分发。

MDA内部典型设备清单

1. 核心网络交换机
   - 数据中心核心交换机(如100G/400G核心交换)
   - 通常2台做冗余(双活或主备)
   - 上联到ER(连接外部网络)
   - 下联到各HDA(连接内部网络)

2. 核心光纤配线架(ODF)
   - 从ER来的主干光缆在此终端
   - 到各HDA的主干光缆在此始发
   - 高密度光纤配线(MPO/MTP连接器)
   - 光纤端口数可能达到数千个

3. 核心铜缆配线架
   - 管理层面的连接(如带外管理网络)
   - 端口数量相对较少

4. 安全设备
   - 防火墙
   - 入侵检测/防御系统(IDS/IPS)
   - 负载均衡器

5. SAN核心交换机(如有)
   - 存储区域网络的核心设备
   - 通常也做冗余配置

6. 光纤跳线管理
   - 大量的光纤跳线(可能数百到数千根)
   - 需要良好的跳线管理架和标签系统

MDA位置选择

  • 应位于数据中心的几何中心重心位置
  • 目的:缩短到各HDA的主干光缆距离,降低信号衰减
  • 同时应靠近ER,减少ER到MDA的主干光缆长度

Rating 3/4的冗余MDA设计

Rating 3:
  可以设置1个MDA + 冗余连接
  即MDA内部的核心交换机做冗余(双机),但物理空间是一个MDA

Rating 4:
  应设置2个物理上分离的MDA(MDA-A和MDA-B)
  两个MDA分别连接不同的ER
  每个MDA内部设备独立
  IT设备通过冗余连接同时连接MDA-A和MDA-B

1.1.3 HDA(Horizontal Distribution Area)水平配线区 —— 深入设计

HDA的工程设计要点

HDA是布线系统中数量最多的配线点,直接决定了机柜区域的网络连接质量。

HDA内部典型设备清单

1. 接入层/汇聚层网络交换机
   - ToR(Top-of-Rack)或EoR(End-of-Row)方式
   - 上联到MDA核心交换(通常用光纤)
   - 下联到EDA机柜(通常用铜缆或短距光纤)

2. 光纤配线架
   - 来自MDA的主干光缆终端
   - 光纤跳线连接到交换机的光口

3. 铜缆配线架
   - 到EDA机柜的水平铜缆终端
   - Cat 6A配线架

4. KVM交换机(如需要)
   - 远程管理服务器的控制台

HDA的服务范围计算

核心限制因素:铜缆水平布线的100米距离限制

永久链路(配线架到机柜信息点):≤90m
设备跳线 + 工作区跳线:≤10m
总信道长度:≤100m

实际可覆盖的机柜数量取决于:
1. HDA的位置(列头/列中/列尾)
2. 机柜列的长度和排列方式
3. 线缆的实际走线路径(不是直线距离)

典型估算:
  一个HDA可以服务半径约40~50m范围内的机柜
  按每排20~30个机柜、排间距1.2m计算
  一个HDA约可服务200~400个机柜

平谷项目HDA数量估算:
  9,120个机柜 / 300个机柜每HDA ≈ 31个HDA
  考虑冗余和布局优化,设计约35~40个HDA

HDA布局方式的选择

方式说明优点缺点适用场景
EoR(End of Row)HDA设在每排机柜的末端集中管理、便于维护水平铜缆较长大型数据中心
MoR(Middle of Row)HDA设在每排机柜的中间缩短铜缆距离维护需进入机柜区中型数据中心
ToR(Top of Rack)每个机柜顶部安装交换机铜缆最短交换机数量多、管理复杂高密度/云计算

智算中心推荐方案

  • GPU集群通常使用ToR模式(每个机柜或每2个机柜配一台接入交换机)
  • 因为GPU服务器之间需要高带宽低延迟的互联(如RDMA/RoCEv2)
  • ToR方式可以将服务器到交换机的铜缆缩短到2~3m,减少信号延迟

1.1.4 EDA(Equipment Distribution Area)设备配线区 —— 深入设计

EDA就是机柜区域,设计重点是机柜内部的走线和连接规范。

机柜内部走线规范

机柜前面(冷面):
  └── 服务器/设备面板
  └── 网线/光纤连接到设备前面板的网口

机柜后面(热面):
  └── 电源线连接到设备后面板的电源口
  └── PDU安装在机柜后部两侧

机柜内走线架:
  └── 顶部水平走线架:用于引导网线/光纤从机柜顶部进入
  └── 两侧垂直理线器:用于整理线缆的走向
  └── 底部走线通道:部分设计从地板下方进线

线缆管理原则:
  1. 强弱电分离:电源线走一侧,数据线走另一侧
  2. 保持弯曲半径:铜缆≥4倍外径,光纤≥10倍外径(或按厂商要求)
  3. 避免过度捆扎:线缆束不应太紧,影响散热和后续更换
  4. 冗余预留:每根线缆在两端各预留30~50cm的余量
  5. 所有线缆必须贴标签

1.1.5 ZDA(Zone Distribution Area)区域配线区 —— 何时使用

ZDA是可选层级,在以下场景中使用价值较大:

  1. 机柜布局频繁变化的场景

    • 新增机柜时,只需从ZDA到新机柜拉线,不用从HDA重新布放
    • 减少对已有布线系统的影响
  2. 超大型数据中心

    • HDA到EDA的水平距离较远
    • ZDA作为中间汇聚点,简化管理
  3. 开放办公区域混合场景

    • 数据中心内有部分开放区域(如运维工作区)
    • 用ZDA提供灵活的网络接入点

ZDA在平谷项目中的应用

  • 如果采用ToR交换机方案,通常不需要ZDA(交换机就在机柜旁边)
  • 如果采用EoR方案,可以在每2~3排机柜之间设置一个ZDA,作为铜缆的汇聚点

1.2 各Rating等级的布线要求对比(完整版)

要求项Rating 1Rating 2Rating 3Rating 4
ER数量≥1≥1≥2≥2
ER入楼路由1条1条≥2条(不同方向)≥2条(完全独立)
MDA数量111(冗余连接)≥2(完全冗余)
HDA到MDA连接单连接单连接冗余连接双独立连接到2个MDA
主干光纤路由单路由单路由双路由双路由(物理完全隔离)
水平布线单连接单连接冗余(双接入)冗余(双独立接入)
铜缆最低等级Cat 5eCat 6Cat 6ACat 6A
主干光纤类型OM3或单模OM3或单模OM4+单模OM4+单模(双路由)
管路冗余冗余管路冗余管路(隔离)
标签要求基本基本完整(TIA-606-B)完整(TIA-606-B)

1.3 铜缆选型详解

1.3.1 各等级铜缆参数对比

参数Cat 5eCat 6Cat 6ACat 8
标准TIA-568-C.2TIA-568-C.2TIA-568-C.2TIA-568.2-D
频率100MHz250MHz500MHz2000MHz
1Gbps距离100m100m100m100m
10Gbps距离不支持55m(10GBASE-T)100m(10GBASE-T)100m
25Gbps距离不支持不支持不支持(标准外)30m
40Gbps距离不支持不支持不支持30m
屏蔽类型UTP(常见)/F/UTPUTP/F/UTPF/UTP或U/FTP(推荐)S/FTP
线径(AWG)24AWG23AWG23AWG22~23AWG
外径约5mm约6mm约7~8mm约8mm
弯曲半径≥4×外径≥4×外径≥4×外径≥4×外径
连接器RJ45RJ45RJ45RJ45(40GBASE-T)/非RJ45连接器
市场价格(每米)¥3~5¥5~10¥10~20¥30~60
推荐使用淘汰中一般场景数据中心首选特殊高速场景

1.3.2 为什么数据中心推荐Cat 6A?

  1. 支持10GBASE-T满100m:Cat 6在10G下只支持55m,Cat 6A支持100m,给水平布线设计留出充裕的距离余量
  2. 外来串扰防护:Cat 6A增加了Alien Crosstalk(外来串扰)的测试要求,在高密度布线环境下(数据中心机柜内线缆密集捆扎)性能更稳定
  3. 前瞻性:随着服务器网卡从1G向10G甚至25G迁移,Cat 6A可以平滑支持
  4. 成本合理:与Cat 6相比价格差距不大(约1.5~2倍),但性能提升显著
  5. TIA-942 Rating 3/4要求:Cat 6A是Rating 3及以上的最低铜缆要求

1.3.3 屏蔽vs非屏蔽

类型缩写说明适用场景
非屏蔽UTP无屏蔽层一般办公环境
总屏蔽F/UTP外层铝箔屏蔽数据中心(最低要求)
单对屏蔽U/FTP每对线独立铝箔数据中心推荐
双重屏蔽S/FTP外层编织+每对铝箔高干扰环境

数据中心为什么推荐屏蔽铜缆?

  • 数据中心内电磁干扰源多(UPS、PDU、大功率服务器电源等)
  • 高密度布线时铜缆之间的串扰严重
  • 屏蔽可以有效降低外来干扰和串扰
  • Cat 6A屏蔽铜缆(F/UTP或U/FTP)是数据中心水平布线的最佳选择

屏蔽铜缆的注意事项

  • 屏蔽层必须两端良好接地(否则屏蔽层反而成为天线,接收更多干扰)
  • 配线架和跳线也必须使用屏蔽型
  • 整个链路的屏蔽要保持连续性

1.4 光纤选型详解

1.4.1 多模光纤(OM系列)参数对比

参数OM1OM2OM3OM4OM5
芯径62.5/125μm50/125μm50/125μm50/125μm50/125μm
外护色橙色橙色水绿色紫色/水绿色绿色
带宽(MHz·km)200@850nm500@850nm2000@850nm4700@850nm28000@953nm
1Gbps距离300m600m1000m1100m1100m
10Gbps距离33m82m300m550m550m
40Gbps距离100m150m150m
100Gbps距离100m(SR4)150m(SR4)150m(SR4)
400Gbps70m(SR8)100m(SR8)100m(SR4.2 SWDM)
光源LED/VCSELLED/VCSELVCSELVCSELVCSEL(多波长)
推荐使用已淘汰已淘汰可用推荐前瞻选择
市场价格中高

1.4.2 单模光纤(OS系列)参数对比

参数OS1OS2
芯径9/125μm9/125μm
外护色黄色黄色
衰减@1310nm≤1.0 dB/km≤0.4 dB/km
衰减@1550nm≤1.0 dB/km≤0.4 dB/km
10Gbps距离10km+40km+
100Gbps距离10km+(LR4)
400Gbps距离10km+(DR4)
应用场景室内短距室外长距/楼间
推荐使用逐步淘汰推荐

1.4.3 数据中心光纤选型原则

主干布线(ER到MDA、MDA到HDA)

距离推荐光纤说明
同一建筑内(<300m)OM4多模支持10/25/40/100G,成本适中
不同建筑间(>300m)OS2单模支持长距离,适合园区内楼间连接
混合场景OM4 + OS2并行Rating 3以上要求,多模和单模各布一路

水平布线(HDA到EDA)

距离推荐介质说明
<100mCat 6A铜缆成本低,支持10GBASE-T
<100m(高速需求)OM4多模光纤支持25G/40G/100G
ToR场景(<5m)Cat 6A铜缆或DACDAC(直连铜缆)更经济

平谷项目光纤选型建议

ER到MDA主干:
  · OS2单模 48芯(楼间连接,距离可能>300m)
  · OM4多模 48芯(楼内连接,备用)
  · 双路由布放(Rating 3要求)

MDA到HDA主干:
  · OM4多模 24~48芯(楼内中距离连接)
  · 未来可升级到OM5支持SWDM高密度
  · 冗余路由

HDA到EDA水平:
  · Cat 6A屏蔽铜缆(管理网络、一般接入)
  · OM4多模 12芯(高速GPU互联场景)
  · DAC直连铜缆(ToR交换机到服务器的短距离高速连接)

GPU集群内部互联(特殊需求):
  · 可能需要400G光互联(OM4或OS2 + QSFP-DD光模块)
  · InfiniBand场景可能使用专用线缆

1.4.4 光纤连接器选型

连接器芯数特点适用场景
LC双芯小型化,最常用设备面板端口(10G/25G)
SC双芯推拉式,较大配线架(逐步被LC替代)
MPO/MTP-88芯高密度多芯40G SR4(4对收发)
MPO/MTP-1212芯高密度多芯100G SR4、预端接线缆
MPO/MTP-2424芯超高密度100G SR10、400G SR8

数据中心推荐

  • 设备端口侧:LC连接器(最通用)
  • 主干光缆:MPO/MTP预端接方案(施工速度快、占用空间小)
  • 配线架侧:高密度MPO到LC分支模块

1.5 主干与水平布线的介质选择原则

总体原则

"主干用光,水平用铜(或短距光纤)"

原因:
  · 主干距离长(几十米到几百米),光纤的带宽和距离优势明显
  · 水平距离短(<100m),铜缆成本更低、维护更简单
  · 光纤不受电磁干扰,适合穿越配电区域等高EMI环境
  · 铜缆可以通过PoE为末端设备供电(如摄像机、门禁)

决策矩阵

场景距离速率需求推荐介质理由
ER到MDA>100m≥100GOS2单模长距离高速
MDA到HDA50~300m≥40GOM4多模中距离高速
HDA到EDA(普通)<100m1~10GCat 6A成本低,可PoE
HDA到EDA(高速)<100m25~100GOM4铜缆不支持或距离受限
ToR到服务器<5m10~25GCat 6A或DAC最短距离,成本最优
楼间连接>300m≥10GOS2单模唯一选择
弱电系统<100m≤1GCat 5e/Cat 6成本控制

1.6 冗余路由设计要求

冗余路由是Rating 3及以上的核心要求——确保任何一条线缆路由被切断时,仍有另一条路由可以使用。

1.6.1 物理路由分离原则

错误设计(单路由):
  ER ──[桥架A]──→ MDA ──[桥架A]──→ HDA
  (所有线缆走同一条桥架,桥架被切断则全部中断)

正确设计(双路由):
  ER ──[桥架A(东侧管井)]──→ MDA ──[桥架A]──→ HDA
  ER ──[桥架B(西侧管井)]──→ MDA ──[桥架B]──→ HDA
  (两路线缆走不同的桥架和管井,物理上完全隔离)

路由分离的具体要求

要求Rating 3Rating 4
竖直管井不同管井不同管井(建筑不同侧)
水平桥架不同桥架不同桥架(不同通道)
穿墙/穿楼板不同预留孔洞不同预留孔洞
室外管道不同方向不同方向且间距≥20m
消防分区可穿越同一分区不应穿越同一防火分区

1.6.2 冗余路由设计示意

平面示意(简化):

          北
     ┌────────────┐
     │   ER-A     │
     │  (东侧)    │
     └──┬─────────┘
        │路由A(东侧管井)
   ┌────┴────────────────────┐
   │                          │
   │     ┌──────┐             │
   │     │ MDA  │             │
   │     └──┬───┘             │
   │        │                  │
   │   ┌────┴──┐  ┌─────┐    │
   │   │ HDA-1 │  │HDA-2│    │
   │   └───────┘  └─────┘    │
   │                          │
   └────┬────────────────────┘
        │路由B(西侧管井)
     ┌──┴─────────┐
     │   ER-B     │
     │  (西侧)    │
     └────────────┘
          南

1.7 强弱电分离标准

1.7.1 间距要求及依据

根据TIA-942和GB 50174的要求,弱电线缆与强电线缆之间应保持一定的物理间距,以避免电磁干扰(EMI)。

场景最小间距说明
弱电线缆与未屏蔽的220V电力电缆平行布放≥300mm在同一桥架内不可混放
弱电线缆与屏蔽的220V电力电缆平行布放≥150mm使用屏蔽电缆可缩短间距
弱电线缆与高压电缆(>1kV)平行布放≥600mm或使用金属隔板完全隔离
弱电线缆与电力电缆交叉布放≥50mm交叉角度应为90°
弱电线缆与荧光灯镇流器≥300mm镇流器是常见EMI源
弱电桥架与强电桥架上下布放≥300mm弱电桥架应在强电桥架上方

为什么弱电桥架应在上方?

  • 万一强电桥架漏电或起火,向上的热气和水(消防水)不会直接影响弱电线缆
  • 实际施工中,弱电桥架在上、强电桥架在下已成为行业通行做法

1.7.2 工程实践

在数据中心机房内,典型的桥架分层布局(从上到下):

天花板(吊顶)
  │
  ├── 第一层:弱电桥架(网线/光纤)
  │     间距 ≥300mm
  ├── 第二层:强电桥架(UPS输出线缆)
  │     间距 ≥300mm
  ├── 第三层:制冷管道(如有上走管方案)
  │
机柜顶部
  │
  ├── 机柜内部(42U)
  │
活动地板面
  │
  ├── 地板下方:冷通道送风空间
  ├── 地板下方:强电线缆(部分设计走地板下)
  │
结构楼板

1.8 标签管理规范(TIA-606)

1.8.1 TIA-606标准概述

TIA-606(现行版本TIA-606-C)是专门规范布线系统标签管理的标准,全称《Administration Standard for Telecommunications Infrastructure》。

为什么标签如此重要?

  • 数据中心内可能有数万根线缆,没有标签的线缆等于废线——不知道它从哪来、到哪去
  • 运维人员在故障排查、设备搬迁、线路扩容时,都依赖标签来快速定位
  • 缺少标签的布线系统,维护成本会呈指数级增长

1.8.2 标签体系的四个等级

TIA-606定义了四个管理等级:

等级适用范围标签内容
Class 1单一建筑内配线架端口、线缆标识
Class 2单一建筑内+多楼层Class 1 + 建筑标识
Class 3多建筑园区Class 2 + 园区标识
Class 4多园区/数据中心Class 3 + 站点标识

大型数据中心至少应达到Class 3,多站点运营商应达到Class 4。

1.8.3 标签命名规范

配线架标签格式示例

格式:[建筑]-[楼层]-[房间]-[机柜]-[配线架]-[端口]
示例:B01-F02-MDA-R05-P03-24

解析:
  B01   = 1号楼
  F02   = 2层
  MDA   = 主配线区
  R05   = 第5个机柜(Rack 05)
  P03   = 第3个配线架(Panel 03)
  24    = 第24端口

线缆标签格式示例

格式:[近端标识]——[远端标识]
示例:B01-MDA-R05-P03-24 → B01-HDA3-R12-P01-08

近端标签:
  位于MDA的第5机柜第3配线架第24端口

远端标签:
  位于HDA-3的第12机柜第1配线架第8端口

每根线缆的两端都应贴上标签
线缆中间(如进入桥架处)也应贴标签

机柜标签格式

格式:[建筑]-[楼层]-[列号]-[柜号]
示例:B01-F02-A-12

解析:
  B01 = 1号楼
  F02 = 2层
  A   = A列(第一列机柜)
  12  = 该列第12个机柜

1.8.4 标签的物理要求

要求项规范
标签材料耐久型(防褪色、防水、耐温)
打印方式热转印或激光打印(不可手写)
字体大小≥6pt(确保可读)
粘贴位置线缆两端各贴一个,距接头10~20cm
颜色编码可选(如多模=水绿色,单模=黄色,管理=白色)
更新维护任何线缆变更后48小时内更新标签

1.9 机柜内走线规范

1.9.1 基本原则

1. 左电右网(或前网后电):
   数据线缆和电源线缆走不同侧,避免EMI干扰

2. U位对齐:
   线缆进出机柜的位置应与设备U位对齐
   使用水平理线器在每1~2U设备之间整理线缆

3. 弯曲半径:
   铜缆:≥4倍外径(Cat 6A约28mm)
   多模光纤:≥25mm(弯曲不敏感光纤)或≥38mm(常规光纤)
   单模光纤:≥15mm(弯曲不敏感光纤)或≥30mm(常规光纤)

4. 不过度捆扎:
   线束直径不应超过100mm
   扎带不应过紧(手指可伸入为标准)
   建议使用魔术贴而非尼龙扎带(便于后续维护)

5. 余量管理:
   预留30~50cm余量在机柜内盘绕
   余量不应阻碍气流

1.9.2 气流管理与走线的关系

在数据中心的热通道/冷通道架构中,线缆走线会直接影响气流效率:

冷通道封闭场景:
  - 冷空气从活动地板下方进入机柜前面板
  - 如果线缆堆积在地板出风口处,会阻碍冷风
  - 如果线缆在机柜顶部过于密集,会影响热空气排出

良好实践:
  ✅ 线缆整齐捆扎,不阻碍出风口
  ✅ 机柜底部线缆用理线器固定在两侧
  ✅ 机柜空余U位安装盲板(防止冷热空气短路)
  ✅ 机柜顶部线缆走桥架,不堆在机柜顶部

不良实践:
  ❌ 线缆乱堆在地板出风口上
  ❌ 机柜内线缆随意悬挂,遮挡设备进风口
  ❌ 机柜空余U位不安装盲板
  ❌ 线缆从冷通道穿越到热通道(破坏冷热隔离)

二、ASHRAE TC 09.09 热管理指南

2.1 ASHRAE在数据中心领域的角色

ASHRAE(American Society of Heating, Refrigerating and Air-Conditioning Engineers,美国暖通空调工程师学会)是全球暖通空调领域最权威的技术组织。

其下属的TC 09.09委员会(Technical Committee 09.09 - Mission Critical Facilities, Data Centers, Technology Spaces and Electronic Equipment)专门研究数据中心的热管理和环境控制问题。

TC 09.09的主要贡献

  1. 定义了数据中心环境的温湿度推荐包络线
  2. 为服务器厂商和数据中心设计师提供统一的环境标准参考
  3. 推动了数据中心提高运行温度、降低PUE的行业趋势
  4. 出版了《ASHRAE Datacom Series》系列技术书籍

与GB 50174的关系

  • GB 50174-2017在制定温湿度指标时参考了ASHRAE的研究成果
  • 但GB 50174的温度范围(1827°C)比ASHRAE的推荐范围(1827°C)相同,比其允许范围(15~32°C)更窄
  • 国内项目在温度设计上通常以GB 50174为准,但在节能优化时参考ASHRAE的允许范围

2.2 推荐温度包络线(A1-A4类环境详解)

ASHRAE将数据中心IT设备的运行环境分为A1、A2、A3、A4四类,每类有不同的温湿度要求:

2.2.1 四类环境对比

环境类推荐温度范围允许温度范围推荐湿度范围典型设备
A118~27°C15~32°C露点-9°C~15°C, RH≤60%企业级服务器、存储
A218~27°C10~35°C露点-9°C~15°C, RH≤60%大部分IT设备
A318~27°C5~40°C-12°C露点~24°C露点, RH≤85%工业级IT设备
A418~27°C5~45°C-12°C露点~24°C露点, RH≤90%高温耐受设备

关键理解

  • 推荐范围:设备厂商保证在此范围内设备能以最佳性能和最长寿命运行
  • 允许范围:设备可以在此范围内正常工作,但可能会有轻微性能下降或寿命缩短
  • 四类的推荐范围完全相同(18~27°C),差异仅在允许范围

2.2.2 包络线的工程含义

温度轴(°C)
45°C ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─  A4允许上限
40°C ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─     A3允许上限
35°C ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─       A2允许上限
32°C ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─         A1允许上限
27°C ═══════════════════════════             推荐上限(所有类别相同)
     ║                         ║
     ║     推荐运行范围         ║
     ║   (最佳性能和寿命)     ║
     ║                         ║
18°C ═══════════════════════════             推荐下限(所有类别相同)
15°C ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─         A1允许下限
10°C ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─           A2允许下限
 5°C ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─ ─             A3/A4允许下限

对数据中心设计的影响

  • 如果按推荐范围(18~27°C)设计制冷系统,系统需要在任何室外气温条件下都能将机房温度控制在此范围内
  • 如果按允许范围(如A1的15~32°C)运行,可以在室外气温较低时提高机房温度到27°C以上,从而减少制冷能耗,提升自然冷却的使用时间

2.3 服务器进风温度管理原则

进风温度(Inlet Temperature)是数据中心热管理的核心指标。ASHRAE的所有温度要求都是指服务器进风口处的温度,不是机房的平均温度。

为什么强调"进风口"?

典型机房温度分布(冷通道封闭场景):

  冷通道温度:18~22°C ← 这是服务器进风口温度
  服务器内部温升:+30~50°C
  热通道温度:38~55°C ← 这是服务器出风口温度

如果测量机房"平均温度":(22+45)/2 ≈ 33.5°C
这个数字毫无意义——真正决定设备健康的是进风口温度

进风温度管理最佳实践

  1. 冷热通道隔离:通过物理屏障(封闭冷通道或封闭热通道)阻止冷热空气混合
  2. 消除热点
    • 安装盲板封堵空余U位
    • 封堵机柜内线缆孔洞
    • 确保机柜之间无间隙
  3. 温度分级监控
    • 每个机柜至少3个温度传感器(底部、中部、顶部)
    • 实时监控进风温度,偏差>2°C即预警
  4. 气流管理
    • 活动地板出风口的位置和开孔率需要计算匹配
    • 高密度机柜前方应增大出风口面积
    • 避免"冷风短路"(冷风不经过服务器直接从空隙溢入热通道)

2.4 高密度机柜散热挑战

2.4.1 什么是"高密度"?

功率密度分类制冷方式典型设备
<3kW/柜低密度传统房间级精密空调一般服务器
3~6kW/柜中密度精密空调+冷热通道封闭刀片服务器
6~15kW/柜高密度行级空调/列间空调GPU服务器(平谷项目)
15~30kW/柜超高密度后门热交换器/液冷高密度GPU集群
>30kW/柜极高密度直接液冷/浸没式液冷最新AI训练集群

平谷项目6kW/柜处于"高密度"范围,对制冷系统有特殊要求。

2.4.2 高密度散热面临的技术挑战

  1. 局部热负荷集中

    • 6kW/柜意味着每平方米地板面积的热负荷约为23kW(按机柜占地23m²计算)
    • 而传统精密空调的送风能力通常按1~1.5kW/m²设计
    • 热负荷已经超出传统空调的送风能力范围
  2. 气流组织困难

    • 传统下送风方式(活动地板送冷风),冷风在到达远端机柜前已经变暖
    • 高密度区域的机柜"吃冷风"量大,可能"抢走"周围低密度机柜的冷风
    • 热通道温度过高(可能达到55°C+),对相邻设备和人员造成影响
  3. 温度均匀性差

    • 机柜内上下温差可能>10°C(底部冷、顶部热)
    • 同一排机柜首尾温差可能>5°C
    • 不均匀的温度分布导致局部热点

2.4.3 高密度散热解决方案

方案适用密度原理优缺点
列间空调(InRow)6~15kW/柜空调机组放置在机柜列之间,近距离送冷缩短送风距离,冷却效率高;占用机柜位
后门热交换器10~25kW/柜在机柜后门安装水冷散热器直接冷却排风,效率极高;需要水管引入机柜列
直接芯片液冷>15kW/柜冷却液直接接触CPU/GPU散热器最高效的散热方式;需要特殊服务器和管路
浸没式液冷>30kW/柜服务器完全浸泡在绝缘冷却液中散热效率最高;需要特殊机柜和维护方式

平谷项目制冷方案建议

  • 6kW/柜的密度:推荐列间空调(InRow)+ 冷热通道封闭
  • 如果部分区域密度提升到10kW+:需要考虑后门热交换器或直接液冷
  • 未来扩展到更高密度:预留液冷管路和设备空间

2.5 自然冷却的适用判断标准

**自然冷却(Free Cooling)**是指利用室外冷空气或冷水来替代(或辅助)机械制冷,从而降低制冷系统的能耗。

2.5.1 自然冷却的三种形式

形式原理适用条件节能效果
直接风侧自然冷直接引入室外冷空气进入机房室外温度<进风温度设定值高(可替代80%+制冷能耗)
间接风侧自然冷室外空气通过热交换器与室内空气换热室外温度<进风温度设定值中高(比直接方式效率略低)
水侧自然冷利用冷却塔产生的低温冷却水直接或间接为机房制冷室外湿球温度足够低中(对室外湿球温度依赖大)

2.5.2 自然冷却的适用判断

关键参数:室外温度 vs 服务器进风温度设定值

如果进风温度设定为 18°C:
  只有室外温度 < 18°C 时才能使用自然冷却
  北京地区:约11月~3月(约5个月),全年利用时间约40%

如果进风温度设定为 25°C(ASHRAE推荐范围内):
  室外温度 < 25°C 时即可使用自然冷却
  北京地区:约10月~5月(约8个月),全年利用时间约65%

如果进风温度设定为 30°C(ASHRAE A1允许范围内):
  室外温度 < 30°C 时即可使用自然冷却
  北京地区:约9月~6月(约10个月),全年利用时间约80%

关键结论:提高服务器进风温度设定值,可以大幅增加自然冷却的利用时间,显著降低PUE。

但需要注意

  • 设备厂商的保修条件是否允许在高温下运行
  • 更高的运行温度可能缩短设备寿命(虽然ASHRAE评估影响不大)
  • 国内项目必须满足GB 50174的温度要求(A级18~27°C)
  • 部分地方标准和新建绿色数据中心标准开始放宽温度要求

2.5.3 平谷项目自然冷却分析

地理位置:北京平谷区
  年平均温度:约11°C
  夏季极端高温:约38°C
  冬季极端低温:约-15°C

自然冷却时间估算(按25°C进风温度):
  1月(平均-5°C):全自然冷却
  2月(平均-2°C):全自然冷却
  3月(平均 5°C):全自然冷却
  4月(平均14°C):全自然冷却
  5月(平均20°C):全自然冷却
  6月(平均25°C):部分自然冷却
  7月(平均27°C):机械制冷为主
  8月(平均26°C):机械制冷为主
  9月(平均20°C):全自然冷却
  10月(平均13°C):全自然冷却
  11月(平均 4°C):全自然冷却
  12月(平均-3°C):全自然冷却

全年自然冷却可用时间:约9~10个月(约75%~83%)
仅7~8月需要完全依赖机械制冷

PUE影响估算:
  全机械制冷PUE:约1.4~1.5
  有效利用自然冷却PUE:约1.15~1.25(年均)
  节能效果非常显著

2.6 ASHRAE对液冷的观点

ASHRAE TC 09.09在近年的研究报告中对液冷技术给予了高度关注:

ASHRAE的核心观点

  1. 风冷的物理极限已近

    • 空气的热容量(约1.0 kJ/(kg·°C))远低于水(约4.2 kJ/(kg·°C))
    • 空气冷却在单机柜>20~25kW时效率急剧下降
    • 未来AI芯片功耗持续增长,风冷将难以为继
  2. 液冷是必然趋势

    • 直接液冷可以将CPU/GPU的散热效率提升50~100%
    • 浸没式液冷可以将整个IT设备的散热问题一次性解决
    • 液冷的PUE可以降到1.05~1.10(接近理论最优)
  3. 混合方案是过渡期的最佳选择

    • 芯片级液冷(CPU/GPU用液冷)+ 服务器级风冷(其他组件用风冷)
    • 这种方案可以在不完全改变数据中心架构的情况下解决最大的散热瓶颈
  4. 温度标准的演进

    • 随着液冷技术的发展,ASHRAE可能会更新温度包络线
    • 液冷场景下的温度参数(冷却液温度、芯片结温等)需要新的标准框架

对平谷项目的启示

  • 6kW/柜当前可以用风冷解决
  • 但应在建设时预留液冷管路的条件(如:预留冷冻水接口、预留管路空间、楼板承重考虑液冷设备重量)
  • 如果未来业务升级到更高密度的GPU集群,可以平滑过渡到液冷方案

三、记忆强化区

3.1 关键数字速记

记忆点数值助记
Cat 6A 10G距离100m"百米红线"
Cat 6 10G距离55m"只有一半多"
OM4 10G距离550m"五百五十"
OM4 100G距离150m"一百五十"
OS2 10G距离40km+"四十公里"
强弱电平行间距≥300mm"三十厘米"
铜缆弯曲半径≥4×外径"四倍外径"
视频存储天数≥90天"三个月"
ASHRAE推荐温度18~27°C"与GB50174相同"
ASHRAE A1允许上限32°C"三十二度"
防护区面积≤500m²"五百封顶"
水热容量/空气倍数4.2×"水是空气四倍"

3.2 类比记忆法

光纤分类 = 公路等级

  • OM1/OM2 = 乡村公路:能走但速度慢,已过时
  • OM3 = 国道:可以跑得比较快
  • OM4 = 高速公路:快速且距离远,推荐选择
  • OM5 = 智慧高速:支持更多车道(多波长),前瞻性选择
  • OS2 = 铁路/高铁:超长距离,不停站直达

布线拓扑 = 交通网络

  • ER = 国际机场(外部连接入口)
  • MDA = 铁路总站(全国枢纽中心)
  • HDA = 城市公交站(片区枢纽)
  • ZDA = 社区巴士站(区域汇聚点)
  • EDA = 你家(最终目的地)

自然冷却 = 开窗通风

  • 天冷时开窗就行(自然冷却)
  • 天热了必须开空调(机械制冷)
  • 问题是:你愿意把室温设到多高再开空调?
    • 保守派(18°C就开空调)= 一年大部分时间都开空调 = PUE高
    • 激进派(30°C才开空调)= 只有最热的时候开空调 = PUE低

四、2sigma诊断题

题目1(填空 - 数值记忆)

Cat 6A铜缆支持10GBASE-T的最大传输距离为______m,而Cat 6在10GBASE-T下只支持______m。OM4多模光纤支持10Gbps的最大距离为______m,支持100Gbps SR4的最大距离为______m。强弱电线缆平行布放时最小间距应为______mm。

点击查看答案
  • 100m
  • 55m
  • 550m
  • 150m
  • 300mm

题目2(填空 - 数值记忆)

ASHRAE A1类环境的推荐温度范围为______°C ~ °C,允许温度上限为°C。TIA-942布线拓扑中,Rating 3要求ER不少于______个,入楼路由不少于______条。TIA-606标签标准中,大型数据中心至少应达到______级管理等级。

点击查看答案
  • 18°C ~ 27°C
  • 32°C
  • 2个
  • 2条
  • Class 3

题目3(场景判断 - 理解层)

平谷项目的网络工程师提议:"GPU服务器之间的互联用Cat 6A铜缆就够了,100m距离支持10G没问题。"作为弱电架构师,你怎么评估这个建议?

A. 完全正确,Cat 6A支持10G@100m是事实 B. 部分正确,但需要确认GPU服务器互联的实际带宽需求——如果需要25G/40G/100G/400G互联,Cat 6A可能不够,需要使用光纤或DAC C. 完全错误,GPU集群必须全部使用光纤 D. 完全正确,而且应该用Cat 8来获得更高的速率

点击查看答案

答案:B

分析:

  • A不够全面:虽然Cat 6A确实支持10G@100m,但GPU集群的互联需求通常远超10G。AI训练中GPU之间的数据传输需要极高带宽和极低延迟(通常25G/100G/400G甚至更高)。
  • B正确:需要根据实际网络架构和GPU互联需求来选择介质。如果是RDMA/RoCEv2场景,通常使用25G/100G光纤或DAC短距铜缆。Cat 6A在管理网络和一般接入场景下是合适的,但作为GPU互联可能不够。
  • C过于绝对:并非所有连接都需要光纤,短距离(<5m)可以使用DAC铜缆。
  • D不合理:Cat 8支持25G/40G但距离限制为30m,而且Cat 8的RJ45连接器兼容性和成本都不如光纤方案。

题目4(场景判断 - 理解层)

数据中心运维团队发现机房PUE偏高(1.5),希望通过提高服务器进风温度来增加自然冷却使用时间。他们计划将进风温度从22°C提高到30°C。这个方案需要注意什么?

A. 没有任何问题,ASHRAE允许到32°C B. 需要确认三点:(1)GB 50174 A级温度上限是27°C,30°C超标;(2)设备厂商保修条件是否允许;(3)对设备寿命的潜在影响 C. 不可行,30°C会导致所有服务器宕机 D. 只需要确认设备厂商是否允许,不需要考虑国标

点击查看答案

答案:B

分析:

  • A错误:虽然ASHRAE A1允许到32°C,但国内项目必须遵守GB 50174。GB 50174 A级上限是27°C,30°C已经超标。
  • B正确:提高进风温度确实能降低PUE,但必须同时考虑:
    1. GB 50174的合规要求(A级上限27°C)
    2. 设备厂商的保修条件(超出厂商建议温度可能导致保修失效)
    3. 高温运行对设备寿命的影响(ASHRAE评估影响不大,但不等于没有影响) 如果要突破27°C,需要与业主、设计院充分沟通,可能需要降级为B级或申请特殊设计。
  • C过于绝对:30°C不会导致宕机,服务器通常在35~40°C进风温度下仍可工作。
  • D遗漏了国标要求。

题目5(开放描述 - 应用层)

请为平谷智算中心的主干布线设计一个Rating 3等级的冗余方案。要求包括:ER的数量和位置、MDA的位置和冗余方式、ER到MDA和MDA到HDA的光纤选型和路由方案。

点击查看参考答案

ER设计

  • 数量:2个(ER-A和ER-B)
  • 位置:ER-A位于园区东侧,ER-B位于园区西侧
  • 入楼路由:从不同方向引入,ER-A从东侧道路引入,ER-B从西侧道路引入
  • 运营商接入:至少接入2~3家运营商,每家运营商的光缆至少进入一个ER
  • ER-A和ER-B之间通过园区内部冗余光缆互联

MDA设计

  • 数量:1个主MDA,冗余通过内部设备双机实现(Rating 3要求)
  • 位置:位于园区核心数据中心楼的中心位置
  • 冗余方式:
    • 核心交换机2台做堆叠或双活
    • ODF配线架做A/B双路标记
    • 从2个ER各有独立的光缆路由到达MDA

ER到MDA光纤选型和路由

  • 光纤类型:OS2单模光纤(楼间距离可能>300m)
  • 芯数:每路≥48芯(考虑未来扩容)
  • 路由方案:
    • 路由A:ER-A → 东侧地下管道 → MDA
    • 路由B:ER-B → 西侧地下管道 → MDA
    • 两条路由完全物理分离,不经过同一管井或管道
    • 管道应有防水、防鼠措施

MDA到HDA光纤选型和路由

  • 光纤类型:OM4多模光纤(楼内中距离连接,<300m)
  • 芯数:每路≥24芯
  • 路由方案:
    • 每个HDA通过2条独立路由连接到MDA
    • 路由A走东侧竖向管井+水平桥架
    • 路由B走西侧竖向管井+水平桥架
    • 双路由不在同一桥架和管井
    • 穿越防火分区时做防火封堵

HDA数量和布局

  • 约35~40个HDA(按每个HDA服务约250个机柜计算)
  • 采用EoR(End of Row)方式,设置在每排机柜的端头
  • GPU集群区域可能补充ToR交换机,从HDA上联到MDA

下一章预告:M1-05 将对模块1的全部知识进行综合回顾和对标诊断,包括三套规范的综合对比练习、平谷项目完整对标检查表、常见面试考点清单以及15道综合诊断测验。