欢迎光临深圳市联瑞电子有限公司官网!
全国服务热线 : 4000-588-108 | 网站地图 | English 京东店铺 淘宝店铺1688店铺天猫店铺 关注LR-LINK官方微博
LR-LINK联瑞电子官网
[返回上一页]您现在的位置:首页 > 新闻中心 > 基础科普
基础科普

技术详解:PCIe 5.0 服务器高速总线与联瑞电子Switch、Retimer解决方案

2026-05-25 基础科普PCIe 5.0,服务器高速总线,Retimer 信号中继器,AI 服务器,CXL 2.0,400G 网卡,联瑞电子 浏览: 157
PCIe 5.0技术全解析:下一代服务器高速总线详解
技术详解

PCIe 5.0技术全解析:服务器高速总线详解

导读

PCIe 5.0是当前服务器平台上最先进的高速互联总线规范,相比PCIe 4.0实现了每通道传输速率从16GT/s到32GT/s的倍增,x16插槽的双向理论带宽高达128GB/s,彻底解除了新一代AI加速卡、NVMe存储和高速网卡的带宽瓶颈。随着Intel第四/五代至强(Sapphire Rapids/Emerald Rapids)和AMD EPYC Genoa系列处理器的大规模部署,PCIe 5.0正在服务器市场加速普及。联瑞电子已推出多款原生PCIe 5.0产品,包括PCIe 5.0 Switch扩展卡LRSV9500-4I、PCIe 5.0 Retimer信号中继器LRSV9560-2E,以及原生支持PCIe 5.0的400G RDMA智能网卡LRES1260PF-2QSFP112,全面布局下一代服务器互联生态。

PCIe发展历程与版本对比

PCIe(Peripheral Component Interconnect Express,快速外设组件互连)自2003年PCIe 1.0发布以来,经历了多代技术迭代,每一代规范都将传输速率提升约一倍,同时保持向下兼容性。以下是各主要版本的关键参数对比:

规范版本 发布年份 单通道速率 x16 单向带宽 x16 双向带宽 编码方式
PCIe 3.0 2010年 8 GT/s 16 GB/s 32 GB/s 128b/130b
PCIe 4.0 2017年 16 GT/s 32 GB/s 64 GB/s 128b/130b
PCIe 5.0 ★ 2019年 32 GT/s 64 GB/s 128 GB/s 128b/130b
PCIe 6.0 2022年 64 GT/s 128 GB/s 256 GB/s PAM4 + FEC

值得注意的是,PCIe 5.0依然沿用与PCIe 3.0/4.0相同的128b/130b NRZ(非归零)编码方式,而PCIe 6.0开始引入PAM4(四电平脉冲幅度调制)编码以在相同信号频率下传递更多数据。这意味着PCIe 5.0在信号完整性方面是NRZ编码的极限挑战,而PCIe 6.0则是一次编码体系的根本变革。

PCIe 5.0 AI服务器内部
▲ 搭载PCIe 5.0插槽的新一代AI服务器

PCIe 5.0核心技术特性

PCIe 5.0在将单通道速率提升至32GT/s的同时,面临了前所未有的信号完整性挑战,为此引入了多项关键技术改进:

更严格的信道损耗预算:PCIe 5.0将信道的最大插入损耗规格定义为28dB(在16GHz频率下),相比PCIe 4.0(23dB at 8GHz)有所收紧。这意味着PCIe 5.0信道对PCB走线质量、连接器质量和板卡间距的要求都大幅提高,普通FR4 PCB材料可能无法满足要求,需要采用低损耗的高速PCB材料(如Megtron 6、TU-883等)。

增强的均衡技术:PCIe 5.0规范要求发送端(Tx)支持更强的FFE(前馈均衡)系数,接收端(Rx)支持更强的DFE(判决反馈均衡)和CTLE(连续时间线性均衡),以补偿高频信号在PCB走线和连接器中的幅度衰减和相位失真。

更快速的链路训练:PCIe 5.0改进了链路训练(LTSSM)状态机,缩短了设备上电后完成链路协商所需的时间,有利于在AI服务器高密度互联场景下加快系统启动速度。

保持完整的向下兼容性:PCIe 5.0插槽可以插入PCIe 4.0/3.0设备,并以对应规范的速率运行,物理连接器与此前各代完全相同,这为用户的平滑迁移提供了保障。

PCIe 5.0为什么需要Retimer

在PCIe 5.0的32GT/s高速信号下,信号传输距离和系统设计面临严峻挑战:当PCIe 5.0信号在PCB板上传输超过一定距离(通常为3~5英寸)后,高频分量的插入损耗就会超过接收端均衡器的补偿能力,导致误码率(BER)急剧上升,链路无法可靠工作。

在以下典型场景中,PCIe 5.0信号中继是不可回避的工程需求:

  • 扩展插槽到CPU距离较长的服务器主板:当GPU或加速卡插槽距离CPU超过10英寸时,单纯依靠PCB走线无法保证PCIe 5.0的信号质量。
  • PCIe 5.0 Riser卡连接:在机架式服务器中,GPU/加速卡通过Riser卡垂直安装,Riser卡上的连接器、排线/PCB走线会引入额外的插入损耗,通常需要在Riser卡上集成Retimer。
  • PCIe 5.0 Switch扩展:在需要将一个PCIe 5.0 Root Port扩展为多个下行端口的场景中(如一拖四或一拖八),如果Switch卡与CPU之间的物理距离较远(如通过线缆连接外部扩展柜),上行链路同样需要Retimer保障信号质量。

Retimer(信号再生器)的作用是:接收已经衰减的PCIe 5.0信号,通过片上的CDR(时钟数据恢复)电路重新同步时钟,完整重建数据后以满幅度、低抖动重新发送,相当于在信号路径中插入一个"信号接力站",将传输链路的有效距离延伸到数倍以上,且不引入额外延迟(通常仅增加2~4 ns的确定性延迟,不影响PCIe协议时序)。

PCIe 5.0 Retimer 与 Switch 应用场景 场景1:Retimer延长信号距离 CPU PCIe 5.0 信号衰减 Retimer 信号再生 信号重建 GPU/加速卡 PCIe 5.0 Retimer独立应用:延长信号传输距离 当PCB走线/线缆过长时,Retimer重建信号,不改变拓扑 场景2:Switch扩展端口 CPU PCIe 5.0 直连 PCIe Switch 1:4 扩展 400G NIC GPU Switch独立应用:扩展端口数量 当需要更多PCIe设备时,Switch提供端口扩展,无需Retimer
▲ PCIe 5.0 Retimer与Switch的独立应用场景(两者可独立使用,也可组合使用)

PCIe 5.0在AI服务器中的应用

AI计算服务器是PCIe 5.0最重要的落地场景。以大模型训练和推理为代表的AI工作负载,对服务器内部各组件之间的互联带宽有着极为苛刻的要求:

GPU与CPU之间的连接:训练大语言模型时,GPU需要频繁从主内存中读取权重参数,并将梯度数据写回。以A100 GPU(PCIe 4.0 x16,带宽64GB/s)为例,PCIe 4.0已接近瓶颈;而H100 SXM版本采用NVLink代替PCIe,正是因为PCIe 4.0 x16已不足以支撑HBM内存到Tensor Core之间的全速数据流。对于采用PCIe接口的H100 PCIe版本,PCIe 5.0 x16的128GB/s双向带宽可以有效缓解这一瓶颈。

NVMe SSD存储带宽:新一代企业级NVMe SSD(如Gen5 NVMe)的顺序读取速度已突破14GB/s,单盘即可将PCIe 4.0 x4(8GB/s)的通道打满。PCIe 5.0 x4的16GB/s带宽才能充分释放Gen5 NVMe的性能潜力。在AI训练数据集加载场景中,高速本地存储的读取速度直接影响GPU利用率,PCIe 5.0是消除存储带宽瓶颈的关键。

高速网卡带宽需求:400G以太网网卡(如联瑞LRES1260PF-2QSFP112)的双端口满速带宽约为400GB/s(200Gbps×2),超过了PCIe 4.0 x16(32GB/s单向)的承载能力。PCIe 5.0 x16提供的64GB/s单向带宽才能完整承载400G双端口网卡的满速数据流,确保AI集群节点间通信不受网卡到主机内存的带宽限制。

PCIe 5.0网卡硬件
▲ 联瑞电子PCIe 5.0高速网卡及扩展产品

联瑞电子PCIe 5.0产品线

联瑞电子已完成PCIe 5.0全产品线布局,覆盖Switch扩展、信号中继和高速网卡三大核心品类:

PCIe 5.0 Switch

LRSV9500-4I

  • 接口:PCIe 5.0 x16(上行)
  • 下行:2×x16 / 4×x8 / 8×x4
  • 带宽:上行128GB/s双向
  • 特性:PCIe Gen5 非阻塞交换
适用场景:PCIe 5.0插槽扩展、AI服务器多加速卡部署
PCIe 5.0 Retimer

LRSV9560-2E

  • 接口:PCIe 5.0 x16(信号透明直通)
  • 功能:信号再生 / CDR时钟恢复
  • 延迟:引入延迟 <4 ns
  • 特性:透明直通,无需配置
适用场景:Riser卡长距离连接、主板信号完整性补偿
400G PCIe 5.0网卡

LRES1260PF-2QSFP112

  • 接口:PCIe 5.0 x16
  • 端口:双口 QSFP112 400GbE
  • 特性:400G RDMA/RoCEv2/SR-IOV
适用场景:AI集群高速互联、NVMe-oF存储网络

PCIe 5.0服务器选购注意事项

在采购和部署PCIe 5.0服务器及相关扩展卡时,有以下几个关键点需要重点确认:

1. CPU平台确认:首先确认服务器CPU是否原生支持PCIe 5.0。目前支持PCIe 5.0的服务器CPU主要包括:Intel Xeon第四/五代(Sapphire Rapids/Emerald Rapids)、AMD EPYC第四代(Genoa/Bergamo)等。普通消费级PCIe 5.0主板的x16插槽配置与服务器平台存在差异,需要核实具体规格。

2. 插槽物理规格核实:PCIe 5.0设备插入PCIe 5.0插槽才能以Gen5速率运行;插入PCIe 4.0插槽则降级至PCIe 4.0(16GT/s)运行。对于400G网卡等需要x16带宽的设备,务必确认主板提供的是x16物理插槽且CPU侧有足够的PCIe 5.0 Lane配置(Intel SPR每个CPU提供80条PCIe 5.0 Lane)。

3. Retimer需求评估:对于需要通过Riser卡连接GPU/加速卡的机架式服务器,或者PCIe设备距CPU超过10英寸的情况,建议提前评估信号完整性风险,必要时引入联瑞LRSV9560-2E Retimer。信号完整性问题在PCIe 5.0下的表现通常是链路速率自动降级至PCIe 4.0甚至3.0,这种"软故障"非常隐蔽,需要特别关注。

4. 散热设计关注:PCIe 5.0 Switch芯片(如博通PLX系列)和Retimer芯片在满载工作时功耗较高(Switch芯片可达20W以上),服务器机箱的气流组织必须确保这些芯片的有效散热,避免因过热导致降频或不稳定。

PCIe 5.0 实际应用挑战与解决方案

PCIe 5.0将单通道速率推至32GT/s,在带来巨大带宽提升的同时,也给系统设计工程师带来了一系列前所未有的工程挑战。理解并妥善应对这些挑战,是顺利部署PCIe 5.0产品的前提。

信号完整性挑战(32GT/s下的极限考验)

PCIe 5.0依然采用NRZ(非归零)编码,但32GT/s的符号速率意味着信号的奈奎斯特频率高达16GHz。在如此高的频率下,PCB介质损耗(介电损耗角正切tanδ)和导体趋肤效应引起的插入损耗急剧增大,普通FR4材料(tanδ≈0.02)在16GHz处的每英寸损耗可达0.8~1.2 dB/inch,仅5英寸走线即可耗尽信道的损耗预算。为此,PCIe 5.0系统通常需要采用低损耗高速PCB层压板(如Isola Megtron 6、TU-883,tanδ≤0.005),并在布线时严格控制过孔数量、走线长度和差分对间距。Retimer芯片(如联瑞LRSV9560-2E所采用的方案)通过片上CDR重新同步时钟、完整再生信号,是解决32GT/s长距离传输问题的最可靠手段,可将有效传输距离延伸3~5倍。

PCIe 5.0 Retimer与Switch芯片的热管理

PCIe 5.0高速SerDes电路的功耗显著高于上一代:每个32GT/s SerDes通道的功耗约为130~180 mW,一个x16的Retimer芯片仅SerDes部分功耗即可达2~3W,加上数字逻辑部分,整芯片TDP可达5~8W;PCIe 5.0 Switch芯片(如联瑞LRSV9500-4I所采用的博通PEX89048)在96条32GT/s SerDes通道全速工作时,整芯片TDP可高达25~35W,远超同等端口规模的PCIe 4.0 Switch芯片。这对PCB散热设计和服务器机箱气流组织提出了严格要求:Switch芯片通常需要专用铜/铝散热片配合机箱强制对流;Retimer芯片在高密度布局时需要合理隔热,防止相邻发热元器件形成热集中区。联瑞电子LRSV9500-4I在设计时充分考虑了散热需求,板卡顶部配备大面积铝合金散热片,并通过CFD仿真验证了在1U/2U服务器标准气流条件下的工作温度裕量。

MCIO/SlimSAS线缆的长度限制

在PCIe 5.0外部线缆连接场景(如OCP Mezz卡、Riser卡、U.3/U.2 NVMe背板连接)中,通常采用MCIO(Mini Cool Edge IO)或SlimSAS(SFF-8654)连接器及对应的高速信号线缆。然而,受32GT/s信号的频率特性制约,被动铜缆(Passive Copper Cable)在PCIe 5.0下的有效传输距离通常不超过0.5~0.8米;超过此距离需要采用有源光缆(AOC)或主动铜缆(ACC),成本显著上升。在数据中心内部部署PCIe 5.0设备时,应尽量缩短线缆路径,或选择带Retimer的智能线缆方案,以保证信号链路的稳定性。MCIO连接器本身的插入损耗相比传统SFF-8643有所改善,是目前PCIe 5.0 NVMe连接的推荐方案。

联瑞LRSV9500-4I的博通PEX89048解决方案

联瑞电子LRSV9500-4I PCIe 5.0 Switch扩展卡采用博通(Broadcom)PEX89048芯片,这是业界首批量产的PCIe 5.0 Switch芯片之一。PEX89048提供48条PCIe 5.0通道(可配置为1个x16上行口 + 4个x8下行口),非阻塞交换矩阵带宽高达768 GB/s,内置硬件CRC校验和错误纠正,支持Advanced Error Reporting(AER)和SR-IOV虚拟化。基于此芯片,LRSV9500-4I在一块标准PCIe 5.0 x16全高全长扩展卡上,实现了将一个CPU PCIe 5.0 Root Port扩展为4个独立PCIe 5.0 x8下行端口(等效x16设备)的功能,极大提升了AI服务器单CPU节点可连接的高速加速卡数量。

PCIe 各代单通道速率与 x16 带宽演进 0 16 32 48 64 单通道速率 (GT/s) 8 GT/s PCIe 3.0 2010年 · NRZ x16单向: 16 GB/s 16 GT/s PCIe 4.0 2017年 · NRZ x16单向: 32 GB/s 32 GT/s ★ PCIe 5.0 2019年 · NRZ x16单向: 64 GB/s 64 GT/s PCIe 6.0 2022年 · PAM4+FEC x16单向: 128 GB/s ×2 ×2 ×2(PAM4)
▲ PCIe 各代单通道速率与 x16 单向带宽演进对比(每代速率翻倍,PCIe 6.0 引入PAM4编码)

PCIe 5.0 与 CXL 2.0 协同生态

PCIe 5.0不仅是一代总线规范,更为CXL(Compute Express Link)2.0协议的大规模落地奠定了物理层基础,二者共同构成了下一代AI与HPC服务器互联生态的核心支柱。

CXL 2.0以PCIe 5.0物理层为载体

CXL(Compute Express Link)是由Intel主导、PCI-SIG维护的开放互连协议,专为CPU与各类加速器、内存扩展器之间的高性能、低延迟互连而设计。CXL 2.0规范完全建立在PCIe 5.0的物理层(PHY)和链路层(DLLP/TLP)之上:CXL设备插入标准PCIe 5.0插槽即可工作,无需专用连接器;协议层面,CXL 2.0在PCIe TLP框架之上扩展了三条协议子通道——CXL.io(兼容PCIe标准配置/DMA访问)、CXL.cache(设备侧缓存一致性协议,使加速器可直接缓存CPU主内存数据)和CXL.mem(CPU侧直接访问设备本地内存,如扩展DRAM或HBM),实现了CPU与加速器之间的缓存一致性内存共享,从根本上消除了传统PCIe架构中CPU访问GPU显存必须经过DMA拷贝的性能损耗。

内存池化(Memory Pooling)在AI/HPC服务器中的应用

CXL 2.0最重要的新特性是支持内存池化(Memory Pooling)和内存交换(Memory Sharing):多个主机CPU可通过CXL 2.0 Switch共享访问一个大容量内存池(如256GB~4TB CXL DDR5内存扩展模组),突破了单CPU物理DIMM插槽数量对可寻址内存容量的限制。这对于AI推理服务器(大模型推理需要将数百GB的模型权重加载到内存)和HPC应用(基因组学、气象仿真、分子动力学等需要TB级内存)场景意义重大。通过CXL 2.0内存池化架构,原本需要部署多台服务器才能容纳的大模型推理任务,可以在一个CXL内存域内完成,大幅降低服务器节点数量和TCO(总拥有成本)。

CXL 延迟特性与应用场景匹配

CXL 2.0的内存访问延迟相比本地DIMM有一定增加(通常在100~250 ns额外延迟,具体取决于CXL交换层数和内存控制器延迟),这使其更适合对带宽敏感但对延迟要求不极端的工作负载,如AI推理的KV Cache存储、流式数据处理和内存密集型数据分析,而非对亚100ns延迟高度敏感的实时事务处理。理解这一特性,有助于在实际部署中合理规划哪些数据放置在本地DIMM(延迟敏感的"热"数据),哪些数据使用CXL扩展内存(访问频率较低的"温"数据)。

联瑞电子CXL内存扩展方案

联瑞电子顺应CXL生态发展趋势,已规划并推出基于CXL 2.0协议的内存扩展卡产品系列。该系列产品采用标准PCIe 5.0 x8/x16插槽接入,向主机CPU呈现为CXL Type 3内存设备(CXL.mem协议),可为AI推理服务器提供高达512GB的DDR5扩展内存空间,彻底解决大参数量LLM(如百亿~千亿参数模型)在推理部署时的内存容量瓶颈。结合联瑞PCIe 5.0 Switch(LRSV9500-4I)可进一步构建多主机共享CXL内存池架构,为数据中心级AI推理集群提供灵活可扩展的内存资源调度能力。如需了解联瑞CXL内存扩展卡的详细规格和部署方案,欢迎联系联瑞技术团队获取最新产品资料。

CXL 2.0 + PCIe 5.0 协同架构要点速览
  • 物理层完全复用:CXL 2.0设备插入标准PCIe 5.0插槽,无需专用连接器,主板无需改动。
  • 缓存一致性:CXL.cache协议使加速器可以直接缓存CPU的主内存数据,消除DMA拷贝开销。
  • 内存语义访问:CXL.mem协议使CPU可以Load/Store指令直接访问设备侧内存,访问延迟远低于PCIe DMA。
  • 内存池化扩展:CXL 2.0 Switch支持多主机共享一个大容量内存池,单池容量可达TB级。
  • PCIe 5.0是前提:CXL 2.0 x16带宽高达64GB/s(单向),必须依托PCIe 5.0物理层才能充分发挥。

常见问题FAQ

Q:PCIe 5.0 x16的双向128GB/s是理论值,实际带宽能达到多少?
A:PCIe 5.0采用128b/130b编码,编码效率约98.5%,实际有效带宽约为理论值的98.5%。x16的单向有效带宽约63GB/s,双向约126GB/s。考虑到PCIe协议头开销(TLP头部约16字节),实际可用的净数据带宽约为120~124GB/s,与标称的128GB/s非常接近。
Q:现有PCIe 4.0服务器能否使用PCIe 5.0网卡?
A:可以,但会降速运行。PCIe 5.0设备插入PCIe 4.0插槽后,链路会协商至PCIe 4.0速率(16GT/s),x16带宽为64GB/s双向。对于100G网卡而言,PCIe 4.0 x16已完全够用;对于400G网卡,在PCIe 4.0下将存在带宽不足的情况,建议升级到PCIe 5.0平台以充分发挥400G网卡的性能。
Q:什么时候需要购买PCIe 5.0 Switch,什么时候购买Retimer?
A:两者功能完全不同。PCIe 5.0 Switch(LRSV9500-4I)用于"端口扩展":将一个CPU的PCIe 5.0 x16接口扩展为多个独立的下行端口,让多块加速卡可以共享一个CPU PCIe通道,典型场景包括AI多GPU扩展、全闪存存储阵列、GPU资源池化和批量测试平台。PCIe 5.0 Retimer(LRSV9560-2E)用于"信号中继":不增加端口数量,仅用于解决长距离信号衰减问题、恢复信号质量,典型场景包括Riser卡连接、外部扩展柜、背板长距离走线和HPC机柜间互联。复杂场景中两者可组合使用,例如先通过Switch扩展端口再经Retimer补偿长距离信号损耗。联瑞官网提供了大模型训练集群、推理平台、HPC计算中心等典型应用案例可供参考。
Q:PCIe 6.0已经发布,还有必要选购PCIe 5.0设备吗?
A:非常有必要。PCIe 6.0规范虽已发布,但支持PCIe 6.0的CPU(预计Intel下一代Xeon)和终端设备(GPU、NVMe)还没大规模量产,距离普及还有相当长的时间。当前2024~2026年采购的新服务器绝大多数搭载PCIe 5.0平台,PCIe 5.0设备在这些平台上可以发挥全部性能,投资回报期至少3~5年。
需要专业选型建议?
联瑞电子技术团队提供一对一选型咨询,助您找到最优方案
立即咨询 →
粤ICP备18078389号      Copyright © All Rights Reserved. 深圳市联瑞电子有限公司 版权所有
网安备案标识

粤公网安备 44030602003563号

产品咨询
关注官方微信
技术支持
关注官方微信
客服电话服务电话

服务热线:
4000-588-108