新闻中心

基础科普

技术详解：PCIe 5.0 服务器高速总线与联瑞电子Switch、Retimer解决方案

2026-05-25 基础科普PCIe 5.0,服务器高速总线,Retimer 信号中继器,AI 服务器,CXL 2.0,400G 网卡,联瑞电子浏览: 563

技术详解

PCIe 5.0技术全解析：服务器高速总线详解

导读

PCIe 5.0是当前服务器平台上最先进的高速互联总线规范，相比PCIe 4.0实现了每通道传输速率从16GT/s到32GT/s的倍增，x16插槽的双向理论带宽高达128GB/s，彻底解除了新一代AI加速卡、NVMe存储和高速网卡的带宽瓶颈。随着Intel第四/五代至强（Sapphire Rapids/Emerald Rapids）和AMD EPYC Genoa系列处理器的大规模部署，PCIe 5.0正在服务器市场加速普及。联瑞电子已推出多款原生PCIe 5.0产品，包括PCIe 5.0 Switch扩展卡LRSV9500-4I、PCIe 5.0 Retimer信号中继器LRSV9560-2E，以及原生支持PCIe 5.0的400G RDMA智能网卡LRES1260PF-2QSFP112，全面布局下一代服务器互联生态。

PCIe发展历程与版本对比

PCIe（Peripheral Component Interconnect Express，快速外设组件互连）自2003年PCIe 1.0发布以来，经历了多代技术迭代，每一代规范都将传输速率提升约一倍，同时保持向下兼容性。以下是各主要版本的关键参数对比：

规范版本	发布年份	单通道速率	x16 单向带宽	x16 双向带宽	编码方式
PCIe 3.0	2010年	8 GT/s	16 GB/s	32 GB/s	128b/130b
PCIe 4.0	2018年	16 GT/s	32 GB/s	64 GB/s	128b/130b
PCIe 5.0 ★	2019年	32 GT/s	64 GB/s	128 GB/s	128b/130b
PCIe 6.0	2022年	64 GT/s	128 GB/s	256 GB/s	PAM4 + FEC

值得注意的是，PCIe 5.0依然沿用与PCIe 3.0/4.0相同的128b/130b NRZ（非归零）编码方式，而PCIe 6.0开始引入PAM4（四电平脉冲幅度调制）编码以在相同信号频率下传递更多数据。这意味着PCIe 5.0在信号完整性方面是NRZ编码的极限挑战，而PCIe 6.0则是一次编码体系的根本变革。

▲ 搭载PCIe 5.0插槽的新一代AI服务器

PCIe 5.0核心技术特性

PCIe 5.0在将单通道速率提升至32GT/s的同时，面临了前所未有的信号完整性挑战，为此引入了多项关键技术改进：

更严格的信道损耗预算：PCIe 5.0将信道的最大插入损耗规格定义为28dB（在16GHz频率下），相比PCIe 4.0（23dB at 8GHz）有所收紧。这意味着PCIe 5.0信道对PCB走线质量、连接器质量和板卡间距的要求都大幅提高，普通FR4 PCB材料可能无法满足要求，需要采用低损耗的高速PCB材料（如Megtron 6、TU-883等）。

增强的均衡技术：PCIe 5.0规范要求发送端（Tx）支持更强的FFE（前馈均衡）系数，接收端（Rx）支持更强的DFE（判决反馈均衡）和CTLE（连续时间线性均衡），以补偿高频信号在PCB走线和连接器中的幅度衰减和相位失真。

更快速的链路训练：PCIe 5.0改进了链路训练（LTSSM）状态机，缩短了设备上电后完成链路协商所需的时间，有利于在AI服务器高密度互联场景下加快系统启动速度。

保持完整的向下兼容性：PCIe 5.0插槽可以插入PCIe 4.0/3.0设备，并以对应规范的速率运行，物理连接器与此前各代完全相同，这为用户的平滑迁移提供了保障。

PCIe 5.0为什么需要Retimer

在PCIe 5.0的32GT/s高速信号下，信号传输距离和系统设计面临严峻挑战：当PCIe 5.0信号在PCB板上传输超过一定距离（通常为3~5英寸）后，高频分量的插入损耗就会超过接收端均衡器的补偿能力，导致误码率（BER）急剧上升，链路无法可靠工作。

在以下典型场景中，PCIe 5.0信号中继是不可回避的工程需求：

扩展插槽到CPU距离较长的服务器主板：当GPU或加速卡插槽距离CPU超过10英寸时，单纯依靠PCB走线无法保证PCIe 5.0的信号质量。
PCIe 5.0 Riser卡连接：在机架式服务器中，GPU/加速卡通过Riser卡垂直安装，Riser卡上的连接器、排线/PCB走线会引入额外的插入损耗，通常需要在Riser卡上集成Retimer。
PCIe 5.0 Switch扩展：在需要将一个PCIe 5.0 Root Port扩展为多个下行端口的场景中（如一拖四或一拖八），如果Switch卡与CPU之间的物理距离较远（如通过线缆连接外部扩展柜），上行链路同样需要Retimer保障信号质量。

Retimer（信号再生器）的作用是：接收已经衰减的PCIe 5.0信号，通过片上的CDR（时钟数据恢复）电路重新同步时钟，完整重建数据后以满幅度、低抖动重新发送，相当于在信号路径中插入一个"信号接力站"，将传输链路的有效距离延伸到数倍以上，且不引入额外延迟（通常仅增加2~4 ns的确定性延迟，不影响PCIe协议时序）。

▲ PCIe 5.0 Retimer与Switch的独立应用场景（两者可独立使用，也可组合使用）

PCIe 5.0在AI服务器中的应用

AI计算服务器是PCIe 5.0最重要的落地场景。以大模型训练和推理为代表的AI工作负载，对服务器内部各组件之间的互联带宽有着极为苛刻的要求：

GPU与CPU之间的连接：训练大语言模型时，GPU需要频繁从主内存中读取权重参数，并将梯度数据写回。以A100 GPU（PCIe 4.0 x16，带宽64GB/s）为例，PCIe 4.0已接近瓶颈；而H100 SXM版本采用NVLink代替PCIe，正是因为PCIe 4.0 x16已不足以支撑HBM内存到Tensor Core之间的全速数据流。对于采用PCIe接口的H100 PCIe版本，PCIe 5.0 x16的128GB/s双向带宽可以有效缓解这一瓶颈。

NVMe SSD存储带宽：新一代企业级NVMe SSD（如Gen5 NVMe）的顺序读取速度已突破14GB/s，单盘即可将PCIe 4.0 x4（8GB/s）的通道打满。PCIe 5.0 x4的16GB/s带宽才能充分释放Gen5 NVMe的性能潜力。在AI训练数据集加载场景中，高速本地存储的读取速度直接影响GPU利用率，PCIe 5.0是消除存储带宽瓶颈的关键。

高速网卡带宽需求：400G以太网网卡（如联瑞LRES1260PF-2QSFP112）的双端口满速带宽约为400GB/s（200Gbps×2），超过了PCIe 4.0 x16（32GB/s单向）的承载能力。PCIe 5.0 x16提供的64GB/s单向带宽才能完整承载400G双端口网卡的满速数据流，确保AI集群节点间通信不受网卡到主机内存的带宽限制。

▲ 联瑞电子PCIe 5.0高速网卡及扩展产品

联瑞电子PCIe 5.0产品线

联瑞电子已完成PCIe 5.0全产品线布局，覆盖Switch扩展、信号中继和高速网卡三大核心品类：

PCIe 5.0 Switch

LRSV9500-4I

接口：PCIe 5.0 x16（上行）
下行：2×x16 / 4×x8 / 8×x4
带宽：上行128GB/s双向
特性：PCIe Gen5 非阻塞交换

适用场景：PCIe 5.0插槽扩展、AI服务器多加速卡部署

PCIe 5.0 Retimer

LRSV9560-2E

接口：PCIe 5.0 x16（信号透明直通）
功能：信号再生 / CDR时钟恢复
延迟：引入延迟 <4 ns
特性：透明直通，无需配置

适用场景：Riser卡长距离连接、主板信号完整性补偿

400G PCIe 5.0网卡

LRES1260PF-2QSFP112

接口：PCIe 5.0 x16
端口：双口 QSFP112 400GbE
特性：400G RDMA/RoCEv2/SR-IOV

适用场景：AI集群高速互联、NVMe-oF存储网络

PCIe 5.0服务器选购注意事项

在采购和部署PCIe 5.0服务器及相关扩展卡时，有以下几个关键点需要重点确认：

1. CPU平台确认：首先确认服务器CPU是否原生支持PCIe 5.0。目前支持PCIe 5.0的服务器CPU主要包括：Intel Xeon第四/五代（Sapphire Rapids/Emerald Rapids）、AMD EPYC第四代（Genoa/Bergamo）等。普通消费级PCIe 5.0主板的x16插槽配置与服务器平台存在差异，需要核实具体规格。

2. 插槽物理规格核实：PCIe 5.0设备插入PCIe 5.0插槽才能以Gen5速率运行；插入PCIe 4.0插槽则降级至PCIe 4.0（16GT/s）运行。对于400G网卡等需要x16带宽的设备，务必确认主板提供的是x16物理插槽且CPU侧有足够的PCIe 5.0 Lane配置（Intel SPR每个CPU提供80条PCIe 5.0 Lane）。

3. Retimer需求评估：对于需要通过Riser卡连接GPU/加速卡的机架式服务器，或者PCIe设备距CPU超过10英寸的情况，建议提前评估信号完整性风险，必要时引入联瑞LRSV9560-2E Retimer。信号完整性问题在PCIe 5.0下的表现通常是链路速率自动降级至PCIe 4.0甚至3.0，这种"软故障"非常隐蔽，需要特别关注。

4. 散热设计关注：PCIe 5.0 Switch芯片（如博通PLX系列）和Retimer芯片在满载工作时功耗较高（Switch芯片可达20W以上），服务器机箱的气流组织必须确保这些芯片的有效散热，避免因过热导致降频或不稳定。

PCIe 5.0 实际应用挑战与解决方案

PCIe 5.0将单通道速率推至32GT/s，在带来巨大带宽提升的同时，也给系统设计工程师带来了一系列前所未有的工程挑战。理解并妥善应对这些挑战，是顺利部署PCIe 5.0产品的前提。

信号完整性挑战（32GT/s下的极限考验）

PCIe 5.0依然采用NRZ（非归零）编码，但32GT/s的符号速率意味着信号的奈奎斯特频率高达16GHz。在如此高的频率下，PCB介质损耗（介电损耗角正切tanδ）和导体趋肤效应引起的插入损耗急剧增大，普通FR4材料（tanδ≈0.02）在16GHz处的每英寸损耗可达0.8~1.2 dB/inch，仅5英寸走线即可耗尽信道的损耗预算。为此，PCIe 5.0系统通常需要采用低损耗高速PCB层压板（如Isola Megtron 6、TU-883，tanδ≤0.005），并在布线时严格控制过孔数量、走线长度和差分对间距。Retimer芯片（如联瑞LRSV9560-2E所采用的方案）通过片上CDR重新同步时钟、完整再生信号，是解决32GT/s长距离传输问题的最可靠手段，可将有效传输距离延伸3~5倍。

PCIe 5.0 Retimer与Switch芯片的热管理

PCIe 5.0高速SerDes电路的功耗显著高于上一代：每个32GT/s SerDes通道的功耗约为130~180 mW，一个x16的Retimer芯片仅SerDes部分功耗即可达2~3W，加上数字逻辑部分，整芯片TDP可达5~8W；PCIe 5.0 Switch芯片（如联瑞LRSV9500-4I所采用的博通PEX89048）在96条32GT/s SerDes通道全速工作时，整芯片TDP可高达25~35W，远超同等端口规模的PCIe 4.0 Switch芯片。这对PCB散热设计和服务器机箱气流组织提出了严格要求：Switch芯片通常需要专用铜/铝散热片配合机箱强制对流；Retimer芯片在高密度布局时需要合理隔热，防止相邻发热元器件形成热集中区。联瑞电子LRSV9500-4I在设计时充分考虑了散热需求，板卡顶部配备大面积铝合金散热片，并通过CFD仿真验证了在1U/2U服务器标准气流条件下的工作温度裕量。

MCIO/SlimSAS线缆的长度限制

在PCIe 5.0外部线缆连接场景（如OCP Mezz卡、Riser卡、U.3/U.2 NVMe背板连接）中，通常采用MCIO（Mini Cool Edge IO）或SlimSAS（SFF-8654）连接器及对应的高速信号线缆。然而，受32GT/s信号的频率特性制约，被动铜缆（Passive Copper Cable）在PCIe 5.0下的有效传输距离通常不超过0.5~0.8米；超过此距离需要采用有源光缆（AOC）或主动铜缆（ACC），成本显著上升。在数据中心内部部署PCIe 5.0设备时，应尽量缩短线缆路径，或选择带Retimer的智能线缆方案，以保证信号链路的稳定性。MCIO连接器本身的插入损耗相比传统SFF-8643有所改善，是目前PCIe 5.0 NVMe连接的推荐方案。

联瑞LRSV9500-4I的博通PEX89048解决方案

联瑞电子LRSV9500-4I PCIe 5.0 Switch扩展卡采用博通（Broadcom）PEX89048芯片，这是业界首批量产的PCIe 5.0 Switch芯片之一。PEX89048提供48条PCIe 5.0通道（可配置为1个x16上行口 + 4个x8下行口），非阻塞交换矩阵带宽高达768 GB/s，内置硬件CRC校验和错误纠正，支持Advanced Error Reporting（AER）和SR-IOV虚拟化。基于此芯片，LRSV9500-4I在一块标准PCIe 5.0 x16全高全长扩展卡上，实现了将一个CPU PCIe 5.0 Root Port扩展为4个独立PCIe 5.0 x8下行端口（等效x16设备）的功能，极大提升了AI服务器单CPU节点可连接的高速加速卡数量。

▲ PCIe 各代单通道速率与 x16 单向带宽演进对比（每代速率翻倍，PCIe 6.0 引入PAM4编码）

PCIe 5.0 与 CXL 2.0 协同生态

PCIe 5.0不仅是一代总线规范，更为CXL（Compute Express Link）2.0协议的大规模落地奠定了物理层基础，二者共同构成了下一代AI与HPC服务器互联生态的核心支柱。

CXL 2.0以PCIe 5.0物理层为载体

CXL（Compute Express Link）是由Intel主导、PCI-SIG维护的开放互连协议，专为CPU与各类加速器、内存扩展器之间的高性能、低延迟互连而设计。CXL 2.0规范完全建立在PCIe 5.0的物理层（PHY）和链路层（DLLP/TLP）之上：CXL设备插入标准PCIe 5.0插槽即可工作，无需专用连接器；协议层面，CXL 2.0在PCIe TLP框架之上扩展了三条协议子通道——CXL.io（兼容PCIe标准配置/DMA访问）、CXL.cache（设备侧缓存一致性协议，使加速器可直接缓存CPU主内存数据）和CXL.mem（CPU侧直接访问设备本地内存，如扩展DRAM或HBM），实现了CPU与加速器之间的缓存一致性内存共享，从根本上消除了传统PCIe架构中CPU访问GPU显存必须经过DMA拷贝的性能损耗。

内存池化（Memory Pooling）在AI/HPC服务器中的应用

CXL 2.0最重要的新特性是支持内存池化（Memory Pooling）和内存交换（Memory Sharing）：多个主机CPU可通过CXL 2.0 Switch共享访问一个大容量内存池（如256GB~4TB CXL DDR5内存扩展模组），突破了单CPU物理DIMM插槽数量对可寻址内存容量的限制。这对于AI推理服务器（大模型推理需要将数百GB的模型权重加载到内存）和HPC应用（基因组学、气象仿真、分子动力学等需要TB级内存）场景意义重大。通过CXL 2.0内存池化架构，原本需要部署多台服务器才能容纳的大模型推理任务，可以在一个CXL内存域内完成，大幅降低服务器节点数量和TCO（总拥有成本）。

CXL 延迟特性与应用场景匹配

CXL 2.0的内存访问延迟相比本地DIMM有一定增加（通常在100~250 ns额外延迟，具体取决于CXL交换层数和内存控制器延迟），这使其更适合对带宽敏感但对延迟要求不极端的工作负载，如AI推理的KV Cache存储、流式数据处理和内存密集型数据分析，而非对亚100ns延迟高度敏感的实时事务处理。理解这一特性，有助于在实际部署中合理规划哪些数据放置在本地DIMM（延迟敏感的"热"数据），哪些数据使用CXL扩展内存（访问频率较低的"温"数据）。

联瑞电子CXL内存扩展方案

联瑞电子顺应CXL生态发展趋势，已规划并推出基于CXL 2.0协议的内存扩展卡产品系列。该系列产品采用标准PCIe 5.0 x8/x16插槽接入，向主机CPU呈现为CXL Type 3内存设备（CXL.mem协议），可为AI推理服务器提供高达512GB的DDR5扩展内存空间，彻底解决大参数量LLM（如百亿~千亿参数模型）在推理部署时的内存容量瓶颈。结合联瑞PCIe 5.0 Switch（LRSV9500-4I）可进一步构建多主机共享CXL内存池架构，为数据中心级AI推理集群提供灵活可扩展的内存资源调度能力。如需了解联瑞CXL内存扩展卡的详细规格和部署方案，欢迎联系联瑞技术团队获取最新产品资料。

CXL 2.0 + PCIe 5.0 协同架构要点速览

物理层完全复用：CXL 2.0设备插入标准PCIe 5.0插槽，无需专用连接器，主板无需改动。
缓存一致性：CXL.cache协议使加速器可以直接缓存CPU的主内存数据，消除DMA拷贝开销。
内存语义访问：CXL.mem协议使CPU可以Load/Store指令直接访问设备侧内存，访问延迟远低于PCIe DMA。
内存池化扩展：CXL 2.0 Switch支持多主机共享一个大容量内存池，单池容量可达TB级。
PCIe 5.0是前提：CXL 2.0 x16带宽高达64GB/s（单向），必须依托PCIe 5.0物理层才能充分发挥。

常见问题FAQ

Q：PCIe 5.0 x16的双向128GB/s是理论值，实际带宽能达到多少？

A：PCIe 5.0采用128b/130b编码，编码效率约98.5%，实际有效带宽约为理论值的98.5%。x16的单向有效带宽约63GB/s，双向约126GB/s。考虑到PCIe协议头开销（TLP头部约16字节），实际可用的净数据带宽约为120~124GB/s，与标称的128GB/s非常接近。

Q：现有PCIe 4.0服务器能否使用PCIe 5.0网卡？

A：可以，但会降速运行。PCIe 5.0设备插入PCIe 4.0插槽后，链路会协商至PCIe 4.0速率（16GT/s），x16带宽为64GB/s双向。对于100G网卡而言，PCIe 4.0 x16已完全够用；对于400G网卡，在PCIe 4.0下将存在带宽不足的情况，建议升级到PCIe 5.0平台以充分发挥400G网卡的性能。

Q：什么时候需要购买PCIe 5.0 Switch，什么时候购买Retimer？

A：两者功能完全不同。PCIe 5.0 Switch（LRSV9500-4I）用于"端口扩展"：将一个CPU的PCIe 5.0 x16接口扩展为多个独立的下行端口，让多块加速卡可以共享一个CPU PCIe通道，典型场景包括AI多GPU扩展、全闪存存储阵列、GPU资源池化和批量测试平台。PCIe 5.0 Retimer（LRSV9560-2E）用于"信号中继"：不增加端口数量，仅用于解决长距离信号衰减问题、恢复信号质量，典型场景包括Riser卡连接、外部扩展柜、背板长距离走线和HPC机柜间互联。复杂场景中两者可组合使用，例如先通过Switch扩展端口再经Retimer补偿长距离信号损耗。联瑞官网提供了大模型训练集群、推理平台、HPC计算中心等典型应用案例可供参考。

Q：PCIe 6.0已经发布，还有必要选购PCIe 5.0设备吗？

A：非常有必要。PCIe 6.0规范虽已发布，但支持PCIe 6.0的CPU（预计Intel下一代Xeon）和终端设备（GPU、NVMe）还没大规模量产，距离普及还有相当长的时间。当前2024~2026年采购的新服务器绝大多数搭载PCIe 5.0平台，PCIe 5.0设备在这些平台上可以发挥全部性能，投资回报期至少3~5年。

需要专业选型建议？

联瑞电子技术团队提供一对一选型咨询，助您找到最优方案

立即咨询 →

上一篇技术详解：什么是 SR-IOV？服务器网络虚拟化与高性能网卡应用指南

下一篇 NVMe-oF 技术与联瑞 RDMA 网卡实践指南