云计算平台的网络层承载所有虚拟机(VM)和容器(Pod)的南北向与东西向流量,是整个云平台性能的核心瓶颈所在。从裸机直接部署,到基于OpenStack的虚拟机云,再到以Kubernetes为核心的容器云,每一代云平台架构对网络的需求都在持续进化:带宽更大、延迟更低、虚拟化开销更小。联瑞电子(LR-LINK)针对OpenStack和Kubernetes两大主流云平台,提供从接入层到核心层的完整高性能网络方案,通过SR-IOV、DPDK、RDMA等技术消除网络虚拟化层带来的性能损耗。
云计算基础设施经历了多代技术演进,每一代架构对网络的需求都有显著变化:
第一代:裸机(Bare Metal)部署
应用直接运行在物理服务器上,网卡驱动和操作系统直接通信,性能最优但资源利用率低,通常不超过15%。这一阶段千兆网卡已能满足大多数应用的带宽需求。
第二代:虚拟机云(OpenStack IaaS)
通过Hypervisor(KVM/VMware)将物理服务器划分为多个虚拟机,资源利用率提升至60%~70%。然而,虚拟机的网络流量需经过虚拟交换机(OVS)转发,OVS的内核态处理引入了额外的CPU开销和延迟。随着每台物理服务器承载的虚拟机数量增多,网络层成为CPU利用率最高的模块之一,严重影响业务VM的可用计算资源。这一阶段催生了OVS-DPDK(将OVS数据面移至用户态)和SR-IOV(绕过OVS直接将VF分配给VM)两种加速技术需求。
第三代:容器云(Kubernetes)
容器以更轻量的形态替代虚拟机,每台物理节点可运行数十至数百个Pod,东西向流量密度进一步提升。CNI(容器网络接口)插件(Calico、Cilium、Flannel)负责容器网络的IP分配和路由,但软件CNI在大规模容器密度下仍存在性能瓶颈。SR-IOV CNI(使用网卡的VF直接作为容器网络接口)和基于eBPF的Cilium成为Kubernetes网络加速的两大技术路线。
第四代:混合云 / 云原生
虚拟机与容器混合部署,公有云与私有云互联,对网络提出了更高要求:东西向流量需支持微分段安全策略,南北向流量需支持大带宽VPC互联,存储网络需支持NVMe-oF高速访问。这一阶段25G/100G网卡成为主流,RDMA用于存储和AI推理工作负载,高性能网卡成为云平台竞争力的重要组成部分。
OpenStack Neutron是最常用的云网络服务组件,其默认实现基于Linux内核OVS,在高密度虚拟机场景下存在明显性能瓶颈。联瑞电子针对OpenStack平台提供两种加速路径:
路径一:OVS-DPDK加速
将OVS数据面从内核态迁移至DPDK用户态,通过轮询模式(PMD)替代中断模式处理网络包,避免内核态/用户态切换开销。OVS-DPDK需要网卡提供完整的DPDK PMD驱动支持,包括RSS多队列、大页内存DMA和流量分类(Flow Director/rte_flow)能力。典型场景下OVS-DPDK可将VM间转发吞吐从OVS内核态的1~2Mpps提升至14~20Mpps,CPU开销降低约60%。联瑞电子LRES1001PF-2SFP28(XXV710)和LRES1014PF-2QSFP28(E810)均提供经过优化的DPDK PMD驱动,支持OVS-DPDK 2.13及以上版本。
路径二:SR-IOV绕过OVS
SR-IOV(Single Root I/O Virtualization)技术允许网卡在硬件层面将单个物理功能(PF)虚拟化为多个虚拟功能(VF),每个VF可直接映射给一个VM使用,VM的网络流量完全绕过hypervisor和OVS软件层,实现接近裸机的网络性能。OpenStack中通过neutron-sriov-agent实现SR-IOV VF的生命周期管理和带宽配额。SR-IOV的主要限制是VM迁移(Live Migration)需要特殊处理,因为VF绑定了物理端口。对于对性能要求极高且迁移频率低的工作负载(数据库、存储节点),SR-IOV是最佳选择。
Kubernetes的网络模型要求每个Pod都有唯一的IP地址,Pod之间无需NAT即可通信。CNI(Container Network Interface)插件负责实现这一模型,不同CNI在性能、功能和运维复杂度上各有侧重:
SR-IOV在Kubernetes中的应用:通过SR-IOV Device Plugin和Multus CNI(多网卡CNI),可以为Pod同时提供普通CNI接口(用于集群管理通信)和SR-IOV VF接口(用于高性能业务流量)。例如,在AI推理的Kubernetes部署中,Worker Pod使用SR-IOV VF作为RDMA数据面网络,同时保留Calico/Cilium管理网络进行健康检查和调度协调。联瑞电子LRES1001PF-2SFP28支持最多64个VF,单个节点可为多个AI推理容器提供独立的25G SR-IOV网络通道。
在云平台中,以下几项核心技术对网络性能提升有显著效果,且都需要网卡硬件的配合:
DPDK(Data Plane Development Kit)
DPDK通过用户态PMD(Poll Mode Driver)绕过Linux内核网络栈,实现每秒数千万包(Mpps)的处理能力。在OVS-DPDK、VPP(Vector Packet Processing)和DPDK-based NFV等场景中,网卡需提供完整的DPDK PMD驱动支持。联瑞电子基于Intel芯片的网卡均提供经过优化的DPDK PMD驱动(如i40e适用于XXV710系列,ice适用于E810系列),并定期跟进DPDK LTS版本更新。
SR-IOV(Single Root I/O Virtualization)
SR-IOV允许单块物理网卡(PF)虚拟出多个VF,每个VF可以直接映射给VM或容器使用,完全绕过软件虚拟交换层。联瑞电子基于Intel XXV710的网卡支持最多64个VF,基于Intel E810的网卡支持最多256个VF,满足高密度虚拟化环境的需求。
RSS(Receive Side Scaling)与Flow Director
RSS将入站流量按5元组哈希分散到多个接收队列,利用多核CPU并行处理,避免单核成为瓶颈。Flow Director(i40e/ice驱动支持)可实现基于流的精确分流,将特定流量定向到指定队列,用于服务质量(QoS)和流量隔离。
XDP(eXpress Data Path)
XDP在驱动层(甚至NIC硬件,称为HW XDP offload)执行eBPF程序,在数据包进入Linux内核协议栈之前完成处理,延迟比标准内核路径低50%~70%。Cilium基于XDP实现的kube-proxy替代和服务负载均衡,在高请求频率场景下可将每节点处理能力提升3~5倍。联瑞电子LRES1001PF-2SFP28(XXV710)和LRES1014PF-2QSFP28(E810)均支持XDP Native模式(AF_XDP),E810支持硬件XDP offload。
联瑞电子针对云平台的三个网络层次(接入层、核心层、管理层),分别提供最优的产品选型:
越来越多的企业采用混合云架构,将核心业务保留在私有云,同时利用公有云的弹性扩展应对峰值需求。混合云部署对网络有以下特殊要求: