
Spark 支持的以太网全协议栈分层梳理区分原生默认 / 高速 RDMA 扩展Spark本身不绑定任何以太网标准它工作在 TCP/IP 应用层所有底层以太网、二层、RDMA 协议由操作系统 / 网卡 / UCX 库承载只要硬件内核支持Spark 全部透明兼容。一、二层标准以太网数据链路层 L2全部原生支持1. 基础以太网帧标准IEEE 802.3 基础以太网所有速率1G/10G/25G/100G/200G/400GbEIEEE 802.3acVLAN 标签扩展帧1522 字节802.1Q集群 VLAN 隔离必用IEEE 802.3ae(10G) / 802.3bm(100G NRZ) / 802.3cd(200G PAM4) / 802.3ck(400G)100G/200G/400G 高速以太网DGX/AI Spark 集群主流PAM4/NRZ 调制 Spark 无感知巨帧 Jumbo FrameMTU 9000标准 802.3 扩展Spark Shuffle 强烈推荐开启2. 二层辅助协议集群网络必备802.1Q VLAN802.3ac 配套LLDP 802.1AB 链路发现STP/RSTP/MSTP 二层防环路PFC 802.1Qbb无损以太网RoCEv2 强制依赖ECN 802.1Qaz 拥塞标记RoCEv2 流控ARP/NDIP↔MAC 地址解析二、三层网络层IPSpark 默认通信底座Spark 所有 RPC、Shuffle、YARN 通信默认基于 IPIPv4全版本原生支持默认IPv6Spark 完整兼容可配置 driver/executor 绑定 IPv6 地址三、传输层协议两类路线标准 TCP、高速 RDMA 以太网路线 1默认标准 TCP/IP无特殊网卡依赖所有 Spark 通用TCPSpark 原生唯一内置传输协议Driver ↔ Executor RPC、Shuffle 块拉取、Spark Connect (gRPC over TCP)、YARN 通信全部走 Netty TCPUDPSpark 原生逻辑不使用仅RoCEv2 底层承载路线 2以太网 RDMA 协议UCX/RAPIDS 扩展AI 大集群提速 Shuffle基于标准以太网在 TCP/IP 之外旁路内核栈Spark 通过 UCX 库对接RoCE v2主流推荐底层封装以太网帧 UDP/IP三层可路由跨 VLAN / 网段标准IBTA 规范兼容所有 100G/200G 以太网交换机Spark 启用spark.shuffle.managerUCXRAPIDS GPU Spark 标配RoCE v1老旧二层 RDMA不推荐仅同广播域iWARPTCP 封装 RDMA少见Spark 兼容但极少部署区分InfiniBand(IB)是独立网络非以太网RoCE 才是以太网原生 RDMASpark 同时支持 IB 与 RoCE 两套 RDMA 方案。四、Spark 上层应用通信协议跑在以太网之上Spark 内部 RPCNetty TCP 私有协议Shuffle 传输默认 Netty TCPUCX 模式走 RoCEv2 RDMASpark ConnectgRPC over HTTP/2 over TCP存储交互HDFS/S3 均基于 TCP/IP 以太网五、一句话总结支持范围所有 IEEE 802.3 系列以太网物理 / 帧标准全覆盖含 802.3ac VLAN、100G/200G PAM4 高速以太网二层 VLAN、无损 PFC/ECN、巨帧全部透明兼容传输层两条通路标准 TCP默认通用、RoCEv2 以太网 RDMA高性能 GPU 集群IPv4/IPv6 双栈完整支持底层以太网硬件对 Spark 完全无感无需修改 Spark 代码。补充实操边界普通大数据 x86 集群只用标准以太网 TCPDGX/H100/H200 GPU Spark 集群200GbE(802.3cd)RoCEv2UCX ShuffleIB 专用集群Spark 可直接跑 IB 原生 RDMA不依赖以太网。