DeepSeek 致谢腾讯技术团队，DeepEP 开源通信框架性能显著提升

Published 1221 Articles

IT之家 5 月 7 日消息，腾讯技术团队针对 DeepSeek 开源的 DeepEP 通信框架进行深度优化，使其在多种网络环境下均实现显著性能提升。

经测试，优化后的通信框架性能在 RoCE 网络环境提升 100%，IB 网络环境提升 30%，为企业开展 AI 大模型训练提供更高效的解决方案。

该技术方案获得了 DeepSeek 公开致谢，称这是一次“huge speedup”代码贡献。

IT之家注：DeepEP 是一个为专家混合（MoE）和专家并行（EP）量身定制的通信库。它提供高吞吐量和低延迟的全对全 GPU 内核，这些内核也被称为 MoE 派发和组合。该库还支持低精度运算，包括 FP8。

据悉，腾讯星脉网络团队在 DeepEP 开源后便展开技术攻关，发现两大关键瓶颈：一是对于双端口网卡带宽利用率不足，二是 CPU 控制面交互存在时延。

在腾讯的技术优化下，DeepEP 不仅在 RoCE 网络实现性能翻倍，反哺到 IB（InfiniBand）网络时更使原有通信效率再提升 30%。

目前，该技术已全面开源，并成功应用于腾讯混元大模型等项目的训练推理，在腾讯星脉与 H20 服务器构建的环境中，这套方案展现出出色的通用性。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

登录账号

DeepSeek 致谢腾讯技术团队，DeepEP 开源通信框架性能显著提升

DeepSeek APP

Comment (0)

Chapter

Recommended Articles

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

速抢（2核2G）77元/年香港免备案服务器

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

Popular Tags

Popular Authors

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

登录账号

DeepSeek 致谢腾讯技术团队，DeepEP 开源通信框架性能显著提升

DeepSeek APP

Comment (0)

Chapter

Recommended Articles

何必DiT！字节首次拿着自回归，单GPU一分钟生成5秒720p视频

用户破8亿！GPT-5.1来了，表情包含量可自定义

速抢（2核2G）77元/年香港免备案服务器

李飞飞的世界模型来了！一句话生成3D世界，AI 真的开始理解现实了

科技巨头「偷偷借钱」搞AI，次贷危机魅影重现？

腾讯总裁剧透微信搭载智能体！阿里和谷歌也都开始互相伤害了

AIGC大模型能力提升10倍！安谋科技Arm China掏出最强NPU IP大招

小鹏物理AI的尽头，是马斯克的现金流

Popular Tags

Popular Authors

AI中国

钛媒体APP

IT之家

人人都是产品经理

AIbase基地

为您推荐