当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

5个月前 (02-25)Deepseek最新资讯303

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

腾讯与DeepSeek合作背后:一场中国开发者开源的胜利

腾讯与DeepSeek合作背后:一场中国开发者开源的胜利

几乎在马化腾与梁文锋同框引起关注的同时,DeepSeek与腾讯悄悄进行了一次技术合作。用腾讯工程师的话来说,此次合作的成果,相当于实现了AI落地“最后一公里”的突破。近日,DeepSeek工程师在Gi...

外界热议DeepSeek低调“上新”

外界热议DeepSeek低调“上新”

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,...

DeepSeek让观山湖区政务服务实现“边聊边办”

DeepSeek让观山湖区政务服务实现“边聊边办”

近期,贵州省政务服务中心依托国产大模型DeepSeek开发的“贵人智办”AI助手上线,观山湖区作为全省首批试点之一,该功能也在区政务大厅正式亮相。记者走进观山湖区政务大厅看到,B区的自助办理区及“7×...

郑州交警“无人机+DeepSeek”让出行更智能、更顺畅

郑州交警“无人机+DeepSeek”让出行更智能、更顺畅

当警用无人机遇上人工智能会擦出怎样的火花?在郑州街头一场由"无人机+DeepSeek"引领的交通变革正在悄然上演从空中侦察员、安全宣讲员,到事故调解员再到智能调度师郑州交警正在逐步...

开启智慧医疗新篇章 四川广元这家医院率先完成DeepSeek本地化部署

开启智慧医疗新篇章 四川广元这家医院率先完成DeepSeek本地化部署

封面新闻记者 刘彦谷3月7日,记者从广元市中心医院了解到,在医疗行业加速数字化转型的关键节点,该院在区域内率先完成基于国产化服务器的DeepSeek智能中枢本地化部署。这一举措通过构建自主可控的AI基...

效率狂飙!DeepSeek最强16个王炸组合,打工人必看!(强烈建议收藏)

效率狂飙!DeepSeek最强16个王炸组合,打工人必看!(强烈建议收藏)

01内容创作:1分钟输出爆款(1)DeepSeek + 豆包            爆款文案生成器自媒体人痛点:选题难、灵感枯竭?输入行业关...