当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“开源周”第二天开源EP通信库

2个月前 (02-25)Deepseek最新资讯153

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


“DeepSeek“开源周”第二天开源EP通信库” 的相关文章

美图设计室AI图文接入DeepSeek R1,解锁一站式创作新体验

美图设计室AI图文接入DeepSeek R1,解锁一站式创作新体验

近日,美图公司旗下美图设计室AI图文宣布接入DeepSeek大模型,实现文案、笔记封面和内页排版的一键输出,为用户解锁一站式AI图文创作新体验,提升自媒体内容生产效率和笔记点击率。效率低、专业门槛高、...

DeepSeek助攻年轻人的口腔护理,一刷一含一漱健康从“齿”开始

DeepSeek助攻年轻人的口腔护理,一刷一含一漱健康从“齿”开始

你是不是也有这样的困扰:早上刷牙时牙龈出血,喝冰咖啡时牙齿敏感,吃完火锅后口腔异味挥之不去……别急,这些问题,DeepSeek用大数据告诉你:90%的年轻人都中招了!但好消息是,解决这些问题其实很简单...

如何利用 deepseek 高效开发 策略轮动模型 ?

如何利用 deepseek 高效开发 策略轮动模型 ?

近期如何利用deepseek非常火热,我们这些做量化投资的经常重复性的工作就是编程,为此这个周末刚好方便,尝试:如何利用deepseek高效辅助编写量化策略的程序?恰好有个策略轮动模型想要编写测试,那...

接入DeepSeek!汉阳政务服务开启“AI时代”

接入DeepSeek!汉阳政务服务开启“AI时代”

AI智能客服“知小音”24小时在线,数字人“汉小阳”实时解答。3月6日,武汉市汉阳区政务服务全面接入DeepSeek智能技术。线上,手机打开“汉阳云政务”微信小程序,身着一袭古装的AI智能客服“知小音...

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

2月27日上午,由共青团三明市委、兴业银行三明分行、兴业证券三明分公司等联合举办的“三明青年说”在兴业银行三明分行举行,本次活动以“学习探索DeepSeek技术 赋能青年科技创新”为主题,吸引了团市委...

中国高校纷纷开设DeepSeek课程 迎接AI浪潮

中国高校纷纷开设DeepSeek课程 迎接AI浪潮

今年2月,中国多所高校纷纷开设基于本土AI初创企业DeepSeek的人工智能课程。DeepSeek在人工智能领域的突破性进展被誉为中国的“斯普特尼克时刻”,引发了广泛关注,同时也顺应了中国政府推动高校...