当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

2个月前 (02-26)Deepseek最新资讯166

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

“DeepSeek医生”也能上岗“诊疗”了!人工智能自动生成处方靠谱吗?

“DeepSeek医生”也能上岗“诊疗”了!人工智能自动生成处方靠谱吗?

据中央广播电视总台中国之声《新闻纵横》报道,最近,人工智能的春风席卷各大领域,医疗行业也在经历着一场深刻的变革。各地多家医院纷纷引入国产AI大模型DeepSeek,并通过本地化部署将其应用于临床、科研...

DeepSeek+昇腾云技术创享会重庆站成功举办

DeepSeek+昇腾云技术创享会重庆站成功举办

2月27日,以“山城论道 智链未来”为主题的“探秘DeepSeek行业影响暨华为云昇腾云技术创享会”在重庆成功举办。活动现场,政府代表、行业专家、企业决策者及技术开发者等300余人齐聚一堂,围绕人工智...

大模型落地家庭娱乐场景 三星电视接入DeepSeek-R1

大模型落地家庭娱乐场景 三星电视接入DeepSeek-R1

近日,三星电视正式接入DeepSeek-R1,AI能力进一步得到强化。据悉,用户无需复杂的操作步骤,唤醒智能语音助手三星小贝,在对应的语音助手对话页面内,即可便捷体验深度思考功能。三星电视融合Deep...

实达集团完成对DeepSeek-R1应用的部署

实达集团完成对DeepSeek-R1应用的部署

实达集团完成对DeepSeek-R1应用的部署每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSee...

引入DeepSeek模型,AI玩具爆火!有企业已定出200万只→

引入DeepSeek模型,AI玩具爆火!有企业已定出200万只→

(央视财经《天下财经》)DeepSeek带火AI消费市场,今年春节后,玩具市场正悄然掀起一股智能化的风潮,AI玩具不断涌现。我国广东地区具备完善的玩具制造产业链,覆盖从原材料采购到产品组装的各个环节。...

杭州联通助力DeepSeek成功接入建德政务信创云,“智”启政务新篇

杭州联通助力DeepSeek成功接入建德政务信创云,“智”启政务新篇

国产人工智能大模型DeepSeek以其领先技术实力崛起,成为引领技术革新的先锋力量。该模型不仅以超凡的智能交互能力重塑人机协作的边界,更以卓越的计算性能突破传统AI的桎梏,开创了智能认知的新纪元。杭州...