当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周第三日 发布高性能通用矩阵乘法库

4个月前 (02-26)Deepseek最新资讯233

新京报贝壳财经讯(记者罗亦丹)北京时间2月26日,DeepSeek进行了其开源周第三日的发布——DeepGEMM,一个支持密集和MoE(专家混合模型)GEMM(通用矩阵乘法)的FP8 (8位浮点数)GEMM库,为V3/R1训练和推理提供支持。

据了解,通用矩阵乘法是许多高性能计算任务的核心,所以其性能优化也是大模型降本增效的重点。

DeepSeek表示,DeepGEMM在Hopper GPU(一种英伟达GPU架构)上最高可达到1350+FP8TFLOPS(每秒万亿次浮点运算),并且像教程一样简洁,可完全即时编译,其核心逻辑只有约300行代码,且在大多数矩阵尺寸上均优于专家调优的内核,并支持密集布局和两种MoE布局。


标签: DeepSeek

“DeepSeek开源周第三日 发布高性能通用矩阵乘法库” 的相关文章

DeepSeek赋能!浪潮企业云加速助力行业数智化转型

DeepSeek赋能!浪潮企业云加速助力行业数智化转型

3月20日,DeepSeek职场AI应用暨产业化发展沙龙在安徽合肥成功举办,浪潮企业云受邀出席并发表主旨演讲。本次会议以“解锁AI新引擎,赋能新质生产力”为主题,汇聚了百余位企业代表、行业专家及学者,...

国脉文化:目前公司部分产品已接入DeepSeek等多种主流开源大模型

国脉文化:目前公司部分产品已接入DeepSeek等多种主流开源大模型

每经AI快讯,有投资者在投资者互动平台提问:董秘您好!请问贵公司是否已经部署了DeepSeek?如果已经部署了,请问主要应用于哪些具体的业务?公司接入DeepSeek有哪些成本、收益方面的考量?如果公...

DeepSeek热潮已蔓延至大陆汽车圈-多家中国车企宣布与DeepSeek深度融合

DeepSeek热潮已蔓延至大陆汽车圈-多家中国车企宣布与DeepSeek深度融合

参考消息网2月9日报道 据台湾《经济日报》2月9日报道,DeepSeek热潮已蔓延至大陆汽车圈。吉利汽车宣布自研的星睿大模型与DeepSeek已完成深度融合,紧接着极氪、岚图等也宣布与DeepSeek...

中信建投回应“DeepSeek挑战”

中信建投回应“DeepSeek挑战”

中信建投总经理金剑华在2024年度业绩说明会上表示:DeepSeek带来技术赋能机遇,券商可以应用AI技术深度融入投研与交易环节,但目前在复杂资产配置、客户信任构建等场景仍需要人工干预。(资事堂)...

DeepSeek助力省生态环境信息化及指挥调度中心项目提档升级

DeepSeek助力省生态环境信息化及指挥调度中心项目提档升级

近日,为落实副省长余建提出的加快革新、标准先行、统筹推动、注重运用、确保安全工作要求,推进DeepSeek大语言AI模型在生态环境领域落地转化,省生态环境厅一级巡视员林奇昌组织深入研究如何加快Deep...

DeepSeek的顺风车,为何只有腾讯元宝成功“上车”?腾讯元宝联动DeepSeek,打出了当年红包大战的风采

DeepSeek的顺风车,为何只有腾讯元宝成功“上车”?腾讯元宝联动DeepSeek,打出了当年红包大战的风采

腾讯元宝联动DeepSeek,打出了当年红包大战的风采@明晰野望原创作者丨茯神腾讯元宝的大模型超车,是开年以来业内最津津乐道的话题。元宝从百模大战小透明,一度跃升至中国区苹果免费App下载排行榜第一。...