当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-24)Deepseek最新资讯126

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

DeepSeek 又有新动作,开源推理引擎路径

DeepSeek 又有新动作,开源推理引擎路径

4月14日,DeepSeek 在其 GitHub仓库发布预告称,即将开源推理引擎DeepSeek Inference Engine。DeepSeek 在其声明中所述:"几周前,在开源周期间,...

TCL实业全面接入DeepSeek

TCL实业全面接入DeepSeek

公司动态经济观察网讯 2月17日,TCL科技宣布,TCL实业正式接入DeepSeek,将为TCL的智能家居、移动通讯、内部研发等产品线和业务注入AI能力。(编辑:万佳)...

车企扎堆接入DeepSeek,真有用还是纯噱头?

车企扎堆接入DeepSeek,真有用还是纯噱头?

今年春节前后,一场围绕DeepSeek展开的“AI风暴”席卷汽车行业。《消费者报道》统计发现,截至2月20日,已有20余家车企和品牌宣布与DeepSeek深度融合,包括吉利、奇瑞、长安、上汽、东风、广...

吴通控股新增“DeepSeek概念”

吴通控股新增“DeepSeek概念”

025年4月29日,吴通控股(300292)新增“DeepSeek概念”。据同花顺数据显示,入选理由是:根据2025年4月28日互动易:子公司国都互联5G消息平台——5G 101平台已接入DeepSe...

李彦宏:DeepSeek不是万能,最大问题是慢和贵,大多数大模型速度比DeepSeek满血版更快,价格更低「附多模态大模型行业市场分析」

李彦宏:DeepSeek不是万能,最大问题是慢和贵,大多数大模型速度比DeepSeek满血版更快,价格更低「附多模态大模型行业市场分析」

(图片来源:摄图网)4月25日,百度创始人李彦宏在reate2025百度AI开发者大会上发表了题为《模型的世界 应用的天下》的演讲。他在演讲中称 “DeepSeek不是万能的”,并指出了DeepSee...

企业微信+DeepSeek来了-企业微信接入DeepSeek

企业微信+DeepSeek来了-企业微信接入DeepSeek

【企业微信接入DeepSeek】《科创板日报》21日讯,今日,企业微信发布新版本,灰度接入满血版DeepSeek-R1大模型,正式发布"智能机器人"、"智能表格-客户跟进...