当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-25)Deepseek最新资讯189

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

为什么作家阿来不用DeepSeek

为什么作家阿来不用DeepSeek

日前,作家、四川省作家协会主席阿来亮相复旦大学,在“人是出发点,也是目的地”主题研讨会间隙接受文汇报记者专访。原标题:《为什么作家阿来不用DeepSeek》...

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

科蓝软件:已成功将DeepSeek-R1模型整合至公司魔聚平台

人民财讯3月5日电,科蓝软件(300663)3月5日在互动平台表示,公司已成功将DeepSeek-R1模型整合至公司的人工智能应用平台——魔聚平台。具体来说,魔聚平台成功部署并全面投入使用了DeepS...

理想同学App正式接入DeepSeek

理想同学App正式接入DeepSeek

北京商报讯(记者 刘晓梦)2月19日,理想汽车宣布,旗下人工智能助手理想同学App全面接入DeepSeek R1&V3 671B满血版,并实现与理想自研MindGPT大模型的双向自由切换。据了...

拥抱人工智能,岳阳县数据局开展DeepSeek应用培训

拥抱人工智能,岳阳县数据局开展DeepSeek应用培训

华声在线4月2日讯(通讯员 续鼎)为深化数字技术应用,全面提升干部对人工智能大模型DeepSeek的认知与应用能力,4月2日,岳阳县数据局组织机关全体干部职工进行DeepSeek人工智能技术与应用探索...

破!DeepSeek引发中国资产重估,后劲还有多大?

破!DeepSeek引发中国资产重估,后劲还有多大?

近期,资金持续加仓港股态势显著。2月18日,恒生科技指数继续上涨2%至5609.27点。上周,恒生科技指数大涨7.3%,在冲破去年10月的高位之后,创约3年来的收市新高。多只港股科技股近日已经突破去年...

京东云 DeepSeek 一体机升级,单台即可运行满血版 V3 / R1 模型

京东云 DeepSeek 一体机升级,单台即可运行满血版 V3 / R1 模型

IT之家 2 月 22 日消息,京东云昨日宣布 DeepSeek 一体机再升级,京东云 vGPU 智算一体机单台即可运行满血版 DeepSeek V3 / R1。京东云 vGPU 智算一体机,为客户部...