当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2个月前 (02-25)Deepseek最新资讯137

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

随着国产AI公司深度求索的大模型DeepSeek爆红,各类仿冒网站也层出不穷,带来安全隐患。2月6日,澎湃新闻记者从奇安信XLab实验室方面获悉,仿冒DeepSeek的网站、钓鱼网站已经超过2000个...

特斯联完成摩托车产业打造首个DeepSeek应用案例

特斯联完成摩托车产业打造首个DeepSeek应用案例

近日,特斯联完成摩托车行业首例深度融合DeepSeek的应用案例,助力某上市厂商与DeepSeek全场景无缝融合,打造AI助理,开启摩托车智慧出行新范式。来源: 同花顺7x24快讯...

优刻得与百事通战略合作 合力推进DeepSeek一体机司法领域应用

优刻得与百事通战略合作 合力推进DeepSeek一体机司法领域应用

人民财讯4月9日电,记者从优刻得获悉,优刻得与上海百事通信息技术股份有限公司达成战略合作。双方将携手推出DeepSeek一体机司法解决方案,实现“高安全国产算力+垂直领域数据资源”的技术融合,为司法行...

破!DeepSeek引发中国资产重估,后劲还有多大?

破!DeepSeek引发中国资产重估,后劲还有多大?

近期,资金持续加仓港股态势显著。2月18日,恒生科技指数继续上涨2%至5609.27点。上周,恒生科技指数大涨7.3%,在冲破去年10月的高位之后,创约3年来的收市新高。多只港股科技股近日已经突破去年...

刘慈欣称DeepSeek完全可能替代人类作家

刘慈欣称DeepSeek完全可能替代人类作家

本文转自【九派新闻】;3月29日,据央视财经,科幻作家、《三体》作者刘慈欣在接受采访时被问到DeepSeek未来有可能替代科幻作家吗?刘慈欣表示,暂时不太会,但是再过10年、20年,从理论上说完全可能...

怎么修改 DeepSeek 的返回值的数据类型?

怎么修改 DeepSeek 的返回值的数据类型?

怎么修改 DeepSeek 的返回值的数据类型?要修改 DeepSeek 的返回值数据类型,可以通过调整模型的输出配置或使用适当的数据处理方法来实现。以下是一些可能的步骤:明确输出要求:在发送请求时,...