当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

8个月前 (02-25)Deepseek最新资讯417

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

国家知识产权局:严打抢注“DeepSeek”等相关商标申请行为

国家知识产权局:严打抢注“DeepSeek”等相关商标申请行为

中新经纬4月24日电 国新办24日就2024年中国知识产权强国建设有关情况举行新闻发布会。国家知识产权局局长申长雨在会上表示,严厉打击抢注“DeepSeek”等相关商标申请行为,持续强化知识产权保护,...

文心一言:Deepseek在金融证券行业应用有哪些?

文心一言:Deepseek在金融证券行业应用有哪些?

文心一言:Deepseek在金融证券行业应用有哪些?DeepSeek在金融证券行业的应用十分广泛,主要体现在以下几个方面:一、风险管理与信用评估企业信贷风险分析:整合企业财报、舆情数据、供应链关系等信...

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

       应用中的DeepSeek医疗智能操作系统。  近日,保山市人民医院紧跟国内人工智能趋势,正式完成DeepSeek医疗智能系统的本地化部署,这一举措...

运营商全面接入DeepSeek意味着什么?

运营商全面接入DeepSeek意味着什么?

《科创板日报》2月12日讯 近日,三大运营商宣布全面接入DeepSeek,给市场带来了一波不小的冲击。中国电信率先成为国内首家实现DeepSeek模型全栈国产化推理服务落地的运营商级云平台;...

DeepSeek:改变行业格局的技术革命-DeepSeek的未来前景

DeepSeek:改变行业格局的技术革命-DeepSeek的未来前景

标题:DeepSeek:改变行业格局的技术革命关键词:DeepSeek,人工智能,数据分析,技术创新,行业应用,智能化描述:深度探索DeepSeek的广泛应用,如何在各个行业中带来创新和效率的飞跃,提...

快手搜索已全面接入DeepSeek R1

快手搜索已全面接入DeepSeek R1

3月21日,华尔街见闻获悉,快手搜索已全面接入DeepSeek R1的大模型能力,旨在优化搜索效果与用户体验,并进一步提升用户活跃度,未来也会持续探索智能搜索场景的商业化变现能力。(全天候科技)...