当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

7个月前 (02-25)Deepseek最新资讯339

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

谁是“造物主”?关于DeepSeek的冷思考

谁是“造物主”?关于DeepSeek的冷思考

原创 小复 复旦大学出版社我们正在经历一场静默的“创世记”:AI生成媲美人类的作品基因编辑重塑生命密码元宇宙构建平行宇宙究竟谁才是这个时代的“造物主”?2025年1月20日,幻方量化旗下AI公司深度求...

科技伦理视域下DeepSeek的学术风险及其防范

科技伦理视域下DeepSeek的学术风险及其防范

作者:刘科(河南师范大学科技与社会研究所教授);贾豫政(河南师范大学科技与社会研究所助理研究员)近期,人们对DeepSeek(深度求索)的热议揭示了人机关系的复杂性,也凸显了在AI领域嵌入科技伦理的必...

商舟短视频AI获客系统接入DeepSeek

商舟短视频AI获客系统接入DeepSeek

36氪获悉,大人国际宣布旗下商舟集团短视频AI获客系统已正式接入DeepSeek,升级后的短视频AI获客系统增加了智能内容创作辅助功能,能够基于算法为短视频创作提供创意灵感、脚本框架等,同时强化了用户...

DeepSeek能干些什么?探索AI技术的无限可能

DeepSeek能干些什么?探索AI技术的无限可能

标题:DeepSeek能干些什么?探索AI技术的无限可能关键词:DeepSeek,人工智能,数据分析,自动化,创新研发,AI工具,智能化变革描述:DeepSeek作为领先的人工智能工具,正通过其强大的...

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显...

托普云农(301556)已接入deepseek

托普云农(301556)已接入deepseek

 同花顺(300033)金融研究中心03月24日讯,有投资者向托普云农(301556)提问, 请问公司是否接入deepseek?  公司回答表示,您好!我司已接入。此次接入对公司业绩无直接影响,截止目...