当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

4个月前 (02-24)Deepseek最新资讯181

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。


据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。


贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。


上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

蜜度索骥升级!DeepSeek 全文检索 热搜检索

蜜度索骥升级!DeepSeek 全文检索 热搜检索

5月27日,蜜度旗下多模态与跨模态信息检索平台——蜜度索骥,深度融合DeepSeek-R1满血版,推出“深度检索”功能,该功能涵盖两大核心能力,分别为“全文检索”与“热搜检索”。DeepSeek&am...

安徽移动铜陵分公司推动DeepSeek大模型本地化部署卓有成效

安徽移动铜陵分公司推动DeepSeek大模型本地化部署卓有成效

今年以来,DeepSeek大模型风靡全球,在国内外科技领域掀起了AI热潮,为响应人工智能技术快速迭代趋势,推动AI大模型在本地普及和应用落地,安徽移动铜陵分公司(以下简称:铜陵移动)积极推动DeepS...

中国电信浙江公司+DeepSeek开启AI之旅 拥抱智能未来

中国电信浙江公司+DeepSeek开启AI之旅 拥抱智能未来

如今,大模型已成为推动各行业智能化转型的核心驱动力。依托“天翼云”国家级云平台,中国电信浙江公司全面整合DeepSeek开源模型,利用息壤智算一体机-DeepSeek版,为客户提供安全、高效以及本地化...

佛山市总开展DeepSeek智能实战应用系列培训

佛山市总开展DeepSeek智能实战应用系列培训

近日,广东省佛山市总工会举办DeepSeek智能实战应用系列公益培训班,吸引来自全市各机关事业单位、传统行业及家电家具、新能源、工业机器人、医药健康等行业职工参与。原定200人一场的培训规模因报名人数...

DeepSeek大消息!高管发生变更

DeepSeek大消息!高管发生变更

企查查APP显示,近日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司发生工商变更,裴湉由执行董事兼总经理改任经理、董事,新增王贤祖为财务负责人,同时经营范围新增互联网信息服务。该公...

携手DeepSeek!厦门华厦学院智能招生问答系统全面升级

携手DeepSeek!厦门华厦学院智能招生问答系统全面升级

中新网福建新闻3月13日电 当DeepSeek遇上厦门华厦学院,会擦出怎样的火花呢?为了给莘莘学子和家长们带来更好的咨询体验,厦门华厦学院智能招生问答系统已正式接入DeepSeek大模型啦!无论是志愿...