当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

6个月前 (02-26)DeepSeek技术交流427

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是会有损失 结果 DeepSeek 完全没按套路出牌,它不是去压缩模型,而是换了个角度,直接假设未来算力足够,然后想办法更高效地用好现有显卡架构。换句话说,不是缩小参数规模,而是在同等规模下优化计算方式,让计算更具性价比 这种思路比纯工程优化要“硬核”得多。一般来说,搞小模型是比较务实的工程方案,但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容,而且即使以后显卡更强、模型规模更大,这套技术依然能继续用,不会过时

“DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?” 的相关文章

在微信小程序里使用DeepSeek的6种方法

在微信小程序里使用DeepSeek的6种方法

大家好,我是沐颜,专注私域流量变现。我的陪跑项目👉🏻 《超级个体合伙人》我的网创资源站👉🏻《搞钱项目资源》每天分享靠谱的副业项目,感兴趣的朋友,可以点个关注。设定清晰的目标是成功的第一步。当你知道自己...

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

保山市人民医院完成DeepSeek本地化部署-DeepSeek医疗智能操作系统“AI+医疗”为患者提供更精准、更高效的诊疗服务,进一步推动医院智慧化建设迈向新高度

       应用中的DeepSeek医疗智能操作系统。  近日,保山市人民医院紧跟国内人工智能趋势,正式完成DeepSeek医疗智能系统的本地化部署,这一举措...

DeepSeek接入贸易全链路环节!“义乌老板娘”积极拥抱AI新技术

DeepSeek接入贸易全链路环节!“义乌老板娘”积极拥抱AI新技术

在浙江义乌国际商贸城的20多万名从业者中,65%以上是女性,她们也被亲切地称为“义乌老板娘”。随着AI科技的加速发展,这些女性积极拥抱新技术,让小商品贸易赢得更广阔的市场。目前,义乌的AI智创服务平台...

美国试图封禁DeepSeek?新加坡学者:技术制裁终将失败

美国试图封禁DeepSeek?新加坡学者:技术制裁终将失败

“我用DeepSeek,也用Gemini和ChatGPT。我用他们来询问对世界上某些事情的看法。有些机器应该能读懂世界上的所有文字,可以告诉我一个最适中的看法,但人是做不到的。”新加坡国立大学李光耀公...

人工智能体Manus一夜火出圈,公司回应质疑:只是分享阶段性收获

人工智能体Manus一夜火出圈,公司回应质疑:只是分享阶段性收获

如果说2025年的这个春天,最被关注的话题是什么?那一定是人工智能。继火遍全球的国产AI大模型DeepSeek之后,3月6日凌晨,又一匹AI黑马杀出,一个名为“Manus”的产品引起刷屏效应。04:1...

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek第五弹炸裂收官!开源并行文件系统,榨干SSD全部带宽

DeepSeek开源周,今日正式收官!内容依旧惊喜且重磅,直接公开了V3和R1训练推理过程中用到的文件系统。具体来说,包括以下两项内容:Fire-Flyer文件系统(简称3FS,第三个F代表File)...