当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新版本模型：优化推理效率，API降价超50%

6天前Deepseek最新资讯59

　　值得注意的是，此前有不少科技博主发现，DeepSeek-V3.2新模型已上传至其HuggingFace官方页面，随后被删除，此后DeepSeek正式公告新版本的推出。

　　据DeepSeek介绍，作为迈向新一代架构的中间步骤，V3.2-Exp在V3.1-Terminus的基础上引入DeepSeek Sparse Attention（一种稀疏注意力机制），针对长文本的训练和推理效率进行探索性优化和验证。目前，官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp，同时API大幅度降价。

　　据了解，DeepSeek Sparse Attention（DSA）首次实现细粒度稀疏注意力机制，在几乎不影响模型输出效果的前提下，实现长文本训练和推理效率的大幅提升。为严谨评估引入稀疏注意力带来的影响，把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行严格的对齐。在各领域的公开评测集上，DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。

　　在新模型的研究过程中，需要设计和实现很多新的GPU算子，使用高级语言TileLang进行快速原型开发，以支持更深入的探索。在最后阶段，以TileLang作为精度基线，逐步使用底层语言实现更高效的版本。此次开源的主要算子包含TileLang与 CUDA两种版本。

　　DeepSeek表示，得益于新模型服务成本的大幅降低，官方API价格也相应下调，开发者调用DeepSeek API的成本将降低50%以上。从价格来看，输入缓存命中从0.5元降至0.2元/百万tokens，缓存未命中从4元降至2元/百万tokens，输出由12元降至3元/百万tokens。

　　除了DeepSeek，国内另一大模型厂商智谱的新一代旗舰模型GLM-4.6也即将发布，目前deepseek，在Z.ai官网可以看到，GLM-4.5标识为上一代旗舰模型。

　　此前9月18日，梁文锋带着DeepSeek-R1的研究，登上最新一期国际顶级期刊《自然》（Nature）封面。

　　《自然》杂志指出，如此总结DeepSeek-R1带来的进步：如果训练出的大模型能够规划解决问题所需的步骤，那么它们往往能够更好地解决问题。这种“推理”与人类处理更复杂问题的方式类似，但这对人工智能有极大挑战，需要人工干预来添加标签和注释。

　　DeepSeek的研究人员揭示了他们如何能够在极少的人工输入下训练一个模型，并使其进行推理。DeepSeek-R1模型采用强化学习进行训练。在这种学习中，模型正确解答数学问题时会获得高分奖励，答错则会受到惩罚。原文出处：DeepSeek发布新版本模型：优化推理效率，API降价超50%，感谢原作者，侵权必删！

标签: deepseek

返回列表

上一篇：用先进算力，为AGI加速！华为云企业快成长AI技术创新论坛南京站圆满落幕

下一篇：寒武纪：已同步实现对DeepSeek-V3.2-Exp的适配

“DeepSeek发布新版本模型：优化推理效率，API降价超50%” 的相关文章

DeepSeek发布新版本模型：优化推理效率，API降价超50%

“DeepSeek发布新版本模型：优化推理效率，API降价超50%” 的相关文章

华泰证券：DeepSeek-V3.1发布，国产算力链迎来高景气

K时评：DeepSeek R2，翘首以盼

站在DeepSeek肩膀上，小红书开源首款多模态模型：看懂表情包与数学题，一手实

梁文锋论文登上《自然》封面，Nature评价：这一空白“终于被DeepSeek打

特斯拉接入豆包和DeepSeek南财合规周报（第204期）

GPT-5登场！国产大模型“扎堆上新”，DeepSeek得加速了

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.