当前位置：首页 > Deepseek最新资讯 > 正文内容

中原证券-人工智能行业专题：后R1时代，DeepSeek发展的三大阶段-2510

6小时前Deepseek最新资讯15

　　DeepSeek在年初发布了R1以后，受到了各界普遍关注。后续来看，DeepSeek并没有如期发布更先进的模型R2，而是在进行更多小版本的更新换代。结合每个阶段的发展重点，我们将其划分为3个主要的发展阶段。

　　阶段一：性能提升。DeepSeek在3月推出的V3-0324和5月推出的R1-0528，通过后训练实现了模型能力的提升，弥补了和头部模型之间的差距。

　　阶段二：实现混合推理架构、Agent能力提升、与国产芯片协同优化。从8月以后，DeepSeek也顺应了海外混合推理架构和Agent能力提升的大趋势，推出了V3.1和V3.1-Terminus，Agent能力有了较大提升，思考效率也有提升。V3.1采用UE8M0FP8缩放格式训练，针对即将发布的下一代国产芯片设计，实现国产大模型和国产芯片协同设计的优化deepseek，对国产化芯片的应用起到积极的推动作用。

　　阶段三：提效降价，国产适配加速。9月发布的V3.2-Exp，基于V3.1-Terminus构建，引入了新的注意力机制DSA，在保持模型性能的稳定的同时，在训练推理效率方面有了较大的提升，带来了模型较大幅度的降价。考虑到当前大模型之间能力差距在缩小，成本的下降意味着模型具有更好的性价比和可推广性，也将促进应用端实现更多功能的落地。DeepSeek新兴AI编程语言选用TileLang这个新兴AI编程语言，可以实现对不同硬件平台的支撑，极大地改善了国产卡目前所面对的CUDA带来的生态壁垒问题，为国产大模型软硬件生态建立起到了极大的推动作用。发布的当天，国产芯片华为昇腾和寒武纪同步宣布完成对V3.2-Exp的零日适配，国产AI产业从“单点突破”迈向“系统协同”的又一个标志性事件。原文出处：中原证券-人工智能行业专题：后R1时代，DeepSeek发展的三大阶段-251014，感谢原作者，侵权必删！

标签: deepseek