当前位置:首页 > Deepseek最新资讯 > 正文内容

叫板OpenAI,DeepSeek-V3.1正式发布

2个月前 (08-21)Deepseek最新资讯161

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式。这意味着模型在保持性能稳定的同时,能够根据需求选择是快速给出答案,还是展开更长链路的推理。

  更重要的是,经过思维链压缩训练,新版模型在生成结果时的token数量减少了20%至50%(同前代模型DeepSeek-R1-0528相比),这不仅带来响应速度的提升,也直接降低了使用成本。

  配合128K的上下文扩展和FP8精度推理,V3.1在工程层面强化了吞吐效率与能耗表现,为大规模应用打下基础。

  除了推理效率上的改进,V3.1在智能体能力上的进化尤为关键。官方测试显示,在代码修复和命令行任务等编程智能体场景中,新模型展现出更强的执行力和稳定性,能够在真实环境中完成多轮迭代修正,避免“越改越乱”的问题。

  在复杂搜索任务上,V3.1则展现了更成熟的检索与整合能力,它可以规划搜索步骤、筛选证据并综合多源信息,在高难度的多学科题目测试中,性能已经远超前代模型。

  在商业与生态层面,DeepSeek 选择了“双轨”策略deepseek,一方面继续提供 API 服务,但将于9月6日起调整价格并取消夜间优惠;另一方面,V3.1的Base模型与后训练版本已在Hugging Face和魔搭同步开源。

  值得一提的是,在这一次的官方发布说明中,DeepSeek提到“V3.1使用了 UE8M0 FP8 Scale的参数精度”,更为通俗的说,它设置了一个适配于即将发布的新一代国产芯片的技术规范与设计标准。“建议有部署需求的用户仔细阅读新版说明文档。”而在此之前,国产芯片部署DeepSeek通常会有一定性能减弱,除非再做专门的软件适配。

  本次DeepSeek-V3.1的发布也似有与GPT5对垒的意味,都支持超长上下文,都有更强的复杂任务处理能力,基础模型调用更为灵活,成本更为弹性。原文出处:叫板OpenAI,DeepSeek-V3.1正式发布,感谢原作者,侵权必删!

标签: deepseek

“叫板OpenAI,DeepSeek-V3.1正式发布” 的相关文章

DeepSeek暗示国产芯片有望大规模使用

DeepSeek暗示国产芯片有望大规模使用

  8月22日,A股算力板块再度成为“执牛耳者”。截至收盘,本轮行情的“股王”寒武纪以20%涨停报收,总市值来到惊人的5200亿人民币;晶圆龙头中芯国际A/H股分别上涨14.19%和10....

华蓝集团:办公管理系统、项目管理系统已经接入DeepSeek、通义千问等AI大模

华蓝集团:办公管理系统、项目管理系统已经接入DeepSeek、通义千问等AI大模

  证券日报网讯 华蓝集团8月18日在互动平台回答投资者提问时表示,公司办公管理系统、项目管理系统已经接入DeepSeek、通义千问等AI大模型deepseek,提高了公司行政管理、项目管...

DeepSeek V3.1出现“极”字Bug,影响编码流程

DeepSeek V3.1出现“极”字Bug,影响编码流程

  日前,DeepSeek最新版V3.1被发现存在严重Bug,会在代码生成中随机插入“极/極/extreme”等token,导致代码无法正常编译。这一问题不仅出现在第三方量化部署中,官方全...

昇腾:为医疗AI注入向上的力量

昇腾:为医疗AI注入向上的力量

  2025年初,通用大模型DeepSeek的爆火,迅速带火了全国千行万业人工智能应用。算力需求结构也从训练转向推理、微调。这对于国产算力而言,无异于天赐良机。医疗行业尤为典型,从2025...

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

  在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。   正如360集...

从“青”出发 向“浪”而行 青春建功正当时

从“青”出发 向“浪”而行 青春建功正当时

  “获得‘高质量发展标兵’,给我个人带来了很大的成就感,今后我将更加注重专业技能和综合素质的提升。”近日,青年人才积分排名第一的陈翔满怀欣喜地说。陈翔是福建省福州市城南烟草专卖局(分公司...