当前位置:首页 > Deepseek最新资讯 > 正文内容

性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快

2个月前 (08-21)Deepseek最新资讯147

  据介绍,DeepSeek-V3.1具备128K超长上下文处理能力,支持混合推理架构(一个模型同时支持思考模式与非思考模式)。

  不仅如此,DeepSeek-V3.1拥有更强的Agent(智能体)能力,通过Post-Training(后训练)优化,新模型在工具使用与智能体任务中的表现有较大提升。

  比如,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,以及在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1均大幅领先DeepSeek-R1-0528。

  另外,DeepSeek-V3.1思考效率提升有了巨幅提升。经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下deepseek,各项任务的平均表现与R1-0528 持平。

  对于DeepSeek R2发布延迟的原因,DeepSeek总结称,主要由于采用国产昇腾芯片进行训练时遇到技术挑战,以及公司对模型质量的高标准要求。虽然之前有8月发布的传闻,但已被官方否认。目前看来,我们可能需要再等待几周的时间,但具体日期还需以官方消息为准。原文出处:性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快,感谢原作者,侵权必删!

标签: deepseek

“性能大幅领先R1!DeepSeek V3.1免费上线官网和App:回答更快” 的相关文章

[JR热议]电竞小说角色“简茸”被指融梗,作者声称无原型不知道GSL

[JR热议]电竞小说角色“简茸”被指融梗,作者声称无原型不知道GSL

  最近,电竞题材小说《我行让我上》作者酱子贝声称小说角色“无原型”,却遭到大众质疑,认为主角“简茸”融梗知名电竞选手Uzi,还融合了选手刘青松(Crisp)的特点,直接就是引发wb各家粉...

九四智能荣登2025中国AI大模型企业商业落地Top20榜单,引领AI商业应用新

九四智能荣登2025中国AI大模型企业商业落地Top20榜单,引领AI商业应用新

  2025年7月,在备受瞩目的2025世界人工智能大会(WAIC)上,亿欧智库正式发布了《2025中国AI商业落地应用价值研究报告》,并揭晓了“2025中国AI大模型企业商业落地Top2...

叫板OpenAI,DeepSeek-V3.1正式发布

叫板OpenAI,DeepSeek-V3.1正式发布

  8月21日,DeepSeek 正式发布 V3.1版本,并将其称为“迈向 Agent 时代的*步”。与以往的大模型迭代不同,它*的特征是混合推理架构,一个模型同时支持思考模式与非思考模式...

亚马逊云科技为何上架Qwen和DeepSeek的最新模型

亚马逊云科技为何上架Qwen和DeepSeek的最新模型

  2025年二季度云业务营收增速17.5%,相比两年前的2023年三季度同比提升5.2个百分点。   亚马逊总裁安迪·贾西(Andy Jassy)在2025年二季度财报...

创新药Deepseek时刻?恒瑞医药引爆创新药涨停潮,千亿赛道进入兑现期

创新药Deepseek时刻?恒瑞医药引爆创新药涨停潮,千亿赛道进入兑现期

  7月28日,创新药概念持续走强,恒瑞医药、海思科、联环药业、亚太药业、辰欣药业涨停,广生堂涨超10%,热景生物、塞力医疗、我武生物、阳光诺和、泽璟制药等跟涨。   消...

我觉得塞斯科俱乐部还是会去争取 而且得买

我觉得塞斯科俱乐部还是会去争取 而且得买

  1.韦维尔作为红牛系出来的 在塞斯科流入市场后如果不作为 那就是失职 特别是如果纽卡买了新赛季能进12个球左右 韦维尔就是大失职 作为一个职场人 大家都知道里面的道理...