当前位置:首页 > Deepseek最新资讯 > 正文内容

刚刚,DeepSeek发布更新

6小时前Deepseek最新资讯16

  DeepSeek更新日志显示,deepseek-chat和deepseek-reasoner都已经升级为DeepSeek-V3.1-Terminus。此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,主要包括以下方面:一是语言一致性,缓解了中英文混杂deepseek、偶发异常字符等情况;二是Agent能力,进一步优化了Code Agent与Search Agent的表现。

  今年年初,开源大模型DeepSeek曾掀起“开源潮”,引爆AI行业。作为一款开源模型,DeepSeek-R1在数学、代码、自然语言推理等任务上的性能能够与国际头部模型比肩。

  9月17日,DeepSeek-R1推理模型研究论文登上最新一期的Nature封面,引起广泛关注。该论文由DeepSeek团队共同完成,梁文锋担任通讯作者。该文章揭示了开源人工智能模型DeepSeek-R1所采用的大规模推理模型训练方法。开发团队称,该模型使用了强化学习而非人类示例来开发推理步骤,减少了训练成本和复杂性。

  在模型迭代方面,8月21日,DeepSeek宣布发布DeepSeek-V3.1。据介绍,DeepSeek-V3.1的升级包含以下主要变化。一是实现混合推理架构,一个模型同时支持思考模式与非思考模式;二是更高的思考效率;三是更强的Agent能力,新模型在工具使用与智能体任务中的表现有较大提升。

  其中,智能体支持能力方面,DeepSeek聚焦热门发展方向对编程智能体、搜索智能体展开测评,测试结果显示,DeepSeek-V3.1相较此前模型均有提升。在编程智能体方面,在代码修复测评SWE-bench(最具代表性的代码修复评测基准之一)等复杂任务测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。在搜索智能体方面,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试与多学科专家级难题测试上,DeepSeek-V3.1性能已大幅领先DeepSeek-R1-0528。

  同时,DeepSeek宣布,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。其中,UE8M0 FP8是针对即将发布的下一代国产芯片设计。当日,DeepSeek概念板块火热。不少国产芯片产业链企业股价大涨。

  华安证券研报称,DeepSeek V3.1发布后即带动国产算力产业链标的大幅上涨。未来基于DeepSeek模型的训练与推理有望更多应用国产AI芯片,助力国产算力生态加速建设。DeepSeek V3.1在AI Agent能力端显著提升,未来将继续推动AI Agent商业化场景应用。原文出处:刚刚,DeepSeek发布更新,感谢原作者,侵权必删!

标签: deepseek

“刚刚,DeepSeek发布更新” 的相关文章

美国AI独角兽宣称停止服务中国公司,针对DeepSeek?

美国AI独角兽宣称停止服务中国公司,针对DeepSeek?

  9月5日,全球主流大模型之一Claude的开发商Anthropic公司发布公告宣称,“由于法律、监管和安全风险”,将立即停止向“中国控股公司”提供服务。   根据相关...

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压Deep

刚刚,阿里首个超万亿参数新王登基!Qwen3-Max屠榜全SOTA,碾压Deep

  总的来说,Qwen3-Max-Preview有以下几大亮点:性能更强、知识更广、更擅长对话deepseek、任务处理、指令遵循。   比如,在一个杯子流体模拟中,Ge...

中国AI火到海外!多国大使向来华留学生推荐DeepSeek和夸克

中国AI火到海外!多国大使向来华留学生推荐DeepSeek和夸克

  随着新学期到来,大批海外留学生将陆续入学。根据教育部2024年的数据,目前在华留学生总数已突破50万人,比2023年增长12.3%,创下历史新高。中国已成为亚洲第一、全球第三的留学目的...

1355 万、DeepSeek 部署大单

1355 万、DeepSeek 部署大单

  采购内容:智能一体机、安全系统及容灾备份,日常运维、系统更新迭代、各个单位的服务(具体详见招标文件)。   2025 年 8 月 26 日发布中标结果deepseek...

DeepSeek分析:一台比亚迪秦实际成本及毛利,毛利率仅8%合理吗?

DeepSeek分析:一台比亚迪秦实际成本及毛利,毛利率仅8%合理吗?

  网友热议:比亚迪毛利率8%到底靠谱吗?一篇关于比亚迪秦系列车型成本分析的行业报告近日引发广泛讨论。第三方机构基于公开资料及行业数据进行模型推演,以指导价9.98万元的秦L DM-i版本...

DeepSeek背后的腐败窟窿曝光:三人6年套取券商佣金1.18亿

DeepSeek背后的腐败窟窿曝光:三人6年套取券商佣金1.18亿

  幻方量化,DeepSeek的东家,刚被曝出一桩亿元腐败大案。三个人,六年时间,从券商那里套走了1.18个亿!   李橙,幻方量化市场总监,公司创始...