DeepSeek V3.1升级,优化语言一致性等能力
继此前在今年8月DeepSeek线上大模型升级至V3.1,上下文长度从原有的64k拓展至128k后,日前DeepSeek方面宣布,DeepSeek-V3.1已更新至DeepSeek-V3.1-Terminus版本。据悉,此次更新已同步覆盖官方App、网页端、小程序,以及API。
据了解,DeepSeek-V3.1-Terminus在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括改善语言一致性,缓解中英文混杂、偶发异常字符等情况,以及提升Agent能力,进一步优化Code Agent与Search Agent等表现。
目前,DeepSeek-V3.1-Terminus提供了“思考模型”与“非思考模型”两种模式,均支持高达128K的上下文长度,能够处理更复杂的长文本任务,满足专业场景下的多轮对话与文档分析需求。
在定价方面,该模型输入费用根据缓存命中情况区分,若请求内容命中缓存,每百万tokens为0.5 元,未命中缓存则为4元,输出则统一为每百万tokens 12元。
但需要注意的是,由于是以Terminus(终极版)为名deepseek,因此有观点认为“这或许这也是DeepSeek-V3.1最后一次更新”。截止目前,DeepSeek方面尚未对此进行回应。
此外值得一提的是,不久前有消息称,DeepSeek方面或正在开发一款具备更先进AI智能体(Agent )功能的大模型,意在与OpenAI等竞争对手在技术新前沿展开竞争。据称,DeepSeek正在开发的这一模型可根据用户给出的简单指令,自动完成多步骤任务,并具备从以往操作中学习、自我改进的能力。
相关消息源还透露,该项目是由DeepSeek创始人梁文峰亲自带队,目标是今年最后一个季度正式发布相关新产品。原文出处:DeepSeek V3.1升级,优化语言一致性等能力,感谢原作者,侵权必删!