当前位置:首页 > Deepseek最新资讯 > 正文内容

国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新

10小时前Deepseek最新资讯26

  发布研报称,DeepSeek V3.1在多项指标上性能大幅领先R1-0528,加强了智能体支持,独创性使用UE8M0 FP8 Scale精度,与国产AI芯片协同创新。DeepSeek-V3.1加强了智能体支持,并且针对下一代国产AI芯片设计;该行维持计算机板块“增持”评级。

  ①混合推理架构,一个模型同时支持思考模式和非思考模式,官方App与网页端模型已同步升级为DeepSeek-V3.1,用户可以通过“深度思考”按钮,实现思考模式和非思考模式自由切换;②更高的思考效率,相比DeepSeek-R1-0528deepseek,DeepSeek-V3.1-Think能在更短时间内给出答案;③更强的Agent能力,通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

  ①编程智能体,在代码修复测评SWE与命令行终端环境下的复杂任务(Terminal-Bench)测试中,DeepSeek-V3.1相比之前的DeepSeek系列模型有明显提高。②搜索智能体,DeepSeek-V3.1在多项搜索评测指标上取得了较大提升。在需要多步推理的复杂搜索测试(browsecomp)与多学科专家级难题测试(HLE)上,DeepSeek-V3.1性能已大幅领先R1-0528。③思考效率提升,测试结果显示,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

  ①V3.1的Base模型在V3的基础上重新做了外扩训练,一共增加训练了840Btokens。Base模型与后训练模型均已在Hugging face与魔搭开源。②需要注意的是,DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度,UE8M0 FP8是针对即将发布的下一代国产芯片设计。③另外,V3.1对分词器及chat template进行了较大调整,与DeepSeek-V3存在明显差异。

  /特朗普:已有人选接替库克,鲍威尔也很快就离开了!美联储首次回应, 库克的律师宣布将起诉......

  /这次没有空中爆炸!1个小时飞越半个地球,马斯克星舰终于成功了,现场欢呼声、鼓掌声响成一片

  /苹果发布会前瞻:iPhone 17—“史上最薄iPhone”,以及苹果硬件发布会的其他预期新品

  /中国石油拟400亿元人民币收购储气库企业:德国汽车欧宝放弃先前电动化战略,延长燃油车型供应时间原文出处:国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新,感谢原作者,侵权必删!

标签: deepseek

“国泰海通:DeepSeek~V3.1加强智能体支持 与国产AI芯片协同创新” 的相关文章

“记事本”里的大匠心——记济南烟草“金牌工匠”秦建的18年维保征程

“记事本”里的大匠心——记济南烟草“金牌工匠”秦建的18年维保征程

  从计谋全局擘画区域调和成长新图景;面向当前热门的低空经济使用,二是依托铁塔AIoT能力平台,坚持以革新引领区域一体化高质量成长之路。为通用航空和无人机供给低空平安态势感知办事。海内大进...

前首富陈天桥AGI豪赌:高薪挖角清华大牛,剑指下一个Deepseek?

前首富陈天桥AGI豪赌:高薪挖角清华大牛,剑指下一个Deepseek?

  最新消息显示,清华电子工程系副教授、AI青年大牛代季峰,已经从清华辞职,加盟陈天桥旗下盛大,领衔筹备一家AGI创业公司。   与此同时,他早年斥资10亿美元创办的天桥...

Deepseek推荐全国旅游百强区第23名:江苏苏州市吴中区

Deepseek推荐全国旅游百强区第23名:江苏苏州市吴中区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

头号登吹等你来!adidas哈登「UNO FEST」线下狂欢,20张门票随机送!

头号登吹等你来!adidas哈登「UNO FEST」线下狂欢,20张门票随机送!

  詹姆斯·哈登2025中国行即将正式拉开序幕!8月2日,哈登本人将空降广州,开启adidas 「UNO FEST」大型球迷派对。这不止是一场见面会,更是一次属于信徒的朝圣。...

DeepSeek母公司员工套取上亿元被抓,幻方量化称为个人行为

DeepSeek母公司员工套取上亿元被抓,幻方量化称为个人行为

  近日,国内顶级量化私募机构幻方量化陷入一场牵涉金额高达1.18亿元的返佣案件。此案涉及幻方量化市场总监李橙,时间跨度长达六年。案件曝光后,幻方量化作为大模型DeepSeek的母公司,其...

调查 爆火仅半年,DeepSeek在银行业已“泯然众模型”?三大障碍成为拦路虎

调查 爆火仅半年,DeepSeek在银行业已“泯然众模型”?三大障碍成为拦路虎

  今年1月20日,DeepSeek发布了媲美OpenAI o1的R1模型,引发市场高度评价并带动国内众多行业追捧。   如今半年时间刚刚过去,银行业对昔日爆火的Deep...