当前位置:首页 > Deepseek最新资讯 > 正文内容

中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用

2小时前Deepseek最新资讯10

  8月21日,深度求索正式发布并开源DeepSeek-V3.1,采用混合推理架构,deepseek-chat对应非思考模式,deepseek-reasoner对应思考模式,且上下文均已扩展为128K。从性能来看:1)编程:V3.1在Aider编程基准测试中取得71.6%高分deepseek,“霸榜”开源模型、超越Claude Opus 4,同时推理和响应速度更快;2)SVGBench:实力仅次于GPT-4.1-mini,远超前代DeepSeek R1;3)MMLU:在多任务语言理解方面,V3.1的表现毫不逊色于GPT-5,得分达到88.5%。

  1)更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。

  2)思考效率更高效:相同性能下输出token减少,降低推理成本。根据深度求索团队测试结果,经过思维链压缩训练后,V3.1-Think在输出token数减少20%-50%的情况下,各项任务的平均表现与R1-0528持平。同时,V3.1在非思考模式下的输出长度也得到了有效控制,相比于DeepSeek-V3-0324,能够在输出长度明显减少的情况下保持相同的模型性能。

  3)持续保持API价格优势,单次编程任务仅需1.01美元,为专有系统的1/60。V3.1输入价格为0.5元/百万tokens (缓存命中) ,4元/百万tokens (缓存未命中) ;输出价格为12元/百万tokens。

  1)UE8M0 FP8精度格式具备更小带宽、更低功耗和更高吞吐的优势。根据算力豹,UE8M0采用无符号、8位指数、0位尾数的设计,在相同硬件下可降低显存需求高达75%;更适合微缩放场景,减少量化误差;更低的内存和计算需求意味着数据中心的运营成本下降。

  2)下一代国产芯片积极沿用FP8精度,有望形成国产芯片生态圈,提高算力利用率。根据通信世界,寒武纪最新一代MLU370-S4、思元590与690系列均已支持FP8计算;海光、沐曦、中昊芯英、摩尔线程等厂商均有芯片支持FP8;此外,华为昇腾虽在当前版本(910B/910C)尚未开放FP8,但路线图已明确“2025Q4原生FP8”。

  3)我们认为,UE8M0 FP8参数精度的发布,代表着国产AI正走向软硬协同阶段,能够实质性减少对英伟达、AMD等国外算力的依赖,更加凸显国产芯片在AI大时代的竞争力。

  1)国产算力:寒武纪、云天励飞、亿都(国际控股)、浪潮信息、曙光数创、超讯通信、华丰科技、神州数码、软通动力、烽火通信、广电运通、拓维信息、四川长虹;

  2)AI Agent:鼎捷数智、泛微网络、致远互联、金蝶国际、用友网络、汉得信息、赛意信息、迈富时、光云科技、税友股份、润达医疗、同花顺、恒生电子、金山办公、万兴科技、福昕软件、科大讯飞、金桥信息、卓易信息、普元软件等。原文出处:中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用,感谢原作者,侵权必删!

标签: deepseek

“中邮·人工智能周观点:DeepSeek V3.1提振国产算力和应用” 的相关文章

Deepseek推荐全国旅游百强区第23名:江苏苏州市吴中区

Deepseek推荐全国旅游百强区第23名:江苏苏州市吴中区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价,并发布了天和2...

硅谷观察:马斯克起诉苹果偏袒OpenAI,却被网友用DeepSeek打脸

硅谷观察:马斯克起诉苹果偏袒OpenAI,却被网友用DeepSeek打脸

  马斯克不爽自家Grok没有上推荐榜,炮轰苹果偏袒合作伙伴OpenAI,威胁要起诉苹果涉嫌垄断操纵应用商店,却被网友用中国应用DeepSeek光速打脸,更被自家的Grok...

DeepSeek新模型发布!港股半导体集体大涨 华虹半导体涨7%中芯国际涨6%

DeepSeek新模型发布!港股半导体集体大涨 华虹半导体涨7%中芯国际涨6%

  8月22日,港股半导体概念股集体走强,华虹半导体涨幅达到7%,上海复旦同样录得7%的涨幅,中芯国际上涨6%deepseek。这一轮上涨行情与DeepSeek新模型发布形成呼应,推动相关...

服务行业数智化,共创AI新时代 华为中国政企用户峰会2025成功举办

服务行业数智化,共创AI新时代 华为中国政企用户峰会2025成功举办

  7月24日,以“倾听·践行 服务行业数智化 共创AI新时代”为主题的华为中国政企用户峰会2025在山东青岛举办,与会的行业智库、客户和伙伴针对智能时代ICT服务的发展趋势与行业热点发表...

OpenAI发布低成本模型 与

OpenAI发布低成本模型 与

  OpenAI周二发布了自2019年推出GPT-2以来首批开放权重语言模型。这两款纯文本模型分别命名为gpt-oss-120b和gpt-oss-20b,旨在为开发者、研究人员和企业提供更...

利物浦为什么从上赛季前10轮领先能不掉链子

利物浦为什么从上赛季前10轮领先能不掉链子

  除了最后五轮确定拿冠军了,麦卡修养直接放假了,其他主力也偶尔放假,赛季中后期有拉胯的? 平一两场这种算掉链子?标准那么高?   除了最后五轮确定拿冠军了,麦卡修养直接...