当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek R2有望8月下旬发布?内部人士:不属实

14小时前Deepseek最新资讯9

  近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。

  早在今年4月deepseek,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。

  5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。

  公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

  相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

  大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。

  但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。

  在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。

  /创纪录的速度积累,美国国债总额首次超过37万亿美元!美官员:财政状况严重失衡,国会不断让情况恶化

  /600208,重大资产重组,押注靶材龙头!众擎机器人完成10亿融资,这些A股公司新进隐形持股

  /重庆银行1.5%股权将易主:重庆水投集团计划减持不超过5200万股,重庆地产集团拟最高出资5.8亿元接手原文出处:DeepSeek R2有望8月下旬发布?内部人士:不属实,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek R2有望8月下旬发布?内部人士:不属实” 的相关文章

DeepSeek引领AI创新突破:建筑设计行业技术革新深度解析

DeepSeek引领AI创新突破:建筑设计行业技术革新深度解析

  行业专家普遍觉得,跟着深度进修模型的赓续优化和硬件算力的继续提升,未来,开启了“智能设计”新期间。更标志着AI在专业设计领域的深度交融,赞助设计师实现“从草稿到成品”的高效转变。经由历...

DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待

DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待

  2025年1月20日 DeepSeek-R1 的发布,港恒生科技指大涨了一波deepseek,最高涨幅约47%原文出处:DeepSeek-R2 发布传闻牵动股市,历史表现让市场充满期待...

[流言板]曝iPhone 17 Pro要涨价:或将突破1000美元大关

[流言板]曝iPhone 17 Pro要涨价:或将突破1000美元大关

  虎扑07月31日讯 据媒体报道,当地时间7月30日,美国总统特朗普发文称,自8月1日起,美国将对来自印度的商品征收25%的关税。   分析师称,若25%的关税生效,苹...

Deepseek推荐全国旅游百强区第19名:湖南长沙市岳麓区

Deepseek推荐全国旅游百强区第19名:湖南长沙市岳麓区

  日前,全国县镇发展研究课题组、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》deepseek,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...

卓易信息:公司目前在国内使用对接的是经过数据集微调的Qwen系列大模型以及Dee

卓易信息:公司目前在国内使用对接的是经过数据集微调的Qwen系列大模型以及Dee

  近期claude4.10已经发布,chatgpt5也即将发布,贵司的IDE产品是否会与上述大模型合作并受益?尊敬的投资者,您好!公司目前在国内使用对接的是经过我们数据集微调的Qwen系...

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

DeepSeek-R2突传重磅!云计算ETF汇添富(159273)大涨超2%,连

  消息面上,Eventbrite平台出售DeepSeek-R2门票,窗口期为8月16日至8月31日,但具体日期尚未官宣。Eventbrite是美国知名在线活动策划服务平台,主营业务为在线...