当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

4个月前 (03-25)Deepseek最新资讯357

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

PPIO 上线 DeepSeek-Prover-V2-671B

PPIO 上线 DeepSeek-Prover-V2-671B

4月30日,DeepSeek 在 Hugging Face 开源了 DeepSeek-Prover-V2-671B 新模型。作为一站式 AIGC 云服务平台,PPIO派欧云在第一时间上线了 DeepS...

400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署

400亿参数大模型:分布式算力,DeepSeek架构,3090单卡部署

闻乐 发自 凹非寺量子位 | 公众号 QbitAI打破科技巨头算力垄断,个人开发者联手也能训练超大规模AI模型?Nous Research宣布推出Psyche Network,可以将全球算力整合起来训...

创力集团:正在积极探索设备接入DeepSeek相关技术或平台

创力集团:正在积极探索设备接入DeepSeek相关技术或平台

e公司讯,创力集团(603012)2月18日在互动平台表示,公司正在积极探索设备接入DeepSeek相关技术或平台。公司研发团队在AI算法优化、数据处理及自动化控制等领域有丰富经验,利用DeepSee...

华阳集团:DeepSeek部署有效提升研发效率和生产力

华阳集团:DeepSeek部署有效提升研发效率和生产力

中证报中证网讯(王珞)2月18日,华阳集团微信公众号发文表示,公司自研的软件开放平台已接入DeepSeek的API接口,公司的研发系统已初步完成了对DeepSeek的部署,有效提升了研发效率和生产力。...

DeepSeek单日处理量等于镇江全市公务员10年工作量,为何有争议?

DeepSeek单日处理量等于镇江全市公务员10年工作量,为何有争议?

2月19日,江苏镇江举行新闻发布会,正式宣布国产大模型DeepSeek在镇江进行本地化部署。镇江市数据局党组书记、局长周飞在会上表示,“镇江已经建成600台国产算力服务器集群,单日数据处理能力相当于全...

南京市政务云基于华为云Stack成功部署上线满血版DeepSeek-R1-671B

南京市政务云基于华为云Stack成功部署上线满血版DeepSeek-R1-671B

近期,南京市政务云基于华为云Stack成功部署上线满血版DeepSeek-R1-671B,实现了“南京+DeepSeek满血版”的人工智能政务应用一体化赋能升级。...