当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

3个月前 (03-25)Deepseek最新资讯250

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

DeepSeek“落户”新疆,带来了什么?

DeepSeek“落户”新疆,带来了什么?

中新网乌鲁木齐3月25日电 (史玉江)在人工智能的数字化浪潮中,DeepSeek正全面“落户”新疆,在把科技魅力转化为创造力的同时,也悄然改变着人们的生活。“DeepSeek+智慧政务”广泛应用目前在...

DeepSeek R1×AI论文生成实测:10分钟3万字+10%查重率|学术写作4.0工具

DeepSeek R1×AI论文生成实测:10分钟3万字+10%查重率|学术写作4.0工具

写论文这件事,简直就是人类的一场智商大逃杀!熬夜写作、疯狂文献综述、查重率如同悬崖边的舞蹈……尤其是当导师一句再修改一下丢过来时,内心直接崩溃成碎片。说实话,论文压力大的时候,我都怀疑自己是不是被学术...

天津滨海新区多领域“拥抱”DeepSeek

天津滨海新区多领域“拥抱”DeepSeek

连日来,滨海新区数据局积极推动DeepSeek本地化部署,区内各领域、各行业启动适配应用。截至目前,国家超级计算天津中心、滨海智慧集团、天河计算机公司等结合各自业务,探索应用DeepSeek,出炉一系...

DeepSeek+水利 治水迎“智”变

DeepSeek+水利 治水迎“智”变

今年以来,随着以DeepSeek为代表的人工智能技术向垂直领域加速渗透,水利行业也迎来新一轮技术应用变革。目前,全省水利系统正积极开展“DeepSeek+水利”的相关应用,除了已经上线“DS都江堰”智...

DeepSeek杀入金融科技圈

DeepSeek杀入金融科技圈

低成本、低门槛、高效能的优势,加之开源策略支持本地私有化部署,让DeepSeek在近期席卷金融科技圈,从国有大行、互联网大厂金融科技公司到消费金融公司、第三方支付机构、上市金融科技企业纷纷宣布接入De...

从0到1,适合大学生的DeepSeek使用指南

从0到1,适合大学生的DeepSeek使用指南

最近,AI圈可谓是热闹非凡,DeepSeek横空出世,迅速成为大家热议的焦点。它究竟有何神奇之处,能在高手如云的AI领域掀起如此大的波澜?今天,就让我们一起深入了解一下。01DeepSeek到底是什么...