当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

8个月前 (03-25)Deepseek最新资讯552

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

Manus引爆智能体复现潮,DeepSeek已被整合

Manus引爆智能体复现潮,DeepSeek已被整合

Manus背后公司名为“蝴蝶效应”,真的带火了整个智能体赛道:开源复现潮出现了,商业闭源产品也卷起来了。‍‍‍目前进度最快的两个项目,都是在Manus发布的第0天就发布了复现代码。除了之前介绍的Ope...

深圳市全面启用DeepSeek 开启政务智能化加速升级之门

深圳市全面启用DeepSeek 开启政务智能化加速升级之门

新华社客户端深圳2月16日电 随着近期DeepSeek开源模型的发布,人工智能建设应用模式正在发生重要跃变。2月16日,深圳市基于政务云环境面向全市各区各部门正式提供DeepSeek模型应用服务,实现...

DeepSeek R1×AI论文生成实测:10分钟3万字+10%查重率|学术写作4.0工具

DeepSeek R1×AI论文生成实测:10分钟3万字+10%查重率|学术写作4.0工具

写论文这件事,简直就是人类的一场智商大逃杀!熬夜写作、疯狂文献综述、查重率如同悬崖边的舞蹈……尤其是当导师一句再修改一下丢过来时,内心直接崩溃成碎片。说实话,论文压力大的时候,我都怀疑自己是不是被学术...

西安高新区DeepSeek场景应用赋能企业高质量发展

西安高新区DeepSeek场景应用赋能企业高质量发展

近日,西安高新区工信局、企业党委“党建+企业会客厅”活动在都市之门成功举办。活动聚焦“向‘新’而行,求‘质’增效——DeepSeek场景应用赋能企业高质量发展”主题,重点破解企业数字化转型中面临的难题...

中国电信助力泗县人民医院接入DeepSeek 智慧医疗扬帆起航

中国电信助力泗县人民医院接入DeepSeek 智慧医疗扬帆起航

3月1日,中国电信安徽泗县分公司携手泗县人民医院,将DeepSeek本地化部署智能医疗系统正式接入该医院,标志着该医院在智慧医疗领域迈出了重要一步。DeepSeek的引入将全面提升医院的诊疗效率、患者...

DeepSeek+昇腾云技术创享会重庆站成功举办

DeepSeek+昇腾云技术创享会重庆站成功举办

2月27日,以“山城论道 智链未来”为主题的“探秘DeepSeek行业影响暨华为云昇腾云技术创享会”在重庆成功举办。活动现场,政府代表、行业专家、企业决策者及技术开发者等300余人齐聚一堂,围绕人工智...