当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324

8个月前 (03-25)Deepseek最新资讯551

3月24日晚,DeepSeek发布了模型更新——DeepSeek-V3-0324。本次更新为DeepSeek V3模型的版本更新,并非市场此前一直期待的DeepSeek-V4或R2。目前,其开源版本已上线Hugging Face。据悉,其开源版本模型体积为6850亿参数。

同日,DeepSeek在其官方交流群宣布称,DeepSeek V3模型已完成小版本升级,欢迎前往官方网页、App、小程序试用体验(关闭深度思考),API接口和使用方式保持不变。


从网友反馈的实测效果来看,V3编码能力已经接近 Claude3.7,数学能力也有提升,能像推理模型一样解题。

此前于2024年12月发布的DeepSeek-V3模型曾以“557.6万美金比肩Claude 3.5效果”的高性价比著称,其多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。但截至目前,还没有任何关于新版 DeepSeek-V3的能力基准测试榜单出现。


其后,DeepSeek于2025年1月发布了性能比肩OpenAI o1正式版的DeepSeek-R1模型,该模型在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。

2025年2月25日,市场上也曾出现DeepSeek-R2模型的发布时间或将提前的消息。路透社称,DeepSeek正在加快推出DeepSeek-R1模型的后续产品DeepSeek-R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。

综合/上海证券报、第一财经微信

来源:经济日报


“DeepSeek新消息:DeepSeek发布模型更新——DeepSeek-V3-0324” 的相关文章

Deepseek做AI视频10W+流量,保姆级教程

Deepseek做AI视频10W+流量,保姆级教程

AI视频火爆全网,教育、文化领域账号借此快速崛起。今天,破局圈友@三川将分享从文案仿写到剪辑合成的4步制作法。即使零基础,也能轻松上手。变现途径多样,广告、流量分成、收徒、带货皆可。希望各位圈友掌握A...

理想同学重磅升级!MindGPT 3.0上线:深度思考比肩DeepSeek

理想同学重磅升级!MindGPT 3.0上线:深度思考比肩DeepSeek

快科技4月18日消息,理想汽车最新宣布MindGPT 3.0正式上线,模型能力全面升级,在理想同学手机App及网页版均可免费使用。MindGPT 3.0最大的亮点就是支持了深度思考,性能对标DeepS...

DeepSeek提示词编写技巧(高质量典藏版)

DeepSeek提示词编写技巧(高质量典藏版)

“为什么别人用DeepSeek 2分钟搞定周报,你却折腾半小时?为什么别人用DeepSeek分分钟生成精美图表,你还在手动调格式?为什么DeepSeek在别人手里是‘外挂’,到你这就成‘人工智障’?”...

科技对话历史! 甘肃简牍博物馆导览AI机器人接入DeepSeek大模型

科技对话历史! 甘肃简牍博物馆导览AI机器人接入DeepSeek大模型

3月28日,记者获悉,甘肃简牍博物馆馆内导览AI机器人“小简”“小牍”正式接入DeepSeek大模型,提升AI机器人在复杂场景中的交互能力。这一创新举措标志着甘肃省文博领域在数字化、智能化方向迈出重要...

华阳集团:DeepSeek部署有效提升研发效率和生产力

华阳集团:DeepSeek部署有效提升研发效率和生产力

中证报中证网讯(王珞)2月18日,华阳集团微信公众号发文表示,公司自研的软件开放平台已接入DeepSeek的API接口,公司的研发系统已初步完成了对DeepSeek的部署,有效提升了研发效率和生产力。...

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

随着国产AI公司深度求索的大模型DeepSeek爆红,各类仿冒网站也层出不穷,带来安全隐患。2月6日,澎湃新闻记者从奇安信XLab实验室方面获悉,仿冒DeepSeek的网站、钓鱼网站已经超过2000个...