当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

6个月前 (03-25)DeepSeek技术交流412

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

汉王科技:目前公司的电纸本全系产品已经接入Deepseek-R1和V3模型

每经AI快讯,有投资者在投资者互动平台提问:请问贵司有没有Deepseek概念?汉王科技(002362.SZ)4月10日在投资者互动平台表示,目前公司的电纸本全系产品已经接入Deepseek-R1和V...

患者带着DeepSeek来看病,医学博主自嘲“天塌了”!评论区全是经历

患者带着DeepSeek来看病,医学博主自嘲“天塌了”!评论区全是经历

本文转自【中国青年报】;“天都塌了!病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的帖子,引发网友热议。评论区中,不少...

掌趣科技:认为deepseek能助力游戏开发实现行业创新

掌趣科技:认为deepseek能助力游戏开发实现行业创新

金融界3月27日消息,有投资者在互动平台向掌趣科技提问:请问deepseek是否能助力游戏开发,从而实现行业创新,降本增效?公司回答表示:我们认为答案是肯定的。本文源自:金融界...

患者带着DeepSeek来看病,医学博主自嘲“天塌了”

患者带着DeepSeek来看病,医学博主自嘲“天塌了”

“天都塌了!病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的帖子,引发网友热议。评论区中,不少网友都表示遭遇过类似情况...

崆峒山景区正式接入DeepSeek大模型

崆峒山景区正式接入DeepSeek大模型

近日,平凉崆峒山景区正式上线了智游崆峒AI小助手,将崆峒山智慧旅游服务平台成功接入深度求索(DeepSeek)大模型,通过AI技术深度挖掘崆峒山的道源文化底蕴,为游客打造更智能、更沉浸的文旅新体验。智...

AI助教上岗啦!多所高校接入DeepSeek

AI助教上岗啦!多所高校接入DeepSeek

今年伊始,来自中国的开源AI模型DeepSeek火爆全球。这段时间,就有不少高校引入了“DeepSeek”,不仅实现了24小时答疑解惑、精准回应校园生活诉求,还大幅提升了老师的办公科研效率,智慧教学与...