当前位置:首页 > Deepseek最新资讯 > 正文内容

外界热议DeepSeek低调“上新”

6个月前 (03-26)Deepseek最新资讯389

中国人工智能初创公司深度求索(DeepSeek)24日深夜低调上线了DeepSeek-V3的新版本DeepSeek-V3-0324,参数量为6850亿,在代码、数学、推理等多个方面的能力再次显著提升,甚至代码能力追平美国Anthropic公司大模型Claude 3.7。不过,外界对于DeepSeek-V3-0324的关注并不仅仅因为该版本的能力提升,而是猜测它的发布是否意味着DeepSeek更新一代的V4与R2大模型的发布不远了。在回答《环球时报》记者有关DeepSeek-V3新版本有哪些能力提升时,DeepSeek表示,一是新版本代码能力显著提升,接近Claude 3.7水平。例如,有用户在实测中发现,V3-0324能一次性生成800行无错误的网页代码,并实现动态响应式布局和交互效果。二是数学与逻辑推理能力增强。例如经典的“4升水壶问题”和数学竞赛题(如AIME 2025题目),部分表现接近专业推理模型。三是模型架构与开源生态。V3-0324采用MIT许可证,允许自由修改、分发及商业化应用,进一步降低了开发者的使用门槛。清华大学新闻学院、人工智能学院教授沈阳25日对《环球时报》记者表示,DeepSeek-V3-0324不仅是V3系列的一次迭代,更是中国AI技术崛起的又一力证。其在性能、效率和开源策略上的综合优势使其在全球大语言模型领域占据重要地位。未来,DeepSeek可能通过推理能力提升和多模态扩展来巩固技术领先优势,同时在中美竞争和社区生态中寻找平衡。沈阳认为,DeepSeek-V3-0324的发布看似是一次“小更新”,但其性能跳跃表明该团队可能在为后续重大版本(如传言中的DeepSeek-R2或V4)铺路。路透社今年2月底引述3名知情人士的说法宣称,DeepSeek原计划在今年5月初发布R2,但现在希望尽早推出,具体时间尚未透露。此外,DeepSeek希望新模型在代码生成和多语言推理方面的表现进一步提升。不过,外媒的相关传言并没有得到DeepSeek公司的证实与回应。沈阳表示,DeepSeek-V3-0324的推出进一步凸显中国AI企业在技术与成本上的竞争力。美国对华GPU出口限制可能促使中国企业加速国产硬件适配,同时其开源模式或引发西方厂商的连锁动作,例如推出更强闭源模型。2025年可能是中美AI竞争的分水岭。沈阳认为,在OpenAI公司的GPT大模型要把通用大模型和推理大模型融合在一起的背景下,外界关注包括DeepSeek在内的中国头部大模型是不是最终也会出现这种合并的趋势。“这种可能是存在的,因为对于用户来说,并不关心大模型在回应自身问题时用的是什么类型的模型,更关心大模型能不能给出更为智能、合理的参考答案。”

“外界热议DeepSeek低调“上新”” 的相关文章

DeepSeek在企业应用:解锁高效智能新篇章

DeepSeek在企业应用:解锁高效智能新篇章

DeepSeek在企业应用:解锁高效智能新篇章一、引言在数字化浪潮的推动下,企业正面临着前所未有的挑战与机遇。如何快速响应市场变化、提升运营效率、优化决策过程,成为了企业持续发展的关键。DeepSee...

DeepSeek高校上线,智能“助教”为师生深度思考赋能

DeepSeek高校上线,智能“助教”为师生深度思考赋能

国产AI大模型DeepSeek(深度求索)的风,已经吹到了高校。近日,中国人民大学、北京师范大学、北京交通大学等多所高校发布消息,表示正在探索开展有关DeepSeek的实践应用,部分高校已在自主研发的...

央国企春招开启“抢人”模式 “DeepSeek”类人才受青睐

央国企春招开启“抢人”模式 “DeepSeek”类人才受青睐

3月以来春季招聘陆续开始,据不完全统计,今年已经有超过150家央国企及其下属子公司组织开展了春季招聘活动,目前各地也举办了多场国企专项招聘会。“央企能够吸引到DeepSeek团队这类级别的人才。”AP...

DeepSeek加持的AlphaGPT,助力高文律师事务所全面拥抱AI

DeepSeek加持的AlphaGPT,助力高文律师事务所全面拥抱AI

2025年初,中国团队精心雕琢的通用大模型DeepSeek凭借其创新的架构优化以及深入的数据挖掘技术,在逻辑推理、多轮对话和知识搜索等关键领域大放异彩,其为诸多垂直领域,特别是法律行业的智能化转型,开...

中国信通院:启动DeepSeek国产化适配测试工作

中国信通院:启动DeepSeek国产化适配测试工作

中新网北京2月14日电(记者 宋宇晟)近期,DeepSeek陆续开源V3、R1系列高性能、低成本模型,人工智能软硬件协同创新重要性进一步凸显。记者从中国信息通信研究院(简称“中国信通院”)获悉,Dee...

西安举办“解码DeepSeek——大模型技术与应用主题论坛”

西安举办“解码DeepSeek——大模型技术与应用主题论坛”

2月21日,由西安市科学技术局指导,西安电子科技大学人工智能学院、西安市人工智能产业发展联盟等主办的“解码DeepSeek——大模型技术与应用主题论坛”在西安市举行。本次论坛聚焦以DeepSeek为代...