当前位置:首页 > DeepSeek技术交流 > 正文内容

文心大模型X1对上最新版DeepSeek V3,表现谁更好?

3个月前 (03-27)DeepSeek技术交流201

3月26日,在多个公开数据集测评中,百度最新发布的文心大模型X1,在数学、代码、推理等能力上表现优异,超越升级后的DeepSeek-V3-0324。

在数学场景中,GSM8K数据集测试后结果显示,文心X1得分95.6,DeepSeek-V3-0324得分93.6;代码生成层面,HumanEval数据集测试后结果显示,文心X1得分90.9,DeepSeek-V3-0324得分86.6;在知识推理层面,C-Eval数据集测试后结果显示,文心大模型X1得分88.6,DeepSeek-V3-0324得分85.1。

近日,DeepSeek官方宣布V3模型完成小版本升级的消息,包括推理、前端开发、中文写作、中文搜索几个方面的能力优化。

而在不久前,百度正式发布文心大模型X1,具备更强的理解、规划、反思、进化能力。文心X1由百度的慢思考技术发展而来。作为能力更全面的深度思考模型,兼备准确、创意和文采,在中文知识问答、文学创作、文稿写作、日常对话、逻辑推理、复杂计算及工具调用等方面表现尤为出色。

据悉,文心大模型X1即将上线千帆大模型平台,API调用价格为DeepSeek-R1调用价格的50%。


“文心大模型X1对上最新版DeepSeek V3,表现谁更好?” 的相关文章

京东云全面适配最新版DeepSeek模型,推理速度提升50%

京东云全面适配最新版DeepSeek模型,推理速度提升50%

央广网北京3月26日消息 近日,DeepSeek发布了模型更新——DeepSeek-V3-0324,此次升级不仅延续了DeepSeek系列“低成本、高性能”的基因,更凭借 MLA(多头潜在注意力)和...

洛江打造泉州首个接入DeepSeek卫品行业智能体

洛江打造泉州首个接入DeepSeek卫品行业智能体

 近日,洛江区工信局、数据管理局持续推进人工智能与实体经济深度融合,成功指导泉州天娇妇幼卫生用品有限公司率先实现DeepSeek私有化部署并深度融入车间生产流程,形成“问题上报-分析-解决-归档”闭环...

汇丰:DeepSeek成功或使全球重新评估中国创新能力

汇丰:DeepSeek成功或使全球重新评估中国创新能力

汇丰环球私人银行及财富管理中国首席投资总监匡正近日表示,人工智能初创公司DeepSeek的技术突破体现了中国大语言模型已迈向深度推理阶段,其创新能力引起市场高度关注,或将影响全球AI行业格局。匡正表示...

00后主播用DeepSeek直播1天卖出3.3亿元?有人用它写歌获利数万元被投诉了

00后主播用DeepSeek直播1天卖出3.3亿元?有人用它写歌获利数万元被投诉了

据海报新闻3月10日报道:3月8日,00后主播称用DeepSeek直播1天卖出3.3亿元再度引发关注。据悉,该团队早就开始用AI整理直播话术、梳理直播话术,让工作效率大大提升。据此前报道,DeepSe...

百度的后DeepSeek时代,一切为了应用

百度的后DeepSeek时代,一切为了应用

“模型有很多,但统治这个世界的是应用”,百度创始人李彦宏更直白地表达了对应用的重视。近日召开的Create2025百度AI开发者大会上,百度一口气发布了从模型到应用、生态的“九件套”,包括性能提升价格...

济宁中山公用水务率先完成DeepSeek网络安全本地化部署

济宁中山公用水务率先完成DeepSeek网络安全本地化部署

目前,济宁中山公用水务有限公司完成DeepSeek大模型的本地化部署工作,顺利接入公司自主搭建的Web应用防火墙,为公司网络安全及信息管理升级注入强大动力。DeepSeek大模型的本地化部署是公司提升...