当前位置:首页 > Deepseek最新资讯 > 正文内容

最新的DeepSeek更新了 有网友对新版R1模型进行了测试

5个月前 (05-29)Deepseek最新资讯560

5月28日,DeepSeek在官方交流群中公布,DeepSeek R1模型已完成小版本试升级。用户可在官方网页、APP、小程序测试(打开深度思考),API接口和使用方式保持不变。DeepSeek在开源社区Hugging Face也开源了新版R1模型(R1-0528)。

有网友对新版R1模型进行了测试,并表示Deepseek-R1-0528在竞赛级编程的难度基准LiveCodeBench中的表现几乎与OpenAI的o3模型相当。

社交网络和信息网站City-data.com创始人Lech Mazur在社交媒体上表示,Deepseek-R1-0528在Extended NYT Connections基准测试中比原先的DeepSeek R1有了显著改进,分数从38.6上升到49.8。在Thematic Generation基准测试中,Deepseek-R1-0528也优于DeepSeek R1,分数从1.80变为1.74,该分数越低越好。Thematic Generation基准测试衡量各种大模型如何有效地从一小组正例和反例中推断出一个细分或特定的“主题”(类别/规则),然后在一组具有误导性的候选项中检测出哪一项真正符合该主题。

DeepSeek今年春节期间大火。3月份,DeepSeek V3模型完成小版本升级。新版V3模型借鉴DeepSeek R1模型训练过程中所使用的强化学习技术,大幅提高了在推理类任务上的表现水平,在数学、代码类相关评测集上取得了超过GPT-4.5的得分成绩。在HTML等代码前端任务上,新版V3模型生成的代码可用性更高,视觉效果也更加美观、富有设计感。在中文写作任务方面,新版V3模型基于R1的写作水平进行优化,同时提升中长篇文本创作的内容质量。


“最新的DeepSeek更新了 有网友对新版R1模型进行了测试” 的相关文章

朱民:未来18个月 中国将出现超百项“DeepSeek式突破”

朱民:未来18个月 中国将出现超百项“DeepSeek式突破”

【朱民:未来18个月 中国将出现超百项“DeepSeek式突破”】财联社6月26日电,IMF原副总裁朱民在2025年夏季达沃斯论坛期间表示,得益于庞大的工程师队伍、产业规模和消费市场,在未来18个月内...

电信科技+DeepSeek云智赋能福建漳州,让基层治理更有温度!

电信科技+DeepSeek云智赋能福建漳州,让基层治理更有温度!

AI出手,智解千千结!电信科技+DeepSeek云智赋能福建漳州,为基层工作者打造24小时在线的“智能助手”,让基层治理更有温度!...

部署智慧新赛道!DeepSeek落地吴江!

部署智慧新赛道!DeepSeek落地吴江!

在DeepSeek爆火出圈的同时,各地的本地化部署已然争相展开。日前,江苏吴江区数据局正式引入并本地化部署DeepSeek智能平台,标志着吴江在数字城市建设与人工智能技术应用领域迈出关键一步。目前,吴...

浅谈DeepSeek对于数据分析师的赋能

浅谈DeepSeek对于数据分析师的赋能

在数据驱动决策的时代,效率就是生产力。DeepSeek作为AI助手,如何帮助数据分析师解放双手、提升10-100倍效率?本文带你深入了解这一革命性工具。引言数据分析师的日常是什么?清洗数据、探索关系、...

一心堂:公司已完成DeepSeek-R1在部分场景的接入

一心堂:公司已完成DeepSeek-R1在部分场景的接入

 同花顺(300033)金融研究中心04月29日讯,有投资者向一心堂(002727)提问, 有否考虑线上接入DeepSeek-R1,向业务、员工、加盟商及合作伙伴的智能体,包括提供即时、准确的问答支持...

DeepSeek助你复试,复试秒杀!

DeepSeek助你复试,复试秒杀!

想必大家都开始准备复试了吧!今天来教大家如何深入的利用DeepSeek拿捏复试,给大家准备好指令,速来领取!一、生成系统复试学习计划向DeepSeek提供你的基础信息,如目标院校、专业、当前学习进度、...