当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网

3小时前Deepseek最新资讯24

  :V3.1在Aider编程基准测试中取得71.6%高分,超越Claude Opus 4,同时推理和响应速度更快。

  这次最明显的变化是,DeepSeek在官方APP和网页端上,把深度思考(R1)中的「R1」去掉了。

  在MMLU多任务语言理解方面,DeepSeek V3.1毫不逊色于GPT-5。不过在,编程、研究生级基准问答、软件工程上,V3.1与之有一定的差距。

  一位网友实测,模拟六边形中小球自由落体的物理测试,DeepSeek V3.1理解力明显提升。

  相当于整本《红楼梦》正文(约80–100万字)的1/6–1/8deepseek,或者一篇超长博士论文/大部头学术专著。

  在128K上下文测试中,DeepSeek-V3.1输出速度相比以往获得较大提升,并且在工程上做了一些优化。

  整个活,给DeepSeek-V3.1上点压力,让它根据「梦」这个字,输出尽可能多的内容,尽量达到上下文极限。原文出处:DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网在蹲R2和V4,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek V3.1 Base突袭上线!击败Claude 4编程爆表,全网” 的相关文章

AlphaGo开发者创业挑战DeepSeek,成立仅一年目标融资10亿美元

AlphaGo开发者创业挑战DeepSeek,成立仅一年目标融资10亿美元

  近来中国开源模型势头火热,Qwen系列、Kimi K2等纷纷霸榜,OpenAI也在深夜宣布开源,这家公司的挑战可不小。   一方面,Meta作为美国重要的开源AI开发...

你最爱的年轻足球运动员是谁?最好偏冷门一些

你最爱的年轻足球运动员是谁?最好偏冷门一些

  我总是有一种直觉,一种对未来事物的心电感应,所以我相信我会很幸运。接下去似有什么在漫漫的灯火里盈盈扑闪,只要我日夜踏过盆地那宽厚而坚实的山坡。  ...

住建部GBT50500-2024《建设工程工程量清单计价标准》解析及DeepSe

住建部GBT50500-2024《建设工程工程量清单计价标准》解析及DeepSe

  2024年12月30日住建部正式发布《建设工程工程量清单计价标准》GB/T50500-2024,新版《清单计价标准》的出台将为工程造价精细化管理带来一场新的革命,同时也给各单位相关管理...

国产算力开芯局:沐曦发布全栈AI战略,以自主“芯”筑基智能未来

国产算力开芯局:沐曦发布全栈AI战略,以自主“芯”筑基智能未来

  7月27日上午,2025世界人工智能大会(WAIC)核心分论坛在上海世博中心盛大启幕。沐曦集成电路(上海)股份有限公司(以下简称“沐曦”)以“芯聚算力开芯局,源引AI共未来”为主题,联...

deepseek关联公司公布大语言模型部署方法专利

deepseek关联公司公布大语言模型部署方法专利

  天眼查App显示,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利近日公布。摘要显示,该发明涉及人工智能领域,有益效果在于将...

deepseek公布大语言模型部署方法专利

deepseek公布大语言模型部署方法专利

  天眼查App显示,近日,deepseek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种大语言模型的部署方法及系统”专利公布。   摘要显示,该发明涉及人...