当前位置:首页 > Deepseek应用场景 > 正文内容

德国团队推出DeepSeek-R1T2模型 推理速度提升显著

1周前 (07-10)Deepseek应用场景109

近日,德国TNG Technology Consulting GmbH团队基于DeepSeek系列模型推出开源混合模型R1T2,其推理速度较DeepSeek R1-0528提升200%,引发AI领域关注。

该模型采用团队提出的“集合专家(AoE)”方法,整合DeepSeek-R1-0528、R1及V3-0324三个父模型的权重张量,在未额外微调的情况下,继承了前者的推理能力、结构化思维及简洁指令特性。据测试,其推理性能达父模型的90%~92%,输出Token量仅为后者的40%,显著降低计算成本。R1T2采用MIT许可协议,已在Hugging Face开放。该模型在数学、编程等结构化任务中表现突出,为企业级应用提供新选择。(潇栋)


“德国团队推出DeepSeek-R1T2模型 推理速度提升显著” 的相关文章

DeepSeek回答优化新路径:AI-CRO与GEO手段的深度解析

DeepSeek回答优化新路径:AI-CRO与GEO手段的深度解析

【ZOL中关村(5.530, 0.10, 1.84%)在线原创新闻】在人工智能技术迅猛发展的今天,生成式AI平台如DeepSeek、豆包、Kimi等正逐步改变用户获取信息的方式。从传统的关键词搜索到如...

DeepSeek在烟草商业公司的典型应用(附23个部门68个应用场景)

DeepSeek在烟草商业公司的典型应用(附23个部门68个应用场景)

DeepSeek在烟草商业公司的典型应用(附23个部门68个应用场景)国产大模型DeepSeek正悄然掀起一场国资央企的数字化变革浪潮。至今,据不完全统计已有50%的央企完成了DeepSeek模型的部...

中国AI企业崛起挑战美国主导地位,DeepSeek模型全球部署

中国AI企业崛起挑战美国主导地位,DeepSeek模型全球部署

随着中国人工智能企业快速崛起、拓展全球市场,美国在AI领域的主导地位正受到实质性挑战。多家跨国银行与高校开始采用中国初创企业DeepSeek和阿里巴巴等开发的大语言模型作为美国产品的低价替代方案。包括...

国网长乐区供电公司:开展DeepSeek办公节能增效培训

国网长乐区供电公司:开展DeepSeek办公节能增效培训

近日,国网长乐区供电公司联合长乐区总工会开展“DeepSeek办公节能增效”专题培训。活动邀请福建省数字经济促进会人工智能专业委员会副主任、秘书长、海峡(福州)职工创新创业创造中心特聘AI导师黄进授课...

多地政务系统接入DeepSeek

多地政务系统接入DeepSeek

来源:澎湃新闻综合据微信公众号“中国广州发布”2月16日消息,近日,广州市政务服务和数据管理局在政务外网正式部署上线DeepSeek-R1、V3 671B大模型,通过融合海量政务数据要素,大模型将丰富...

DeepSeek R1 新版幻觉最高降低 50%

DeepSeek R1 新版幻觉最高降低 50%

DeepSeek R1 新版幻觉最高降低 50%昨日,DeepSeek R1 模型正式完成小版本升级,目前版本为「DeepSeek-R1-0528」。据介绍,DeepSeek-R1-0528 仍然使用...