当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

7个月前 (02-24)Deepseek最新资讯342

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

学烧菜、学剪视频,老年居民学用DeepSeek解锁智能生活

学烧菜、学剪视频,老年居民学用DeepSeek解锁智能生活

随着人工智能发展火热,DeepSeek问世后掀起了一股全民学习的热潮。近日,四平路街道阜新路社区睦邻中心组织开展了专门的教学活动,教老年人如何使用Deepseek并普及人工智能知识,助力老年人跨越“数...

DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此

DeepSeek引爆「万物皆可AI」时代,20余位大咖分析行业痛点,万字梳理干货在此

“DeepSeek,评价一下第三届中国AIGC产业峰会”:今年的峰会现场,20余位大咖以「万物皆可AI」为主题,激辩“技术前沿与产业痛点”:2025年中国AI应用爆发的关键是提速降费。大模型来了,万物...

联想百应智能体正式官宣引入DeepSeek

联想百应智能体正式官宣引入DeepSeek

近日,联想百应智能体正式官宣引入DeepSeek,二者的结合,将催生出前所未有的创新机遇。DeepSeek以领先的大模型技术实力和超低的训练成本火爆全球,而联想凭借在AI领域的深厚积累,迅速将联想百应...

DeepSeek是免费的吗?揭秘DeepSeek的使用方式与价值!

DeepSeek是免费的吗?揭秘DeepSeek的使用方式与价值!

标题:DeepSeek是免费的吗?揭秘DeepSeek的使用方式与价值!关键词:DeepSeek,免费,搜索工具,使用方式,功能,免费版,付费版描述:DeepSeek,作为一款全新推出的搜索工具,一直...

桦川:“调解+DeepSeek”开启基层社会治理智慧新篇

桦川:“调解+DeepSeek”开启基层社会治理智慧新篇

在基层社会治理的大棋盘上,矛盾纠纷调解是至关重要的一子。近日,桦川县综治中心创新举措,将矛盾纠纷调解工作与DeepSeek功能深度融合,成功化解多起矛盾纠纷,为基层治理难题提供了智慧解决方案,开启了基...

返利科技新增“DeepSeek概念”

返利科技新增“DeepSeek概念”

2025年4月24日,返利科技(600228)新增“DeepSeek概念”。据同花顺数据显示,入选理由是:2025年4月15日互动易,公司在线导购产品“返利”IOS版已接入DeepSeek(深度求索旗...