当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”

5个月前 (02-24)Deepseek最新资讯272

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”” 的相关文章

对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示

对话中科闻歌王磊:DeepSeek给创业者带来的震撼与启示

未来,我们可能需要构建自己的统一计算框架,一旦能够打造好,那国内的GPU芯片生态建设必将向前迈出一大步。腊月二十八那天,中科闻歌董事长王磊跟团队开会到凌晨2点,技术嗅觉敏感的他们一直在讨论DeepSe...

联想杨元庆:DeepSeek推动端侧智能部署,AI加速平民化

联想杨元庆:DeepSeek推动端侧智能部署,AI加速平民化

2月20日下午,在联想发布2024/25财年第三财季业绩后的媒体采访上,DeepSeek成为大家口中的高频词。“DeepSeek深远的影响力证明了一个大方向:人工智能不是只在云上,也以更高效的模式、跟...

企业微信接入DeepSeek,可一键生成24小时“智能助理”

企业微信接入DeepSeek,可一键生成24小时“智能助理”

2月21日,上游新闻记者从腾讯了解到,今日企业微信新版本上线,正式发布“智能机器人”、“智能表格-客户跟进总结”等AI功能,灰度接入满血版DeepSeek-R1大模型。企业可一键创建基于内部知识库的专...

天融信:公司已发布DeepSeek安全智算一体机

天融信:公司已发布DeepSeek安全智算一体机

新京报贝壳财经讯 3月1日,天融信在互动平台表示,公司已发布DeepSeek安全智算一体机,融合“计算、存储、网络、安全、智能”五大能力,为客户提供高性能、安全可靠的一体化智算中心建设方案。...

DeepSeek创始人梁文锋,首登全球富豪榜

DeepSeek创始人梁文锋,首登全球富豪榜

3月27日,胡润研究院发布《2025胡润全球富豪榜》,今年40岁的DeepSeek创始人梁文锋第一次上榜,小米集团56岁的雷军成为财富增长最快的中国企业家。在AI领域,梁文锋和OpenAI 39岁的S...

长城汽车新增“DeepSeek概念”

长城汽车新增“DeepSeek概念”

2025年4月18日,长城汽车(601633)新增“DeepSeek概念”。据同花顺数据显示,入选理由是:根据2025年4月17日互动易:DeepSeek demo 已完成上车验证,融入到长城汽车自研...