当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

8个月前 (02-24)Deepseek最新资讯481

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

梁文锋署名DeepSeek新论文:公开V3大模型降本方法

还有对下一代AI的期待梁文锋亲自参与的DeepSeek最新论文,来了!这一次,团队把DeepSeek-V3在训练和推理过程中,如何解决“硬件瓶颈”的方法公布了出来。具体而言,DeepSeek-V3之所...

引力传媒:公司已完成DeepSeek-R1的本地化部署

引力传媒:公司已完成DeepSeek-R1的本地化部署

每经AI快讯,有投资者在投资者互动平台提问:请问贵公司是真的已经完成deepseek本地化部署了吗引力传媒(603598.SH)2月24日在投资者互动平台表示,公司已完成DeepSeek-R1的本地化...

超200亿“弹药”来了!问了DeepSeek,如何更好配置科创板

超200亿“弹药”来了!问了DeepSeek,如何更好配置科创板

近年来,指数投资已经成为最常用的投资配置工具。科创板更是A股指数化投资比例最高的板块。根据上交所数据显示,科创板相关指数产品合计规模超2400亿元,占科创板整体自由流通市值比例为8.3%。开年以来,科...

从万元到百万元,DeepSeek一体机江湖混战

从万元到百万元,DeepSeek一体机江湖混战

DeepSeek爆火让模型平权,今年以来,市面上的DeepSeek一体机可谓五花八门,有的声称可以“跑满血”,有的称可以运行70B、32B模型;有的是量化版本,有的是全精度版本;价格也是相差甚远,从几...

拥抱AI不落伍!DeepSeek中老年人使用指南来啦

拥抱AI不落伍!DeepSeek中老年人使用指南来啦

DeepSeek作为一款本土化AI工具,不仅能解答生活疑问,更能帮助老年人融入智能时代。一起来看看DeepSeek中老年人使用指南,“银发族”也能轻松玩转DeepSeek。一、如何从零开始01下载与注...

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek 浪潮下,最强县域如何以 AI 赋能智能制造

Deepseek为何掀起全球巨浪?春节期间发布的Deepseek-R1在全球引起震动。著名风险投资家马克·安德森 (Marc Andreessen)甚至描述这是“人工智能的人造卫星时刻”——指的是20...