当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek-R1登上《自然》封面,AI大模型从“黑箱”走向透明

2个月前 (09-19)Deepseek最新资讯181

  9月17日深夜,今年1月引发全球轰动的开源AI大模型DeepSeek-R1,在经过8个多月严格的同行评审之后,登上国际顶尖学术期刊《自然》杂志封面,成为全球首个经过同行评审的大语言模型。此前,主流大模型通常采用一套不同于学术界的成果发布方式:开直播,在预印本网站和官方技术博客上发布突破性成果,同时在测评榜上拿下高分,以证明各自的技术优势。年初,DeepSeek-R1的业界影响力也是由此而来。近年来,人工智能,特别是大语言模型,正以惊人的速度和一种近乎“黑箱”的方式发展。此次,DeepSeek团队在《自然》杂志上发表论文,无疑打破了行业惯例。对此,多位专家表示,此举意味着“野蛮生长”的大模型正在向更为透明、可复现的方向发展,同时也意味着人工智能正努力融入更广泛的科学社区,为AI与其他领域的融合打通更多壁垒。

  这篇由梁文锋担任通讯作者的论文披露了DeepSeek-R1更多训练细节,包括29.4万美元的超低训练成本,并正面回应了模型发布之初的蒸馏质疑。实际上,这篇关于DeepSeek-R1的论文早今年1月就以预印本形式发表在arXiv平台上deepseek。此次论文正式发表前,经历了8名同行评审,并在他们的反馈下作了许多修改、完善和补充,论文的清晰度、可信度和完整度得到进一步提升。自今年1月在全球最大开源AI社区Hugging Face发布以来,DeepSeek-R1模型已成为该平台上下载量最高的复杂问题解决类模型。截至9月18日,R1模型的预印本论文也在短短8个多月中,获得约3600次引用——在大模型领域,这是一个很高的引用数据。“DeepSeek-R1用无限强化学习、奖惩制度来提升大模型的推理能力,在业界起到了引领风潮的作用。”在浙江大学本科生院院长、人工智能研究所所长吴飞教授看来,尽管8个月的同行评审使论文更趋完善,但其最具创新性的方法并没有实质改变。吴飞注意到,这8个月间,在某些任务表现上,有些大模型已超越DeepSeek-R1,但《自然》并未选择发表那些成果,反而坚持发表这篇已在预印本平台上发表过的论文,“这是前所未见的”。过去,AlphaGo、AlphaFold等论文登上《自然》都是首发,而这篇首秀在arXiv上的论文不仅登上顶刊《自然》封面,编辑部还为此配发社论,这让吴飞感觉到AI正在改变论文发表生态——或许未来全球影响力最高的20篇论文,可能最早发表于草根平台。

  在众多业内人士看来,这次R1模型登上《自然》,除了肯定其学术价值,还标志着AI基础模型正从一个靠技术博客和“打榜”为主要评价标准的领域,迈向以方法论的科学性、可复现性和严谨验证为核心的成熟科学。

  上海科技大学信息学院助理院长屠可伟教授告诉记者,期刊发表周期至少6-12个月,会议论文则需3-6个月,这样的发表速度对AI来说太慢了。不过,在“谁都能往上发”的预印本平台arXiv上,论文质量也的确良莠不齐。屠可伟认为,R1模型通过同行评审登上《自然》,更大的意义在于,让AI获得了更广泛科学群体的关注。

  《自然》杂志在同步发表的社论中表示,当前,那些正迅速改变人类知识获取方式的主流大语言模型中,尚无任何一个经过研究期刊的独立同行评审。严格的同行评审有助于清晰呈现大型语言模型的工作原理,并帮助评估其是否能实现宣称的功能,有利于遏制人工智能行业的炒作现象。此次DeepSeek-R1打破行业惯例,让大模型朝着提升透明度的方向迈出了可喜一步。

  同时,同行评审还能增强研究的可信度,在不同群体中获得更高认可度。此外,评审还会对模型的安全性、防护机制作出要求,将推动改善目前颇受关注的数据污染、固有偏见等问题。

  屠可伟坦言,人工智能需要在更大范围与其他学科领域加速融合,而实践中面临的最大挑战就是学科隔阂,增进科学家与AI专家之间的交流极为必要。“此次R1模型登上《自然》,有助于让AI融入更大的‘科学群聊’。”

  /全国第一辆小米SU7出租车司机被同行举报、踢出司机群,吐槽他“太卷了”,本人回应:一年能省3万元

  /80后!北大副校长任羽中被查!曾是四川省文科状元!还有一位“80后”,新任财经大学副校长!

  /财经早报:美联储如约降息25个基点,特朗普再次推迟TikTok禁令执行,外交部回应2025年9月18日原文出处:DeepSeek-R1登上《自然》封面,AI大模型从“黑箱”走向透明,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek-R1登上《自然》封面,AI大模型从“黑箱”走向透明” 的相关文章

2025车网互动与信息通信融合发展专题研讨会成功召开

2025车网互动与信息通信融合发展专题研讨会成功召开

  7月25日,由中国能源研究会信息通信专业委员会主办的“2025车网互动与信息通信融合发展专题研讨会”在江苏无锡成功召开。会议通过现场参观、专题报告、专家研讨等形式,围绕车网互动政策支持...

饼香茶韵共富路

饼香茶韵共富路

  当清晨的炊烟漫过浙江省新昌县外婆坑村的古瓦木楼,“何溪女副食店”的店主何溪女正将玉米面团在圆板上擀开。擀面杖滚动的声响伴着玉米饼在电饼铛中发出的滋滋声,仿佛二十六年的光阴在缓缓流淌,而...

DeepSeek预测:里尔VS巴黎圣日耳曼!姆巴佩领衔大巴黎能否延续连胜?

DeepSeek预测:里尔VS巴黎圣日耳曼!姆巴佩领衔大巴黎能否延续连胜?

  法甲第7轮将迎来一场焦点战,里尔将在主场迎战领头羊巴黎圣日耳曼。目前巴黎圣日耳曼以5胜0平1负积15分排名榜首,而里尔则以3胜1平2负积10分排名第6。这场比赛对于双方来说都至关重要,...

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有

刚刚,全球AI百强榜发布!ChatGPT稳坐第一,DeepSeek第三,前50有

  【新智元导读】a16z最新发布「全球Top100消费级GenAI应用榜单」,AI竞争格局逐渐稳定,中国力量全面崛起,DeepSeek、豆包、夸克等多款产品跻身前十。ChatGPT依旧领...

中金:DeepSeek的突破是市场重估中国创新能力的触发因素之一

中金:DeepSeek的突破是市场重估中国创新能力的触发因素之一

  中金指出,在新的地缘形势下,以内部循环为主体、内外部循环相互促进的双循环呈现一些新的动向。内循环方面,实体经济供给改善、需求疲弱的态势持续,但股市显著上涨,主要源自风险溢价下降。金融周...

DeepSeek预测:马赛vs巴黎圣日耳曼!大巴黎能否延续不败神话?格林伍德VS

DeepSeek预测:马赛vs巴黎圣日耳曼!大巴黎能否延续不败神话?格林伍德VS

  北京时间9月22日凌晨2:45,法甲第5轮将上演重头戏——马赛坐镇韦洛德罗姆球场迎战联赛领头羊巴黎圣日耳曼。目前大巴黎以4战全胜积12分领跑积分榜,而马赛2胜2负积6分暂列第7。这场较...