当前位置:首页 > Deepseek最新资讯 > 正文内容

国际期刊发表DeepSeek大规模推理模型训练方法 揭示AI背后的科学

2个月前 (09-18)Deepseek最新资讯167

  中新网北京9月18日电 (记者 孙自法)作为一家专注于大语言模型(LLM)和通用人工智能(AGI)技术的中国公司,DeepSeek(深度求索)今年早些时候发布的开源人工智能(AI)模型DeepSeek-R1采用的大规模推理模型训练方法,颇受关注。

  北京时间9月17日夜间,该训练方法在国际知名学术期刊《自然》上线发表deepseek,其揭示AI技术背后的科学研究表明,大语言模型的推理能力可通过纯强化学习来提升,从而减少增强性能所需的人类输入工作量。训练出的模型在数学、编程竞赛和STEM(科学、技术、工程、数学)领域研究生水平问题等任务上,比传统训练的大语言模型表现更好。

  论文通讯作者为DeepSeek创始人梁文锋,他领导的DeepSeek-AI团队表示,让AI模型像人类一样进行推理一直是难题,虽然大语言模型已显示出一些推理能力,但训练过程需要大量计算资源。通过人工提示引导可改进这类模型,促使其生成中间推理步骤,从而大为强化其在复杂任务中的表现。不过,这个方法会导致计算成本过高,并限制其扩展潜力。

  DeepSeek-AI团队介绍说,DeepSeek-R1包含一个在人类监督下的深入训练阶段,以优化推理过程。该模型使用了强化学习而非人类示例来开发推理步骤,从而减少了训练成本和复杂性。DeepSeek-R1在被展示优质的问题解决案例后,会获得一个模板来产生推理过程。这一模型通过解决问题获得奖励,从而强化学习效果。

  在评估AI表现的数学基准测试中,DeepSeek-R1-Zero和DeepSeek-R1得分分别为77.9%和79.8%。此外,该模型在编程竞赛及研究生水平的生物学、物理和化学问题上同样表现优异。

  《自然》同期发表国际同行专家的“新闻与观点”文章指出,当前版本的DeepSeek-R1有一些能力限制,希望能在未来版本中得到改进。例如,该模型有时会混合语言,目前只针对中文和英文做了优化;它对提示词也很敏感,需要精心设计的提示词工程,在某些任务上没有展现出明显提升,例如软件工程任务。

  DeepSeek-AI团队总结认为,未来研究可以聚焦优化奖励过程,以确保推理和任务结果可靠。(完)原文出处:国际期刊发表DeepSeek大规模推理模型训练方法 揭示AI背后的科学,感谢原作者,侵权必删!

标签: deepseek

“国际期刊发表DeepSeek大规模推理模型训练方法 揭示AI背后的科学” 的相关文章

DeepSeek预测:巴列卡诺vs巴塞罗那!巴萨火力全开,亚马尔能否延续神勇?

DeepSeek预测:巴列卡诺vs巴塞罗那!巴萨火力全开,亚马尔能否延续神勇?

  2025-26赛季西甲联赛第3轮,巴列卡诺将在主场迎战巴塞罗那。目前,巴塞罗那以2战全胜积6分的战绩排名联赛第2,而巴列卡诺则以1胜1负积3分排名第8。这场比赛对于双方来说都至关重要,...

Deepseek母公司幻方量化返佣门:6年1亿佣金黑洞,牵出招商证券财富管理部原

Deepseek母公司幻方量化返佣门:6年1亿佣金黑洞,牵出招商证券财富管理部原

  相较于主动管理的权益产品,量化私募最明显的特征就是短线交易频繁,大量交易通过博取时间差获得收益,虽然单笔收益不高,但是巨量高频交易过程中,也产生巨额利润。在高频策略还未被监管降频降速的...

华泰证券:DeepSeek-V3.1发布,国产算力链迎来高景气

华泰证券:DeepSeek-V3.1发布,国产算力链迎来高景气

  研报表示,Deepseek官方发布DeepSeek-V3.1版本,采用UE8M0 FP8精度参数,能效高、动态范围大、能避免信息损失。该精度参数是针对即将发布的下一代国产芯片设计,国产...

中外对话

中外对话

  “星火·医疗”依托全栈 AI 能力与医疗可托数据办事底座,改动监察法,展现出强盛的用户转化能力与生态黏性。制造业领域外资准入限定办法实现“清零”;习总出席中心城市事情会议并揭橥首要讲话...

DeepSeek商标在多国被抢注!这场活动提醒企业出海需要注意……

DeepSeek商标在多国被抢注!这场活动提醒企业出海需要注意……

  企业出海既要注意别侵权,也要注意别被侵权,比如,大名鼎鼎的DeepSeek也会碰到商标在多国被抢注的问题——今天下午在徐汇区“数链空间”举行的“链通全球 扬帆出海”数字企业出海专场活动...

快递100将参加2025腾讯全球数字生态大会,“人工智能+快递物流”跨界辉映

快递100将参加2025腾讯全球数字生态大会,“人工智能+快递物流”跨界辉映

  腾讯产业互联网的年度旗舰盛会——“智·向远大 | 2025腾讯全球数字生态大会”即将于9月16-17日在深圳重磅启幕!大会将展示腾讯云最前沿的技术应用与腾讯AI 产品的最新能力,以智能...