当前位置:首页 > Deepseek最新资讯 > 正文内容

腾讯研发全新 TiG 框架:用 AI 玩《王者荣耀》,让 DeepSeek、Qw

  IT之家 10 月 4 日消息,据 decoder 今天报道,腾讯研究人员最近用《王者荣耀》游戏作为训练平台,探索如何让 AI 在游戏中学会“战略性思考”,研究全新 TiG(Think in Games)框架,

  研究团队指出,目前的 AI 模型存在明显的功能鸿沟,以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策,而语言模型虽然可以推理策略,但很难真正执行操作,为此他们研发了全新 TiG 框架,让模型在游戏中同步思考、行动。

  团队选择以《王者荣耀》游戏作为训练范本,先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动,胜负回数均衡,AI 模型们必须要在每个定义好的场景下选择最佳策略,并解释其战略缘由。

  具体来说,训练分为两个阶段,首先是在监督中学习,弄清楚这些策略的基本机制;随后通过奖励机制进行强化学习,如果行动正确能得 1 分,错误行动则得 0 分。

  随后团队测试了多种语言模型,涵盖 Qwen2.5(7B、14Bdeepseek、32B)、Qwen3-14B 模型,并使用 DeepSeek-R1 大模型作为对照组;先从 DeepSeek-R1 提炼高质量训练数据,然后使用群体相对策略优化(GRPO)技术,比较不同策略之间的优劣。

  最终经过 TiG 框架训练的模型不仅能制定行动计划,还能解释原因,例如 AI 会指出某个防御塔防守薄弱,是理想的进攻目标,但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。原文出处:腾讯研发全新 TiG 框架:用 AI 玩《王者荣耀》,让 DeepSeek、Qwen 模型学会战略性思考,感谢原作者,侵权必删!

标签: deepseek

“腾讯研发全新 TiG 框架:用 AI 玩《王者荣耀》,让 DeepSeek、Qw” 的相关文章

寒武纪适配DeepSeek、智谱模型!科创人工智能ETF大涨3.28%

寒武纪适配DeepSeek、智谱模型!科创人工智能ETF大涨3.28%

  科创人工智能ETF(589520)场内频现溢价区间,收盘资金率0.21%,显示买盘资金更为强势!伴随成交放量,   成份股方面,亚信安全领涨超10%,乐鑫科技、海天瑞...

早盘消息0820 T 链 Gen3 技术路线重塑供应链、DeepSeek 模型升

早盘消息0820 T 链 Gen3 技术路线重塑供应链、DeepSeek 模型升

  ·政策细节:工信部部长亲自出席,首次把发电企业与地方工信纳入协调,打通制造端到电站端价格传导;强调“市场化法治化”退出落后产能,收储方案7月底已达成初步共识。   价...

OPTA给出了高阶数据,西甲面对多人防守带球过人次数:维尼修斯第一 亚马尔第二

OPTA给出了高阶数据,西甲面对多人防守带球过人次数:维尼修斯第一 亚马尔第二

  其实维尼修斯最恐怖的是这赛季上半赛季,比上赛季还恐怖,60分钟制造一球,萨拉赫都被他压过去了 这是上半赛季的多边形图,只能说小熊的发挥是比上赛季和上半赛季差了 但是很多人太夸张了 什么...

146 万、丹东市公安局 DeepSeek 70B 部署大单

146 万、丹东市公安局 DeepSeek 70B 部署大单

  根据工作需要及建设符合相关数据安全要求。丹东市公安局拟采购 2 套适合中(小)场景应用的 DeepSeek 70B 运行环境。...

我武生物:公司研发人员可以借助DeepSeek等大语言模型检索相关研发信息和资料

我武生物:公司研发人员可以借助DeepSeek等大语言模型检索相关研发信息和资料

  请问人工智能对公司研发有没有帮助,比如deepseek这些应用对研发有没有帮助,请介绍一下投资者您好,公司研发人员可以借助DeepSeek等大语言模型检索相关研发信息和资料。感谢您的关...

DeepSeek分析:一台比亚迪秦实际成本及毛利,毛利率仅8%合理吗?

DeepSeek分析:一台比亚迪秦实际成本及毛利,毛利率仅8%合理吗?

  网友热议:比亚迪毛利率8%到底靠谱吗?一篇关于比亚迪秦系列车型成本分析的行业报告近日引发广泛讨论。第三方机构基于公开资料及行业数据进行模型推演,以指导价9.98万元的秦L DM-i版本...