当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

3个月前 (03-19)Deepseek应用场景177

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

立昂技术:立昂领算云平台已上架最新版DeepSeek-R1 660B推理模型

立昂技术:立昂领算云平台已上架最新版DeepSeek-R1 660B推理模型

  同花顺(300033)金融研究中心04月29日讯,有投资者向立昂技术(300603)提问, 董秘您好,公司跟deepseek有合作吗?请给投资者介绍下,谢谢!  公司回答表示,尊敬的投资者,您好,...

贵州高速集团全面接入DeepSeek大模型

贵州高速集团全面接入DeepSeek大模型

近日,贵州高速集团接入DeepSeek人工智能大模型,通过“自主可控+开源协同”双引擎驱动,完成高速集团自研“贵高智通”大模型的开发,实现数智化转型的阶段性突破,推动智慧交通、物流规划及数据应用三大提...

DeepSeek你不要太爱普洱了

DeepSeek你不要太爱普洱了

今年春节中国AI公司深度求索开发的大模型DeepSeek火爆“出圈”今天让我们以“旅居”角度对话DeepSeek去看看它眼中旅居普洱是什么样的吧DeepSeek笔下的普洱对话DeepSeek解锁旅居普...

腾讯理财通接入DeepSeek-R1模型满血版

腾讯理财通接入DeepSeek-R1模型满血版

2月20日,经济观察网获悉,腾讯理财通正式接入DeepSeek-R1模型满血版,同时支持腾讯混元大模型。用户下载腾讯理财通App,首页点击搜索框或股票行情入口即可体验。此前腾讯理财通已上线AI(人工智...

中国电信新疆公司深挖DeepSeek融合应用 AI加“数”构筑智算服务新高地

中国电信新疆公司深挖DeepSeek融合应用 AI加“数”构筑智算服务新高地

“自从上线AI客服,依托DeepSeek大模型的强大语义理解能力,不仅能快速响应,精准解答,还能俄语、哈萨克语、维吾尔语等多语种对话,办事效率高多了。”霍尔果斯政务平台工作人员说。霍尔果斯市是“一带一...

怎么恢复误删的 DeepSeek 模型?

怎么恢复误删的 DeepSeek 模型?

怎么恢复误删的 DeepSeek 模型?要恢复误删的 DeepSeek 模型,可以尝试以下步骤:检查版本历史:打开 DeepSeek 界面,查找右上角的时间钟图标,点击进入。在这里,你可以看到之前所有...