当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

5个月前 (03-19)Deepseek应用场景258

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

中国电信、中国移动、中国联通三大运营商宣布接入DeepSeek,他们究竟要干嘛?

中国电信、中国移动、中国联通三大运营商宣布接入DeepSeek,他们究竟要干嘛?

三大运营商开始在大模型领域角力,究竟哪家实力更强一些?2025年伊始,中国电信、中国移动、中国联通三大运营商相继宣布全面接入DeepSeek,在通信与AI融合领域激起千层浪。银河证券研报指出,三大运营...

还在等DeepSeek R2?刚刚,DeepSeek R1模型小版本试升级已完成!优化了这些方面

还在等DeepSeek R2?刚刚,DeepSeek R1模型小版本试升级已完成!优化了这些方面

5月28日,DeepSeek官方宣布DeepSeek R1模型已完成小版本试升级,欢迎前往官方网页、APP、小程序测试(打开深度思考),API 接口和使用方式保持不变。关于这次试升级的内容,小编询问D...

腾讯游戏《和平精英》接入DeepSeek

腾讯游戏《和平精英》接入DeepSeek

中证报中证网讯(记者 王辉)腾讯旗下战术竞技手游《和平精英》2月21日宣布,将接入DeepSeek,为数字代言人“吉莉”注入人工智能。根据计划,2月25日将开启灰度测试,并在短期内面向全量用户开放。由...

拥抱新机遇,多家医疗企业接入DeepSeek

拥抱新机遇,多家医疗企业接入DeepSeek

近期,多家医疗企业密集宣布,公司已接入DeepSeek。互联网医疗企业称,DeepSeek可用于AI辅助诊疗、智能医疗服务等场景;医疗体检企业认为,DeepSeek可用于疾病监测、慢病管理等场景;中医...

DeepSeek声称其“推理”模型在某些基准测试上超越OpenAI的o1

DeepSeek声称其“推理”模型在某些基准测试上超越OpenAI的o1

中国 AI 实验室 DeepSeek 发布了其所谓推理模型 DeepSeek-R1 的开源版本,声称在某些 AI 基准测试上表现与 OpenAI 的 o1 相当。R1 在 AI 开发平台 Huggin...

宁夏路网中心举办DeepSeek培训 AI赋能推动智慧交通发展

宁夏路网中心举办DeepSeek培训 AI赋能推动智慧交通发展

宁夏新闻网讯(记者 胡俊)4月24日,宁夏路网监测与应急处置中心举办DeepSeek专题培训班,深化人工智能技术应用能力,推动交通行业智能化转型,以高质量党建聚力实施交通运输提质增效攻坚年。本次培训聚...