当前位置:首页 > Deepseek应用场景 > 正文内容

英伟达宣布创造满血 DeepSeek 推理世界记录

1个月前 (03-19)Deepseek应用场景112

IT之家 3 月 19 日消息,英伟达在今日举行的 NVIDIA GTC 2025 上宣布其 NVIDIA Blackwell DGX 系统创下 DeepSeek-R1 大模型推理性能的世界纪录。

据介绍,在搭载了八块 Blackwell GPU 的单个 DGX 系统上运行 6710 亿参数的满血 DeepSeek-R1 模型可实现每用户每秒超 250 token 的响应速度,系统最高吞吐量突破每秒 3 万 token。

英伟达表示,随着 NVIDIA 平台继续在最新的 Blackwell Ultra GPU 和 Blackwell GPU 上突破推理极限,其性能将会继续不断提高。

▲ 运行 TensorRT-LLM 软件的 NVL8 配置的 NVIDIA B200 GPU

单节点配置:DGX B200(8 块 GPU)与 DGX H200(8 块 GPU)

测试参数:最新测试采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

英伟达表示,通过硬件和软件的结合,他们自 2025 年 1 月以来成功将 DeepSeek-R1 671B 模型的吞吐量提高了约 36 倍。

节点配置:DGX B200(8 块 GPU)、DGX H200(8 块 GPU)、两个 DGX H100(8 块 GPU)系统

测试参数:依然采用 TensorRT-LLM 内部版本,输入 1024 token / 输出 2048 token;此前测试为输入 / 输出各 1024 token;并发性 MAX

计算精度:B200 采用 FP4,H100 / H200 采用 FP8 精度

与 Hopper 架构相比,Blackwell 架构与 TensorRT 软件相结合可实现显著的推理性能提升。

英伟达表示,包括 DeepSeek-R1、Llama 3.1 405B 和 Llama 3.3 70B,运行 TensorRT 软件并使用 FP4 精度的 DGX B200 平台与 DGX H200 平台相比已经提供了 3 倍以上的推理吞吐量提升。

英伟达表示,在对模型进行量化以利用低精度计算优势时,确保精度损失最小化是生产部署的关键。IT之家注意到,在 DeepSeek-R1 模型上,相较于 FP8 基准精度,TensorRT Model Optimizer 的 FP4 训练后量化(PTQ)技术在不同数据集上仅产生微乎其微的精度损失。


“英伟达宣布创造满血 DeepSeek 推理世界记录” 的相关文章

每日互动:已接入DeepSeek相关版本,用于业务垂直场景及研发提效

每日互动:已接入DeepSeek相关版本,用于业务垂直场景及研发提效

金融界3月17日消息,有投资者在互动平台向每日互动提问:请问公司有没有考虑向deepseek一体机方向发展。公司回答表示:公司在2024年上半年就接入DeepSeek相关版本,目前主要用于业务垂直场景...

李国杰院士“七问”DeepSeek都说了些什么?

李国杰院士“七问”DeepSeek都说了些什么?

近日,DeepSeek的横空出世,在全球科技领域激起千层浪,引发了从学界到业界的广泛热议与深度思考。《科技导报》2025年第3期刊发李国杰院士的《DeepSeek引发的AI发展路径思考》一文,深入剖析...

西安高新区DeepSeek场景应用赋能企业高质量发展

西安高新区DeepSeek场景应用赋能企业高质量发展

近日,西安高新区工信局、企业党委“党建+企业会客厅”活动在都市之门成功举办。活动聚焦“向‘新’而行,求‘质’增效——DeepSeek场景应用赋能企业高质量发展”主题,重点破解企业数字化转型中面临的难题...

躺平拿证、含金量拉满?“工信部认证DeepSeek证书”是真的吗?

躺平拿证、含金量拉满?“工信部认证DeepSeek证书”是真的吗?

本文转自【法治网】;“课程永久有效且学习灵活,学完可获得工信部认证证书!”近日,河南郑州的张先生,在被某培训机构销售人员的话术打动后,支付了6480元报考学习deepseek课程、AI课程等。该培训机...

酷狗音乐与DeepSeek达成深度合作,推出系列创新功能

酷狗音乐与DeepSeek达成深度合作,推出系列创新功能

格隆汇4月8日|据36氪,酷狗音乐宣布与人工智能公司深度求索(DeepSeek)达成深度合作,推出系列创新功能,推动音乐平台向"智慧化娱乐中枢"转型。此次升级包括每周听歌报告系统,...

Deepseek打通招聘全流程讲座在合肥智能科技园举办

Deepseek打通招聘全流程讲座在合肥智能科技园举办

3月13日,区团工委联合青企协、恒创智能公司、合肥海诚公司、智联招聘合肥分公司、合肥市工业互联网协会、合肥梦海创业孵化器管理有限公司举办Deepseek打通招聘全流程专场培训讲座,区内70余家企业的人...