当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

5个月前 (03-03)Deepseek最新资讯315

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


标签: DeepSeek

“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

匆忙接入DeepSeek,你想好怎么收费了么?

匆忙接入DeepSeek,你想好怎么收费了么?

自从ChatGPT在全球范围引爆关注,国内外大模型接连登场,AI技术迅速从研究室走向产业一线。无论是OpenAI的GPT-4,还是国内如DeepSeek、通义千问、文心一言等产品,AI正以前所未有的速...

北京大学 | DeepSeek应用、提示词工程和落地场景(附PPT下载)

北京大学 | DeepSeek应用、提示词工程和落地场景(附PPT下载)

今天和大家分享的资料来自于北京大学DeekSeek内部研讨系列讲座,两份PPT资料“DeepSeek与AIGC应用”“DeepSeek提示词工程和落地场景”均由北京大学AI肖睿团队制作,分享给各位老师...

聚焦“DeepSeek与医疗革新”第二十三期“四季智汇”活动顺利举行

聚焦“DeepSeek与医疗革新”第二十三期“四季智汇”活动顺利举行

深圳新闻网2025年3月15日讯(记者 刘梦婷 通讯员 深卫信)3月14日,由深圳市健研数管中心主办的第二十三期“四季智汇”学术交流活动在市急救血液健研数管三中心学术报告厅举行,活动主题为“多方位剖析...

西部利得基金完成DeepSeek大模型本地化部署

西部利得基金完成DeepSeek大模型本地化部署

西部利得基金宣布,公司在数字化建设领域取得重要进展,完成了DeepSeek多个大模型的本地化部署,并搭建了公司内部AI应用平台。这一举措不仅标志着公司在智能化转型上的突破性进展,也为后续在投研、风控、...

机构调研券商!DeepSeek部署成为热点问题

机构调研券商!DeepSeek部署成为热点问题

券商股近期异动频频。券商中国记者注意到,对于上市券商的关注,除了一些合并传闻的扰动,机构投资者对长江证券、长城证券等上市券商以及券商概念股——指南针等,也展开了新一轮调研,券商布局DeepSeek的进...

deepseek能用来干啥-deepseek有什么用途

deepseek能用来干啥-deepseek有什么用途

DeepSeek是一款基于人工智能技术的工具,旨在帮助用户高效处理和分析数据、生成内容、优化工作流程等。其应用场景非常广泛,具体功能和使用场景包括但不限于以下几个方面:一、数据分析与可视化数据导入:支...