当前位置:首页 > Deepseek最新资讯 > 正文内容

华为和DeepSeek手拉手迈出一大步

2个月前 (09-19)Deepseek最新资讯202

  9月18日,上海举行的华为全联接大会(HC大会)上,华为轮值董事长徐直军一上台,就提起了年初由DeepSeek引起的这场全民狂欢。

  “从今年春节开始到4月30日,经过多团队的协同作战,终于使昇腾(Ascend)910B/910C的推理能力达成了客户的基本需求。”徐直军说到,DeepSeek横空出世吼,一时间众多政府机构、央企响应接入DeepSeek,作为算力提供商,华为也必须跟进响应。

  华为自2018年首次发布昇腾310芯片、2019年推出昇腾910芯片以来,持续投入AI基础算力的研发与创新。虽然DeepSeek开创的模式大幅减少了算力需求deepseek,但徐直军认为,要走向AGI和物理AI,华为认为,算力,过去是、未来也将继续是人工智能的关键。

  其中,昇腾950系列包含两颗芯片:950PR和950DT,950PR将于2026年一季度上市,950DT将于2026年四季度上市。

  与上一代相比,昇腾950在多个方面实现根本性技术提升:新增支持FP8/MXFP8/HIF8、MXFP4等低精度数据格式,算力分别达到1 PFLOPS和2 PFLOPS,大幅提升训练与推理效率;大幅提升向量算力,支持更精细粒度内存访问;互联带宽提升2.5倍,达到2TB/s;并搭载自研HBM技术HIBL1.0和HIZQ2.0。

  在通算领域,华为规划了鲲鹏950与鲲鹏960,分别将于2026年第四季度和2028年第一季度上市,围绕支持超节点和更多核、更高性能持续演进。

  此外,华为正式发布了面向超节点的互联协议——灵衢,并开放灵衢2.0技术规范。自2019年开始研究,灵衢1.0已开启商用验证,如今灵衢2.0的开放,旨在邀请产业界基于灵衢研发相关产品和部件,共建灵衢开放生态。

  由于国际政治等复杂原因,徐直军也在发布会上直言,华为单片芯片的算力表现比不过英伟达,“但华为有三十年在连接技术的积累,华为的超节点计算机,能做到世界上算力最强,满足全世界在AI训练推理上的巨大需求。”

  超节点(SuperPod)是眼下是智算发展的重要趋势。徐直军认为,超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。

  在具体的超节点业务进展上,华为发布了Atlas 950 SuperPoD和Atlas 960 SuperPoD。其中基于昇腾950芯片的Atlas 950超节点支持8192卡规模,由128个计算柜和32个互联柜组成,占地面积约1000平方米,FP8算力达8EFlops,FP4算力达16EFlops,互联带宽高达16 PB,相当于当前全球互联网总带宽的10倍以上。

  昇腾950超节点将于2026年第四季度上市,徐直军强调,Atlas 950超节点将是2026~2028年间全球算力最强的AI超节点。

  而另外的Atlas 960超节点,支持15488卡,由176个计算柜和44个互联柜组成,算力、内存和带宽在Atlas 950基础上再度翻番,计划于2027年四季度上市。

  徐直军特别提到,超节点的价值不仅限于制造、通信和计算等传统业务领域。在互联网产业广泛应用的推荐系统方面也有重要作用。华为基于泰山950和Atlas 950可构建混合超节点,为下一代深度推荐系统开创全新的架构方向。

  例如,如何实现8192卡乃至15488卡规模的可靠互联,就是行业亟待解决的技术难题。目前产业界许多已发布的超节点方案未能实现大规模部署,其核心瓶颈并非芯片本身,而是互联技术尚未成熟,具体体现是两方面的挑战:

  一是如何做到长距离而且高可靠。大规模超节点机柜多,柜间联接距离长达1000至2000米。当前电互联技术在高速信号传输时距离受限,最多仅支持两个机柜互联;而光互联技术虽能满足长距离连接需求,却无法达到单一计算机系统所要求的高可靠性。

  二是如何实现超大带宽与超低时延。当前跨机柜卡间互联带宽与超节点需求存在5倍以上差距,时延最好仅能达到3微秒左右,与Atlas 950/960设计目标仍有24%的差距。在时延已逼近物理极限的情况下,每0.1微秒的提升都极具挑战。

  首先,为了解决长距离且高可靠问题,华为在互联协议的物理层、数据链路层、网络层、传输层等每一层都引入了高可靠机制;同时在光路引入了百纳秒级故障检测和保护切换,当出现光模块闪断或故障时,让应用无感;并且,华为重新定义和设计了光器件、光模块和互联芯片。这些创新和设计让光互联的可靠性提升100倍,且互联距离超过200米,实现了电的可靠和光的距离。

  其次,为了解决大带宽且低时延问题,华为突破了多端口聚合与高密封装技术,以及平等架构和统一协议,实现了TB级的超大带宽,2.1微秒的超低时延。

  “正是因为一系列系统性、原创性的技术创新,我们才攻克了超节点互联技术,满足了高可靠、全光互联、高带宽、低时延的互联要求,让大规模超节点成为了可能。”徐直军说到。原文出处:华为和DeepSeek手拉手迈出一大步,感谢原作者,侵权必删!

标签: deepseek

“华为和DeepSeek手拉手迈出一大步” 的相关文章

Deepseek母公司幻方量化返佣门:6年1亿佣金黑洞,牵出招商证券财富管理部原

Deepseek母公司幻方量化返佣门:6年1亿佣金黑洞,牵出招商证券财富管理部原

  相较于主动管理的权益产品,量化私募最明显的特征就是短线交易频繁,大量交易通过博取时间差获得收益,虽然单笔收益不高,但是巨量高频交易过程中,也产生巨额利润。在高频策略还未被监管降频降速的...

与DeepSeek梁文锋并肩!佛山女企业家跻身《财富》榜单

与DeepSeek梁文锋并肩!佛山女企业家跻身《财富》榜单

  8月12日,《财富》(中文版)发布“中国40位40岁以下的商界精英”榜单,榜单包括两部分,中国40位40岁以下的商界精英榜单与中国40岁以下最具潜力的商界精英榜。来自佛山的“女二代”—...

宣城市烟草专卖局创新推出采购文件智能比对工具 以数字赋能推动合规管理提质增效

宣城市烟草专卖局创新推出采购文件智能比对工具 以数字赋能推动合规管理提质增效

  在采购管理领域,一个长期存在的痛点浮出水面。《中华人民共和国招标投标法》及其实施条例明确规定,合同的主要条款应与招标文件和中标人的投标文件内容一致。然而,检查反馈显示,全市系统内还不时...

文本已死,视觉当立!Karpathy狂赞DeepSeek新模型,终结分词器时代

文本已死,视觉当立!Karpathy狂赞DeepSeek新模型,终结分词器时代

  【新智元导读】AI新突破!DeepSeek-OCR以像素处理文本,压缩率小于1/10,基准测试领跑。开源一夜4.4k星,Karpathy技痒难耐,展望视觉输入的通用性。...

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

智能体迎来“DeepSeek时刻”,为何主角是纳米AI?

  在这背后,并非其技术力量不足,而是当前的应用形态仍停留在“工具赋能”的初级阶段,大模型的潜力被束缚在碎片化场景中,未能转化为重构生产逻辑的核心动能。   正如360集...

用先进算力,为AGI加速!华为云企业快成长AI技术创新论坛南京站圆满落幕

用先进算力,为AGI加速!华为云企业快成长AI技术创新论坛南京站圆满落幕

  当前,生成式人工智能(AGI)正加速重塑商业格局,不仅推动各行业效率革命,更成为企业突破增长瓶颈的关键变量。然而,众多企业在拥抱AI的过程中仍面临战略落地难、成本高、技术门槛高等挑战。...