当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配

  9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,据称能够有效降低计算资源消耗并提升模型推理效率。此外,DeepSeek还大幅下调了API价格,降价幅度超过50%。

  据“华为计算”微信公众号29日消息,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。

  寒武纪29日表示,已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配。依托DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。

  30日上午,海光信息在官方微信公众号宣布,其DCU实现对DeepSeek-V3.2-Exp的无缝适配+深度调优,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。

  受此消息提振,9月30日,市场早盘震荡拉升,科创50指数表现强势,其中AI芯片、华为昇腾概念表现活跃。截至下午1点30分,品茗科技涨超19%,铂科新材涨超14%,恒烁股份涨超11%,云天励飞-U、昆仑万维(维权)等跟涨。

  业界分析指出,此次软硬件“双向奔赴”的意义远超单点技术突破deepseek,标志着国产AI生态从“可用”向“好用”演进,通过芯片与模型的联合创新,形成了从底层算力到上层应用的闭环。在全球AI竞争加剧的背景下,自主可控的技术链条不仅降低了对外部供应链的依赖,也为行业提供了更具竞争力的软硬件一体化解决方案。

  国泰海通证券表示,大模型与生成式AI正快速从云端走向消费终端,各巨头加紧构建软硬件一体的AI生态:短期有望提升产品附加值和用户黏性,长期看谁能率先打造出“AI+硬件”的杀手级应用,谁就能在下一波计算平台竞争中占得先机。这也将成为资本市场衡量科技公司成长性的关键指标。原文出处:DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek新模型上线,昇腾、寒武纪、海光等宣布适配” 的相关文章

张成教练:樊振东一年没跟队训练,还那么厉害

张成教练:樊振东一年没跟队训练,还那么厉害

  肌肉记忆了属于是,一阶段第一场对徐瑛彬的时候,还各种失误出台,明显手还是生了不少,后边手感就越来越好了,真就是以赛代练了   肌肉记忆了属于是,一阶段第一场对徐瑛彬的...

您的AI智能工作台已升级!鸿蒙版ima率先接入DeepSeek V3.1,效率飞

您的AI智能工作台已升级!鸿蒙版ima率先接入DeepSeek V3.1,效率飞

  8月21日DeepSeek正式发布V3.1并宣布开源。鸿蒙版ima第一时间接入了DeepSeek-V3.1deepseek,为用户带来更强大、更智能的AI使用体验。...

华为昇腾、寒武纪宣布适配DeepSeek最新模型

华为昇腾、寒武纪宣布适配DeepSeek最新模型

  V3.2-Exp在V3.1-Terminus的基础上首次引入了团队自研的DeepSeek Sparse Attention (一种稀疏注意力机制,DSA),针对长文本的训练和推理效率进...

DeepSeek V3.1: 显存带宽降50%,FP8技术推理吞吐提升2.3倍,

DeepSeek V3.1: 显存带宽降50%,FP8技术推理吞吐提升2.3倍,

  国产算力突破:DeepSeek V3.1显存带宽降50%,FP8技术推理吞吐提2.3倍;2025年市场规模破200亿,国产芯片渗透率30%deepseek。原文出处:DeepSeek...

砸数万元将产品植入Deepseek,AI还能被骗多久?

砸数万元将产品植入Deepseek,AI还能被骗多久?

  为了“骗”过模型,有人每天陪AI聊天,摸透模型的脾气和规则;有人在图片里用透明字体写上诱导语,扰乱模型答案排序。   人在哪,流量就在哪,入口就在哪。2025年春节后...

达嘉维康:公司现有业务板块暂未接入DeepSeek、ChatGPT端口

达嘉维康:公司现有业务板块暂未接入DeepSeek、ChatGPT端口

  金融界8月25日消息,有投资者在互动平台向达嘉维康提问:“请问董秘,贵公司有没有应用到人工智能技术,有没有接入应用到相关的大模型,比如deepseek,chatgpt?”...