当前位置:首页 > Deepseek最新资讯 > 正文内容

报道:DeepSeek决定使用华为人工智能芯片训练部分模型

2个月前 (08-30)Deepseek最新资讯211

  观点网讯:8月29日,据媒体报道,DeepSeek已决定使用华为的人工智能芯片来训练其部分模型,反映其正在减少对英伟达芯片的依赖。

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片deepseek。原文出处:报道:DeepSeek决定使用华为人工智能芯片训练部分模型,感谢原作者,侵权必删!

标签: deepseek

“报道:DeepSeek决定使用华为人工智能芯片训练部分模型” 的相关文章

锐评|DeepSeek迎来“Nature时刻”,中国范儿就是这么大大方方

锐评|DeepSeek迎来“Nature时刻”,中国范儿就是这么大大方方

  “同行评审”在学术界属于常见且必要的论文审查程序,为何此次《自然》单独将其提出,并以“打破空白”来高度评价DeepSeek?事实上,自ChatGPT起,全球范围内大模型发展就犹如一场“...

2025年10月deepseek排名优化推荐:市场报告与知名机构对比

2025年10月deepseek排名优化推荐:市场报告与知名机构对比

  进入2025年,生成式搜索流量已占中文互联网检索总量的47%,DeepSeek、豆包、通义千问、元宝、Kimi五家平台每日联合处理请求超18亿次。企业市场部发现,传统SEO带来的点击占...

DeepSeek驱动云端推理算力升级,四大细分领域迎发展机遇

DeepSeek驱动云端推理算力升级,四大细分领域迎发展机遇

  DeepSeek等大模型应用的爆发性增长,正强力驱动云端推理算力需求升级,产业链四大细分领域迎来发展机遇:   高性能GPU服务器、高速网络(如InfiniBand)...

百度搜索AI 助手已全量上线极速大模型 生成速度超DeepSeek V3.1版5

百度搜索AI 助手已全量上线极速大模型 生成速度超DeepSeek V3.1版5

  8月29日,百度搜索AI助手已全量上线极速大模型,其自研技术能够大幅提升搜索结果生成速度。对比DeepSeek V3.1,在效果持平情况下,生成速度是其5倍,而调用成本仅为70%。...

闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了

闹玩呢!首届大模型对抗赛,DeepSeek、Kimi第一轮被淘汰了

  在玩游戏方面,到底哪个模型最厉害?为了回答这个问题,谷歌近日发起了首届大模型国际象棋对抗赛。   这个比赛是在一个名叫「Kaggle Game Arena」的平台上进...

DeepSeek真的不行了吗

DeepSeek真的不行了吗

  这几天,“DeepSeek不行了吗”登上多个热搜的榜单。行业分析机构QuestMobile的最新数据显示,DeepSeek的月均下载量从*季度的8111.3万降至2258.9万,降幅达...