当前位置:首页 > Deepseek最新资讯 > 正文内容

报道:DeepSeek决定使用华为人工智能芯片训练部分模型

11小时前Deepseek最新资讯29

  观点网讯:8月29日,据媒体报道,DeepSeek已决定使用华为的人工智能芯片来训练其部分模型,反映其正在减少对英伟达芯片的依赖。

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片deepseek。原文出处:报道:DeepSeek决定使用华为人工智能芯片训练部分模型,感谢原作者,侵权必删!

标签: deepseek

“报道:DeepSeek决定使用华为人工智能芯片训练部分模型” 的相关文章

乔丹当年有没有退役巡演?詹姆斯会否学他

乔丹当年有没有退役巡演?詹姆斯会否学他

  你说的是碧昂丝和jayz吧,因为吹牛老爹的事受点舆论牵连,蕾哈娜和ASAP rocky没听说受啥影响啊。   你说的是碧昂丝和jayz吧,因为吹牛老爹的事受点舆论牵连...

七夕心动预告!Cleer ARC 5 音弧为爱上色!

七夕心动预告!Cleer ARC 5 音弧为爱上色!

  七夕将至,空气中弥漫着甜蜜的气息,许多人都希望在这特别的日子里来表达专属的爱意。今年,Cleer ARC 5音弧开放式AI耳机携全新色彩惊艳登场,用“燃动红”与“幻彩银”两种极具张力的...

DeepSeek回应R2发布日期确认

DeepSeek回应R2发布日期确认

  #DeepSeek回应R2发布日期# 期盼已久的DeepSeek-R2,这次的发布消息看来是准了。   对涉及DeepSeek-R2的相关发布日期,一些媒体对此进行了...

DeepSeek掷出FP8骰子:一场关于效率、成本与自主可控的算力博弈

DeepSeek掷出FP8骰子:一场关于效率、成本与自主可控的算力博弈

  芯片指数与AI算力指数近期持续走高背后,是AI浪潮与大模型算力需求剧增下,国产替代加速与供应链多元化路径日渐成熟的趋势。而DeepSeek掷出FP8这颗 “魔力骰子”,不仅精准切中行业...

盘中必读DeepSeek-V3.1正式发布!算力股爆发,科德教育等多股涨停

盘中必读DeepSeek-V3.1正式发布!算力股爆发,科德教育等多股涨停

  8月22日,算力板块大涨,截止午市收盘,AI50指数涨超3%,顺网科技、科德教育、品高股份纷纷20CM涨停,合力泰、群兴玩具、航锦科技等多股封板。涨停个股中,科德教育值得关注。...

【新思想引领新征程】文化的力量——习近平文化思想在浙江的溯源与实践

【新思想引领新征程】文化的力量——习近平文化思想在浙江的溯源与实践

  习近平总书记高度重视文化建设,早在二十多年前,他在浙江工作时对文化就有着深刻的思考与实践,他将“加快建设文化大省”列为“八八战略”重要内容,部署实施了文化大省建设“八项工程”,为浙江文...