当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek -V3.1让国产算力迎新机遇

17小时前Deepseek最新资讯40

  DeepSeek方面称,本次升级包含以下主要变化:混合推理架构让一个模型同时支持思考模式与非思考模式;相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案,让模型拥有更高的思考效率;通过Post-Training优化,让新模型有更强的Agent能力,在工具使用与智能体任务中的表现有较大提升。

  据悉,官方App与网页端模型已同步升级为DeepSeek-V3.1。用户可以通过“深度思考”按钮,实现思考模式与非思考模式的自由切换。

  就此,速途研究院院长丁道师告诉《中国经营报》记者,这次版本的升级,性能更强大了,更好用了。但核心还不是这些升值,而是针对国产芯片的优化,这个才是重中之重。

  爱分析首席李喆告诉本报记者,V3.1版本融合了大语言模型和推理模型,做了Agent适配和国产芯片适配。整体来看,模型能力本身没有大提升,主要是工程化方面做了很多优化,更适合在模型之上开发各类应用。

  丁道师认为,英伟达芯片不安全了,我们就要开启国产化了,在这个背景下,DeepSeek进行了这次大升级。“所以说要把这些背景全部结合起来看,才能一目了然看到这一次升级的本质,就是说现在我国大模型人工智能产业要实现自主可控,要不被美国的产品卡脖子,我们就需要在模型、芯片、算法等多个层面实现自主突破,这样就能理解此次DeepSeek的升级,以及华为芯片的升级之所以备受关注的原因所在了,这背后是整个国家战略的支撑。”

  据了解,DeepSeek宣布其新一代模型DeepSeek-V3.1采用了UE8MO FP8 Scale参数精度,该模型与UE8M0FP8动态范围大,提升稳定性与效率,适配华为昇腾等芯片,实现“低卡高能”部署,带动全产业链发展。在政策推动下,其与昇腾组合切入关键领域,打破垄断,对国产算力及AI产业发展意义重大。

  根据中研网预测,2025年中国AI算力市场达1200亿元。华西证券表示,DeepSeek-V3.1通过技术迭代带动芯片、服务器和云服务的联动优化。国产算力链条呈现出“外部受阻、内部加速”的格局,标志着中国大模型生态正在进入自主化与规模化并进的新阶段。

  近日,硅谷顶级风投a16z发布了新一期的AI应用百大榜单。ChatGPT依旧稳坐第一,但这个宝座越来越不稳固了。Google的Gemini用户数已经追到它的一半,它俩现在是两大顶级的新一代人工智能平台。

  马斯克的Grok靠着一款二次元虚拟伴侣Ani,硬是从0发展到2000万月活。DeepSeek在今年年初爆火后,月活跃用户出现下降,移动端下降了22%,网页端达到了40%。不过其他国产应用表现继续亮眼,移动端Top 50的应用中,预计有22款是由中国团队开发的应用。

  在前20名里,阿里的夸克、字节的豆包、月之暗面的Kimi同时上榜。其中,Kimi作为新兴创业团队的一款产品,能和ChatGPT、Gemini这些巨头产品同台竞争,已经说明了国内用户对中文大模型的强烈需求。

  “DeepSeek -V3.1的优势是继续降低了token使用量,降低使用成本。性能与效果层面,V3.1和其他基模无显著差异。后续各家基模能力上不会有特别大差别deepseek,大概率都围绕着如何降低使用成本、提升使用体验和输出稳定性方面进行不断优化。新一轮模型价格战要开始了。”李喆说。

  要论2024年国内最风光的AI明星,DeepSeek认第二,可能没人敢认第一。QuestMobile数据显示,去年一季度它的下载量冲到8111万次,相当于每16个中国人就有1人装了其APP,比当年微信刚出朋友圈还火。

  不过,后来有第三方数据显示,DeepSeek用户使用率和官网流量回落。据第一财经报道,360集团创始人周鸿祎对此表示,DeepSeek官网流量下降是因为DeepSeek没有花心思,但现在很多第三方云服务上都有DeepSeek的服务,用了DeepSeek的大模型流量一直很高。在中国,许多公司包括360智能体的基座模型等都使用DeepSeek来改,相当于很多公司的“武器装备”都是DeepSeek提供的。

  比如,Kimi K2就用了MOE架构,总参数1T,激活参数32B。另外,阿里巴巴通义千问发布新版Qwen3系列模型,包括2个MoE模型和6个dense模型,参数量从0.6B到235B。原文出处:DeepSeek -V3.1让国产算力迎新机遇,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek -V3.1让国产算力迎新机遇” 的相关文章

DeepSeek算力租赁业务估值或超百亿,北交所AI板块扩容在即

DeepSeek算力租赁业务估值或超百亿,北交所AI板块扩容在即

  据接近交易人士透露,深度求索算力租赁业务上市前估值已突破80亿元,预计发行后市值将超百亿。北交所相关负责人表示:“该企业上市将显著提升交易所科技属性,吸引更多硬科技企业关注。”...

所以说反对樊粉网暴其他队员,就是支持樊振东本人啊

所以说反对樊粉网暴其他队员,就是支持樊振东本人啊

  都current world ranking了,不需要世排吗,而且还有种子排名,不看世排看啥呢   都current world ranking了...

张骏吐槽DeepSeek过度思考致回答延迟

张骏吐槽DeepSeek过度思考致回答延迟

  #DeepSeek是很内耗的人工智能# 张骏又开启神吐槽模式!半决赛这轮他说在每次问Deepseek一些问题它都要自己盘问一番,比如你问它1+1等于几,它会先说:用户现在问我1+1等于...

DeepSeek V3.1更新:代码能力与前端审美显著提升

DeepSeek V3.1更新:代码能力与前端审美显著提升

  据悉,DeepSeek悄悄更新至V3.1版本,官方仅提及上下文长度拓展至128K。此次更新在代码能力和前端审美方面有显著提升。模型尺寸达685B,支持BF16、F8_E4M3、F32等...

加速大模型落地,浪潮信息这场沙龙探讨了DeepSeek部署

加速大模型落地,浪潮信息这场沙龙探讨了DeepSeek部署

  近日,浪潮信息在深圳举办“智算无界 探索未来”沙龙活动,10多家互联网行业头部企业的IT技术专家参与。本次沙龙活动还为互联网用户的多样化业务场景提供定制化部署建议,加速大模型技术向产业...

迈向智能体时代“第一步” DeepSeek-V3.1 发布

迈向智能体时代“第一步” DeepSeek-V3.1 发布

  新京报贝壳财经讯(记者罗亦丹)8月21日,DeepSeek在官方公号发文称deepseek,正式发布DeepSeek-V3.1。本次升级包含以下主要变化:一个模型同时支持思考模式与非思...