当前位置:首页 > DeepSeek技术交流 > 正文内容

全国高校首个!东南大学继DeepSeek又上线QwQ-32B

8个月前 (03-09)DeepSeek技术交流504

本文转自【新华日报】;

近日

东大基于昇腾国产算力平台

正式接入阿里最新开源模型QwQ-32B

成为全国首个上线QwQ-32B服务的高校

国产算力基座+头部大模型双轨融合

将为教学科研注入更强的AI动能

QwQ-32B:DeepSeek-R1的超强平替

性能比肩顶级模型

QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。

上图展示了 QwQ-32B 与其他领先模型在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)中的性能对比,QwQ-32B 表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 蒸馏模型。

低成本、易部署

模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,助力师生在科研中快速实现AI推理需求。

智能体能力革新

集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。

来源:东南大学微信公众号


“全国高校首个!东南大学继DeepSeek又上线QwQ-32B” 的相关文章

DeepSeek-V3模型悄然更新,编程数学能力更强了

DeepSeek-V3模型悄然更新,编程数学能力更强了

交汇点讯 3月24日晚间,deepseek 悄然发布一款新的大语言模型——deepseek-v3-0324。这款 641gb 大小的模型在开源平台hugging face上亮相,几乎未作任何宣传。本次...

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

学习探索DeepSeek技术 赋能青年科技创新 三明青年说在兴业银行三明分行举行

2月27日上午,由共青团三明市委、兴业银行三明分行、兴业证券三明分公司等联合举办的“三明青年说”在兴业银行三明分行举行,本次活动以“学习探索DeepSeek技术 赋能青年科技创新”为主题,吸引了团市委...

股市连续涨停板,四川金顶:未与DeepSeek开展业务合作

股市连续涨停板,四川金顶:未与DeepSeek开展业务合作

微成都报道2月19日晚间,四川金顶(600678.SH)发布股票交易风险提示公告称,在2月17日至2月19日连续3个交易日期间,公司股票收盘价格累计涨幅达33.13%,属于股票交易异常波动,提醒广大投...

DeepSeek,大消息!“Open Source Week”下周开启

DeepSeek,大消息!“Open Source Week”下周开启

近日,2025全球开发者先锋大会在上海开幕,众多明星AI企业和数万名开发者将参展。据悉,DeepSeek低调参与。2月23日,据媒体报道,从2025全球开发者先锋大会主办方获悉,DeepSeek参与了...

DeepSeek,重磅突发!DeepSeek官宣,今日开源代码库为DeepEP

DeepSeek,重磅突发!DeepSeek官宣,今日开源代码库为DeepEP

2月25日,DeepSeek官宣,今日开源代码库为DeepEP,它是首个用于 MoE 模型训练和推理的开源EP通信库。特点有:高效的全员沟通;节点内和节点间均支持 NVLink和RDMA;用于训练和推...

中旅国际与华为云合作接入DeepSeek满血版

中旅国际与华为云合作接入DeepSeek满血版

2月25日消息,中旅国际与华为云合作接入DeepSeek满血版大模型,打造面向文旅行业的领域大模型,推动文旅智能场景创新。据悉,华为昇腾AI云服务将在其中提供AI算力支持,将DeepSeek部署至客户...