当前位置:首页 > DeepSeek技术交流 > 正文内容

《自然》网站:中国AI模型“又一个DeepSeek时刻”

4个月前 (07-17)DeepSeek技术交流282

新华社伦敦7月16日电(记者郭爽)英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:

继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出的第二个强大的AI模型越来越感到兴奋。北京月之暗面科技有限公司于7月11日推出了Kimi K2。

Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。

目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

与DeepSeek系列模型类似,Kimi K2采用开源协议发布,允许研究人员免费下载并进行本地部署与二次开发。同时,该模型支持通过应用程序接口调用,其定价显著低于“克劳德4”等主流闭源模型。

美国艾伦人工智能研究所机器学习研究员纳坦·兰伯特说:“今年早些时候发布的DeepSeek-R1更像是AI发展轨迹中的前传,而非昙花一现。Kimi K2是全球最佳的全新开源模型。”

原标题:《《自然》网站:中国AI模型“又一个DeepSeek时刻”》


“《自然》网站:中国AI模型“又一个DeepSeek时刻”” 的相关文章

车企扎堆接入DeepSeek,真有用还是纯噱头?

车企扎堆接入DeepSeek,真有用还是纯噱头?

今年春节前后,一场围绕DeepSeek展开的“AI风暴”席卷汽车行业。《消费者报道》统计发现,截至2月20日,已有20余家车企和品牌宣布与DeepSeek深度融合,包括吉利、奇瑞、长安、上汽、东风、广...

DeepSeek算力需求暴降,为什么全球算力竞赛反而更疯狂了?

DeepSeek算力需求暴降,为什么全球算力竞赛反而更疯狂了?

春节期间,国产大模型DeepSeek-R1的横空出世,一度让人们看到了“降本增效”的曙光。DeepSeek-R1以更低的成本和算力需求,实现了世界一流的模型性能,打破了大模型领域“烧钱买芯片”的传统路...

DeepSeek最新预警:5大HR高危岗位名单曝光!第1个淘汰率突破85%…

DeepSeek最新预警:5大HR高危岗位名单曝光!第1个淘汰率突破85%…

“不是所有HR都会被淘汰,但固守传统工作模式的从业者注定出局。”‌晚上8点,李婷关掉电脑,揉了揉发酸的眼睛。作为一家中型企业的招聘专员,她刚刚结束今天的第20场初面——从早上9点到现在,她机械地重复着...

韩代表团探寻DeepSeek诞生秘密

韩代表团探寻DeepSeek诞生秘密

韩代表团探寻DeepSeek诞生秘密参考消息网7月11日报道据韩国《中央日报》网站7月8日报道,DeepSeek(深度求索)为何诞生于杭州?韩国代表团此次杭州行正是为寻找这一问题的答案而展开的。在参访...

家家都有DeepSeek服务,如何谎称速度快?

家家都有DeepSeek服务,如何谎称速度快?

原创 亲爱的数据 亲爱的数据不是人人都有“钞能力”,我们的故事,从用单节点方案部署DeepSeek-R1开始。为什么是单节点呢?因为H200单卡有140GB显存,可用单节点(8卡)方案部署。而H800...

冷知识:DeepSeek为什么好多国家要禁止?揭秘背后的原因

冷知识:DeepSeek为什么好多国家要禁止?揭秘背后的原因

近年来,DeepSeek作为一款强大的AI工具,在全球范围内广受欢迎,但同时也引发了一些争议,甚至在某些国家面临限制或禁止。为什么会出现这种情况?这背后究竟隐藏着哪些原因?1. 数据隐私与合...