当前位置:首页 > DeepSeek技术交流 > 正文内容

《自然》网站:中国AI模型“又一个DeepSeek时刻”

18小时前DeepSeek技术交流32

新华社伦敦7月16日电(记者郭爽)英国《自然》杂志网站16日发表文章说,中国人工智能(AI)模型Kimi K2发布后引发轰动,世界迎来“又一个DeepSeek时刻”。中国在6个月内推出第二款令人印象深刻的模型,表明这一成功并非偶然。文章摘要如下:

继今年1月DeepSeek-R1震惊世界之后,全球研究人员对中国推出的第二个强大的AI模型越来越感到兴奋。北京月之暗面科技有限公司于7月11日推出了Kimi K2。

Kimi K2在编程方面的表现尤其出色,在LiveCodeBench(一个专门用于评估大型语言模型编码能力的数据集)等测试中取得了高分。此外,Kimi K2似乎还颇具写作天赋,在一些专业测试中名列前茅。

目前,包括硅谷的开源社区等在内的AI开发者都在热议Kimi K2。官方数据显示,其总参数规模达到了万亿级别(1T),不过由于采用混合专家架构,每次任务仅动态激活320亿参数,只需调用模型中相关模块,从而有助于控制所需算力。

与DeepSeek系列模型类似,Kimi K2采用开源协议发布,允许研究人员免费下载并进行本地部署与二次开发。同时,该模型支持通过应用程序接口调用,其定价显著低于“克劳德4”等主流闭源模型。

美国艾伦人工智能研究所机器学习研究员纳坦·兰伯特说:“今年早些时候发布的DeepSeek-R1更像是AI发展轨迹中的前传,而非昙花一现。Kimi K2是全球最佳的全新开源模型。”

原标题:《《自然》网站:中国AI模型“又一个DeepSeek时刻”》


“《自然》网站:中国AI模型“又一个DeepSeek时刻”” 的相关文章

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

华为+DeepSeek,推理性能创新高!技术报告也公布出来了

金磊 发自 凹非寺量子位 | 公众号 QbitAI部署超大规模MoE这件事,国产芯片的推理性能,已经再创新高了——不仅是“英伟达含量为0”这么简单,更是性能全面超越英伟达Hopper架构!而做到这一点...

DeepSeek服务器崩了!百万用户集体“断网”,学生党崩溃

DeepSeek服务器崩了!百万用户集体“断网”,学生党崩溃

7月3日早间,国内知名AI工具DeepSeek突发大面积宕机,大量用户在社交媒体反映无法正常使用。据用户反馈,问题主要集中在无法提交提问、回复严重延迟、频繁显示"服务器繁忙"等。部...

从DeepSeek-R1看AI国产化的全球突围

从DeepSeek-R1看AI国产化的全球突围

近期,中国初创公司深度求索(DeepSeek)推出的大模型DeepSeek-R1引发全球关注。这款完全基于国产技术研发的AI产品,不仅在自然语言处理、多模态交互等领域展现出不逊于国际顶尖模型的性能,更...

DeepSeek上市了吗?如何购买股票以及未来投资潜力解析

DeepSeek上市了吗?如何购买股票以及未来投资潜力解析

在近年来快速发展的科技行业中,一家名为DeepSeek的公司逐渐走入了公众视野。DeepSeek专注于人工智能领域的研究与开发,尤其在大语言模型和生成式AI技术方面表现突出。如果你也在关注这家企业,可...

DeepSeek如何赋能政务,扬州样本来了|一线

DeepSeek如何赋能政务,扬州样本来了|一线

《科创板日报》5月3日讯(记者 黄心怡)今年以来,DeepSeek大模型火爆出圈,其如何赋能政务?《科创板日报》记者获悉,扬州市政务云率先部署“满血版”DeepSeek-R1-671B,成为江苏省内首...

医疗机构如何部署DeepSeek?这一专家共识给出参考→

医疗机构如何部署DeepSeek?这一专家共识给出参考→

近日,《医疗机构部署DeepSeek专家共识》在京发布,引起业界关注。该共识从医疗需求适配性、数据质量保障、伦理合规等5大维度提出系统性部署框架,以期为人工智能(AI)落地医疗场景提供标准化路径。该共...