当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布新一代AI模型:推理更强,使用成本降一半

  中国人工智能开发商 DeepSeek 推出了一款实验性大型语言模型(LLM),号称在训练与推理能力上有显著提升,并能以更低的成本运行。

  总部位于杭州的DeepSeek表示,该模型采用 稀疏注意力(sparse attention) 技术,使得API(应用程序接口)调用价格可降低一半。API是企业和开发者接入AI模型的主要方式,按使用次数或调用量付费。

  DeepSeek在开发者社区 Hugging Face 上发布文章称,这款新模型是其“下一代AI产品线的重要进展”。

  随着国内外竞争日益激烈,中国科技企业正不断升级自研大模型。就在上周,巴巴推出了其迄今规模最大、功能最强的新一代旗舰模型。

  事实上,谷歌与OpenAI等国际巨头早在2019年就探索过稀疏注意力技术。OpenAI当时指出,对于超大规模输入,完整的注意力矩阵计算成本过高deepseek,而“稀疏模式”可通过只关注部分关键输入,大幅提高效率。

  DeepSeek在随新模型发布的论文中介绍称,该模型采用了 “闪电索引器(lightning indexer)” 与 “精细化的token选择机制”,确保注意力计算仅应用于最相关的token。

  值得注意的是,华为云已在周一晚间发文确认,已“快速完成”对 DeepSeek-V3.2-Exp 模型的适配工作。

  目前,DeepSeek的V3.1版本与阿里巴巴的通义千问Qwen3系列,在人工智能分析平台的全球LLM排名中位列中国前两名,仅次于OpenAI、xAI与Anthropic等国际厂商。原文出处:DeepSeek发布新一代AI模型:推理更强,使用成本降一半,感谢原作者,侵权必删!

标签: deepseek

“DeepSeek发布新一代AI模型:推理更强,使用成本降一半” 的相关文章

[韩网翻译]Faker:战胜GEN让我们重拾信心,Guma五杀被抢感觉是遭报应了

[韩网翻译]Faker:战胜GEN让我们重拾信心,Guma五杀被抢感觉是遭报应了

  虎扑7月31日讯 LCK第三赛段T1以2比0击败KT,赛后T1中单Faker选手接受韩媒xportsnews专访,原文内容翻译如下:   Faker:第一局在首次团战...

DeepSeek发布新版本模型:优化推理效率,API降价超50%

DeepSeek发布新版本模型:优化推理效率,API降价超50%

  值得注意的是,此前有不少科技博主发现,DeepSeek-V3.2新模型已上传至其HuggingFace官方页面,随后被删除,此后DeepSeek正式公告新版本的推出。...

中国AI震撼全球!DeepSeek-R1登顶《自然》封面

中国AI震撼全球!DeepSeek-R1登顶《自然》封面

  这一刻,中国科技终于站上了世界之巅! 谁能想到,全球首个经过同行评审的主流大语言模型,竟然来自中国团队?DeepSeek-R1登上国际顶级期刊《自然》封面,直接打破了欧美在AI领域的垄...

Deepseek推荐全国旅游百强区第18名:贵州贵阳市花溪区

Deepseek推荐全国旅游百强区第18名:贵州贵阳市花溪区

  日前,全国县镇发展研究课题组deepseek、天和经济研究所县镇发展研究院联合发布了2024《全国县镇发展报告》,报告评价篇对全国县市以及包含乡村人口的市辖区旅游发展水平进行了综合评价...

《财富》:2025年中国科技50强华为DeepSeek入选

《财富》:2025年中国科技50强华为DeepSeek入选

  除上述三家公司,登上榜单的还有阿里巴巴、腾讯科技、比亚迪deepseek、字节跳动、宇树科技、大疆创新、联想等。   关于华为,该榜单评价称,华为是中国最具全球竞争力...

DeepSeek发布V3.1终极版

DeepSeek发布V3.1终极版

  南方财经9月23日电,22日晚间,DeepSeek宣布DeepSeek-V3.1 已更新至 DeepSeek-V3.1-Terminus (终极)版本。新版本在保持V3.1模型原有能力...