当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek又得了个第一

7个月前 (02-15)Deepseek最新资讯390

智东西2月14日报道,刚刚,DeepSeek在开源社区Hugging Face上的点赞数跃居第一,获约8730次点赞,这一数字仍在持续上涨。



这是继DeepSeek应用力压ChatGPT登顶美区App Store免费榜、模型在开源社区GitHub上Star数首次超越OpenAI之后,DeepSeek创下的又一个历史时刻,在海外平台再次登顶。


Hugging Face点赞榜单前十名的模型中,都曾在不同节点引爆整个大模型产业。


排名第二的是曾以AI生图“新王”名号横空出世的FLUX.1,由StableDiffusion原班人马成立的黑森林工作室打造,点赞数约8710次。


排名第六的是全球1000名科学家组成BigScience打造的参数高达1760亿个的超大NLP模型BLOOM,第八的是欧洲AI独角兽Mistral AI基于MoE架构的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包揽。


OpenAI的语音转录模型Whisper-large-v3被挤出前十名之列,排名第11,点赞数约3810次。


此外,DeepSeek-V3的排名在第19名,点赞约3810次,超越了微软的Phi-2和谷歌Gemma-7B模型。


Hugging Face点赞数排行榜前30的还有DeepSeek另一款开源的多模态模型Janus-Pro-7B,该模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。



▲开源社区Hugging Face点赞榜(图源:Hugging Face)


DeepSeek V3、DeepSeek R1、Janus-Pro-7B分别于2024年12月26日和今年1月20日、1月28日发布。


DeepSeek V3为DeepSeek自研MoE模型,参数量达到671B,激活参数量37B,在14.8T token上进行了预训练,该模型在多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B等开源模型,并在性能上和闭源模型GPT-4o以及Claude-3.5-Sonnet比肩。


DeepSeek R1在数学、代码、自然语言推理等任务上,性能比肩OpenAI o1正式版,在开源DeepSeek-R1-Zero和DeepSeek-R1两个660B模型的同时,蒸馏了6个小模型,其中32B和70B模型在多项能力上实现了对标OpenAI o1-mini的效果。


多模态模型Janus-Pro是去年发布的Janus的高级版本,可显著提高多模态理解和视觉生成。


当下,全球已经掀起了从芯片企业、云计算巨头到各路基础设施公司适配、接入DeepSeek的热潮,DeepSeek所展现出的卓越性能与广泛的应用潜力正在逐渐放大。


“DeepSeek又得了个第一” 的相关文章

黄山AI旅行助手全面接入DeepSeek大模型

黄山AI旅行助手全面接入DeepSeek大模型

上证报中国证券网讯(记者 杨翔菲)记者2月21日从黄山旅游获悉,日前,公司旗下途马科技已将黄山AI旅行助手全面接入DeepSeek大模型。此举成为文旅产业与人工智能深度融合的里程碑,黄山景区将成为国内...

部署智慧新赛道!DeepSeek落地吴江!

部署智慧新赛道!DeepSeek落地吴江!

在DeepSeek爆火出圈的同时,各地的本地化部署已然争相展开。日前,江苏吴江区数据局正式引入并本地化部署DeepSeek智能平台,标志着吴江在数字城市建设与人工智能技术应用领域迈出关键一步。目前,吴...

除了不能当女婿,DeepSeek比董宇辉差到哪了?

除了不能当女婿,DeepSeek比董宇辉差到哪了?

原创 薛亚萍 字母榜“DeepSeek推荐”正在成为年轻人新的消费决策仪式。打开购物APP之前,在北京工作的白领刘雪先去寻求DeepSeek的帮助:“我27岁,敏感肌,请你帮我推荐几款适合我的防晒霜”...

大连企业发布全国首款公交专属DeepSeek一体机

大连企业发布全国首款公交专属DeepSeek一体机

记者近日从高新区智达科技公司了解到,该公司成功发布基于DeepSeek大模型的公交行业专属一体机Z-AI Cube,为全国首款。智达科技为国家高新技术企业和国家级专精特新“小巨人”企业,专注于“公共交...

DeepSeek如何助力医疗服务智能化?

DeepSeek如何助力医疗服务智能化?

DeepSeek通过其先进的人工智能技术,为医疗服务智能化提供了有力支持。以下是DeepSeek助力医疗服务智能化的具体方式:一、提升医疗效率快速文献检索:DeepSeek能够快速检索最新的医学文献和...

DeepSeek一体机密集发布!私有化部署需求激增 云厂商:已接到大量用户咨询

DeepSeek一体机密集发布!私有化部署需求激增 云厂商:已接到大量用户咨询

《科创板日报》2月12日讯(记者 黄心怡)DeepSeek掀起的算力热潮还在持续。中国电信昨日宣布推出了息壤智算一体机-DeepSeek版,在硬件层面以华为昇腾芯片为基础,提供8卡、16卡、32卡等多...