当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗

6个月前 (04-02)Deepseek最新资讯488

国家知识产权局官网显示,4月1日,DeepSeek关联公司杭州深度求索人工智能基础技术研究有限公司申请的“一种广度数据采集的方法及其系统”专利公布。

摘要显示,本发明涉及数据采集领域,尤其涉及一种广度数据采集的方法及其系统,包括:建立网页元信息库;确定每日调度单元下载配额及当日下载总额度;从网页元信息库中选取相应数量的链接,分配下载额度;下载过程控制;下载文本进行后处理及数据清洗后进入回灌队列,通过信息回灌实现网页元信息库更新。本发明的有益效果在于:发现尽可能多的网页链接,并减少对网站的流量冲击;对已经下载的内容进行分析,对未下载的连接进行质量推断,通过择优下载分配额度的方式,减少低质量网页下载和重复下载,提高数据质量及下载效率,减少在数据采集过程中网络资源的消耗;采用单独的信息回灌队列,保证网页元信息库修改操作的原子性和稳定性。


“DeepSeek新专利“一种广度数据采集的方法及其系统”公布,可减少数据采集时网络资源消耗” 的相关文章

中国电信舟山分公司:自研完成全市首个DeepSeek本地化应用,深度赋能社会救助数智化转型

中国电信舟山分公司:自研完成全市首个DeepSeek本地化应用,深度赋能社会救助数智化转型

自DeepSeek全新开源模型掀起AI浪潮以来,中国电信舟山分公司作为数字舟山建设的主力军,凭借强大的技术实力和创新能力,迅速行动、深度探索DeepSeek大模型融合各行各业,为舟山市民政局率先实现D...

DeepSeek工业应用趋势与前瞻布局

DeepSeek工业应用趋势与前瞻布局

DeepSeek作为新一代工业大模型,其核心创新源于底层架构的颠覆性优化,具体体现在以下五大维度:1.注意力机制的高效化传统Transformer模型在工业场景中面临的核心挑战在于自注意力机制的计算复...

deepseek入局搜索混战

deepseek入局搜索混战

DeepSeek应用以史上最快速度达成3000万日活。据调研机构QuestMobile,1月28日,DeepSeek日活跃用户数首次超越豆包,随后在2月1日突破3000万大关。目前DeepSeek、字...

DeepSeek助力数禾科技,探索金融服务新边界

DeepSeek助力数禾科技,探索金融服务新边界

在当今科技飞速发展的时代,人工智能技术正以前所未有的态势重塑着各个行业,金融领域也不例外。从传统的柜台服务到线上便捷的金融交易,从人工审核信贷到智能风控体系,金融服务的模式与效率在AI科技的驱动下不断...

四川自贡举行小学科学教学研讨会 教师将AI数字人、DeepSeek融入课堂

四川自贡举行小学科学教学研讨会 教师将AI数字人、DeepSeek融入课堂

5月16日,自贡市2024-2025学年下学期小学科学教学研讨会,在自贡市汇东实验学校成功举办。本次活动以“深耕科学课堂,点燃创新梦想”为主题,通过教学研讨与校园科技节双线并行,展现科学教育实践成果,...

智能应对多种场景 DeepSeek助力四川环境应急

智能应对多种场景 DeepSeek助力四川环境应急

4月6日,记者从四川省生态环境厅获悉,近日新增一位环境应急“助手”——一款基于DeepSeek大模型与生态环境应急指挥平台深度融合的AI助手。目前,通过阶段性探索,该AI助手已初步形成智能问答、智能分...