当前位置:首页 > Deepseek最新资讯 > 正文内容

哈佛团队研发HPV-DeepSeek,已启动更大规模临床验证

  HPV-DeepSeek 是什么?乍一看,你可能觉得这是不是和中国的 DeepSeek 公司有什么关系?事实上,这是一群科学家于近期打造的一款液体活检检测方法,该方法可以在无症状个体出现症状的 10 年前就能检测出人乳头瘤病毒(HPV,Human Papillomavirus)相关的口咽癌,日前相关论文发表于《美国国家癌症研究所期刊》。

  我们无法得知研究人员在为这一技术命名时是否从国内的 DeepSeek 模型汲取了灵感,但对于熟悉这一模型的国人来说,可能看到 HPV-DeepSeek 这一名称会感到多了几分亲切。然而,该技术确实是一项国外技术,其由美国哈佛医学院助理教授、博德研究所副研究员、麻省眼耳医院头颈外科肿瘤科主治外科医生和麦克托特头颈癌中心首席研究院丹尼尔·L·法登(Daniel L.Faden)率队完成。

  通过针对这类癌症进行早期诊断,HPV-DeepSeek 不仅可以提高治疗成功率,还能减少使用激进疗法。这一成果首次证明“HPV+口咽癌”的精准早期检测是可行的,通过血液样本可以更早地检测出癌症,为筛选 HPV 相关的口咽癌带来了新机会。

  据了解,HPV-DeepSeek 依靠全基因组测序来识别从肿瘤中分离并在血液中循环的 HPV DNA 微小片段。该团队的早期研究表明,这一检测方法在患者初次就诊时,其诊断癌症的特异性和敏感性均可达到 99%,对于癌症早期检测的敏感性高达 79%,优于现有的诊断方法。

  为了确定 HPV-DeepSeek 能否在患者确诊的很久之前就检测出 HPV 相关口咽癌,研究人员针对来自麻省总医院布莱根生物库的 56 样本进行了测试,其中 28 个样本来自多年后患上 HPV 相关口咽癌的个体,另外 28 个样本来自健康对照者。在 28 份后来患上癌症的患者血液样本中,研究人员从其中的 22 份中检测到了 HPV 肿瘤 DNA,而所有 28 份对照样本的检测结果均为阴性,这表明此次检测方法具有高度的特异性。对于距离患者确诊时间较近时所采集的血液样本,这一检测方法能够更好地检测出其中的 HPV DNA。在一份距离患者确诊 7.8 年之前采集的血液样本中,研究人员也检测出了阳性成果。

  利用机器学习,研究人员进一步提高了这一方法的测试能力,使得其能准确识别出 28 例癌症病例中的 27 例,甚至能从患者确诊 10 年之前收集的样本中识别出癌症。

  具体来说,研究人员利用 306 例“HPV+口咽癌”病例和对照组数据训练并验证了一个机器学习模型。结果显示,早期检测的敏感性提升 96%,最长可以提前 10 年deepseek。研究人员表示,这可能是迄今为止基于循环肿瘤 DNA(ctDNA,Circulating Tumor DNA)的癌症早期检测中最长的检测时间。

  期间,他们采用了二元机器学习方法,借此将样本分类为 HPV 阳性口咽鳞状细胞癌和非 HPV 阳性口咽磷状细胞癌。在建模之前,研究人员通过采取标准数据预处理技术,针对数值特征进行了最小-最大归一化处理。在选择这些数值特征时,他们主要基于 HPV-DeepSeek 的五个输出指标:第一个指标是独特的 HPV 对齐读数,第二个指标是基因组覆盖率,第三个指标是平均片段长度,第四个指标是片段长度偏度,第五个指标是片段长度峰度。

  通过此,研究人员排除了一些其他特征,比如高危 HPV 单核苷酸多态性、PIK3CA 突变和病毒整合事件,之所以将这些特征排除在外,是因为它们的可靠注释需要较高的测序覆盖率,而这在预诊断样本中是不可行的。

  在独立机器学习训练与测试列队中,研究人员将 80% 的样本用于训练,将 20% 的样本用于测试。借此训练了多种可解释模型架构,包括随机森林(Random Forest)、AdaBoost 和朴素贝叶斯(Naive Bayes)。模型性能指标包括准确率、精确率、召回率、宏观 F1 分数、特异性、阴性预测值和受试者工作特征曲线下面积(AUC-ROC,Area Under the Receiver Operating Characteristic Curve)。

  在适用的情况下,研究人员使用 10 折交叉验证在训练集上进行超参数调优。针对基于决策树的模型,研究人员对其进行了可视化,以便能够识别关键预测因子。在对模型进行调优之后,研究人员对模型进行了最终确定,并针对保留的测试集进行了 Bootstrap 重采样,以便生成模型性能指标的经验 95% 置信区间。

  然后,研究人员使用分层 K 折生成了交叉验证和测试集的 AUC-ROC 曲线。为了解释模型,研究人员使用了沙普利加性解释(SHAP,SHapley Additive Explanations)技术,它能够估计每个输入特征对于个体预测的贡献。

  SHAP 值指标能够显示输入特征在所有测试样本中的影响方向和影响大小,借此得到了每个特征的平均 SHAP 值和模型之间的总体重要性排名。需要说明的是,机器学习模型具有等效的性能和重叠的置信区间,同时研究人员选择了朴素贝叶斯作为代表模型。

  研究人员在论文中指出,机器学习显著改善了距离时间较远的样本的分类能力,这种提升主要源于以下两个方面。首先,能够针对独特读数数量和基因组覆盖百分比这两个主要特征进行差异化加权,而非采用稀释试验来确定固定阈值。其次,能够在特定模型中引入片段组学特征。

  研究中,研究人员还将 HPV-DeepSeek 与通过 ddPCR(目前用于检测 ctHPVDNA 的临床标准护理)进行的 ctHPVDNA 检测进行了比较,借此发现 HPV-DeepSeek 能够显著提高早期检测敏感性和最长提前时间。

  除此之外,HPV-DeepSeek 还具备一些其他优势,比如能够同时检测所有的 HPV 基因型,能够检测和注释大量预后和支持性诊断特征。结合该检测的总体高敏感性和特异性,这表明针对“HPV+口咽鳞状细胞癌”的单一或组合的基于血液的早期检测方法在技术上是可行的。

  基于循环肿瘤 DNA 的早期检测方法确实有望显著改善癌症早期诊断,并且尤其适用于目前缺乏筛查手段的癌种。当前,大多数癌症类型由于在确诊时缺乏筛查,导致患者在接受治疗时往往已经拖至晚期甚至开始出现临床症状。而患者直到癌症晚期才得到诊断,就会导致生存率下降、医疗成本增加以及病损加重。

  HPV 是美国大约 70% 口咽癌患者的病因,口咽癌也是与 HPV 病毒相关的最常见癌症类型。目前,这类癌症的发病率呈现出逐年上升的趋势。其他一些 HPV 相关癌症已经拥有成熟的筛选方案,但是此前尚未出现检测 HPV 相关口咽癌的检测方法。

  对于 HPV 相关口咽癌患者来说,他们往往在肿瘤已经扩散到数十亿个细胞、引发症状并已经扩散到附近淋巴结时才被诊断出来。研究人员表示,当患者出现癌症症状才来到医院时,这时所需要接受的治疗可能会带来严重的终身副作用。因此,开发能够更早发现这类癌症的筛查工具,能够让患者更早地接受治疗和改善预后。

  而本次研究还使用了后来发展为“HPV+口咽鳞状细胞癌”的无症状个体和人群对照的血浆样本,结合 HPV-DeepSeek 这一新型超灵敏多特征的液体活检技术,证明对于敏感和特异的基于血液的“HPV+口咽鳞状细胞癌”早期检测来说,HPV-DeepSeek 可以将检测时间提前到患者在临床上被确认患癌的 10 年之前,这为 HPV 相关口咽癌提供基于血液的早期检测测试带来了新机会。

  目前,研究人员正在美国国立卫生研究院资助的第二项盲法研究中继续验证本次方法,涉及到使用美国国家癌症研究所的前列腺癌、肺癌、结直肠癌和卵巢癌的数百个样本,预计将能惠及更多患者。原文出处:哈佛团队研发HPV-DeepSeek,已启动更大规模临床验证,感谢原作者,侵权必删!

标签: deepseek

“哈佛团队研发HPV-DeepSeek,已启动更大规模临床验证” 的相关文章

备件管理准确率98%!AI如何重塑高效售后服务?

备件管理准确率98%!AI如何重塑高效售后服务?

  晚上9点半,广州,某知名新茶饮品牌门店内,店长小林接到了平云小匠工程师的电话。确认其在店及报修情况后,工程师半小时内携备件到达门店,根据标准作业程序操作,完成签到、检测、维修、确认核销...

我问deepseek区块链周刊是什么,他这样回答我

我问deepseek区块链周刊是什么,他这样回答我

  区块链周刊(Blockchain Weekly)是一家成立于2025年、总部位于香港的专业区块链与Web3媒体平台,具有国际期刊资质(ISSN 3104-5227),专注于行业深度研究...

闽籍青年苏仲尧个展 DEEPSEEK下的“说亮话”

闽籍青年苏仲尧个展 DEEPSEEK下的“说亮话”

  弗洛伊德曾以“神秘书写板”为模型分析知觉-意识与记忆系统的区隔:通过在最上层的赛璐珞薄片上刻写,其下的蜡纸和蜡板紧密接触时会留下印痕,而一旦分离字迹便会消失,但蜡板却永久保留了每次书写...

有兄弟买了韦德之道1复刻吗

有兄弟买了韦德之道1复刻吗

  这双鞋可以打篮球,但绝对谈不上好穿。前掌毫无回馈,后掌要非常用力才有一点点软的感觉。特别是后跟落地的时候没有引导过渡直接啪一下下来,而且这双鞋的中底钢性不差,我感觉高强度下来腿部力量下...

H20停产,Deepseek力挺国产AI,AIETF涨超4%

H20停产,Deepseek力挺国产AI,AIETF涨超4%

  8月25日,市场集体高开,芯片板块领跑全市,$科创芯片ETF富国(588810)涨超2%,$AIETF富国(589380)涨近4%。成分股航天宏图、云天励飞-U涨超15%,寒武纪-U涨...

DeepSeek与智谱将发布新模型

DeepSeek与智谱将发布新模型

  9月29日,AI从业者发现DeepSeek-V3.2新模型已被上传至社区平台HuggingFace,随后被删除。另外,记者了解到deepseek,智谱新模型GLM-4.6也将于近日发布...