Science Translational Medicine:干血斑代谢谱解锁早产风险密码,精准守护脆弱新生儿

基于干血斑代谢物谱与深度学习定量评估新生儿健康

2026年1月,美国斯坦福大学等单位的研究人员在《Science Translational Medicine》(IF:14.6)上发表了题为“Quantitative assessment of neonatal health using dried blood spot metabolite profiles and deep learning”的研究论文,该研究基于常规新生儿筛查(NBS)干血斑代谢物数据,开发了结合深度学习与亚组发现的NBS代谢健康指数,证实了可通过常规NBS代谢谱预测四种常见早产不良结局的发生概率,并具备广泛临床转化潜力。


  亮点概述:

  • 代谢健康指数可有效识别出未出现四种早产不良结局的低风险早产儿。
  • 代谢健康指数与亚组发现方法的联合应用,可识别出早产不良结局高风险的新生儿亚群
  • 代谢健康指数的预测效能具有跨队列稳健性。
  • 为实现精准的风险亚组识别,需采用针对单个队列或研究中心的多变量代谢物分位数来识别共识亚组。

  研究背景:

早产(定义为妊娠37周前分娩)与重大健康风险相关。支气管肺发育不良(BPD)、脑室内出血(IVH)、坏死性小肠结肠炎(NEC)及早产儿视网膜病变(ROP)是早产相关的四种严重获得性疾病,可导致显著的发病率和死亡率。仅依据胎龄(GA)和出生体重(BW)对早产进行风险分层的参考价值十分有限。因此,优化新生儿风险评估手段是临床的迫切需求。

在美国、英国及部分欧洲、亚太和拉丁美洲国家,所有新生儿出生后均需通过足跟采血制成干血斑进行NBS,以检测严重遗传性代谢疾病。除作为代谢疾病的诊断指标外,NBS代谢物水平会随新生儿发育状态发生变化,这表明代谢成熟度存在时间性的生物学模式。既往研究表明,NBS代谢物可反映早产相关的代谢失调。因此研究人员提出假设:早产导致的不同不良结局具有共同的潜在生物学机制,这种机制可通过NBS代谢物谱及人工智能技术加以捕捉。
 

本研究将确诊为BPD、IVH、NEC及ROP的新生儿纳入病例组,与GA相近的未患上述疾病的新生儿为对照组。研究队列分别为加州队列用于模型开发,安大略队列则作为独立的外部验证队列。在加州队列(n=13536)胎龄22-29周极早产儿中,通过相关网络分析,发现氨基酸与酰基肉碱呈现空间分离,而长链与短链酰基肉碱则表现出更紧密的邻近重叠,其中3-羟基长链酰基肉碱位于外围区域。主要NBS代谢物类别的空间分离表明不同代谢物类型包含独特的生物学信息。研究人员进一步探究了单个代谢物与新生儿结局的关联,多个氨基酸(酪氨酸、瓜氨酸、甲硫氨酸、脯氨酸、丙氨酸)与IVH显著相关;短链酰基肉碱在ROP中显著富集;特定酰基肉碱及比值与NEC相关。随后,研究人员鉴定出早产所有四种不良结局中均呈现一致的核心动态变化规律的代谢物对,包括C-12:1酰基肉碱与精氨酸、亮氨酸/异亮氨酸与C-16酰基肉碱、亮氨酸/异亮氨酸与苯丙氨酸/酪氨酸比值、苯丙氨酸/酪氨酸比值与C-5酰基肉碱、精氨酸/鸟氨酸比值与5-氧代脯氨酸。相比之下,少数代谢物对仅针对单一结局表现出方向性变化。

基于NBS代谢物的代谢健康指数风险分层概念框架

研究人员将加州队列作为代谢健康指数模型开发的开发队列,对该队列采用K-fold划分,同时预留部分数据作为内部验证集。早期实验仅基于NBS代谢物数值构建深度多任务模型,通过受试者工作特征曲线下面积(AUROC)和精确率-召回曲线下面积(AUPRC)两项指标,在K-fold交叉验证测试集和内部验证集上对BPD、IVH、NEC和ROP四种结局进行模型评估,证实早产不良结局婴儿的NBS代谢谱具备一定的风险分层潜力。随后,研究人员探究如何以最优方式整合各类风险结局并将其与代谢物生物标志物直接关联。通过在多任务深度神经网络中增设瓶颈层,将四种不良结局的全部风险信息压缩为单一评分;这一设计实质上促使网络将所有代谢风险信号整合为一个标量值,该标量值即被定义为用于风险分层的代谢健康指数。利用该代谢健康指数,在测试集和内部验证集中,未出现四种病症的新生儿均能有效区分。随后,研究人员筛选出了包含新生儿结局相关信息的核心代谢检测指标,C-16酰基肉碱、C-18:1酰基肉碱、C-18:2酰基肉碱、鸟氨酸/瓜氨酸比值、C-4酰基肉碱和C-5酰基肉碱,这些指标构成了上述单一代谢健康指数的基础,该指数可有效识别出未出现四种早产不良结局的低风险早产儿。

极早产儿的不良结局相关风险特征可能存在异质性,研究人员以NBS代谢物分位数定义亚组,以四种结局各自对应的亚组特异性模型AUROC为评分标准,基于单评分代谢健康指数模型识别出了结局特异性亚群。优化后的代谢健康指数风险分层精准度显著提升,代谢健康指数与亚组发现方法的联合应用优于多种常用模型。这些结果表明依托NBS提供的生物学检测指标,可通过独特的代谢谱识别出早产不良结局高风险的新生儿亚群。

早产新生儿风险分层的深度代谢健康指数模型的开发

研究人员进一步探讨了临床风险因素与代谢健康指数的相互作用,发现整合临床变量效果优于单纯使用新生儿常用临床变量的线性模型。研究人员将婴儿性别、GA和BW作为输入特征整合到完整建模框架中,构建了一个代谢健康指数模型,模型增强了对BPD、ROP和NEC的风险分层能力。提示临床变量可直接与NBS代谢物整合至代谢健康指数中,从而构建全面的风险分层模型。为了评估四种早产不良结局共享信息对代谢健康指数模型多任务架构模块的重要性,研究人员开展了消融实验:每次迭代移除一种不同的不良结局,通过训练模型识别早产四种不良结局中的三种。结果显示代谢健康指数模型对四种结局中任一单一不良结局的移除均具有稳健性,表明该模型在风险分层中对单一不良结局的依赖性较低。

为了验证代谢健康指数模型的外部有效性,研究人员将其应用于3299人的安大略队列并重新开展亚组发现,模型在该队列中实现了良好的风险分层,AUROC和AUPRC表现优异。总体而言,该亚组发现方法可应用于其他队列,以评估和优化NBS代谢健康指标,从而得出可推广的模型性能共识亚组。

代谢健康指数模型及方法在多个队列中的通用性

前期亚组发现结果采用三种代谢物的分位数来定义跨队列共识模型性能亚组。研究人员探讨了不同队列中单个代谢物在亚组发现定义上的差异。使用单个代谢物的三分位数划分来定义模型性能亚组并评估相关指标,发现两个队列在代谢物的亚组定义能力上存在显著队列差异,且代谢物与健康指数模型性能呈显著的队列特异性关联,由此证实需采用针对单个队列或研究中心的多变量代谢物分位数来识别共识亚组。

综上所述,该研究证实,通过采用结合深度学习与亚组发现优化方法的数据驱动模型,可利用常规NBS获得的代谢特征对极早产新生儿进行风险分层。基于NBS的代谢健康指数具有转化应用潜力,能够改善最脆弱新生患儿的治疗决策。

收藏