自学内容网 自学内容网

学习笔记-人工智能增强心电图作为心脏和非心脏疾病统一筛查工具的前景:一项紧急护理的探索性研究

学习笔记-人工智能增强心电图作为心脏和非心脏疾病统一筛查工具的前景:一项紧急护理的探索性研究

文章标题:

人工智能增强心电图作为心脏和非心脏疾病统一筛查工具的前景:一项紧急护理的探索性研究
原文链接:https://academic.oup.com/ehjdh/article/5/4/454/7670685

背景:

  • 现有的 AI 心电图研究局限于二进制预测问题,在定义适当的控制组时面临挑战。
  • 使用闭源数据集,导致模型泛化能力差,难以在新数据上表现良好。
  • 缺乏临床基本事实,限制了心电图诊断边界的解释
  • FDA 批准的心电图算法虽然出现,但孤立应用程序的范围有限。

研究目的:

  • 使用基于深度学习的心电图分析算法,通过全面的临床诊断声明进行训练。
  • 提供详细的个性化风险评分,同时支持深度表型分析
  • 未来可将该模型与其他模式的患者数据(如基因组测序或医学成像)结合使用。

研究过程:

两个患者用例:

  1. 患者1:

    • 到达急诊科 -> 进行心电图检查 -> 根据心电图数据预测急诊诊断 -> 急诊后出院
  2. 患者2:

    • 到达急诊科 -> 进行心电图检查 -> 住院治疗 -> 根据住院期间数据预测出院诊断 -> 最终出院

深度学习模型结构:

  • Conv1D(卷积层):初步处理输入的 ECG 信号数据。

  • S4 Block(结构化状态空间模块):模型中的核心模块,每个块包含以下组件:

    • S4Layer:捕捉时间序列中的复杂模式。
    • Dropout:防止过拟合的正则化技术。
    • GeLU:激活函数,用于增加模型的非线性能力。
    • TransLinear:数据变换操作,用于层间输出连接。
  • LayerNorm:层归一化,确保训练稳定性。

  • Linear(线性层):最终用于输出预测结果。


方法

数据集构建:

  • 数据来源整合:将 ECG 信号与患者的入院和出院数据进行匹配。
  • ICD 代码的标准化:将 ICD-9-CM 转换为 ICD-10-CM 代码,以便统一训练和预测。
  • 优先级:使用出院诊断作为主要的预测目标,而非急诊诊断,因为出院诊断更全面。

预测任务和训练过程:

  • 这是一个监督学习过程,目标是进行多标签分类,预测患者的出院诊断。
  • 使用 AdamW 优化器二进制交叉熵损失来优化模型。
  • 为了防止过拟合,基于验证集的最高宏 AUROC(说明多类别上都有良好的表现)进行模型选择。
  • 使用2.5秒的 ECG 片段进行训练,预测时使用多个片段的平均值来优化性能。

评估程序:

  • 数据设计:在测试和验证集中,每个患者只使用一次 ECG 记录,以避免多次记录导致的偏差。
  • 评估指标:使用宏 AUROC作为主要评估指标,并通过 bootstrapping 进行不确定性评估。
  • 数据集划分:不同的数据子集用于模型训练和评估,重点考察泛化能力和模型在不同任务上的表现。

结果与模型性能

  • 在 1079 个考虑的 ICD-10 代码中,有 439 个的性能超过了 0.8 的 AUROC 分数。通过 bootstrap 置信区间评估的统计不确定性相当低,所有代码的中位数为 0.0506 (IQR 0.0373)。说明该模型有很好的可靠性稳定性
  • 外部验证显示,该模型在仅有六种心脏状况的粗略集合中,仍然表现出优于内部测试集的性能。这可能是因为内部预测任务更复杂,需要区分相似的鉴别诊断,而外部验证则在较少的条件下进行。说明该模型有很好的泛化能力。
  • 模型不仅能够预测多种心脏病(如心肌梗死、心房颤动),还能够预测非心脏病,例如:
    • 大肠杆菌感染
    • 白血病
    • 2 型糖尿病
    • 酒精依赖
    • 呼吸衰竭
    • 酒精性肝硬化
    • 溃疡
    • 肾病
    • 心源性休克
    • 中毒
    • 交通事故导致的损伤
    • 辅助装置的存在

局限性

首先,出院诊断可能包含与患者病情无关的事件,并且编码过程可能出现偏差。虽然可以通过整合时态元数据和使用全文出院报告来改善这一点,但出院诊断仍然是临床事实的重要代表,能在一定程度上提升专家注释的质量。

第二,研究结果仅显示相关性而非因果关系,混杂因素(如人口统计变量和病史)可能掩盖因果关系。引入临床元数据可以帮助揭示这些复杂因素。

第三,该方法在处理共存疾病时相对不易受到未控制的混杂效应影响,因为它考虑了所有急诊室心电图的临床相关患者,而不是依赖特定对照组。研究中提到的模型在有腹水与无腹水的肝硬化患者中均能保持高AUROC评分,这显示出对混杂因素的良好控制。

最后,尽管控制了混杂因素,合并症仍可能影响结果。通过Matthew相关系数(MCC)分析,发现特定语句与其父语句之间的高度相关性,这表明模型可能未能完全捕捉所有信息。排除父级陈述后,发现标签之间的相关性通常表示相同病症的不同编码。虽然分析没有明确表明共存标签存在显著混杂效应,但在某些情况下,这些因素可能影响模型的泛化能力。

以上是对论文有关知识点的总结,摘抄,下面是相关的知识点

二进制预测问题:

指的应该就是0/1,比如患病/不患病

闭源数据集:

指的是不公开分享的、只能通过特定授权或渠道访问的数据集。

心电图诊断边界:

指的是在心电图分析过程中,模型或算法如何确定正常与异常心电图之间的界限。

FDA批准的心电图算法:

FDA(美国食品药品监督管理局)批准的心电图算法是指通过FDA严格审查和批准的医疗设备算法或软件。

深度表型分析

深度表型分析是一种综合方法,用于从多种数据源(如基因组、临床特征、影像学数据等)中提取和整合患者的详细特征。这种分析可以帮助研究人员更好地理解疾病的复杂性及其与患者特征之间的关系,通常用于疾病的精准医疗和个性化治疗。

ICD(国际疾病分类)

是一种用于记录疾病和健康相关问题的标准分类系统。ICD-9-CM和ICD-10-CM是不同版本的疾病编码系统。将ICD-9-CM转换为ICD-10-CM代码是为了统一数据集,使得模型能够在不同时间和数据版本之间进行训练和预测,确保一致性和准确性。

AdamW 优化器

AdamW是一种改进的优化算法,结合了自适应学习率和权重衰减(L2正则化)。它在训练深度学习模型时,可以更有效地减少过拟合,提升收敛速度和模型性能。

二进制交叉熵损失

二进制交叉熵损失是一种用于二分类问题的损失函数。它衡量模型预测概率与真实标签之间的差异,越小的损失值表示模型性能越好。在训练中使用该损失函数可以帮助模型学习更准确的分类边界。

宏AUROC(Macro AUROC)

AUROC(Area Under the Receiver Operating Characteristic Curve,受试者工作特征曲线下的面积)是一种衡量分类模型性能的指标,表示模型区分正类和负类的能力。宏AUROC是针对多分类问题的AUROC计算方法。与“微AUROC”(Micro AUROC)不同,宏AUROC是对各个类别的AUROC分别计算后取平均值,从而对每个类别给予相同的权重。因此,宏AUROC适合用来衡量不同类别间具有较大不平衡的数据集的整体分类性能。

Bootstrapping

Bootstrapping是一种统计方法,用于通过随机抽样和重复计算来估计模型或统计量的稳定性或不确定性。在模型评估中,bootstrapping技术通过多次从原始数据集中抽样并重新训练模型,生成多个估计值,从而计算模型性能的置信区间。这种方法有助于评估模型预测结果的可靠性和稳定性。

整合时态元数据

时态元数据指的是与时间相关的额外信息,如数据采集时间、事件发生的时间顺序等。整合时态元数据意味着将这些时间信息融入到模型中,使得模型不仅能够根据静态特征进行预测,还能基于事件随时间的变化做出更准确的判断。例如,患者的入院时间、症状开始的时间等信息可以帮助模型更好地理解疾病的进展情况。

混杂效应

混杂效应是指在统计或机器学习模型中,某些未被控制的变量对研究结果产生了干扰,导致研究结果偏离实际。例如,在研究某种治疗效果时,患者的年龄、性别等人口统计学信息可能会干扰对治疗效果的评估。混杂效应会使模型的预测能力受到干扰,从而影响结果的准确性。为了解决这个问题,研究人员通常会引入额外的变量进行调整或通过实验设计来减小混杂效应。

合并症

合并症是指患者同时患有两种或多种疾病的情况。

Matthew相关系数(MCC)

是一种用于评估二分类模型性能的统计量。它综合考虑了四种基本分类结果的数量:真正例(TP)、假正例(FP)、真负例(TN)和假负例(FN)。MCC的值范围从-1到1。

$ \text{MCC} = \frac{TP \times TN - FP \times FN}{\sqrt{(TP + FP)(TP + FN)(TN + FP)(TN + FN)}} $


原文地址:https://blog.csdn.net/2301_80930906/article/details/142906610

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!