Machine learning for the prediction of sepsis: a systematic review and meta-analysis of diagnostic test accuracy
meta-analysis
machine learning
Fleuren Lucas M.2020年3月发表于Intensive Care Med,机器学习在脓毒症预测中的应用的系统性综述和诊断试验准确性荟萃分析
机器学习在脓毒症预测中的应用的系统性综述和诊断试验准确性荟萃分析(Fleuren 等 2020)
这篇文章是一篇关于机器学习在脓毒症预测中的应用的系统性综述和诊断试验准确性荟萃分析,发表于《Intensive Care Medicine》(2020年),由Lucas M. Fleuren等人完成。
以下是该文章的核心内容总结:
研究目的
评估机器学习模型在医院环境中对脓毒症、严重脓毒症或脓毒性休克进行实时预测(即“右对齐”模型)的性能,并通过系统性回顾和荟萃分析识别影响模型表现的关键因素。
研究方法
- 文献检索:在PubMed、Embase和Scopus数据库中检索截至2019年9月的研究。
- 纳入标准:
- 研究对象为成人患者;
- 使用监督式机器学习模型;
- 目标是实时预测脓毒症(右对齐模型);
- 包括ICU、急诊科(ED)和普通病房等各类医院环境。
- 质量评估:
- 使用QUADAS-2工具评估偏倚风险;
- 使用GRADE方法评估证据质量。
- 数据分析:
- 提取130个模型进行合成分析;
- 对报告了AUROC(受试者工作特征曲线下面积)的模型进行荟萃分析,探索影响性能的因素。
主要结果
1. 研究概况
- 共纳入28项研究,涵盖130个机器学习模型。
- 多数研究集中在重症监护室(ICU,54%),其次是普通病房(25%)和急诊科(14%)。
- 常用数据来源包括MIMIC数据库和医院内部数据集。
2. 预测性能(AUROC)
不同场景下的最佳预测性能如下:
场景 | 预测目标 | AUROC范围 |
---|---|---|
ICU | 脓毒症 | 0.68 – 0.99 |
普通住院环境 | 脓毒症 | 0.96 – 0.98 |
急诊科(ED) | 脓毒症 | 0.87 – 0.97 |
ICU | 脓毒性休克 | 0.83 – 0.96 |
普通住院环境 | 脓毒性休克 | 0.86 – 0.94 |
⚠️ 注意:由于各研究对“脓毒症”的定义不一致(如使用SIRS、SOFA、ICD编码、抗生素使用等),难以进行统一的荟萃分析。
3. 临床实施情况
- 只有3篇研究(11%) 实现了临床部署,结果混合:
- 有的显示能缩短ICU转科时间或降低死亡率;
- 有的未显示出明显优势。
- 多数模型仍停留在回顾性验证阶段,缺乏前瞻性临床试验支持。
4. 影响模型性能的因素(多变量分析)
以下因素对模型性能影响最大: - 体温数据 - 实验室检查值(如乳酸、白细胞计数等) - 模型类型(如神经网络、集成方法等优于传统模型)
研究结论
- 机器学习模型在回顾性数据上表现良好,能够提前准确预测脓毒症的发生。
- 尽管优于传统评分系统(如SIRS),但由于研究间异质性高(定义、数据、方法不同),无法得出整体性能的综合估计。
- 当前大多数模型尚未经过充分的临床验证,从“数据”到“床边”的转化仍然不足。
- 需要标准化报告规范、统一的脓毒症定义以及更多前瞻性临床研究来评估这些模型对患者结局的实际影响。
核心信息(Take-home message)
回顾性研究表明,机器学习模型可以较准确地预测脓毒症和脓毒性休克的发生。然而,必须开展更多床旁前瞻性研究,以评估这些模型是否真正改善患者的临床结局。
局限性与建议
- 缺乏统一的脓毒症定义;
- 多数研究存在高偏倚风险(如未说明数据划分、伦理审批等);
- 很少公开代码或数据,可重复性差;
- 建议未来研究应:
- 遵循标准化报告指南;
- 开展真实世界前瞻性试验;
- 注重临床实用性而非仅追求高AUROC。
总结一句话
机器学习在脓毒症预测方面潜力巨大,但目前仍处于“实验室阶段”,距离广泛临床应用还有很长的路要走。
参考文献
Fleuren, Lucas M., Thomas L. T. Klausch, Charlotte L. Zwager, Linda J. Schoonmade, Tingjie Guo, Luca F. Roggeveen, Eleonora L. Swart, 等. 2020. 《Machine learning for the prediction of sepsis: a systematic review and meta-analysis of diagnostic test accuracy.》 Intensive care medicine 46 (3): 383–400. https://doi.org/10.1007/s00134-019-05872-y.