机器学习将如何指导心房颤动的临床护理

大部分内容为机器翻译,英语水平有限,若有不足的地方还请见谅

今天介绍一篇17分的高分综述:

HowWillMachineLearningInformtheClinicalCareofAtrialFibrillation?

在过去的十年里,机器学习在心脏病学中的应用发展迅速。在日益复杂的医疗环境中,随着机器学习工具和海量数据的出现,心房颤动(AF)这一发病率和社会经济影响显著的常见慢性病的治疗正经历着知识和实践的转变。在其他进展中,包括卷积神经网络的深度学习机器学习方法使得能够使用容易获取的12导联ECG来开发AF筛查路径以检测高危人群(诸如具有隐蔽中风的人群)中的无症状阵发性AF,通过使用从电子健康记录或可穿戴式监视技术中提取的结构化和非结构化数据的综合数字表型来改进AF和中风预测方案,以及优化从中风预防到抗心律失常监测的治疗策略。尽管这些工具在临床和人群的影响仍在进一步发展,但这样的变革性进展并不是没有挑战,例如对采用黑盒技术进行评估和用于训练此类模型的输入数据质量的担忧,以及持续而非缓解的健康差异的风险。本文对目前与房颤治疗相关的机器学习的研究进展、潜在的未来发展方向及其潜在的局限性和挑战进行了评价。

机器学习在房颤临床护理中的应用

1.房颤筛查

1.1.房颤筛查的现状及面临的挑战

房颤筛查可以通过心电图记录直接进行,也可以通过评估脉搏不规则性间接进行。筛查方法大致可分为四大类:(1)脉搏触诊;(2)血压监测仪;(3)心电图,包括标准的12导联心电图,手持设备,贴片,皮带,智能手机,手表等中的单导联心电图,这些筛查测试的表现各不相同,但最近对19项AF筛查研究进行的荟萃分析发现,筛查的产量不受所使用的筛查方法的影响。筛查产量最大的驱动因素似乎是研究人群的年龄。通过心电监测补丁或使用手持心电重复记录进行间歇或连续筛查可以提高产率,但它们也更昂贵和负担更大。机器学习方法可以提高这些筛查方法的产率。值得注意的是,ML方法已经应用于从单导联ECG或光体积描记术获得的信号。例如,已经开发出一种深度神经网络,可以从AppleWatch获得的光体积描记信号中被动检测房颤。

1.2现有房颤风险评分用于指导房颤筛查计划

在过去的十年中,已经开发和验证了几种用于预测房颤风险的风险评分(见下图)。这些模型很大程度上包括相似的风险因素,例如年龄、性别、种族、身高、体重、血压、心力衰竭等。事实上,即使是简单的CHA2DS2-VASc评分(被设计为房颤患者的中风风险分层工具)也证明了用于预测房颤的C统计量为0.69到0.74。这些模型的微小差异归因于包含某些风险因素的情况得到了改善。例如,在Charge-AF研究(基因组流行病学心房颤动中心脏和衰老研究的队列)中,增加左心室肥厚和PR间期并没有显著改善结果。值得注意的是,这些模型都是用回归方法建立的。虽然与传统的统计方法相比,ML方法可以潜在地提高模型的性能,但如果没有这些临床危险因素之外的其他类型的数据的加入,这种改进不太可能具有临床意义。特定人群的偏差和残差混杂也可能影响基于ML的预测模型,这与传统预测模型没有什么不同。

不同AF筛选方法的性能

1.3.基于窦性心律心电图预测未识别房颤的人工智能算法

上述风险预测模型均未在常规实践中用于指导房颤筛查。一个关键原因是他们都预测房颤的中长期风险,例如5年或10年,而不是未识别房颤的同期风险。然而,ECG可以提供一个观察AF患者发生的电生理重构的窗口,使得从ECG中系统地提取特征可以检测出更有可能有阵发性AF病史或风险的患者。评估这些特征的调查记录确实很长,例如,通过信号平均ECG和标准ECG上的其他P波指数对P波进行分割。

在该工具能够广泛应用于临床之前,需要解决一些重要问题。该算法是从选定人群中得出的,房颤患病率高于较少选定的普通人群。因此,外部有效性和普遍性仍有待确定。这种方法的增量价值高于临床因素和风险评分,需要进一步研究。事实上,标准临床因素在鉴别伴发(而非未来)房颤方面的价值在很大程度上是未知的。此外,在普通人群或初级保健人群中广泛应用该工具对下游检测、治疗利用率、成本、患者报告的生活质量和硬结果(中风、出血、死亡)的影响尚不清楚。

1.4.用于实现AF预测算法的ML

ML算法可以促进传统风险预测模型(如CHARGE-AF)的实现,也可以促进人工智能(AI)ECG算法的实现。为了计算CHARGE-AF等风险分数,需要从EHR中提取数据。一些信息,例如年龄、性别和血压,可以直接从记录中的预定义区域获得,例如人口统计或生命体征选项卡,在这些选项卡中为每个患者输入这些信息(结构化数据字段)。其他诊断,如糖尿病、心力衰竭和心肌梗死更为模糊。依靠诊断或程序代码来确定病史假定此类代码已由医疗专业人员正确裁决并正确输入EHR。然而,当前和以前编码系统的复杂性使得不同专业人员之间编码可能存在显著的不一致性,从而降低了仅基于诊断代码得出的预后评分的可靠性。自然语言处理(NLP)通过从EHR的自由文本临床文档中提取信息,有可能改善诊断的确定。

1.5.利用ML改善房颤筛查的未来方向

对于大型医疗系统,利用人工智能的基于ECG的房颤预测可以作为一种低成本的大规模筛查工具,下一步将是研究纳入CHARGEAF的额外临床风险因素和其他新的风险因素(如血液生物标记物、成像方式,甚至多基因风险评分)是否可以进一步提高模型的性能。例如,将其他已建立的风险因素添加到AIECG算法可以以协同方式进一步提高其预测性能,而不一定增加实现预测算法的成本和复杂性,只要关于这些附加风险因素的信息可以容易地通过EHR获得。

接下来的问题将是如何将人工智能算法扩展到更广泛的人群中。一个挑战是,当这些算法应用于不同的人群时,需要重新验证或调整。区块链技术的利用可能允许产生一个分散的市场,用于跨机构安全和可追踪地共享大量患者数据,用于人工智能工具的再培训和测试。此外,并不是每个诊所都像最初开发人工智能算法的大型医疗系统那样拥有数据采集和处理的能力和基础设施。这些人工智能解决方案的成功实施还需要广泛的培训和支持,例如,帮助临床医生了解当他们收到人工智能生成的结果时他们应该做什么。

基于单一12导联窦性心律心电图检测近伴性房颤的卷积网络的发展

二、房颤治疗

2.1卒中危险分层

自从40年前房颤被认为是卒中的主要危险因素以来,实现有意义的个体化风险分层的努力已经取得了进展。当前的指南认可广泛使用的CHA2DS2-VASc评分作为识别可能需要启动OAC的患者的首选风险分层方案。该评分基于简单的临床变量,通常很容易在日常实践中应用,并且大多数医疗保健提供者都熟悉它。然而,由于EHR采样的不准确性或必须依赖患者报告的病史,要准确确定所有临床风险因素来计算单个患者在特定时间点或超过纵向随访时的CHA2DS2-VASc评分并不总是简单明了的。正如上一节所讨论的,将结构化和非结构化数据与NLP结合使用的ML方法在自动化和改进风险表型以及识别将从OAC启动中受益的高危患者方面提供了希望。

2.2无房颤的高危人群中的OAC

对于隐源性卒中患者,目前的指南建议进行动态心律监测,以评估其他无症状的房颤。然而,这种方法检测房颤的灵敏度相当低,尤其是在监测时间较短的情况下。长时间的监测,例如,常规使用的植入式环路记录器,可能导致较高的房颤诊断率,但这种侵入性方法成本高昂,在某些情况下可能不必要。绕过长时间的心律监测,甚至在记录房颤之前常规使用OAC已被考虑并在使用利伐沙班和达比加群的2项临床试验中进行了测试。这两项试验均证明,与阿司匹林相比,出血风险增加,复发性卒中没有减少,这表明在无房颤记录的患者中,OAC的益处可能不会超过出血增加的危害。由于只有少数隐源性卒中确实与房颤相关,这些NOAC对降低复发性卒中风险的作用也可能减弱。更好地检测未识别的房颤的工具可能有助于将OAC的使用限制在最有可能受益的患者。应用前面描述的范例,67例隐源性卒中患者可以根据AI增强ECG进行OAC治疗,显示高AF概率。这将避免使用植入式监护仪或其他监护仪进行长时间的动态心律监测,减少不必要的资源利用,减少治疗性OAC的时间。类似地,AI启用的ECG或其他AI启用的诊断工具可以识别高保真心衰患者,这些患者可能有未诊断或未来的房颤以及随后的并发症风险(中风和心衰恶化),从而允许早期实施有效的治疗。在COMMANDERHF试验中,对射血分数降低、冠心病和无房颤的心力衰竭患者进行低剂量利伐沙班与安慰剂对照试验时,没有达到这一目标(一项评估利伐沙班降低失代偿性心力衰竭和冠心病患者死亡、心肌梗死或中风风险的有效性和安全性的研究).最后,经验OAC在无症状all患者中的潜在价值是一种发人深省的方法,需要进一步的测试和临床验证,这些患者根据AI的预测被预测为房颤和房颤相关卒中的高风险。

2.3优化治疗选择

房颤治疗是真正的多维治疗。它包括症状管理和预防房颤相关并发症的药理学(抗心律失常药物、心率控制药物、OAC)、导管消融和基于设备的干预(LAA闭塞和起搏器)方面的考虑。尽管在有专业知识的中心使用现代方法治疗房颤患者的结果有所改善,但仍然存在重大的不确定性,使代表临床医生和患者的决策进一步复杂化。大型数据集的可获得性,如基于行政声明的数据集和那些源自大型临床试验的数据集,允许对不同治疗方法和临床结果之间的关联进行深入的表型分析。传统的方法可以与ML方法结合起来,在回顾性和前瞻性研究的背景下整合常规收集的信息,这些研究丰富了广泛可用的EHR衍生信息。这些工具可以为共同决策提供信息,以确定一系列当前治疗困境的最佳选择。

2.4华法林治疗监测

尽管接受了NOACs,华法林仍在美国广泛使用。在其他已知的局限性中,华法林的治疗窗口很窄。治疗范围内的时间表明抗凝控制不良与房颤患者的不良临床结局相关。此外,定义最佳剂量对于刚开始服用药物的患者来说可能具有挑战性,因为个体之间的剂量需求存在显著差异。结合人口统计学、临床甚至药物基因组学数据的ML方法已成功开发,以提高预测单个患者华法林剂量的能力。此外,对OAC的遵守通常是次优的,随着NOAC使用量的增加,仅略有改善。在一项随机试验中,Labovitz等人测试了基于智能手机的监测干预的影响,该干预使用人工智能自动化直接观察治疗,以目视确认药物摄入。根据血浆药物浓度水平确定,干预组和对照组的依从性分别为%和50%,表明此类工具的可行性和潜在临床效用。

2.5抗心律失常药物管理

AAD通常用于房颤和其他心律失常的治疗,但需要密切监测,因为药物诱导的QT延长可能导致致命性室性心律失常,而多非利特和索他洛尔的副作用最为显著。医院的心电图监测下开始服用的。随后可能需要根据QT延长程度、伴随QT延长药物以及肾功能的潜在变化进行剂量调整,因为索他洛尔和多非利特主要通过肾脏代谢。然而,QT间期是一个不完善的监测指标,因为它不能准确反映血浆浓度或促心律失常电位。梅奥诊所的一组研究人员开发了一个深度学习模型,用ECG预测42名受试者的多非利特血浆浓度。这种深度学习方法预测血浆多非利特浓度具有良好的相关性(r=0.58)。

3.ML的局限性和挑战

虽然大量数据可以增强ML模型的能力,但对其质量进行批判性评估变得越来越困难。当使用深度学习卷积模型时,这一点变得更为关键,因为非线性数据转换和多重卷积使得难以跟踪数据的内部处理方式以及输入数据的哪些方面对模型输出影响最大。深度学习ML方法的一个主要问题是,考虑到如何分析一组输入数据以导出输出的不可知性质,它是一个黑箱。因此,深入学习算法的可解释性是正在进行的研究的一个重要领域。另一个担忧是,这种黑盒模型可能不允许患者和提供者参与有意义的共享决策,因为不知道是什么推动了模型提供的建议。对这种担忧的反驳是,这种不带偏见的方法实际上可能能够增强共享决策,因为它没有提供任何基于人类在某种程度上不可避免地进行共享决策交互的先入为主的概念的建议。

4.社会和法律考虑

随着ML从纯粹的研究工具演变为直接用于临床护理的工具,重要的是考虑其社会和法律含义。为了让ML应用程序对人群健康和福祉产生有意义的影响,这些应用程序需要易于扩展,以便能够到达最有可能受益的目标人群。在房颤筛查的例子中,最需要房颤筛查的人群是心脏病学子专科护理以外的初级护理人群,通常是学术医疗中心以外的人群。在这些环境中,对人工智能的熟悉程度可能低于积极从事研究的专业实践。我们在应用人工智能技术时必须保持警惕,以免使健康差距永久化或恶化。最后,监管和法律环境可能对临床护理中充分实现ML的好处构成挑战。例如,侵权法支持医疗标准,因此,当ML算法提出的建议偏离了标准(这可能被视为个性化医疗的目标),责任风险可能会妨碍医生遵循ML工具提供的可能更准确的指导。

参考文献:SiontisKC,YaoX,PirruccelloJP,PhilippakisAA,NoseworthyPA.HowWillMachineLearningInformtheClinicalCareofAtrialFibrillation?CircRes.Jun19;(1):-.doi:10./CIRCRESAHA...EpubJun18.PMID:.

翻译不易,若需转载,请注明出处

小猪的科研生活



转载请注明:http://www.fbrmw.com/jbby/18359.html


  • 上一篇文章:
  • 下一篇文章: 没有了
  • 网站简介 | 发布优势 | 服务条款 | 隐私保护 | 广告合作 | 网站地图 | 版权申明 |