# Abstract

# Findings

In this cohort study including 448 patients (228 for derivation and 220 for control) with takotsubo syndrome (TTS) and acute myocardial infarction (AMI), a machine learning system was established. The system achieved the ability to outperform a committee of cardiologists in distinguishing TTS from AMI.

这项包括 448 名患者(其中 228 名用于数据推导,220 名用于对照)的队列研究涉及 Takotsubo 综合症(TTS)和急性心肌梗死(AMI)。研究中建立了一个机器学习系统,该系统在区分 TTS 和 AMI 方面的表现超过了一组心脏病专家。

# Exposure

Transthoracic echocardiograms of 224 patients with TTS and 224 patients with AMI were analyzed.

# Main Outcomes and Measures

Area under the receiver operating characteristic curve (AUC), accuracy, sensitivity, and specificity of the machine learning system evaluated on an independent data set and 4 practicing cardiologists for comparison.

Echocardiography videos of 228 patients were used in the development and training of a deep learning model. The performance of the automated echocardiogram video analysis method was evaluated on an independent data set consisting of 220 patients. Data were matched according to age, sex, and ST-segment elevation/non-ST-segment elevation (1 patient with AMI for each patient with TTS).

Predictions were compared with echocardiographic-based interpretations from 4 practicing cardiologists in terms of sensitivity, specificity, and AUC calculated from confidence scores concerning their binary diagnosis.

使用 228 名患者的超声心动图视频来开发和训练一个深度学习模型。这个自动化的心脏超声视频分析方法的性能在一个独立的数据集上进行了评估,该数据集包括 220 名患者,数据根据年龄、性别以及 ST 段抬高 / 非 ST 段抬高进行了匹配(每个 TTS 患者对应一个 AMI 患者)。

主要的评估指标包括机器学习系统的接收器操作特征曲线下面积(AUC)、准确率、敏感性和特异性。这些指标是在一个独立的数据集上进行评估的,并且与 4 位实践中的心脏病专家进行了比较。此外,还将预测结果与这四位心脏病专家基于超声心动图解读的敏感性、特异性和 AUC 进行了比较,AUC 是根据他们对二分法诊断的信心评分计算得出的。

# Article

# Background

The applicability of machine learning models remains limited due to their black-box nature. This interpretation problem is particularly relevant in medicine, where the reasons to support a certain prediction often match the value of the prediction itself.
机器学习模型的应用受限于其 “黑箱性质”,即无法解释其预测的原因。在医学领域,这个问题尤为重要,因为支持某个预测的理由和预测本身的价值一样重要。

Furthermore, all state-of-the art pipelines require human assistance, for instance, manual tracing of cardiac structures. Previously, echocardiographic cardiovascular disease classification based on deep learning has been applied using output data from speckle-tracking echocardiography.
此外,所有最先进的流程都需要人工辅助,例如手动描绘心脏结构。之前,基于深度学习的超声心动图心血管疾病分类已经使用了斑点追踪超声心动图的输出数据。

# QA

# 什么是 cohort study

Cohort study(队列研究)是流行病学和临床研究中的一种研究设计,用于评估人群中的健康状况、疾病发生、发展和相关因素。在队列研究中,研究者会跟踪一组共同特征的个体(称为 “队列”),并观察他们在一段时间内的健康结果。队列研究可以是前瞻性的(prospective cohort study)也可以是回顾性的(retrospective cohort study)。

前瞻性队列研究通常从健康或疾病早期阶段开始,随后长期跟踪参与者,以观察特定暴露因素(如生活方式、环境因素、遗传因素等)如何影响其健康结果。研究者会记录参与者在研究期间发生的所有健康相关事件。

回顾性队列研究则是利用现有的数据和记录,从已经发生的健康结果出发,回顾参与者在过去的暴露情况。

队列研究的特点和优势包括:

  1. 时间顺序:队列研究能够确定暴露与结果之间的时间顺序,这对于推断因果关系至关重要。

  2. 多因素分析:能够同时评估多个暴露因素和结果,并对混杂变量进行控制。

  3. 适用于罕见疾病:对于罕见疾病的研究,队列研究可以收集足够的案例。

  4. 长期跟踪:对于慢性疾病的发展和长期结果的研究,队列研究是理想的设计。

  5. 风险评估:能够计算特定暴露因素对疾病风险的影响。

然而,队列研究也有局限性,例如:

  1. 成本和时间:前瞻性队列研究特别是长期、大规模的研究可能需要大量的资金和时间。

  2. 跟踪丢失:参与者可能会在研究期间脱落,导致数据不完整。

  3. 改变与适应:参与者可能会改变他们的行为或生活方式,这可能会影响研究结果。

  4. 选择偏倚:如果队列成员的选择不代表整个人群,研究结果可能会有偏差。

队列研究是公共卫生和临床医学研究中的一个重要工具,用于探索疾病的风险因素、预防策略和治疗干预的有效性。

# 什么是 IIT

在临床研究中,IIT 是指 "Investigator-Initiated Trial"(研究者发起的试验)。这是由独立的研究者(例如,医生或学术研究人员)发起和主导的临床试验,而不是由制药公司或其他商业实体直接发起。

以下是 IIT 的一些关键特点:

  1. 研究者主导:IIT 通常由学术机构、医院或独立研究者发起。研究者负责设计试验、撰写方案、申请伦理委员会批准、招募受试者和管理试验的各个方面。
  2. 非商业驱动:虽然 IIT 可能会得到制药公司或其他机构的资助,但它们的主要驱动力通常是科学探索、临床问题的解决、或现有治疗方法的改进,而不是商业利益。
  3. 灵活性:研究者发起的试验往往有更大的灵活性,可以探索新颖的研究问题、治疗方法或患者群体,并且可以更快地响应临床需求。
  4. 数据所有权:在 IIT 中,研究数据通常归研究者或其所属机构所有,而不是资助的公司。
  5. 监管要求:尽管 IIT 是由研究者发起的,但它们仍然需要遵守相应的法规和伦理要求,确保研究的安全性和科学性。

研究者发起的试验在临床研究中起着重要的作用,因为它们可以提供独立的、创新的视角,推动医学知识的进步和临床实践的改进。

# 什么是 exposure

在流行病学和医学研究中,“exposure”(暴露)通常指的是研究对象(如人类或动物)接触或接受某种特定因素的过程。这些因素可以是环境因素(如空气污染、饮用水中的化学物质)、生活方式因素(如饮食、运动、吸烟)、药物治疗、生物学因素(如遗传变异)或社会经济因素等。

在队列研究(cohort study)中,研究者会关注暴露与某种健康结果(如疾病发生、恢复或死亡)之间的关系。暴露可能是一个潜在的风险因素(negative exposure),增加了某种疾病的风险,也可能是一个保护因素(positive exposure),降低了疾病风险。

例如,在讨论心脏疾病的研究中,暴露可能指的是吸烟、高血压、高胆固醇水平或者是某种药物的使用。研究者会跟踪暴露与未暴露的两组人群,以比较他们发展心脏疾病的风险。

在文章中提到的 “Exposure” 可能是指研究中的暴露因素,即研究者关注的可能影响心脏疾病诊断结果的特定因素。具体的暴露因素需要根据文章的具体内容来确定。

# 什么是 AUC

AUC(Area Under the Receiver Operating Characteristic Curve),中文名为 “受试者工作特征(ROC)曲线下的面积”,是一种用于衡量二分类模型性能的指标。AUC 提供了一个单一的度量值,用以评估模型在不同分类阈值下对正负样本分类的能力。

ROC 曲线是一个图形化的工具,它展示了在不同的分类阈值下,模型的真阳性率(TPR,即灵敏度或召回率)和假阳性率(FPR,即 1 - 特异度)之间的关系。

  • 真阳性率(TPR): 也称为灵敏度,是模型正确识别出所有正样本的比例。
  • 假阳性率(FPR): 是模型错误地将负样本识别为正样本的比例。

AUC 值的范围从 0 到 1:

  • AUC = 1: 模型完美地将所有样本分类正确,没有错误。
  • 0.5 < AUC < 1: 模型的分类性能优于随机猜测。
  • AUC = 0.5: 模型的分类性能和随机猜测一样,没有区分能力。
  • 0 < AUC < 0.5: 模型的分类性能比随机猜测还差,通常这意味着模型的输出需要反转。

AUC 值越高,表示模型在分类任务上的性能越好。AUC 是一个综合考虑了所有分类阈值的性能指标,因此它在评估模型性能时非常有用,特别是在类别不平衡的情况下。在医学诊断领域,AUC 常用于评估诊断工具或模型在区分健康和疾病样本方面的效能。

# IQR

IQR 是 “interquartile range” 的缩写,即四分位距。四分位距是统计学中的一个量度,用于描述数据集的分布情况。具体来说,它是上四分位数(Q3)与下四分位数(Q1)之间的差距,反映了中间 50% 数据的范围。这样可以帮助理解数据集中值分布的集中趋势和变异性。

Transthoracic echocardiography was performed at a median of 1 day (IQR, 0-2 days) after hospitalization in patients with TTS.
在 TTS 患者中,超声心动图检查在住院后的中位时间为 1 天,四分位距在 0 到 2 天之间。

这意味着 50% 的患者在住院后的 0 到 2 天内进行了超声心动图检查。