Resumen:
|
[ES] Introducción: La fibrilación auricular (FA) es la arritmia cardiaca más frecuente y está
relacionada con eventos embólicos. La eficacia y seguridad de la anticoagulación con
antivitamina K (AVK), entre ellos el ...[+]
[ES] Introducción: La fibrilación auricular (FA) es la arritmia cardiaca más frecuente y está
relacionada con eventos embólicos. La eficacia y seguridad de la anticoagulación con
antivitamina K (AVK), entre ellos el acenocumarol, en la prevención del ictus depende del
tiempo que el paciente se mantiene en rango terapéutico (TRT). Se han diseñado algunas escalas
para predecir el comportamiento del TRT al inicio de la terapia. El objetivo de este trabajo fue
evaluar la capacidad predictiva y discriminativa del score SAMe-TT2R2 en una población
caucásica, así como investigar y comparar diferentes modelos predictivos de TRT al inicio de la
anticoagulación como herramienta para decidir si acenocumarol es el tratamiento adecuado o
hay que recurrir a anticoagulantes orales de acción directa.
Material y métodos: Se ha realizado un estudio analítico de cohorte retrospectiva en 1000
pacientes con fibrilación auricular sin patología valvular (FANV) en tratamiento activo con
acenocumarol entre 2007 y 2021 en el Consorcio Hospital General Universitario de Valencia
(CHGUV), tras la previa recopilación y digitalización de 57 probables predictores de TRT. Se
calculó el TRT durante los 6 meses siguientes al mes inicial de ajuste de dosis y se compararon
distintos modelos predictivos de TRT, usando aproximaciones de regresión y clasificación
(TRT: <60%, <65%, <70%), con la puntuación del score SAMe-TT2R2
. Tras el tratamiento de
los datos (imputación de valores nulos, anómalos, sesgo, estandarización), se eliminaron 12
variables categóricas por su baja frecuencia en una de sus categorías, así como 13 variables por
su alta correlación con otras. Se adoptaron 2 estrategias por lo que respecta a la selección de
variables: Etapa 1 con las 32 restantes y el score SAMe-TT2R2
, y Etapa 2 con las 13 variables
cuyas pruebas de significancia con el TRT mostraron un valor p ≤ 0.2. Ambas estrategias se
utilizaron en el entrenamiento y test de los siguientes modelos de Machine Learning (ML):
regresión lineal/logística, árboles de decisión, redes neuronales (Multilayer Perceptron: MLP),
ensembles (Adaboost y Voting), Máquinas de Vectores de Soporte (SVM) y algoritmos de los K
Vecinos más Cercanos (KNN). Finalmente, se realizó una validación independiente en 50
pacientes recogidos de forma posterior a la selección de los modelos óptimos en la fase de test.
Resultados: Los resultados de los modelos de ML utilizando únicamente el score
SAMe-TT2R2 fueron mejorados al introducir otras variables adicionales. En cuanto al problema
de regresión, los mejores resultados se obtuvieron con los modelos MLP y regresión lineal al
incluir las 6 variables con un valor p < 0.05 en las pruebas de significancia con el TRT,
explicando un 3.5% y 4% respectivamente de la variabilidad de los datos y los únicos modelos
con un R
2 ajustado positivo. Para el problema de clasificación, los modelos más equilibrados en
referencia al f1 score, precisión y recall/sensibilidad (métricas entre 0.5 y 0.6) fueron KNN y
regresión logística, incluyendo las variables de la Etapa 2 en la predicción de TRT<60%;
además de tener una balanced accuracy y área bajo la curva de aproximadamente 0.6.
Conclusiones: Este estudio ha evidenciado las limitaciones del score SAMe-TT2R2 como
factor predictor del TRT y que los modelos de ML pueden ayudar a mejorar la calidad de la
predicción si se les alimenta con las variables más relevantes. A pesar de ello, ninguno de los
modelos de ML desarrollados en este trabajo han conseguido suficiente capacidad predictiva.
Estos resultados pueden haber estado influenciados por el tipo de cohorte (retrospectiva), el
número de pacientes, el tipo de variables así como la falta de homogeneidad en los diagnósticos
clínicos a constar en historial electrónico. Por lo que sería necesario futuros estudios
prospectivos incluyendo mayor número de pacientes y otro tipo de variables.
[-]
[EN Introduction: Atrial fibrillation (AF) is the most common cardiac arrhythmia and is
associated with embolic events. The efficacy and safety of anticoagulation with antivitamin K
(VKA), including acenocoumarol, in the ...[+]
[EN Introduction: Atrial fibrillation (AF) is the most common cardiac arrhythmia and is
associated with embolic events. The efficacy and safety of anticoagulation with antivitamin K
(VKA), including acenocoumarol, in the prevention of stroke depends on the time the patient
remains in therapeutic range (TRT). Some scales have been designed to predict the behavior of
TRT at the start of therapy. The aim of this study was to evaluate the predictive and
discriminative capacity of the SAMe-TT2R2 score in a Caucasian population, as well as to
investigate and compare different predictive models of TRT at the start of anticoagulation as a
tool to decide whether acenocoumarol is the appropriate treatment or whether direct-acting oral
anticoagulants should be used.
Material and methods: An analytical retrospective cohort study was performed in 1000
patients with atrial fibrillation without valvular pathology (NVAF) under active treatment with
acenocoumarol between 2007 and 2021 at the Consorcio Hospital General Universitario de
Valencia (CHGUV), after prior collection and digitization of 57 probable predictors of TRT.
TRT was calculated during the 6 months following the initial month of dose adjustment and
different predictive models of TRT were compared, using regression and classification
approaches (TRT: <60%, <65%, <70%), with the SAMe-TT2R2 score. After data processing
(imputation of null values, outliers, skew, standardization), 12 categorical variables were
eliminated due to their low frequency in one of their categories, as well as 13 variables due to
their high correlation with others. Two strategies were adopted with regard to variable selection:
Stage 1 with the remaining 32 variables and the SAMe-TT2R2 score, and Stage 2 with the 13
variables whose significance tests with the TRT showed a p value ≤ 0.2. Both strategies were
used in the training and testing of the following Machine Learning (ML) models: linear/logistic
regression, decision trees, neural networks (Multilayer Perceptron: MLP), ensembles (Adaboost
and Voting), Support Vector Machines (SVM) and K Nearest Neighbors (KNN) algorithms.
Finally, an independent validation was performed on 50 patients collected after the selection of
the optimal models in the test phase.
Results: The results of the ML models using only the SAMe-TT2R2 score were improved
by introducing additional variables. Regarding the regression problem, the best results were
obtained with the MLP and linear regression models when including the 6 variables with a
p-value < 0.05 in the significance tests with the TRT, explaining 3.5% and 4% respectively of
the variability of the data and the only models with a positive adjusted R2. For the classification
problem, the most balanced models in reference to f1 score, precision and recall/sensitivity
(metrics between 0.5 and 0.6) were KNN and logistic regression, including the Stage 2 variables
in the prediction of TRT<60%; in addition to having a balanced accuracy and area under the
curve of approximately 0.6.
Conclusions: This study has evidenced the limitations of the SAMe-TT2R2 score as a
predictor of TRT and that ML models can help improve the quality of prediction if fed with the
most relevant variables. Despite this, none of the ML models developed in this work have
achieved sufficient predictive ability. These results may have been influenced by the type of
cohort (retrospective), the number of patients, the type of variables as well as the lack of
homogeneity in the clinical diagnoses to be recorded in the electronic history. Future prospective studies including a larger number of patients and other types of variables would be
necessary.
[-]
|