ISNN - 0300-9041
ISSNe - 2594-2034
Indizada en: PubMed, SciELO, Índice Médico Latinoamericano, LILACS, Medline
EDITADA POR LA Federación Mexicana de Colegios de Obstetricia, y Ginecología A.C.
FUNDADA POR LA ASOCIACIÓN MEXICANA DE GINECOLOGÍA Y OBSTETRICIA EN 1945
INFORMACIÓN EXCLUSIVA PARA LOS PROFESIONALES DE LA SALUD
Periodicidad: mensual
Editor: José Niz Ramos
Coeditor: Juan Carlos Barros Delgadillo
Abreviatura: Ginecol Obstet Mex
ISSN: 0300-9041
ISSNe: 2594-2034
Indizada en: PubMed, SciELO, Índice Médico Latinoamericano, LILACS, Medline.
Comentario y respuesta al artículo: "Comparación de cuatro tablas de crecimiento fetal para la predicción de desenlaces perinatales adversos en un hospital de tercer nivel de México".
Comparison of four growth charts fetal for the prediction of perinatal outcomes adverse events in a tertiary hospital in Mexico.
Ginecol Obstet Mex | 20 de Enero de 2022
Ginecol Obstet Mex 2022; 90 (1): 115-118.
https://doi.org/10.24245/gom.v90i1.6992Héctor Oviedo-Cruz,1 Erika Ruth Carrasco-Blancas,1 Marco Antonio Cortes-Martínez2
1 Departamento de Medicina Materno-Fetal, Centro Médico para Atención Especializada. Hospital Español. Ciudad de México.
2 Departamento de Bioquímica y Calidad, Laboratorio CEMAFE, Ciudad de México.
Recibido: octubre 2021
Aceptado: diciembre 2021
Héctor Oviedo Cruz
hector.oviedo@antesdelparto.com
Comentario y respuesta al artículo: "Comparación de cuatro tablas de crecimiento fetal para la predicción de desenlaces perinatales adversos en un hospital de tercer nivel de México".
Sr. Editor:
El trabajo de Mendoza-Carrera et al1 es único y valioso porque describe el rendimiento de cuatro curvas de crecimiento fetal para predecir eventos perinatales adversos en una población mexicana; hecho sin precedentes. Sin embargo, no se realizó la comparación estadística entre los indicadores de rendimiento de las pruebas. De acuerdo con el objetivo del estudio, “comparar el rendimiento”, esta es una deficiencia metodológica que afecta la conclusión por privarle de sustento formal.
El desempeño de las pruebas de predicción se evalúa de forma similar al de las pruebas diagnósticas.2 Para comparar el desempeño entre dos pruebas diagnósticas en el mismo grupo de pacientes, el análisis estadístico puede basarse en la diferencia entre las sensibilidades y especificidades3 o en la comparación pareada de las áreas bajo las curvas de característica de receptor-operador (AUC-ROC).4
El estadístico más recomendable para comparar las sensibilidades y especificidades entre dos pruebas es el de McNemar,5 que utiliza la distribución de χ2;6 ésta también sirve de base para los estadísticos que comparan tres o más pruebas.7
La comparación entre más de dos curvas ROC se hace mediante estadísticos de diseño propio,8-11 preferentemente codificados en programas de cómputo;12-14 pero el análisis también puede basarse solo en los intervalos de confianza de las AUC-ROC.15
El documento de Mendoza-Carrera et al1 omitió explicar cómo se llegó al tamaño de muestra, incumpliendo las recomendaciones STROBE16 declaradas por los autores; es menester reportarlo incluso si fue por conveniencia, como en estudios piloto o cuando no hay datos previos, aunque suele basarse en los índices de desempeño de la prueba en cuestión.17
Por lo anterior, el trabajo de Mendoza-Carrera et al1 es único y valioso, pero su conclusión debió ponderarse formalmente con alguna prueba estadística.
REFERENCIAS
Respuesta al comentario anterior
Agradecemos los comentarios y retroalimentación constructiva por parte de los doctores Oviedo-Cruz, Carrasco-Blancas y Cortés-Martínez. Dado que en el estudio de Mendoza-Carrera et al (1) evaluó el rendimiento predictivo global de cuatro tablas de crecimiento fetal en relación con un desenlace perinatal adverso compuesto utilizando diferentes parámetros (es decir, riesgo relativo, sensibilidad, especificidad, valor predictivo positivo, valor predictivo negativo, sensibilidad ajustada a una tasa de falsos positivos del 10%, y área bajo la curva [AUC, c-statistic]), la comparación formal de cada uno de esos parámetros entre las cuatro tablas utilizando pruebas estadísticas como se sugiere, incrementaría de manera significativa la tasa de falsos positivos2 y sería necesario utilizar algún método para corregir dicha multiplicidad (por ejemplo, la prueba propuesta por Bonferroni). Igualmente, se requeriría realizar una comparación por pares para cada parámetro ya que no se estarían evaluando dos tablas, sino cuatro, lo que requeriría un tamaño de muestra mucho mayor.3 También es importante mencionar que en el estudio de Mendoza-Carrera et al1 se realizaron varios análisis de subgrupos (por ejemplo, resultado respiratorio compuesto, ingreso a unidad de cuidados intensivos neonatales, hiperbilirrubinemia) lo que incrementaría aún más la tasa de falsos positivos si se llevara a cabo una comparación estadística formal.
Asimismo, agradecemos la oportunidad para aclarar que en el estudio de Mendoza-Carrera et al1se utilizó un método de muestreo por conveniencia,4 incluyendo todos los datos disponibles en el periodo de estudio. En la discusión del artículo de Mendoza-Carrera et al1 se destaca el tamaño de muestra relativamente pequeño y la necesidad de realizar más proyectos de investigación (idealmente multicéntricos) en población mexicana y en otros países de América Latina para confirmar los resultados reportados en dicho estudio.
La información presentada en el estudio de Mendoza-Carrera et al1 podría ser de utilidad para realizar el análisis de poder para estudios de investigación similares en los que se plantee una hipótesis específica definida a priori5 (por ejemplo, se plantea la hipótesis que la tabla de crecimiento fetal de la Fundación de Medicina Fetal Barcelona6 tiene un mejor rendimiento predictivo [tomando el AUC como referencia] que la tabla propuesta por INTERGROWTH-21st7 en población mexicana). Por otra parte, con una única comparación e hipótesis correspondiente, se evitaría el problema de multiplicidad antes descrito.
Finalmente, estamos de acuerdo con los doctores Oviedo-Cruz, Carrasco-Blancas, y Cortés-Martínez en cuanto a diseñar y analizar estudios de investigación con el mayor rigor metodológico posible, siguiendo siempre las recomendaciones propuestas por la red Enhancing the QUAlity and Transparency Of health Research (EQUATOR)8 y por otras organizaciones internacionales especializadas en ginecología y obstetricia.
Claudia Elvira Mendoza-Carrera, Sandra Acevedo-Gallegos, Mario Lumbreras-Márquez, Juan M Gallardo-Gaona, Diana Yazmín Copado-Mendoza, María J Rodriguez-Sibaja
REFERENCIAS