SciELO - Scientific Electronic Library Online

 
vol.13 issue2Scientific Writing Series: Case-Control studiesResearch ethics committees during the novel coronavirus (COVID-19) epidemic in Peru author indexsubject indexarticles search
Home Pagealphabetic serial listing  

Services on Demand

Journal

Article

Indicators

  • Have no cited articlesCited by SciELO

Related links

  • Have no similar articlesSimilars in SciELO

Share


Revista del Cuerpo Médico Hospital Nacional Almanzor Aguinaga Asenjo

Print version ISSN 2225-5109On-line version ISSN 2227-4731

Rev. Cuerpo Med. HNAAA vol.13 no.2 Chiclayo Apr./Jun 2020  Epub June 30, 2020

http://dx.doi.org/10.35434/rcmhnaaa.2020.132.675 

Contribución Especial

Metodologías Cuantitativas 2: Sesgo de confusión y cómo controlar un confusor

Quantitative Methodologies 2: Confusion bias and how to control a confounding factor

Antonio M. Quispe1  *  , Médico Epidemiólogo, Doctor en Epidemiología y Control de Enfermedades Globales
http://orcid.org/0000-0003-2100-7423

María Gracia Alvarez-Valdivia2  , Estudiante de Nutrición
http://orcid.org/0000-0002-3934-2599

Silvana Loli-Guevara3  , Estudiante de Nutrición
http://orcid.org/0000-0001-7586-5146

1 Universidad Continental, Lima, Perú.

2 Universidad Católica de Santa María, Facultad de Medicina Humana, Centro de Investigación y Estudios Médicos - CIEM

3 Universidad Nacional Mayor de San Marcos, Facultad de Medicina San Fernando, Sociedad Científica de San Fernando

RESUMEN

Identificar el sesgo de confusión y cómo controlarlo es uno de los desafíos metodológicos más importantes en el diseño de estudios que buscan identificar la causalidad. Este sesgo está presente en cualquier análisis de la asociación entre una exposición y un resultado de interés, una asociación que puede estar sesgada o no por una tercera variable llamada confusor. Podemos diagnosticar un confusor en todos los casos en los que este crea una asociación espuria entre una variable de exposición o variable independiente y la variable de resultado o variable dependiente. Para controlar el sesgo de confusión, podemos usar diferentes métodos. Estos incluyen aquellas técnicas aplicadas en el diseño del estudio, tales como restricción, aleatorización y coincidencia, y aquellas técnicas empleadas en el análisis de datos, como la estratificación, el análisis multivariado, la estandarización, los puntajes de propensión, el análisis de sensibilidad y el inverso ponderación de probabilidad. En esta revisión, analizamos cómo identificar una variable de confusión y las principales técnicas para controlar el sesgo de confusión.

Palabras claves: Sesgo de confusión; Diseño de Investigaciones Epidemiológicas; Sesgos; Análisis de regresión; Puntajes de propensión

ABSTRACT

Addressing confounding bias is one of the challenges when conducting causality studies. This occurs when we report a causal association between an exposure and an outcome, when in fact it could be result of the effect of a third factor called confounding variable. That is, when an confounder variable creates a spurious relationship between the exposure or independent variable and the outcome of interest or dependent variable. By knowing the confounding variables and their association with the exposure of interest, the confounding bias could be controlled. To control for confounding bias, we can use different methods. These include techniques applied in study design, such as restriction, randomization, and coincidence, and techniques used in data analysis, such as stratification, multivariate analysis, standardization, propensity scores, analysis sensitivity and the inverse probability weighting. In this review, we discuss how to identify a confounding variable and the main techniques for controlling for confounding bias.

Keywords: Confounding Factors, Epidemiologic; Epidemiologic Research Design, Bias; Regression Analysis; Propensity Score

Introducción

Es sesgo de confusión es un sesgo que se encuentra presente en todos los estudios científicos que plantean una hipótesis de tipo causal1. Una variable confusora, también llamado confusor o factor confusor, sesga una asociación cuando se asocia tanto a la exposición como a la variable desenlace a la vez, creando una asociación espúrea2. En este caso, la exposición o factor causal estudiado está asociado con otro factor, que a su vez está asociado causalmente con la variable desenlace de interés3. Esto puede inducir a que el investigador reporte una asociación entre la exposición y el desenlace, cuando en realidad está observando el efecto de una variable confusora sobre el desenlace4. En esta supuesta asociación es importante notar la relación temporal entre la variable confusora y la variable exposición, para determinar si se está o no ante un efecto confusor5. El control de la variable confusora puede eliminar el sesgo, pero para esto los investigadores deben conocer la naturaleza de su asociación con la exposición y el desenlace de interés6. Entonces la capacidad de controlar el sesgo de confusión depende de la capacidad de investigador para discernir una asociación espúrea de una asociación causal así como de su capacidad para implementar estrategias para controlar el sesgo de confusión en el diseño del estudio7. Para ello puede optar básicamente por dos tipos de estrategias de control del sesgo de confusión, las estrategias que se implementan en el diseño propiamente dicho (restricción, aleatorización, pareamiento, etc.) y las que se implementan en el análisis estadístico (análisis de regresión multivariable, estratificación, estandarización, puntuación de propensión, análisis de sensibilidad, ponderación de probabilidad inversa, etc.), los cuales pueden son aplicables tanto en los estudio experimentales como en los estudios observacionales8.

Idealmente todo investigador debe diseñar su estudio de tal manera que pueda concluir si una exposición causa o previene el desenlace de interés8. Para ello, según la razonamiento contrafáctico, idealmente los participantes del estudio deberían poder estar expuestos y no expuestos a la vez, toda vez que así es el único escenario en el que conseguiría un comparador perfecto y con ello se controlaría indubitablemente el sesgo de confusión9. Dado que esto no es factible en la práctica el investigador debe diseñar su estudio lo más cercano a este escenario ideal posible utilizando una o más estrategias para controlar el sesgo de confusión. Revisiones previas han sugerido que como mínimo se deben combinar las estrategias de restricción, regresión multivariable y análisis de sensibilidad, pero que una de las estrategias más potentes para controlar el sesgo de confusión es la aleatorización10. Sin embargo, es importante que si bien esto es cierto todas las estrategias tienen sus fortalezas y limitaciones.

Si bien no son pocas las revisiones en las que se ha discutido el sesgo de confusión, se ha observado que los investigadores siguen aún tienen un concepto erróneo de este importante sesgo y suelen subestimar su impacto en sus resultados11. En el presente artículo de revisión revisamos detalladamente el sesgo de confusión y cómo controlarlo. Con ello esperamos contribuir a que más investigadores tomen conciencia de su relevancia en sus diseños de estudio y mediante una serie de recomendaciones prácticas aprendan como cómo reconocerlo pero más importante cómo controlarlo.

¿QUÉ ES UN CONFUSOR?

Un confusor o variable confusora es un factor distinto al de la exposición, que se asocia de forma independiente tanto con la variable exposición como con la variable desenlace12. Este confusor, a su vez, puede alterar tanto la magnitud como la direccionalidad de esta asociación, sesgándola por completo produciendo desde asociaciones espúreas o inexistentes hasta asociaciones sobredimensionadas. Para que una variable se considere un verdadero confusor, tiene que estar ausente en la vía causal de asociación entre la variable de exposición y la variable desenlace13. En el caso de un único confusor, el solo ajuste de este proporciona una estimación no distorsionada de la relación entre las variables independientes y dependientes14. Para poder reconocer la existencia de un confusor o más confusores uno de los métodos más recomendados en la actualidad es el uso de diagramas causales15 o DAGs, acrónimo en inglés de los diagramas acíclicos dirigidos16.

Por ejemplo, planteémonos el escenario en que el que estamos interesados en investigar la asociación entre consumir café y desarrollar cáncer de pulmón (Figura 1). Lo primero que deberíamos hacer es representar nuestra asociación de interés (Figura 1a), donde consumir café podría constituir un factor de riesgo (variable exposición de interés X) de desarrollar cáncer de pulmón (variable desenlace de interés Y). Sin embargo, revisando el marco teórico conocido de cáncer de pulmón encontramos que un confusor conocido es la variable consumo de cigarrillos. Entonces, lo correcto es actualizar nuestro DAG y plantearnos la posibilidad de que el consumo de cigarrillos se constituya como un confusor (variable confusora Z) de la asociación entre consumo de café y cáncer de pulmón. Nuevamente, revisando la literatura confirmamos de que efectivamente dado que existe una asociación entre consumo de cigarrillos y consumo de café (quienes consumen cigarrillos tienen un riesgo incrementado de consumir café) y que existe un asociación entre el consumo de cigarrillos y cáncer de pulmón (el consumo de cigarrillos incrementa el riesgo de cáncer de pulmón) concluimos que efectivamente la variable consumo de cigarrillos representa un confusor de la asociación entre nuestra exposición y desenlace de interés, y por ende que de encontrarse una asociación estadística entre ambas esta es espúrea (Figura 1b). Adicionalmente a lo anterior, otro paso importante en el análisis de confusores es reconocer si nuestro confusor se encuentra o no en la ruta causal de nuestro desenlace de interés (Figura 1c).

Figura 1 Representación gráfica del sesgo de confusión 

¿QUÉ ES EL SESGO DE CONFUSIÓN?

El sesgo de confusión es uno de los tres tipos de sesgos más frecuentemente observados en los estudios epidemiológicos, siendo los otros dos el sesgo de selección y el sesgo de información7. A través del tiempo, se han propuesto diferentes definiciones del sesgo de confusión. Actualmente, podemos considerar que el sesgo de confusión se produce cuando se encuentra una asociación espúrea o se pierde una asociación verdadera entre una variable exposición y una variable de desenlace como resultado de la presencia de uno o varios factores de confusión13. La confianza en una relación causal aumenta si se puede juzgar que una asociación está razonablemente libre de confusión12.

Para un mejor entendimiento del manejo del sesgo de confusión es importante manejar los siguientes términos:

Asociación espúrea: Es la asociación matemáticamente errónea que se obtiene como resultado de la presencia de un confusor17.

Confusión observada o medida: Es dada por aquellas variables que el investigador conoce y considera como confusoras, por lo que puede tomarlas en cuenta para ser medidas y ajustadas7.

Confusión no observada o no medida: Esta es desconocida por el investigador, por lo tanto reducirla es un problema7.

Confusión Residual: Aún luego de aplicadas las estrategias para la reducción del sesgo de confusión, es matemáticamente imposible reducirla a cero, por lo que esta confusión sobrante sería la confusión residual18.

El término sesgo de confusión se ha utilizado para referirse al menos a cuatro conceptos distintos por lo que puede encontrarse en la literatura con diferentes sinónimos, tales como asociación espuria, asociación ficticia, asociación secundaria, sesgo de susceptibilidad y la paradoja de Simpson19. Algunos autores definen un confusor más ampliamente como cualquier variable para la cual el ajuste es útil para reducir el sesgo en la estimación del efecto19. Según esta definición más amplia, una variable puede ser un confusor incluso si no es una causa del resultado, siempre que la variable sea un sustituto (proxy) de dicha causa. Las variables que son factores de confusión en virtud de sus efectos sobre el parámetro de resultado (como en la definición anterior) se denominan factores de confusión causales. Por ejemplo, un confusor proxy podría verse afectado por un confusor causal y ser un determinante del tratamiento.

Las estrategias para el control del sesgo de confusión se pueden clasificar en aquellas que se aplican en el diseño propiamente dicho y las que se aplican en el análisis. Entre las estrategias que se aplican en el diseño las principales son restricción, aleatorización y pareamiento, mientras que entre aquellas que aplican en el análisis estadístico las principales son análisis de regresión multivariable, estratificación, estandarización, puntajes de propensión, análisis de sensibilidad y ponderación de probabilidad inversa. Cada de un de estas estrategias tienen sus ventajas y desventajas (Tabla 1), por lo que a continuación pasaremos a revisarlas en detalle una por una.

Tabla 1 Ventajas y desventajas de las estrategias para el control del sesgo de confusión. 

ESTRATEGIAS DE CONTROL DE SESGO DE CONFUSIÓN SEGÚN DISEÑO

Restricción

La restricción es una estrategia que consiste en restringir la población de estudio a una subpoblación de individuos con características específicas para lo cual se utilizan criterios de elegibilidad. Es decir, se eliminan de la población de estudio a todos los que son positivos al confusor que queremos controlar y analizamos nuestra asociación de interés en una subpoblación que se encuentra libre del efecto de dicho confusor13. Como ventajas, la restricción ofrece forma muy sencilla de entender y aplicar pero a la vez muy potente para eliminar el efecto de un confusor conocido8. Esta puede y debe utilizarse en todos los estudios controlados como son los estudios observacionales analíticos llámese estudios de cohortes, casos y controles, y estudios transversales como en todos los estudios experimentales20.

Sin embargo, este método se utiliza para abordar un número limitado de factores de confusión. Ya que esto implica seleccionar pacientes con características específicas para tener una población de estudio más homogénea13. Lo cual genera un inconveniente desde el punto de vista práctico, ya que debido al proceso de selección, el número de participantes elegibles generalmente se reduce; por lo que lograr el tamaño de muestra requerido se vuelve más difícil13. Además, al reducir el número de individuos en el estudio, puede existir una pérdida de potencia13. Otra desventaja de la restricción es que no permite estudiar el efecto de la variable restringida21. Por último, luego de restringir a la población, debe considerarse que la validez externa podría verse amenazada, ya que puede ser difícil la generalización de los resultados. Por lo tanto, solo debemos usar restricciones para las variables que estamos seguros que serán confusoras21.

Aleatorización

La aleatorización es considerada la mejor estrategia para controlar sesgos en general, particularmente el sesgo de confusión13. Este método consiste en seleccionar de manera aleatoria a los sujetos que será asignados a cada grupo de estudio, maximizando la probabilidad de alcanzar dos poblaciones comparables, siendo esta más alta si se utilizan métodos avanzados de aleatorización22. Con este método, si es rigurosamente empleado, se puede distribuir a los grupos de manera homogénea con lo que se minimiza sustancialmente el efecto de los confusores medidos si es que no lo desaparece13. Adicional a ello y como una ventaja importante vale destacar que este método, cuando es se consigue una adecuada comparabilidad, permite también minimizar el efecto de los confusores no medidos12, lo cual es particularmente importante en los ensayos clínicos16. Dicho lo anterior, es importante tomar en consideración que si bien la aleatorización garantiza que cualquier diferencia entre los grupos a comparar se deba al azar este método se basa en probabilidades por lo que a mayor tamaño de muestra mayor la probabilidad de minimizar la probabilidad de sesgos.

Pareamiento o emparejamiento

El pareamiento es un método consiste en seleccionar a los participantes buscando a propósito una distribución homogénea (1:1) de participantes según variables confusoras específicas23. Este método es particularmente útil en el caso de los estudios de casos y controles y estudios de cohortes21. Como tal este método ofrece como ventaja controlar múltiples factores de confusión eficientemente con menos errores aleatorios, siempre y cuando se identifique apropiadamente el grupo control19. Esta metodología puede ser individual, donde cada sujeto de estudio está afectado por un confusor, o grupal, donde se busca la misma frecuencia de un confusor sobre el grupo de expuestos y no expuestos 23. Con respecto a los estudios de casos y controles, un análisis coincidente (o estratificado) de los datos permite que la población fuente se mantenga inalterada21. Sin embargo, hay que tomar en cuenta ciertas consideraciones como la búsqueda adecuada de pares para los múltiples factores de confusión, si se dan las condiciones. Entre estas se incluyen disponer de un tamaño de muestra grande para encontrar pares suficientes, la calidad de los datos y los instrumentos de medición, así como la complejidad del análisis de datos que debe ajustarse según la proporción de coincidencia brindada13.

ESTRATEGIAS DE CONTROL DE SESGO DE CONFUSIÓN SEGÚN ANÁLISIS

Análisis de regresión multivariable.

El método de regresión multivariable consiste en incluir el confusor en un modelo multivariado para analizar como varía la asociación de interés en presencia de todos 21. Para ello mediante el uso de modelos anidados se analiza cómo varía la direccionalidad y magnitud de asociación entre las variables exposición y desenlace de interés antes y después de realizar el ajuste por la variable confuso13. Sin embargo, es importante tener en consideración que se pierde precisión mientras más variables se introduzcan en un modelo multivariable21. Por lo tanto, el número máximo de variables (factores de riesgo potenciales, variables de confusión o interacción) que se puede introducir al modelo depende en gran medida del tamaño de la muestra y poder del estudio. Para que este método funcione se requiere un dominio amplio del marco teórico disponible para reconocer cuales son los principales confusores a considerar para cada asociación de interés.

Estratificación

La estratificación es un método que consiste en controlar el sesgo de confusión analizar la asociación de interés por “estratos” o categorías de la variable confusora7 y comparando la magnitud de asociación en cada estrato (categoría) para verifica si varía o no21. Por lo mismo una de las desventajas de este método es que no permite el análisis de variables confusoras continuas, las mismas que para poder ser analizadas con este método primero deben ser categorizadas24. Además, esta estrategia tiene como desventaja que solo permite analizar unos pocos factores de confusión simultáneamente13.

Estandarización

Las estandarización es un método que consiste en distribuir el confusor de manera homogénea en el grupo de expuestos y en el de no expuestos, acercándose a un diseño ideal de estudio7. Para ello se tiene que calcular el número de eventos esperados comparados con el número de eventos observados25. Como tal es un método que podría considerarse como un tipo de emparejamiento pero que se diferencia de este porque se aplica después de la recolección de los datos7. Y desde el punto de vista metodológico la estandarización puede usarse de manera directa cuando se cuenta con un grupo de expuestos y no expuestos, o de manera que indirecta cuando se usa un población de referencia para estandarizar y luego comparar los grupos25. Como desventaja, la estandarización tradicional requiere la estratificación de la población según las categorías de la variable o variables confusoras lo que ocasiona una estimación inestable cuando se estratifica por factores múltiples, pudiendo generar datos dispersos. Como alternativa se han propuesto nuevos métodos como la estandarización basado en modelos y la estandarización covariada, para poder lidiar con el problema de inestabilidad26.

Puntajes de propensión

El uso de puntajes de propensión o propensity scores es un método que usa la probabilidad condicional del sujeto de recibir tratamiento para minimizar el sesgo de confusión27. Este análisis se puede aplicar a través del emparejamiento, la estratificación, la ponderación de probabilidad inversa, la regresión o como una covariable28. El objetivo de esta estrategia es formar poblaciones de estudio comparables de pacientes tratados y no tratados, estimando el efecto del tratamiento ajustado, y equilibrando las diferencias entre grupos de estudios con el objetivo de reducir el sesgo29. Una puntuación más alta indicará una mayor probabilidad de recibir la exposición30. La principal desventaja de esta es la falta de consideración de las covariables desconocidas o no medidas, por lo tanto genera posible confusión residual30. Al utilizar el puntaje de propensión estratificado, se retiene la data de todos los participantes y se logra cuantificar un estimado para cada estrato; pero no funciona muy bien cuando hay un alto número de estratos. Por otro lado los puntajes de propensión emparejados son sencillos de analizar e interpretar, además en la mayoría de los casos provee un buen balance del sesgo de confusión. Sin embargo, algunos pacientes pueden quedar desemparejados, lo que podría causar que esa información sea excluida del análisis y se pierda. A pesar de ello el ajuste del sesgo de confusión por puntajes de propensión comparado con el ajuste por modelos de regresión multivariable mostraron resultados similares28. El uso de puntajes de propensión con ponderación de probabilidad inversa será discutido más adelante en un apartado propio.

Análisis de Sensibilidad

El análisis de sensibilidad es un método que analiza como varía la magnitud de asociación entre la exposición y desenlace de interés, removiendo la variable confusora31. Para ello, primero se debe especificar ciertos parámetros y aplicar fórmulas analíticas para calcular la fuerza de evidencia de causalidad31. Generalmente, se utiliza el análisis de sensibilidad para el ajuste frente a una variable de confusión medida que el investigador considera importante; sin embargo, el ajuste por múltiples variables de confusión también es posible32. Como desventaja, este análisis es considerado subjetivo ya que se tiene la libre elección de parámetros y concluye en suposiciones simples31. Por lo que el valor del análisis es dependiente de la calidad de estas suposiciones; ya que aun cuando estas estén respaldadas por la ciencia, siguen siendo solamente suposiciones32.

Ponderación de probabilidad inversa (IPW)

La ponderación de probabilidad inversa (IPW) es una técnica utilizada para el control del sesgo de confusión, específicamente cuando se aborda un confusor que varía en el tiempo y que es afectado por exposiciones previas33. Esta consiste en crear una pseudopoblación que representa una población total donde todos tuviesen una igual distribución del confusor7. El procedimiento consiste en darle un peso a cada sujeto de estudio, tomando la inversa de la probabilidad que tiene este sujeto de recibir su exposición (puntaje de propensión). Si la probabilidad de ser elegido en el grupo de intervención es de 0,2 (puntaje de propensión), entonces la inversa de su probabilidad (su peso asignado) sería de 5. Una desventaja de este método es su alta variabilidad cuando analiza probabilidades de estar expuesto o no expuesto cercana a uno o cero. Este problema empeora con efectos grandes de confusión y cuando no se miden los principales confusores de la asociación de interés7.

ASPECTOS METODOLÓGICOS DEL SESGO DE CONFUSIÓN

Diagramas Acíclicos Dirigidos (DAGs)

Los diagramas acíclicos dirigidos o DAGs (Figura 2) son diagramas que representan la causalidad entre la exposición y el desenlace de interés, así como su asociación con otras variables que influyen tanto en la exposición como en el desenlace34. Este método permite identificar las variables confusoras e informar el diseño y las estrategias de control de sesgos34. De ahí que esta representación visual de la causalidad debe aplicarse al momento de diseñar el estudio y orientar la selección de criterios de elegibilidad y las variables a medir35.

Figura 2.  Representación gráfica de un Diagramas Acíclico Dirigido (DAGs)  

Recomendaciones Prácticas

En primer lugar, para la identificación de variables confusoras, el investigador debe preguntarse cuáles serían los potenciales confusores de la asociación de interés. En el proceso decidir cuáles van a ser los confusores medidos y no medidos, evaluar la naturaleza de la asociación, su direccionalidad y qué variables son los principales determinantes del desenlace de interés. Para responder estas preguntas, el investigador debe basarse en literatura científica confiable y apoyarse de métodos de cuantificación de posibles factores de confusión, así como evaluar el tamaño del potencial efecto de las variables confusoras36. Por lo tanto, el valor del marco teórico de referencia es muy importante para evaluar críticamente tanto la interrelación entre las variables del estudio con respecto a la exposición y el desenlace de interés37. Se recomienda también la elaboración de un diagrama acíclico dirigido con el fin de visualizar de manera práctica las variables que podrían actuar como confusoras.

Es importante tener en cuenta la naturaleza de las variables antes de elegir una estrategia de reducción del sesgo de confusión. Ya que de acuerdo a estos ciertos métodos podrían ser más viables que otros. Además, se debe recalcar que puede utilizarse más de una estrategia para disminuir el sesgo de confusión en una investigación de causalidad. Los análisis estadísticos correspondientes a cada método de control de sesgo quedan fuera del alcance de esta revisión.

La habilidad de minimizar la confusión mediante las estrategias de control de diseño y/o análisis del estudio permite que los resultados presentados en una investigación se acerquen más a la realidad. Existen métodos con distintos grados de dificultad para el abordaje del sesgo de confusión. Sin importar el que se elija, es importante aplicarlo de manera correcta y registrar su uso al redactar el artículo.

Mensajes clave:

Motivación para realizar el estudio: En el contexto de la pandemia de COVID-19 se ha registrado un infodemia o epidemia de información con bajos controles de calidad, los mismos que para poder ser considerados válidos, requieren un conocimiento de la importancia de sesgos y como controlarlos, particularmente el sesgo de confusión.

Principales hallazgos: Se encontró que existe un cuerpo de evidencias bastante rico en estrategias y recomendaciones prácticas sobre cómo reconocer y controlar el sesgo de confusión.

Implicancias: Este estudio contribuye con estrategias y recomendaciones sobre cómo reconocer y controlar el sesgo de confusión, el mismo que con el relajamiento de los controles de calidad y el crecimiento de los artículos publicados expeditamente se hace más y más relevante que nunca.

Agradecimientos

A los participantes del Club de Redacción de Artículos Científicos (CRAC) por su valiosos comentarios y ediciones a las versiones preliminares de este manuscrito

REFERENCIAS BIBLIOGRÁFICAS

1. VanderWeele TJ. Principles of confounder selection. Eur J Epidemiol. 2019;34(3):211-9. doi: 10.1007/s10654-019-00494-6 [ Links ]

2. Haneuse S. Distinguishing Selection Bias and Confounding Bias in Comparative Effectiveness Research. Med Care. 2016;54(4):e23-9. doi: 10.1097/MLR.0000000000000011 [ Links ]

3. Matsui EC, Keet CA. Weighing the evidence: Bias and confounding in epidemiologic studies in allergy/immunology. J Allergy Clin Immunol. 2017;139(2):448-50. doi: 10.1016/j.jaci.2016.09.030 [ Links ]

4. Grimes DA, Schulz KF. Bias and causal associations in observational research. Lancet. 2002;359(9302):248-52. doi: 10.1016/S0140-6736(02)07451-2 [ Links ]

5. Vetter TR, Mascha EJ. Bias, Confounding, and Interaction: Lions and Tigers, and Bears, Oh My! Anesth Analg. 2017;125(3):1042-8. doi: 10.1213/ANE.0000000000002332 [ Links ]

6. Fewell Z, Davey Smith G, Sterne JA. The impact of residual and unmeasured confounding in epidemiologic studies: a simulation study. Am J Epidemiol. 2007;166(6):646-55. doi: 10.1093/aje/kwm165 [ Links ]

7. Howards PP. An overview of confounding. Part 1: the concept and how to address it. Acta Obstet Gynecol Scand. 2018;97(4):394-9. doi: 10.1111/aogs.13295 [ Links ]

8. Kyriacou DN, Lewis RJ. Confounding by Indication in Clinical Research. JAMA. 2016;316(17):1818-9. doi: 10.1001/jama.2016.16435 [ Links ]

9. Howards PP. An overview of confounding. Part 2: how to identify it and special situations. Acta Obstet Gynecol Scand. 2018;97(4):400-6. doi: 10.1111/aogs.13293 [ Links ]

10. Bradbury BD, Gilbertson DT, Brookhart MA, Kilpatrick RD. Confounding and control of confounding in nonexperimental studies of medications in patients with CKD. Adv Chronic Kidney Dis. 2012;19(1):19-26. doi: 10.1053/j.ackd.2012.01.001 [ Links ]

11. Hemkens LG, Ewald H, Naudet F, Ladanie A, Shaw JG, Sajeev G, et al. Interpretation of epidemiologic studies very often lacked adequate consideration of confounding. J Clin Epidemiol. 2018;93:94-102. doi: 10.1016/j.jclinepi.2017.09.013 [ Links ]

12. Shapiro S. Causation, bias and confounding: a hitchhiker's guide to the epidemiological galaxy. Part 1. Principles of causality in epidemiological research: time order, specification of the study base and specificity. J Fam Plann Reprod Health Care. 2008;34(2):83-7. [ Links ]

13. Braga LH, Farrokhyar F, Bhandari M. Confounding: what is it and how do we deal with it? Can J Surg. 2012;55(2):132-8. doi: 10.1503/cjs.036311 [ Links ]

14. MacKinnon DP, Krull JL, Lockwood CM. Equivalence of the mediation, confounding and suppression effect. Prev Sci. 2000;1(4):173-81. doi: 10.1023/a:1026595011371 [ Links ]

15. Williamson EJ, Aitken Z, Lawrie J, Dharmage SC, Burgess JA, Forbes AB. Introduction to causal diagrams for confounder selection. Respirology. 2014;19(3):303-11. doi: 10.1111/resp.12238 [ Links ]

16. Williams TC, Bach CC, Matthiesen NB, Henriksen TB, Gagliardi L. Directed acyclic graphs: a tool for causal studies in paediatrics. Pediatr Res. 2018;84(4):487-93. doi: 10.1038/s41390-018-0071-3 [ Links ]

17. Calude CS, Longo G. The Deluge of Spurious Correlations in Big Data. Foundations of Science. 2016;22(3):595-612. doi: 10.1007/s10699-016-9489-4 [ Links ]

18. Groenwold RH, Klungel OH, Altman DG, van der Graaf Y, Hoes AW, Moons KG, et al. Adjustment for continuous confounders: an example of how to prevent residual confounding. CMAJ. 2013;185(5):401-6. doi: 10.1503/cmaj.120592 [ Links ]

19. Greenland S, Morgenstern H. Confounding in health research. Annu Rev Public Health. 2001;22:189-212. doi: 10.1146/annurev.publhealth.22.1.189 [ Links ]

20. Mares JD, Gutierrez AR, Valentin EB, Quispe AM. Serie de Redacción Científica: Estudios Trasversales. Revista del Cuerpo Médico del HNAAA. 2020;13(1):72-7. doi: 10.35434/rcmhnaaa.2020.131.626 [ Links ]

21. de Irala J, Martinez-Gonzalez MA, Guillen Grima F. [What is a confounding variable?]. Med Clin (Barc). 2001;117(10):377-85. doi: 10.1016/s0025-7753(01)72121-5 [ Links ]

22. Consonni D, Bertazzi PA, Zocchetti C. Why and how to control for age in occupational epidemiology. Occup Environ Med. 1997;54(11):772-6. doi: 10.1136/oem.54.11.772 [ Links ]

23. de Graaf MA, Jager KJ, Zoccali C, Dekker FW. Matching, an appealing method to avoid confounding? Nephron Clin Pract. 2011;118(4):c315-8. doi: 10.1159/000323136 [ Links ]

24. Jager KJ, Zoccali C, Macleod A, Dekker FW. Confounding: what it is and how to deal with it. Kidney Int. 2008;73(3):256-60. doi: 10.1038/sj.ki.5002650 [ Links ]

25. Gharibzadeh S, Mohammad K, Rahimiforoushani A , Amouzegar A, M.A. M. Standardization as a Tool for Causal Inference in Medical Research. Arch Iran Med. 2016;19(1 de septiembre). doi: 10.161909/aim.0011 [ Links ]

26. Sato T, Matsuyama Y. Marginal structural models as a tool for standardization. Epidemiology. 2003;14(6):680-6. doi: 10.1097/01.EDE.0000081989.82616.7d [ Links ]

27. Blackstone EH. Comparing apples and oranges. J Thorac Cardiovasc Surg. 2002;123(1):8-15. doi: 10.1067/mtc.2002.120329 [ Links ]

28. Elze MC, Gregson J, Baber U, Williamson E, Sartori S, Mehran R, et al. Comparison of Propensity Score Methods and Covariate Adjustment: Evaluation in 4 Cardiovascular Studies. J Am Coll Cardiol. 2017;69(3):345-57. doi: 10.1016/j.jacc.2016.10.060 [ Links ]

29. Austin PC. An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies. Multivariate Behav Res. 2011;46(3):399-424. doi: 10.1080/00273171.2011.568786 [ Links ]

30. Lu CY. Observational studies: a review of study designs, challenges and strategies to reduce confounding. Int J Clin Pract. 2009;63(5):691-7. doi: 10.1111/j.1742-1241.2009.02056.x [ Links ]

31. VanderWeele TJ, Ding P. Sensitivity Analysis in Observational Research: Introducing the E-Value. Ann Intern Med. 2017;167(4):268-74. doi: 10.7326/M16-2607 [ Links ]

32. Groenwold RH, Sterne JA, Lawlor DA, Moons KG, Hoes AW, Tilling K. Sensitivity analysis for the effects of multiple unmeasured confounders. Ann Epidemiol. 2016;26(9):605-11. doi: 10.1016/j.annepidem.2016.07.009 [ Links ]

33. Allan V, Ramagopalan SV, Mardekian J, Jenkins A, Li X, Pan X, et al. Propensity score matching and inverse probability of treatment weighting to address confounding by indication in comparative effectiveness research of oral anticoagulants. J Comp Eff Res. 2020. doi: 10.2217/cer-2020-0013 [ Links ]

34. Akinkugbe AA, Sharma S, Ohrbach R, Slade GD, Poole C. Directed Acyclic Graphs for Oral Disease Research. J Dent Res. 2016;95(8):853-9. doi: 10.1177/0022034516639920 [ Links ]

35. Suttorp MM, Siegerink B, Jager KJ, Zoccali C, Dekker FW. Graphical presentation of confounding in directed acyclic graphs. Nephrol Dial Transplant. 2015;30(9):1418-23. doi: 10.1093/ndt/gfu325 [ Links ]

36. Zhang X, Faries DE, Li H, Stamey JD, Imbens GW. Addressing unmeasured confounding in comparative observational research. Pharmacoepidemiol Drug Saf. 2018;27(4):373-82. doi: 10.1002/pds.4394 [ Links ]

37. Yang JY, Webster-Clark M, Lund JL, Sandler RS, Dellon ES, Sturmer T. Propensity score methods to control for confounding in observational cohort studies: a statistical primer and application to endoscopy research. Gastrointest Endosc. 2019;90(3):360-9. doi: 10.1016/j.gie.2019.04.236 [ Links ]

Financiamiento: Autofinanciada

Recibido: 20 de Mayo de 2020; Aprobado: 30 de Junio de 2020

Correspondencia: Antonio M Quispe MD, MSc, CPH, PhD. Dirección: General Borgoño 355, Miraflores. Teléfono: 962169519. Correo: drantonioquispe@gmail.com

Conflictos de interés: Ninguno de los autores reporta algún conflicto de interés.

Contribuciones de los autores: Antonio M Quispe, María Gracia Alvarez-Valdivia y Silvana Loli-Guevara participaron en la concepción del artículo, la recolección de datos, su redacción y aprobación de la versión final. Además, Antonio M Quispe, Esmeralda M Rojas, David E Advíncula Rosa Barrera-Cajahuanca y Yessica Hinojosa-Ticona realizaron el análisis de datos.

Creative Commons License Este es un artículo publicado en acceso abierto bajo una licencia Creative Commons