INTRODUCCIÓN
En la actualidad, el cáncer de mama sigue siendo uno de los cánceres más frecuentes a nivel global, el más frecuente en el sexo femenino, con elevada morbilidad, mortalidad, costos en salud y afectación de la calidad de vida.1,2En Latinoamérica, se estima que se diagnostican un cuarto de los casos a nivel global, con una frecuencia de casi 500 mil.2Aunque el pronóstico de los canceres de mama ha mejorado notablemente en países de altos ingresos, en países de bajos y medianos ingresos sigue siendo débil, con importantes barreras en la implementación de estrategias relacionadas al diagnóstico y manejo precoz.3-6
El tamizaje, esencialmente por mamografía, ha demostrado ser útil en la detección temprana de este cáncer.7Aún así, no en todos los escenarios es reproducible, o impacta de la misma forma, debido a variables relacionadas a la formación en talento humano, infraestructura o políticas públicas. Por tal motivo, se han diseñado herramientas que complementen el rendimiento de esta ayuda diagnóstica, como la inteligencia artificial, para promover el flujo de paciente.8La ejecución de estudios con el diseño de algoritmos basados en patrones imagenológicos y características clínicas, ha mejorado significativamente el rendimiento diagnóstico del cáncer de mama.9Aún así, no existen grupos de investigación, líneas de trabajo ni cohortes masivas, que faciliten el agrupamiento de datos basados en población.10-12
Con el objetivo de conocer el panorama de la investigación global sobre una herramienta que puede modificar la detección precoz del cáncer de mama, y que sea replicable en gran número de escenarios, incluyendo países de bajos y medianos ingresos,13el objetivo de este estudio fue analizar la producción científica global relacionada al uso de inteligencia artificial en imagenología para la detección de cáncer de mama.
METODOLOGÍA
Se realizó un estudio bibliométrico de corte transversal, haciendo uso de la base de datos más grande de literatura científica revisada por pares, Scopus. El uso de esta base para este tipo de análisis ha sido utilizada previamente.14,15Distinto a otros motores de búsqueda, índices citacionales y bases de datos, como lo son PubMed o Web of Science, Scopus posee mayor número de indexación de revistas biomédicas latinoamericanas, que facilitan la identificación de evidencia de esta región.
Se diseñó y ejecutó una búsqueda estructurada, para identificar artículos relacionados al uso de inteligencia artificial en imagenología para la detección de cáncer de mama. Para esto, se tomó en cuenta la afiliación reportada en los metadatos y corroborara por la publicación oficial a texto completo. La estrategia de búsqueda, se construyó haciendo uso de términos MeSH, así como sinónimos, tanto en idioma inglés como español. Posterior a una prueba piloto, se definió utilizar la siguiente búsqueda: TITLE-ABS-KEY(“Breast Carcinoma In Situ”) OR TITLE-ABS-KEY(“Breast Ductal Carcinoma”) OR TITLE-ABS-KEY(“Lobular Carcinoma”) OR TITLE-ABS-KEY(“Triple Negative Breast Neoplasms”) OR TITLE-ABS-KEY(“Unilateral Breast Neoplasms”) OR TITLE-ABS-KEY(“Inflammatory Breast Neoplasms”) OR TITLE-ABS-KEY(“Breast Cancer”) OR TITLE-ABS-KEY(“Mammary Cancer”) OR TITLE-ABS-KEY(“Malignant Neoplasm of Breast”) OR TITLE-ABS-KEY(“Breast Malignant Neoplasm”) OR TITLE-ABS-KEY(“Breast Malignant Tumor”) OR TITLE-ABS-KEY(“Cancer of Breast”) OR TITLE-ABS-KEY( “Cancer of the Breast”) OR TITLE-ABS-KEY(“Breast Carcinoma”) AND TITLE-ABS-KEY(“Artificial Intelligence”) OR TITLE-ABS-KEY(“Computational Intelligence”) OR TITLE-ABS-KEY(“Machine Intelligence”) OR TITLE-ABS-KEY(“Computer Reasoning”) OR TITLE-ABS-KEY(“Computer Vision System”) OR TITLE-ABS-KEY(“Machine Learning”) OR TITLE-ABS-KEY(“Deep Learning”) OR TITLE-ABS-KEY(“Sentiment Analysis”) OR TITLE-ABS-KEY( “Neural Networks”) AND TITLE-ABS-KEY(“Early Detection of Cancer”) OR TITLE-ABS-KEY(“Cancer Screening”) OR TITLE-ABS-KEY(“Cancer Early Diagnosis”) OR TITLE-ABS-KEY(“Early Diagnosis”).
Esta búsqueda, fue realizada hasta el 10 de febrero de 2024, y fue filtrada con las etiquetas “Humanos” y “Revistas”. De esta forma, fue excluida literatura que no sigue el proceso de revisión por pares regular para publicación en revistas científicas, como, por ejemplo, libros, series de libros, resúmenes, y memorias de eventos científicos. No se estableció una ventana límite de tiempo para inclusión de artículos
Posteriormente, se realizó una revisión manual, para eliminar duplicados y aquellos artículos no relacionados al tema de interés, basados en título, resumen y palabras clave. Todo lo anterior, se realizó en Microsoft Office Excel 2016. Subsiguiente, se estandarizaron los datos de las variables de interés, para reducir las discrepancias entre la forma en la que se registran los metadatos originalmente. De esta forma, se reagruparon categorías. Por ejemplo, en el caso de tipología de artículos, todos aquellos estudios originales, que aportaran datos primarios, independientemente del diseño observacional o experimental, fueron categorizados como “Artículos con datos primarios”; de la misma forma, todas aquellas revisiones, independientemente de su diseño (ya sea narrativa, sistemática o meta-análisis), fueron categorizadas como “Revisiones”. Editoriales, cartas al editor, comentarios, etc; fueron categorizados como “Correspondencias”.
Para el análisis estadístico, se emplearon métricas de redes, para visualizar las tendencias, características, y calcular impacto científico. Se hizo uso del paquete bibliometrix de R para la realización de este análisis, que permite calcular indicadores bibliométricos cuantitativos, así como la visualización de los resultados (versión 4.3.1).16Sinónimos, errores, plurales y variantes, fueron estrictamente reagrupados para hacer homogéneo el análisis. De esta forma, se estandarizaron palabras clave, autores e instituciones. Agregado, se ejecutó el análisis descriptivo de la producción científica encontrada. Se caracterizaron los autores más prolíficos, y la distribución de publicaciones, por medio de la Ley de Lotka. Se construyeron redes de colaboración, para determinar el grado y fuerza de colaboración entre países.
Para medir el impacto de instituciones y países, se hizo uso del índice h, así como valor absoluto de citaciones acumuladas. Las definiciones y especificaciones del uso de estas métricas en estudios bibliométricos, ha sido descrito previamente.17,18El cálculo de frecuencias y porcentajes, se realizó por medio de Microsoft Office Excel 2016.
Aspectos éticos: Este estudio no requirió aprobación por parte de comité de ética, teniendo en cuenta que no realizó investigación en seres humanos, modelos biológicos o historial médico.
RESULTADOS
Inicialmente, se identificaron 1833 documentos, los cuales, posterior a la aplicación de criterios de inclusión y exclusión, fueron seleccionados finalmente 1292. De forma particular, del total de documentos identificados inicialmente, 540 documentos correspondieron a conference paper. La ventana de tiempo de la evidencia analizada, fue de 1989 a 2024 (35 años). De los documentos seleccionados, el 75,3% (n=973) fueron artículos con datos primarios, seguido de un 16,2% (n=209) correspondiente a revisiones. Se identificó una colaboración internacional del 26,5%, y un crecimiento anual de la producción del 10,78% (Tabla 1). Se observó un crecimiento lento hasta el año 2013, donde el incremento en el volumen de publicaciones es notable, con pico en el año 2023, con más de 300 artículos publicados (Figura 1-A ). Contrario al número de citaciones obtenidas a lo largo del tiempo, el cual ha sido fluctuante, con pico en 2019 (Figura 1-B ). Al aplicar la ley de Lotka, se encontró que, el 84% de los autores solo ha publicado un documento, seguido de un 9,8% con dos documentos.
Tabla 1 Características generales de la producción científica global sobre uso de inteligencia artificial en imagenología para la detección de cáncer de mama (N=1292).
n | % | |
Tipología de artículo | ||
Artículo con datos primarios | 973 | 75,3 |
Revisión | 209 | 16,2 |
Correspondencias* | 110 | 8,5 |
Autores | ||
Autorías | 5517 | - |
Autores de documentos con autoría única (N=5517) | 85 | 1,54 |
Colaboración | ||
Artículos con autoría única | 94 | - |
Coautorías por artículo (media) | 5,7 | - |
Coautoría internacional | 26,5 | - |
Palabras clave | 2206 | - |
Revistas | 535 | - |
Edad promedio de artículo (años) | 3,84 | - |
Promedio de citaciones por documento | 23,9 | - |
Crecimiento anual | - | 10,78 |
*Incluye cartas al editor, editoriales, comentarios, etc.

Figura 1 Crecimiento científico anual de la investigación global sobre uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Frecuencia de publicación anual. B. Promedio de citas recibidas por artículo por año.
Estados Unidos fue el país más prolífico con 311 documentos, así como el que más impacto ha obtenido (índice h de 52 y 11.757 citaciones). Le siguen China (índice h de 33 y 4231 citaciones) e India (índice h de 30 y 2862 citaciones), con 213 y 186 documentos, respectivamente. En cuanto a afiliaciones/instituciones, Radboud University Medical Center (ubicada en Países Bajos) fue la afiliación más prolífica y con mayor impacto, con 29 documentos e índice h de 19 (1425 citaciones), seguido de Harvard Medical School (índice h de 12 con 1814 citaciones), Karolinska Institutet (índice h de 14 con 1145 citaciones), y Massachusetts General Hospital (índice h de 14 con 1858 citaciones), con 24 documentos todas tres.
En cuanto a las revistas donde se ha publicado esta evidencia, Radiology es la revista con mayor número de documentos (n=44) (Figura 2-A ). Sin embargo, la revista Nature ha recibido el mayor número de citaciones (2102 citaciones) (Figura 2-B ). Aún así, Radiology ha obtenido el mayor impacto, medido por los índices h y g (19 y 38, respectivamente) (Figura 2 C-D), mientras que Diagnostics ha obtenido el mayor índice m (2,75) (Figura 2-E ). Radiology y Cancers, son las revistas que han crecido más notablemente en los últimos siete años (Figura 2-F ).

Figura 2 Impacto y frecuencia de publicación en revistas con el mayor número de documentos sobre el uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Frecuencia de artículos publicados. B. Total de citaciones obtenidas. C. Índice h obtenido. D. Índice g obtenido. E. Índice m obtenido. F. Frecuencia acumulada a lo largo del tiempo de artículos en las revistas más populares.
En cuanto a tendencias y patrones de investigación, por medio de la construcción de nube de palabras, se observó que, la clasificación de riesgo por screening, tomosíntesis digital de la mama, aprendizaje por transferencia, segmentación y selección por características, son las palabras clave más comúnmente usadas (Figura 3-A ). En los últimos cinco años, el aprendizaje profundo y la mamografía, han sido los temas con mayor popularidad (Figura 3-B ), mientras que, en los últimos 10 años, otros tópicos como aprendizaje automático, redes neuronales, densidad mamaria, minería de datos y estratificación de riesgo, también han ganado gran interés en la investigación de este campo (Figura 3 C-D ). Los biomarcadores ligados a la ecografía mamaria y su potencial diagnóstico, surgen como nichos temáticos, mientras que la tomosíntesis digital de mama y la biopsia liquida, son temas emergentes (Figura 3-E ). El análisis factorial por correspondencia múltiple, muestra una asociación notable entre los tópicos de: 1) Radiómica, resonancia magnética nuclear y estratificación de riesgo; 2) Mamografía, redes neuronales y clasificación de imágenes; 3) Densidad de mama, tomosíntesis y termografía (Figura 3-F ).

Figura 3 Evolución y tendencias de la investigación global sobre uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Nube de palabras clave más frecuentes. B. Evolución de los tópicos más frecuentes a lo largo del tiempo. C. Frecuencia de tópicos a partir del 2010. D. Red de co-ocurrencia de palabras clave. E. Mapa temático con grado de desarrollo y relevancia de tópicos. F. Análisis de correspondencia múltiple con grado de contribución de cada tópico.
En cuanto a redes de colaboración, se pudo visualizar que, la escuela de medicina de la Universidad de Harvard, Universidad de Pensilvania, Instituto Karolinska, y el Centro Médico Universitario Radboud, lideran la colaboración internacional, colaborando todas las instituciones, con instituciones esencialmente europeas y norteamericanas (Figura 4-A ). Respecto a los países, se identificó una sólida colaboración entre Estados Unidos, China y Reino Unido. Específicamente, China colabora fuertemente con países del continente asiático, mientras que, Estados Unidos y Reino Unido, lo hace con países europeos (Figura 4-B ). Distinto a Brasil, no se identificó otro país latino que destacara en colaboración internacional en el tema de interés.

Figura 4 Redes de colaboración institucional y de países en investigación global sobre uso de inteligencia artificial en imagenología para la detección de cáncer de mama. A. Colaboración entre afiliaciones. B. Colaboración entre países.
Al resumir los artículos con el mayor impacto obtenido a la fecha, medido por número de citaciones recibidas, se encontró que, los tres más destacados fueron: 1) International evaluation of an AI system for breast cancer screening (1282 citaciones; publicado en Nature en 2020; DOI: 10.1038/s41586-019-1799-6); 2) Artificial intelligence in cancer imaging: Clinical challenges and applications (901 citaciones; publicado en CA: A Cancer Journal for Clinicians en 2019; DOI: 10.3322/caac.21552); 3) Deep Learning to Improve Breast Cancer Detection on Screening Mammography (541 citaciones; publicado en Scientific Reports en 2019; DOI: 10.1038/s41598-019-48995-4).
DISCUSIÓN
Este análisis, revela por primera vez la evolución de los patrones y tendencias de la investigación global relacionada al uso de inteligencia artificial en imagenología para el diagnóstico de cáncer de mama. Se identificó que, a pesar de haberse identificado las primeras publicaciones a finales de la década de los 80 y a principios de los 90, solo fue a partir de la década del 2010, que hubo un incremento paulatino pero notable de la producción científica global sobre el uso de la inteligencia artificial aplicado a la imagenología para la detección de cáncer de mama. Esto, puede explicarse por la difusión y avance del uso de las herramientas de las ómicas, ligado a la inteligencia artificial, el cual se ha expandido rápidamente.19,20Sin embargo, países de los continentes latinoamericanos y africanos, aún tienen un nivel de investigación, así como de colaboración internacional, muy modesto, a pesar de ser regiones con importantes necesidades en la atención y detección precoz del cáncer de mama.21Posiblemente, la ausencia de evidencia y datos sobre el estado actual de la investigación aplicada de la inteligencia artificial en imagenología y cáncer de mama, ha impedido la construcción de una hoja de ruta basada en evidencia, que impulse la investigación de este campo.
Se puede inferir que, por la masiva existencia de redes, consensos y colaboraciones internacionales sobre cáncer de mama,22,23localizadas esencialmente en Estados Unidos y Europa, es que estos continentes han progresado de forma importante en la innovación de aplicación de técnicas novedosas de inteligencia artificial ligada a la detección precoz, estratificación de riesgo, y predicción del cáncer de mama. Aun así, se determinó un porcentaje de colaboración internacional menor al 30%. La aplicación de investigación traslacional, con búsqueda de biomarcadores por medio del uso de las ómicas, y apoyado en la minería de datos analizada por inteligencia artificial, permite la construcción de clusters basado en características comunes, clínicas, imagenológicas e histopatológicas, para lograr resultados aplicables y con un rendimiento aceptable en la práctica asistencial.24,25
Es por la emergencia de este nicho de investigación, que se puede apreciar el notable número de citaciones e impacto acumulado, a pesar de los pocos años del crecimiento dramático de la producción científica. El uso de aprendizaje profundo, redes neuronales, aprendizaje automático, y aprendizaje por transferencia, permite la alimentación de algoritmos con un alto grado de precisión para la identificación de patrones sugestivos de malignidad, que faciliten la detección precisa de un cáncer de mama.26Considerando que, existen variables no modificables en la fisiopatología y evolución del cáncer,27es necesario reproducir de forma rigurosa y sólida este tipo de estudios, que impulsen el cumplimiento de metas en salud.
Favorablemente, en función de la construcción esperable de nuevo conocimiento, la evidencia existente es predominantemente a expensas de datos primarios. Aún así y, basados en la brecha del origen de los datos, todavía existen muchos lugares del mundo donde la producción de datos es muy baja o nula, lo que podría sesgar el potencial predictivo de un algoritmo basado en características clínicas, sociales o genéticas de distintas poblaciones. Pero, esto no resta el avance importante identificado en el presente análisis.
Como limitaciones, se encuentra el uso de una sola base de datos e índice citacional, Scopus, pero se ha reportado como la base con el mayor número de literatura indexada en ciencias de la salud. Así mismo, el sesgo inherente del margen de error de los metadatos registrados. No obstante, para el control de esto, se realizó el proceso de revisión y estandarización manual por parte de los autores.
CONCLUSIONES
Se identificó un crecimiento notable en la investigación global sobre el uso de inteligencia artificial en imagenología para la detección de cáncer de mama, marcado a partir de la década del 2010, esencialmente por medio de publicación de artículos con datos primarios. La producción ha sido liderada por Estados Unidos, China e India. Sin embargo, las redes de colaboración internacional, son lideradas por Estados Unidos, China y Reino Unido. Dentro de los nichos y patrones de investigación más populares, se encuentran el aprendizaje por transferencia, aprendizaje profundo, redes neuronales, aprendizaje automático, segmentación y selección por características, ligado a la mamografía y tomosíntesis digital de la mama, para la estratificación de riesgo.