Impulsando una IA transparente en radiología: por qué localizar y describir los hallazgos es importante

Vista trasera de una joven cirujano analizando una radiografía en una tableta digital en el hospital.

Cuando se trata de salud, cada minuto cuenta. Imaginemos a un paciente que necesita una radiografía de tórax: para ello, acude al servicio de radiología donde le realizan una prueba. Después tendrá que esperar que un radiólogo examine detenidamente la imagen —revisando los pulmones, el corazón y los huesos— para redactar un informe detallado que, posteriormente, verá un médico especialista. Ese informe es clave para tomar decisiones críticas sobre el diagnóstico y el tratamiento.

Ahora imaginemos que la Inteligencia Artificial pudiera acelerar este proceso y, además, mejorar su precisión. Ahí es donde entra en juego MAIRA-2, un modelo de investigación desarrollado por Microsoft Research. Este sistema es capaz de redactar informes radiológicos, utilizando los mismos datos que observa el radiólogo. En la práctica, esto podría traducirse en una menor carga cognitiva para los profesionales, informes más precisos y flujos de trabajo más ágiles. Sin embargo, lo realmente innovador es que MAIRA-2 no solo redacta: también explica. Cada frase del informe preliminar está anclada a la región exacta de la radiografía en la que está basada. De este modo, los radiólogos podrían verificar al instante el razonamiento de la IA, haciendo que el proceso sea tanto eficiente como seguro.

Para que esto sea posible, era necesario algo nuevo: así se desarrollo PadChest-GR, el primer dataset público y multilingüe, diseñado específicamente para generar informes radiológicos fundamentados a partir de radiografías de tórax. Creado por la Universidad de Alicante, MedBravo y el Hospital Sant Joan d’Alacant, en colaboración con Microsoft Research, este dataset permite entrenar y evaluar a MAIRA-2, y marca un nuevo estándar de transparencia en el uso de la IA en el ámbito sanitario.

¿Por qué es importante? Porque localizar y describir los hallazgos no es solo una característica técnica, sino una cuestión de confianza. Puede ayudar a que los radiólogos se sientan más seguros al contar con la asistencia de la IA, y también puede hacer que los informes sean más claros tanto para los médicos como para los pacientes. Cuando todos comprenden el “porqué” detrás de un diagnóstico, la atención médica tiene el potencial de ser más rápida, más segura y mejor informada.

Ejemplo de un informe fundamentado de PadChest-GR. Texto original del informe: ”Motivo de consulta: Preoperatorio. Rx PA tórax: Impresión diagnóstica: Ateromatosis aórtica calcificada. Engrosamiento pleural biapical. Atelectasia laminar basal izquierda. Elongación aórtica. Sin otros hallazgos radiológicos significativos.”

PadChest-GR, un dataset para mejorar la radiología

PadChest-GR es un conjunto de datos que incluye 4.555 radiografías de tórax con hallazgos clínicos descritos en español y en inglés. Cada hallazgo va acompañado de una anotación espacial —una caja que indica su posición exacta en la imagen— para hallazgos positivos y negativos, así como una descripción redactada en lenguaje clínico. Se trata del primer benchmark público que evalúa la generación de informes radiológicos basados completamente en radiografías de tórax.

Más allá de los números, PadChest-GR aporta una base sobre la que se pueden construir herramientas con impacto real para hospitales, clínicas e investigadores. Para su desarrollo, se utilizó Azure OpenAI Service con GPT-4 con el objetivo de extraer conclusiones clínicas a partir de informes clínicos no estructurados. Los hallazgos, tanto positivos como negativos, se tradujeron al inglés y se vincularon a las etiquetas existentes en PadChest. El subconjunto se seleccionó cuidadosamente para reflejar una distribución realista de casos clínicamente relevantes.

A continuación, se aplicó un proceso de validación manual en la plataforma Centaur Labs, donde radiólogos del Hospital Sant Joan d’Alacant realizaron un control de calidad minucioso y añadieron cuadros delimitadores a los hallazgos positivos, aportando información espacial esencial. Finalmente, todas las anotaciones se armonizaron en formatos coherentes y estandarizados, preservando el contexto clínico original y mejorando su interpretabilidad tanto para humanos como para modelos generativos.

Descripción general del proceso de curación de datos

El desarrollo de PadChest-GR: un esfuerzo colectivo

PadChest-GR nació de la labor práctica y colaborativa entre varias disciplinas que incluyeron científicos informáticos, profesionales clínicos e investigadores del sector, trabajando codo con codo hacia un objetivo común:

  • La Universidad de Alicante, Medbravo y el BIMCV proporcionaron su sólida experiencia en procesamiento del lenguaje natural e imagen médica, y crearon en el 2019 la primera versión de PadChest, con más de 160.000 radiografías de tórax, acompañadas de sus respectivos informes y etiquetas.
  • Microsoft Research aplicó su tecnología de IA generativa, utilizando GPT-4 a través de Azure OpenAI Service, así como su conocimiento en investigación para transformar esos datos en herramientas más accesibles y evaluables para los profesionales clínicos.
  • El Hospital Universitario Sant Joan d’Alacant ofreció liderazgo clínico, contribuyendo con catorce de sus radiólogos, que revisaron y validaron los datos, asegurando que la práctica médica real estuviera siempre en el centro del proyecto.

Aunque cada colaborador aportó una experiencia única, todos compartían un mismo propósito, el de ayudar a los profesionales sanitarios a obtener respuestas más claras, más rápidas y en distintos idiomas. Esta colaboración es un recordatorio de que el verdadero progreso en salud no viene solo de la tecnología, sino de la ciencia y la dedicación humana trabajando juntos.

Javier Álvarez-Valle, el científico español que lidera el proyecto

Javier Álvarez-Valle, director sénior de Imagen Biomédica en Microsoft Research, ha desarrollado su carrera aplicando la tecnología a la salud. Originario de Asturias, su trabajo siempre ha estado enfocado en generar un impacto real con la tecnología, tanto en pacientes como en profesionales clínicos.

Antes de liderar el proyecto MAIRA, Javier fue uno de los impulsores de la labor de traducción clínica de Microsoft en el marco de Project InnerEye, una iniciativa de herramientas de imagen médica de código abierto desarrolladas junto con Cambridge University Hospitals NHS Foundation Trust (CUH). Estas herramientas sirvieron de base para OSAIRIS, el primer sistema de Inteligencia Artificial en la nube implantado en el Servicio Nacional de Salud (NHS) de Reino Unido para la planificación de tratamientos de radioterapia. Esta innovación permitió a los profesionales sanitarios ofrecer tratamientos aproximadamente 2,5 veces más rápido, reduciendo así los tiempos de espera para pacientes con cáncer.

Retrato de Javier Álvarez-Valle al aire libre durante el atardecer.

Javier Álvarez-Valle, director sénior de Imagen Biomédica en Microsoft Research

”La transparencia en la IA no se trata solo de velocidad, sino de confianza. Los hallazgos localizados convierten a la IA generativa en un copiloto en el que los clínicos pueden apoyarse

Este trabajo no se podría haber realizado de manera autónoma. Junto a profesionales de Mayo Clinic, el equipo del científico español colabora en el desarrollo de modelos fundacionales multimodales para radiografías de tórax —avanzando en la generación automática de informes y de tareas relacionadas— y llevando a cabo estudios clínicos para entender cómo estas herramientas pueden agilizar los flujos de trabajo, mejorar la calidad de los informes gracias a la localización, y apoyar decisiones más seguras en los centros de atención sanitaria.

Español (España)
Icono de exclusión de opciones de privacidad Tus opciones de privacidad
Privacidad de la salud del consumidor Ponte en contacto con Microsoft Privacidad Gestionar cookies Condiciones de uso Marcas registradas Sobre nuestra publicidad Docs de cumplimiento de la UE Informes regulatorios