Investigadores de Microsoft detectan riesgos de cáncer de pulmón en registros de búsquedas web

Por: John Roach

eric-horvitz-microsoft-08-e1461796181565
Eric Horvitz, investigador y director administrativo del laboratorio de investigación de Microsoft en Redmond, Washington, dice que las consultas de búsqueda pueden ser una alerta temprana de cáncer de pulmón. (Fotografía por Scott Eklund / rojo Box Fotos)

Fumar cigarro es la principal causa de cáncer de pulmón, la causa más común de muerte por cáncer en el mundo. Casi 20 por ciento de los diagnósticos de cáncer de pulmón se realizan en personas que son no fumadores. Eso significa que, además de fumar, existen factores geográficos, demográficos y genéticos que juegan un papel en esta devastadora enfermedad.

Un proyecto de los laboratorios de investigación de Microsoft está explorando la posibilidad de utilizar la búsqueda web de datos anónimos para aprender más sobre los factores de riesgo del cáncer de pulmón y proporcionar una alerta temprana a las personas que son candidatos para la detección de enfermedades.

TWEET THIS
“Las personas tienden a susurrar sus preocupaciones de salud en los motores de búsqueda en una base regular.” – Eric Horvitz

Los resultados, publicados en la revista de oncología JAMA, se desprenden de la investigación que los miembros del equipo publicaron en junio pasado sobre la viabilidad de utilizar los textos que la gente formula al usar motores de búsqueda para predecir el diagnóstico de cáncer de páncreas. El método de aprendizaje automático se basa en patrones que se encuentran en las consultas de búsqueda.

«Aquí, no estamos simplemente buscando en el texto de las consultas; estamos considerando los lugares donde la gente está cuando terminan las consultas, se relacionan y luego se vuelven a descomponer en factores de riesgo contextuales relacionados con dichos lugares «, dice el coautor del estudio Ryen White, director de tecnología de información sanitaria en Microsoft Salud en Redmond, Washington.

Por ejemplo, el modelo desarrollado por los investigadores determina el código postal del lugar donde la búsqueda se ha manifestado y se correlaciona con los datos de los mapas de alquiler del Servicio Geológico de EE.UU. para determinar los niveles ambientales del gas radón, un riesgo conocido de cáncer de pulmón. Los datos del censo revelan la edad promedio de los hogares en cada región, lo que es relevante pues las casas antiguas están mal ventiladas y por lo tanto pueden atrapar gas radón.

Conocer los códigos postales ayuda a los investigadores a inferir la raza y el nivel socioeconómico de los usuarios, proporcionando buenas pistas adicionales sobre el riesgo de cáncer. De acuerdo con los Centros para el Control y Prevención de Enfermedades, las personas que viven por debajo del nivel de la pobreza, tienen mayores tasas de fumar que la población general y las tasas de mortalidad para las personas con cáncer son más altas entre los negros americanos.

Además, el modelo utiliza algoritmos para determinar el probable género y edad de las personas que realizan las búsquedas a partir de patrones de consultas. Las búsquedas desde el mismo dispositivo móvil en cuestión de horas de un código postal a otro, separadas por cientos, o miles de millas, podría indicar viajes aéreos.

Tomados en conjunto, esos datos «nos permiten descubrir nuevos factores de riesgo, cosas que podrían no haber sido pensadas en el pasado hecho que pudieran ser significativas», dice White. «Nos fijamos en los viajes aéreos, por ejemplo, como uno de los factores que podrían ser ligados a una probabilidad más alta.»

ryen-white-chief-technology-officer-for-microsoft-health-and-an-information-retrieval-expert
Ryen White, director de tecnología de Microsoft Salud y un experto de recuperación de información. (Fotografía por Scott Eklund / rojo Box Fotos)

Los hallazgos son asociaciones, no es evidencia de una causa, destaca el coautor del estudio Eric Horvitz, investigador técnico y director del laboratorio de investigación de Microsoft en Redmond. Pero, añade, pueden sugerir direcciones para futuros estudios clínicos sobre el cáncer de pulmón.

Tomen los viajes en avión, por ejemplo. Horvitz dice que, aunque es de utilidad en sus modelos predictivos, los investigadores tienen todavía que confirmar una conexión casual entre un viaje de avión y el cáncer de pulmón. «Sin embargo, el resultado enmarca una hipótesis que puede seguirse y estudiarse. Lo mismo con la vinculación entre el gas radón y los hogares más viejos», menciona.

Para desarrollar el modelo, Horvitz y White identificaron las denominadas consultas experimentales tales como «Acabo de ser diagnosticado con cáncer de pulmón», que luego son seguidos por comportamientos que proporcionan evidencia de un diagnóstico reciente, como varias consultas sobre las opciones de tratamiento y efectos secundarios.

A continuación, el modelo busca hacia atrás en el tiempo en los registros anónimos para las búsquedas que pueden indicar un diagnóstico pendiente. Estos incluyen búsquedas por síntomas como ronquera y otros que proporcionan evidencia de la factorización de riesgo conocidos y potenciales, tales como el uso del cigarrillo, lugares vinculados a los niveles elevados de radón y los frecuentes viajes de larga distancia.

Los investigadores realizaron el modelo en los registros anónimos de casi 5 millones de buscadores y encontraron que puede identificar cerca de 1.5 por ciento a casi 40 por ciento de los buscadores con un año de antelación de cuándo incluyen consultas de entrada con un diagnóstico de cáncer de pulmón. Los porcentajes varían según la sensibilidad del modelo limita tasas de falsos positivos de 1 en 100,000 a 1 en 1,000. El enfoque es más efectivo por más búsquedas como de alto riesgo, tales como la vida en un código postal con niveles elevados de gas radón.

La investigación, explica Horvitz, quien posee un doctorado y una maestría de la Universidad de Stanford, es parte de un esfuerzo más amplio en curso para utilizar las grandes agregaciones de los datos compilados a partir de la interacción humana con la web para ayudar a la medicina clínica.

«La gente tiende a indagar sus problemas de salud en los motores de búsqueda de manera regular», dice. «Este tipo de datos pueden servir como complemento a la información clínica más formal.»

La investigación, añade, «se muestra prometedora para la identificación de nuevos hallazgos clínicamente relevantes en múltiples áreas de la salud.»

Los investigadores todavía están discutiendo cómo la investigación podría ser utilizada con el tiempo. Por ejemplo, dice White, en algún momento en el futuro la gente pudiera dar su consentimiento para que la información y las inferencias relevantes de los registros de las búsquedas web y flujos de datos sean compartidas con su médico.

En este punto, señala Horvitz, esto es solo investigación. Con la publicación de los hallazgos en la literatura médica, el trabajo podría estimular el interés de los investigadores clínicos de informar sobre el desarrollo de futuros sistemas de detección que pudieran  detectar el cáncer antes de su propagación.

«El primer paso», dice, «es ver si estas cosas son factibles.»

Publicaciones Relacionadas