Por: John Roach.
Conforme se alarga el invierno, algunas personas piensan si empacar unos pantalones cortos para una escapada a Florida para finales de marzo, mientras que otros miran las tendencias de temperatura en abril en anticipación a comenzar a sembrar. Los encargados de la gestión del agua en la parte occidental de Estados Unidos observan la posibilidad de tormentas tempranas en primavera para bañar la capa de nieve de las montañas, que es crucial para la irrigación, la energía hidroeléctrica y el salmón en los meses de verano.
Por desgracia, los pronósticos para este lapso, de alrededor de dos a seis semanas, son impredecibles, comentó Lester Mackey, investigador de aprendizaje automático estadístico en el laboratorio de investigación de Microsoft en Nueva Inglaterra en Cambridge, Massachusetts. Mackey ha traído a la mesa su experiencia en inteligencia artificial en una apuesta por incrementar las probabilidades de pronósticos precisos y confiables.
“El régimen subestacional es donde los pronósticos podrían ser de mayor ayuda”, mencionó.
Mackey sabia poco sobre clima y pronóstico de clima hasta que Judah Cohen, un climatólogo en Atmospheric and Environmental Research, una empresa de Versik que realiza consultorías sobre riesgo climático en Lexington, Massachusetts, lo contactó por ayuda en la utilización de técnicas de aprendizaje automático para desenredar patrones repetitivos de clima en montañas de datos históricos como una manera de mejorar los modelos subestacionales y de pronóstico de estaciones.
Los modelos preliminares de pronóstico basados en aprendizaje automático que Mackey, Cohen y sus colegas desarrollaron superaron a los modelos estándar utilizados por las agencias de gobierno de los Estados Unidos para generar pronósticos subestacionales de temperatura y precipitaciones de dos a cuatro semanas y de cuatro a seis semanas en una competencia patrocinada por la Oficina de Recuperación de Tierras de Estados Unidos.
De manera reciente, el equipo de Mackey consiguió financiación de la iniciativa AI for Earth de Microsoft para mejorar y refinar su técnica con la mira puesta en hacer progresar la tecnología para el bien social.
“Lester trabaja en esto porque es un problema grande en aprendizaje automático, no porque sea un problema grande en el pronóstico del clima”, aclaró Lucas Joppa, jefe de medio ambiente en Microsoft, que lidera el programa AI for Earth, mientras explicaba por qué su grupo ayuda a financiar la investigación. “Sucede que las técnicas en las que está interesado en explorar tienen una enorme capacidad de aplicación en el pronóstico del clima, y da la casualidad de que tienen una enorme capacidad de aplicación en dominios sociales y económicos más amplios”.
IA en el cerebro
Mackey comentó que los modelos actuales de clima se desempeñan bien en hasta siete días, y los modelos de pronóstico de clima se vuelven más confiables conforme se extiende el horizonte de tiempo de estaciones a décadas. Los pronósticos subestacionales son el punto medio, se basan en una mezcla de variables que impactan al clima a corto plazo como la temperatura diaria y los factores de viento y de estaciones como el estado de El Niño y la extensión del hielo marítimo en el Ártico.
Cohen contactó a Mackey con la creencia de que el aprendizaje automático, el brazo de la IA que consigue reconocer patrones en datos estadísticos para hacer predicciones, podía ayudar a mejorar su método para generar pronósticos subestacionales al recopilar información de valor desde grandes cantidades de datos históricos sobre el clima.
“De manera básica, en mi cabeza hago algo como reconocimiento de patrones aprendidos de manera automática”, explicó Cohen, y destacó que los patrones de clima se repiten durante las estaciones y de año a año y por lo tanto ese reconocimiento de patrones puede y debe informar a los pronósticos a largo plazo. “Creo que tal vez puedo mejorar lo que hago en mi cabeza con algunas de las técnicas de aprendizaje automático que existen en la actualidad”.
El uso de patrones de datos históricos de clima para predecir el futuro era una práctica estándar en la generación de pronósticos del clima hasta la década de los ochenta. Ahí fue cuando los modelos físicos de cómo la atmósfera y los océanos evolucionan comenzaron a dominar la industria. Estos modelos han crecido en popularidad y sofisticación con el crecimiento exponencial en el poder de cómputo.
“Hoy en día, todos los grandes centros climáticos emplean super computadoras masivas para simular la atmósfera y los océanos”, comentó Mackey. “Los pronósticos han mejorado de manera sustancial con los años, pero casi no utilizan datos históricos. En su lugar, toman las condiciones climáticas actuales y luego avanzan sus ecuaciones diferenciales”.
Competencia de pronósticos
Mientras Mackey y Cohen discutían sobre una investigación colaborativa, Cohen recibió la noticia de una competición patrocinada por la Oficina de Recuperación de Tierras de Estados Unidos para mejorar los pronósticos subestacionales de temperatura y precipitación en el oeste de Estados Unidos. La agencia de gobierno está interesada en pronósticos subestacionales mejorados para preparar mejor a los encargados de la gestión del agua sobre cambios en los regímenes hidrológicos, incluida la aparición de sequías y climas húmedos extremos.
“Dije, ‘Oye, ¿Qué opinas de tratar de entrar a esta competencia como una manera de motivarnos, para conseguir algo de progreso?’”, recordó Cohen.
Mickey, que era profesor asistente de estadística en la Universidad de Stanford en California antes de unirse a la organización de investigación de Microsoft y se mantiene como profesor adjunto en la universidad, invitó a dos estudiantes graduados a participar en el proyecto. “Ninguno de nosotros tenía experiencia de haber hecho algo en esta área y pensamos que sería una gran manera de poner manos a la obra”, comentó.
Durante los 13 meses que duró la competencia, los investigadores experimentaron con dos tipos de enfoques en aprendizaje automático. Uno rastreaba a través de un lavadero de datos que contenía todo desde temperatura histórica a registros de precipitación hasta datos de la concentración de hielo marítimo y el estado de El Niño, así como un ensamble de modelos de pronósticos físicos. El otro enfoque estaba basado sólo en datos históricos para la temperatura cuando se pronostica temperatura o precipitación cuando se pronostica precipitación.
“Hacemos pronósticos cada dos semanas y entre esos pronósticos adquirimos nuevos datos, los procesamos, construimos algo de infraestructura para probar nuevos métodos, desarrollamos métodos y los evaluamos”, explicó Mackey. “Y luego cada dos semanas teníamos que parar lo que hacíamos, hacer un pronóstico y luego repetir”.
Para la parte final de la competencia, el equipo de Mackey descubrió que un ensamble de ambos enfoques de aprendizaje automático se desempeñaba mejor que como lo hacían por separado.
Los resultados de la competencia han sido anunciados. Mackey, Cohen y sus colegas consiguieron el primer lugar en pronosticar temperatura promedio entre tres y cuatro semanas por adelantado y el segundo lugar para pronosticar precipitación total para cinco a seis semanas.
Foto: Getty Images.
Pronosticar para el futuro
Después de la competencia, los colaboradores combinaron su ensamble de enfoques de aprendizaje automático con los modelos estándar utilizados por las agencias de gobierno de Estados Unidos para generar pronósticos subestacionales y encontraron que los modelos combinados mejoraron la precisión del pronóstico operativo entre 37 y 53 por ciento para temperatura y 128 y 154 por ciento para precipitación. Estos resultados están reportados en un documento que el equipo publicó en arXiv.org.
“Creo que no dejaremos de ver que estos tipos de enfoques se mejoren más y se incremente su amplitud de uso dentro del campo de los pronósticos del clima”, comentó Kenneth Nowak, coordinador de investigación de disponibilidad acuífera dentro de la Oficina de Recuperación de Tierras de Estados Unidos, que organizó la competencia de pronóstico. Además, agregó que las agencias de gobierno “buscarán oportunidades para aprovechar” el aprendizaje automático en generaciones futuras de modelos operativos de pronóstico.
El programa AI for Earth de Microsoft brinda financiación a Mackey y a sus colegas para contratar a un pasante para expandir y refinar el aprendizaje automático basado en técnicas de pronóstico. Los colaboradores también esperan que otros investigadores en aprendizaje automático sean atraídos al reto de romper el código para pronósticos subestacionales precisos y confiables. Para motivar estos esfuerzos, han puesto a disposición para el público el conjunto de datos que crearon para entrenar sus modelos.
Cohen, que arrancó la colaboración con Mackey por una curiosidad sobre el impacto potencial de IA en pronósticos subestacionales y estacionales, comentó, “Por supuesto que veo los beneficios del aprendizaje automático. Esto no es el final; es más bien el inicio. Hay mucho más que podemos hacer para incrementar su aplicabilidad”.
Contenido relacionado:
- Conozcan más sobre el Subseasonal Climate Forecast Rodeo de Estados Unidos
- Lean: Mejorar el pronóstico subestacional en el oeste de Estados Unidos con aprendizaje automático (inglés)
- Accedan al conjunto de datos SubseasonalRodeo
- Lester Mackey es un investigador estadístico de aprendizaje automático en el laboratorio de investigación de Microsoft en Nueva Inglaterra.
- Judah Cohen es jefe de pronóstico estacional en Atmospheric and Environmental Research.
- Lucas Joppa es jefe de medio ambiente en Microsoft y lidera la iniciativa AI for Earth.
John Roach escribe sobre investigación e innovación en Microsoft. Síganlo en Twitter.