A continuación dos cosas que sabes sobre el clima: Tenemos toneladas de datos sobre él, y nos preocupa mucho.
Fueron esos dos factores los que llevaron a Ashish Kapoor y Eric Horvitz, investigadores de Microsoft a voltear hacia los más recientes avances en inteligencia artificial para tratar de encontrar una mejor respuesta a esa añeja pregunta: ¿Qué es el pronóstico del clima?
Ellos descubrieron que su enfoque, que aprovechaba métodos desarrollados dentro de un subcampo de la inteligencia artificial llamado aprendizaje de máquina, era más preciso para predecir patrones climáticos en las siguientes 24 horas que un modelo tradicional de pronosticación.
Esto les da esperanza de que este método podría ser utilizado de manera eventual para ayudar a resolver algunos de los más complicados acertijos climáticos, como entender cómo el cambio climático afecta los patrones del clima o realizar predicciones climáticas a largo plazo más precisas.
“Ahí es donde creo que podríamos en verdad aprovechar el poder de los métodos de aprendizaje de máquina”, dijo Kapoor, investigador senior en Microsoft.
Por supuesto que, los climatólogos y meteorólogos han rastreado datos climáticos por mucho tiempo y los han utilizado para realizar pronósticos.
A diferencia de los enfoques de pronóstico del clima más típicos, que por tradición se han apoyado en simulaciones físicas, Kapoor dijo que su investigación tomó un enfoque centrado en datos: Ellos sólo miraron los datos y no trataron de hacer suposiciones restrictivas sobre cómo tiende a actuar la naturaleza.
Este tipo de enfoque es posible debido a los recientes avances en aprendizaje de máquina, que permite a la gente tomar grandes conjuntos de datos y analizarlos a través de sistemas de cómputo de gran escala. El aprendizaje de máquina se centra en el desarrollo y utilización de algoritmos que pueden aprender a hacer predicciones basándose en datos pasados.
Los investigadores utilizaron datos históricos para algunas variables climáticas – presión atmosférica, temperatura, punto de rocío y vientos – para entrenar a sus sistemas para que hagan predicciones sobre futuros patrones climáticos basados en datos pasados.
Para realizar sus predicciones, aplicaron una mezcla de modelos físicos y una combinación de métodos de aprendizaje de máquina, que incluye redes neurales profundas. Esa es la misma técnica que ha sido utilizada de manera reciente para mejorar de manera vasta la precisión de cosas como clasificación de imágenes, reconocimiento de habla y traducción.
Este trabajo se basa en la investigación previa de Kapoor y Horvitz sobre hacer más precisos los pronósticos de vientos al utilizar miles de aviones como sensores de viento. Ese trabajo está detrás de un servicio en vivo de predicción de vientos llamado Windflow, que puede ser utilizado por pilotos para optimizar los tiempos de los vuelos.
El esfuerzo de predicción climática también está relacionado muy de cerca con otro proyecto en el que Kapoor trabaja, en el que ayuda a Kirby Chambliss, piloto de Red Bull Air Race, a mejorar sus tiempos en carreras aéreas.
Aditya Grover, un becario que trabajó en el proyecto de predicción climática con Horvitz y Kapoor, presentará los descubrimientos del equipo en la Conferencia ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos, una conferencia de la industria que se realiza en Sídney, Australia.
Grover todavía no se graduaba cuando llegó a Microsoft Research, y se inspiró tanto por el trabajo de predicción climática que decidió seguir una carrera en inteligencia artificial. Comenzará a asistir a la escuela en la Universidad de Stanford para graduarse.
“Para ser honesto, este fue el factor principal que me empujó hacia buscar graduarme”, dijo Grover.
Los investigadores de Microsoft y sus colegas de otras universidades e instituciones de investigación presentarán algunos otros documentos en KDD2015. Entre estos se encuentran:
- Influencia a escala: Cómputo distribuido de contagio complejo en redes.
- Cargas de trabajo de solicitudes para índices de series de datos.
- Inferencia organizacional de tablas.
- Hacia la construcción interactiva de jerarquía tópica: un enfoque a la descomposición de tensor recursivo.
- Modelado de desempeño y optimización de escalabilidad de los sistemas de aprendizaje profundo distribuido.
- ClusType: Reconocimiento efectivo y escritura de entidad por relación basada en frase de clúster. Ensamble: descubrimiento eficiente de patrones espaciales co-evolutivos en datos masivos geo-sensoriales.
- Hacia el soporte de decisión y consecución de metas: Identificar relaciones con resultados de acción desde medios sociales.
- Bromas internas: Identificar textos humorísticos en cartones.
- Regularidad y conformidad: Predicción de ubicación a través de datos heterogéneos de movilidad.
- Modelos inteligibles para el cuidado de la salud: Predecir riesgo de neumonía y readmisión a hospitales en 30 días.
- PTE: Integración de Texto Predictivo a través de redes de texto heterogéneas a gran escala.
- ¿Dónde implementar la siguiente estación de monitoreo? Un sistema de inferencia y recomendación conjunto para construir nuevas estaciones de medición.