La Inteligencia Artificial toma su turno para transformar el negocio de la fotografía deportiva
Una IA pre-entrenada, combinada con aprendizaje profundo, identifica imágenes de jugadores de baseball en Japón ocho veces más rápido
Las estrellas deportivas se encuentran hoy en día entre las personas más fotografiadas en el planeta. Su desempeño en el terreno de juego, estilo, gestos, y expresiones faciales son capturados casi de manera continua por fanáticos, los medios, para uso comercial y para la posteridad, de manera digital.
No es algo extraño que miles de imágenes sean tomadas de todos los ángulos en cualquier encuentro profesional de la actualidad. Así que, es probable que una temporada típica se produzcan montañas virtuales de imágenes de los grandes clubes y competencias en casi todos los deportes.
Ahora, el baseball profesional en Japón ha volteado hacia la inteligencia artificial y la nube para manejar la magnitud de lo que ha sido una laboriosa tarea que consume mucho tiempo, la gestión de fotografías.
Las fotografías deportivas pueden tener un valor inmediato, duradero y lucrativo, pero sólo si son mantenidas en colecciones bien organizadas y catalogadas a las que se pueda acceder de manera eficiente. IMAGE WORKS, un servicio del icónico gigante japonés de fotografía, Fujifilm, gestión el Centro de Imágenes de Contenido de la Nippon Professional Baseball (NPB), basado en la nube.
En este lugar los curadores clasifican imágenes, identifican a los jugadores en cada imagen y las etiquetan con esa información. Suena como una tarea sencilla, pero el volumen de imágenes que se produce en la actualidad es enorme. La manera usual de gestionar esto ya no es funcional.
Para entender el por qué, demos un vistazo al lugar especial que ocupa el baseball en el Japón moderno, donde ha sido un deporte con una gran popularidad desde los años treinta. Aunque sus reglas difieren un poco de las del pasatiempo favorito en Estados Unidos, la NPB es a Japón lo que las Ligas Mayores (MLB, por sus siglas en inglés) son para Estados Unidos. La NPB consiste en dos ligas profesionales principales, la Liga Central y la Liga del Pacífico. Cada una cuenta con seis equipos, y en cada una se juegan 146 partidos por temporada, durante casi todos los días de la semana desde marzo a octubre. Luego, cada liga realiza sus propias finales, que son seguidas por una serie de siete juegos conocida como Nippon Series Championship entre los dos campeones de cada liga, en un espectáculo similar al de la Serie Mundial en los Estados Unidos.
Existe una constante avalancha de imágenes desde todo el país durante casi todo el año con alrededor de 3 mil imágenes tomadas durante cada juego. Después de que la multitud ha abandonado el estadio, los curadores de cada equipo por lo general seleccionan alrededor de 300 fotografías. Luego pasan cerca de cuatro horas para identificar y etiquetar de manera manual la información del jugador en cada imagen.
Esta cantidad de tiempo puede ser un problema en este mundo tan acelerado. La demanda por imágenes es por lo general en su punto más alto en tiempo real o casi en tiempo real, esto es, durante o justo cuando ha terminado cada juego. Fanáticos y medios pueden perder interés en el contenido de un juego de manera rápida una vez que uno nuevo inicia. Así que no sólo el trabajo de identificar la imagen de un jugador es algo masivo, también se necesita realizar de manera rápida.
Ahora, la IA toma su turno. Desarrolladores de Fujifilm y Microsoft Japón han elaborado una solución: una función automática de etiquetado del nombre del jugador que identifica y etiqueta imágenes mucho más rápido de lo que la gente puede hacerlo, y en volúmenes más grandes.
Desde junio de 2018, ha estado a prueba y se ha enfocado en sólo cinco equipos de baseball, incluido Hiroshima Toyo Carp, que ha ganado el título de la Liga Central ocho veces, y la Nippon Series en tres ocasiones. La prueba tuvo tanto éxito, que la función será utilizada para todos los equipos de la NPB en la temporada 2019.
Sus capacidades de análisis de fotografías están basadas en una IA pre-entrenada de Microsoft Cognitive Services y un marco de trabajo de aprendizaje profundo de Microsoft Cognitive Toolkit. De manera específica, el reconocimiento facial que utiliza la Microsoft Cognitive Services Face API está combinado con un modelo de determinación única construido sobre Microsoft Cognitive Toolkit.
Esto permite la clasificación de imágenes en cuatro tipos: bateo, pitcheo, fildeo y correr bases. También, puede determinar el nombre de un jugador cuando su rostro no es visible en una toma angulada o lateral. Azure Durable Functions y Automatic Player Name Tagging, y una revisión manual final realizada por personas han reducido el tiempo total de procesamiento de las tradicionales cuatro horas a solo 30 minutos.
Durante sus etapas de desarrollo, Microsoft Japón brindó un modelo ResNet de red neural de Microsoft Research, su rama de investigación y desarrollo. También realizó varios hackathons con Fujifilm Software, desarrollador de IMAGE WORKS. Los repetidos ejercicios de verificación vieron que las tasas de precisión de reconocimiento de jugador saltaran a más del 90%.
“Con el poder de Azure y el aprendizaje profundo, hemos sido capaces de crear una solución de IA que nuestro servicio de fotografía mucho más eficiente y rápido. Y eso es algo Bueno para nuestros clientes”, comentó Riki Sato, líder del grupo de soluciones avanzadas en IMAGE WORKS. Su colega Daichi Hayata comenta también sobre la colaboración entre el equipo de IMAGE WORKS y Microsoft Japón. “Esta fue la primera vez que hemos hecho algo con aprendizaje profundo, y lo pudimos hacer con conocimientos básicos”, comentó.
Fujifilm Imaging Systems ahora planea ampliar su uso a las ligas de baseball amateur y a otros deportes. También podría ser aplicado a las necesidades de contenido fuera del mundo deportivo. Y también contempla la posibilidad de utilizar análisis de video a través de Azure Video Indexer.
Microsoft Japón está comprometido en ayudar a las compañías y organizaciones a adoptar la transformación digital con IA y considera como utilizar esta combinación de IA pre-entrenada y un marco de trabajo personalizable de aprendizaje profundo en otros campos, como el de la medicina.