Breaking Bard: Utilizar la IA de Microsoft para desbloquear las mayores obras de Shakespeare

Por: Reportero Microsoft.

Libro de obra de Shakespeare

Alerta de spoiler: Al final de Romeo y Julieta, los dos mueren.

Ok, para como son los spoilers, este no es grande. La mayoría de las personas han leído la obra, han visto las famosas películas o se han sentado durante incontables clases dedicadas a William Shakespeare y su obra. Saben que no acaba bien para la pareja más famosa de Verona.

De hecho, el reto es encontrar algo que nadie sepa sobre la famosa obra de 300 años. Ahí es donde la inteligencia artificial puede ayudar.

Phil Harvey, arquitecto de soluciones de nube en Microsoft en Reino Unido, utilizó la API Text Analytics de la compañía en 19 de las obras de The Bard (El Bardo, en español). La API, que está disponible para todas las personas como parte de Azure Cognitive Services de Microsoft, puede ser utilizada para identificar sentimiento y tópicos en un texto, así como elegir frases clave y entidades. La API es una de las varias herramientas de Procesamiento de Lenguaje Natural (NLP, por sus siglas en inglés) disponibles en Azure.

Al crear una serie de coloridos gráficos de Power BI (a continuación) que muestran cuán negativo (rojo) o positivo (verde) era el lenguaje utilizado por los personajes de The Bard, él esperaba arrojar una nueva luz a las más grandes piezas de la literatura, así como hacerlas más accesibles para la gente que le preocupa que las obras sean muy complejas de entender de manera sencilla.

Harvey comentó: “La gente puede ver tramas completas con sólo ver mis gráficos de sentimiento de lenguaje. Debido a que los ejemplos visuales son mucho más sencillos de absorber, hacen más accesibles a Shakespeare y a su obra. Leer un idioma de los siglos XVI y XVII puede ser retador, así que esta es una manera rápida de mostrarles lo que Shakespeare trata de hacer.

“Es un gran ejemplo de cómo los datos nos brindan nuevas cosas por aprender y nuevas maneras de saberlo; es un cambio fundamental a cómo procesamos el mundo que nos rodea. Ahora podemos tomar a Shakespeare, convertirlo en un conjunto de datos y procesarlo con algoritmos en una nueva manera de aprender algo que antes no sabía”.

Lo que revelan los gráficos de Harvey es que Romeo batalla con emociones más extremas que Julieta. El amor tiene un efecto mucho mayor en él, lo que desafía los estereotipos de la época en que las mujeres, el sexo más justo, eran más propensas a las altas y bajas de las relaciones.

“Es interesante ver que el protagonista masculino es el que tiene las emociones más extremas”, comentó Harvey. “Las líneas más largas, tanto positivas como negativas, son habladas por él. Julieta es más estable; es positiva y negativa pero no es extrema en lo que dice. Romeo es una persona con emociones más extremas, rebota por todas partes”.

Macbeth también es interesante porque están estos dos picos de emoción, y Shakespeare utiliza a las esposas en estos puntos para darle un giro a la historia. También miré a Helena y Hermia en Sueño de una Noche de Verano, porque tienen un historia de amor cruzada. Ambas son positivas al inicio pero luego descubren algo y se vuelve negativo al final”.

Estatua William Shakespeare
El proyecto requirió que la IA trabajara junto con los humanos para en verdad entender y apreciar por completo las obras de Shakespeare

Sus gráficos de Shakespeare son el paso final en un largo proceso. Después de descargar de internet un archivo de texto de las obras de The Bard, Harvey tuvo que procesar los datos para prepararlos para los algoritmos de IA de Microsoft. Removió todas las direcciones de escena, mantuvo los números de acto y escena, los nombres de los personajes y lo que decían. También subió el texto a la API de Microsoft Cognitive Services, un conjunto de herramientas que pueden ser utilizados en aplicaciones, sitios web y bots para ver, escuchar, hablar, entender e interpretar usuarios a través de métodos naturales de comunicación.

La API Text Analytics está pre-entrenada con un extensivo cuerpo de texto con asociaciones de sentimiento. El modelo utiliza una combinación de técnicas durante el análisis de texto, incluido procesamiento de texto, análisis de partes de un discurso, colocación de palabras y asociaciones de palabras.

Después de escanear las obras de Shakespeare, la herramienta NLP de Microsoft le dio a las líneas de diálogo una calificación entre cero y uno, las calificaciones cercanas a uno indicaban un sentimiento positivo, y las calificaciones cercanas a cero indicaron un sentimiento negativo.

Sin embargo, antes de que comiencen a imaginar un mundo en el que sólo los robots leen libros antes de contarles a los humanos lo que sucedió, Harvey descubrió algunos retos inesperados con la prueba.

Mientras que el sistema de IA trabajó bien para las obras de Shakespeare que contienen tramas y diálogos directos, se le complicó determinar si un diálogo más matizado era positivo o negativo. El algoritmo no podía deducir si lo enojos de Hamlet eran reales o imaginarios, si los personajes eran engañosos o decían la verdad. Esto significaba que la IA etiquetaba eventos como positivos cuando eran negativos, y viceversa. La IA creía que La Comedia de las Equivocaciones era una tragedia debido a los momentos físicos y a los chistes presentes en la obra.

Todo lo que necesitan saber sobre la nube de Microsoft

Nube

Harvey notó que las partes de las obras que muestran lo que en verdad nos hace únicos como humanos: las bromas, euforia, mentiras, doble sentido, subterfugios, sarcasmo, sólo podía ser observado e interpretado por lectores humanos. Su proyecto requirió que la IA trabajara junto con humanos para en verdad entender y apreciar por completo a Shakespeare.

Harvey insiste que sus experimentos con las obras de Shakespeare son solo el punto de inicio pero que esa misma combinación de IA y humanos también puede extenderse de manera eventual a las compañías y sus equipos.

“Tomemos el ejemplo de los clientes que marcan por teléfono a su compañía de energía”, comentó. “Con las herramientas NLP de Microsoft, puedes ver si las conversaciones que sucedieron después de las 5 pm son más negativas que aquellas que suceden a las 9 am, y desplegar equipo de acuerdo con esta situación. También puedes ver si un trabajador de un centro de atención telefónica vuelve negativas las conversaciones, incluso si estas comenzaron positivas, y trabajar con esta persona para asegurar que eso no suceda en el futuro”.

“Esto puede ayudar a las compañías a involucrarse con los datos de una manera diferente y asistirlos con sus tareas diarias”.

Harvey también comentó que los periodistas podrían utilizar la herramienta para ver cómo responden los lectores a sus artículos, o los expertos en redes sociales podrían tener una idea de cómo los consumidores ven a su marca.

Por ahora, Harvey está concentrado en los Clásicos y volteó su atención a Charles Dickens, si puede persuadir al Museo de Victoria y Alberto (V&A) en Londres que le permitan estudiar algunos de sus manuscritos.

“En los manuscritos del V&A, puedes ver dónde Dickens tachó palabras. Me encantaría entrenar a un modelo de visión personalizada en esto para ver una vista página a página de sus cambios. Después vería una copia publicada del texto y vería en qué partes del libro trabajó más; tal vez esa parte funcionó bien pero pudo haber batallado con ella. El trabajo de Dickens fue serializado en periódicos, por lo que podríamos deducir si recibía retroalimentación de los editores de la cual no teníamos idea. Creo que eso sería increíble”.

Tags: , , , , , , ,

Publicaciones Relacionadas