Decifre O Bardo: a IA da Microsoft ajuda a explorar os melhores trabalhos de Shakespeare

Página de uma edição impressa de Macbeth.

Repórter Microsoft

Alerta de spoiler: no final de Romeu e Julieta, os dois morrem.

OK, como spoiler, não é grande coisa. A maioria das pessoas leu a peça, assistiu a um dos filmes famosos ou acompanhou inúmeras lições escolares dedicadas a William Shakespeare e sua obra. Sabem que não acaba bem para o casal mais famoso de Verona.

Na verdade, o desafio é encontrar algo que ninguém saiba sobre a mundialmente famosa peça de 300 anos de idade. É aí que a inteligência artificial pode ajudar.

Phil Harvey, arquiteto de soluções em nuvem da Microsoft no Reino Unido, usou a API de análise de texto da empresa em 19 das peças de O Bardo. A API, que está disponível para qualquer pessoa como parte dos Serviços Cognitivos do Microsoft Azure, pode ser usada para identificar sentimentos e tópicos em texto, além de selecionar frases-chave e entidades. Essa API é uma das várias ferramentas de processamento de linguagem natural (NLP) disponíveis no Azure.

Ao criar uma série de gráficos coloridos no Power BI (abaixo) mostrando como o negativo (vermelho) ou positivo (verde) era a linguagem usada pelos personagens de O Bardo, Harvey esperava lançar uma nova luz sobre algumas das maiores obras literárias, além de torná-las mais acessíveis para as pessoas que acham as peças complexas demais para serem facilmente entendidas.

Harvey disse: “As pessoas podem ver enredos inteiros apenas olhando meus gráficos sobre o sentimento da linguagem. Como os exemplos visuais são muito mais fáceis de absorver, isso torna Shakespeare e suas peças mais acessíveis. Ler idiomas dos séculos XVI e XVII pode ser um desafio, então essa é uma maneira rápida de mostrar a elas o que Shakespeare está tentando fazer.

“É um ótimo exemplo de dados que nos dão novas informações e novas formas de conhecê-los; é uma mudança fundamental em como processamos o mundo ao nosso redor. Agora podemos pegar Shakespeare, transformá-lo em um conjunto de dados e processá-lo com algoritmos de uma maneira nova para aprender algo que eu não sabia antes.”

O que os gráficos de Harvey revelam é que Romeu luta com emoções mais extremas que Julieta. O amor tem um efeito muito maior sobre ele, desafiando os estereótipos do tempo em que as mulheres – o sexo mais honesto – eram mais propensas aos altos e baixos dos relacionamentos.

“É interessante ver que o protagonista masculino é o que tem emoções mais extremas”, acrescentou Harvey. “As linhas mais longas, positivas e negativas, são faladas por ele. Julieta é mais firme; ela é positiva e negativa, mas não extrema no que ela diz. Romeo é um sujeito de emoções mais extremas, ele salta por todo lado.

Macbeth também é interessante porque existem esses dois picos de emoção, e Shakespeare usa as esposas nesses pontos para transformar a história. Eu também olhei para Helena e Hérmia em Sonho de uma Noite de Verão, porque elas têm uma história de amor cruzada. Ambas são positivas no começo, mas depois descobrem algo e ficam negativas no final.”

Foto de estátua de Shakespeare.
O projeto exigia que a IA trabalhasse ao lado dos humanos para realmente entender e apreciar as peças de Shakespeare.

Seus gráficos de Shakespeare são o passo final de um longo processo. Depois de fazer o download de um arquivo de texto das peças de O Bardo na internet, Harvey precisou processar os dados para prepará-los para os algoritmos de IA da Microsoft. Ele removeu todas as direções do palco, mantendo os números de cena e ato, os nomes dos personagens e o que eles disseram. Em seguida, ele carregou o texto na API dos Serviços Cognitivos da Microsoft, um conjunto de ferramentas que podem ser usadas em aplicativos, sites e bots para ver, ouvir, falar, entender e interpretar usuários por meio de métodos naturais de comunicação.

A API de análise de texto é pré-treinada com um extenso corpo de texto com associações de sentimentos. O modelo usa uma combinação de técnicas durante a análise de texto, incluindo processamento de texto, análise de parte da fala, colocação de palavras e associações entre elas.

Depois de digitalizar as peças de Shakespeare, a ferramenta de NLP da Microsoft deu às linhas de diálogo uma pontuação entre zero e um – pontuações próximas a um indicavam um sentimento positivo, e pontuações próximas a zero indicavam um sentimento negativo.

No entanto, antes de você começar a imaginar um mundo em que apenas robôs liam livros antes de dizer aos humanos a essência do que aconteceu, Harvey descobriu alguns desafios inesperados com seu teste.

Enquanto o sistema de IA funcionava bem para peças de Shakespeare que continham tramas e diálogos diretos, ele se esforçava para determinar se um discurso com mais nuances era positivo ou negativo. O algoritmo não conseguia descobrir se os delírios loucos de Hamlet eram reais ou imaginários, se os personagens estavam enganando ou dizendo a verdade. Isso significa que a IA classificou os eventos como positivos quando eram negativos e vice-versa. A IA acreditava que A Comédia dos Erros era uma tragédia por causa dos momentos físicos, de tapas na peça.

Harvey percebeu que as partes das peças que lidavam com o que verdadeiramente nos torna únicos como seres humanos – brincadeira, euforia, mentira, duplos significados, subterfúgios, sarcasmo – só podiam ser notadas e interpretadas por leitores humanos. Seu projeto exigia que a IA trabalhasse ao lado dos humanos para realmente compreender e apreciar plenamente Shakespeare.

Harvey insiste que suas experiências com as peças de Shakespeare são apenas um ponto de partida, mas que a mesma combinação de IA e humanos pode, eventualmente, ser estendida às empresas e seus funcionários.

“Tome o exemplo de clientes telefonando para a empresa de energia”, disse ele. “Com as ferramentas de NLP da Microsoft, você pode ver se as conversas que acontecem depois das 17h são mais negativas do que as que acontecem às 9h e alocar a equipe de acordo. Você também pode ver se um funcionário da central de atendimento torna as conversas negativas, mesmo que elas comecem positivas, e trabalhar com essa pessoa para garantir que isso não aconteça no futuro.

“Elas podem ajudar as empresas a se envolverem com os dados de uma maneira diferente e a auxiliá-las nas tarefas diárias.”

Harvey também disse que os jornalistas poderiam usar a ferramenta para ver como os leitores respondem aos seus artigos, ou os especialistas em mídias sociais teriam uma ideia de como os consumidores viam sua marca.

Por enquanto, Harvey está se concentrando nos Clássicos e está voltando sua atenção para Charles Dickens, se puder convencer o V&A (Victoria and Albert Museum) em Londres a deixá-lo estudar alguns de seus manuscritos.

“Nos manuscritos do V&A, você pode ver onde Dickens cruzou as palavras. Eu adoraria treinar um modelo de visão personalizado para obter uma visualização de página por página de suas alterações. Eu poderia então olhar uma cópia do texto publicada e ver em quais partes do livro ele trabalhou mais; talvez essa parte tenha corrido bem, mas ele teve problemas com um ponto. O trabalho de Dickens foi serializado em jornais, então podemos deduzir se ele estava recebendo feedback de editores que não conhecíamos. Acho isso incrível.”

Tags: , , , , , , ,

Posts Relacionados