A fadiga causada por vídeo e um anfitrião noturno sem público inspiram uma nova maneira de ajudar as pessoas a se sentirem juntas, remotamente

Por Susanna Ray 

Quando a pandemia global chegou e todos se voltaram para as videochamadas no trabalho, escola e happy hour, Jeremy Bailenson achou que estava preparado. 

Afinal, videoconferências existem há anos, e o professor da Universidade de Stanford passou duas décadas estudando e escrevendo sobre comunicação e comportamento digital. Mas as videochamadas sempre foram mais uma opção do que a regra, e Bailenson – junto com o resto do mundo – rapidamente se viu chocado com o impacto de uma mudança completa para a comunicação remota. 

“Depois de uma semana direto em casa, fiquei impressionado de como era intenso e exaustivo“, diz Bailenson, que mora na Califórnia, o primeiro estado dos EUA que exigiu que os moradores ficassem em casa para reduzir a propagação do COVID- 19. “A maioria dos estudos sobre videoconferência é sobre como melhorar a produtividade e a colaboração, mas a noção de que isso é esgotador não foi estudada.” 

Enquanto Bailenson começou a reler “tudo o que havia para ler sobre videoconferência“, seu amigo da Microsoft, Jaron Lanier, estava pensando sobre um ângulo diferente para o problema. Um apresentador de um programa noturno em Nova York, cuja banda Lanier tocava ocasionalmente, estava lutando para apresentar seu monólogo para uma câmera na sala de estar, sem uma plateia ao vivo para reagir às suas piadas. Lanier lançou uma rede no mar de pesquisadores, psicólogos e programadores da Microsoft e, em semanas, reuniu o que chama de um novo recurso “mágico” para ajudar o apresentador de TV e seus telespectadores a se sentirem conectados. Sua ideia evoluiu para um recurso do Teams, o modo Juntos, que potencialmente poderia reduzir o cansaço das videochamadas para todos. 

Jeremy Bailenson, professor da Universidade de Stanford, passou duas décadas pesquisando comunicação e comportamento digital, mas ainda estava surpreso com o quão fatigante era mudar completamente para trabalhos remotos e videochamadas quando a pandemia global atingiu este ano. (Foto fornecida por Bailenson.) 
Jeremy Bailenson, professor da Universidade de Stanford, passou duas décadas pesquisando comunicação e comportamento digital, mas ainda estava surpreso com o quão fatigante era mudar completamente para trabalhos remotos e videochamadas quando a pandemia global atingiu este ano. (Foto fornecida por Bailenson.) 

“Foi uma coincidência fortuita de necessidades que levou a um salto dramático na melhoria de reuniões remotas, diz Lanier, cientista da computação, músico, artista e autor que cunhou o termo “realidade virtual” e é considerado um pioneiro no campo. 

O modo Juntos, agora lançado no Microsoft Teams, combina décadas de pesquisa e desenvolvimento de produtos para reunir todos os participantes em uma videochamada em um espaço virtual, como um auditório, sala de reuniões ou café, para que pareçam estar juntos no mesmo lugar. O novo recurso descarta a grade tradicional de caixas, criando um ambiente que os usuários dizem ter um impacto profundo na sensação da videoconferência e fornece mais coesão ao grupo. 

O modo Juntos é criado para dar às pessoas a impressão de que todo mundo está olhando para todo o grupo em um grande espelho virtual, o que Lanier diz ser a solução única, porém simples, que muda toda a experiência. O cérebro das pessoas está acostumado a conhecer outras pessoas com base em suas localizações, e o efeito espelho torna mais difícil para o cérebro perceber irregularidades no contato visual. Essas são algumas das qualidades que tornam mais fácil para todos dizerem como estão reagindo um ao outro. 

 

“Somos criaturas sociais, e os sistemas de consciência social e espacial no cérebro podem finalmente funcionar de maneira mais natural no modo Juntos”, diz Lanier. 

Os cientistas começaram a estudar problemas com o contato visual – ou desalinhamento do olhar – na década de 1960, e Lanier trabalha para melhorar esse elemento da videoconferência desde os dias analógicos da década de 1970. No entanto, embora a tecnologia tenha se tornado mais robusta e estável ao longo das décadas, não houve melhorias reais na experiência humana viáveis ​​para uso generalizado. O modo Juntos usa a computação em nuvem em vez das câmeras e telas especializadas necessárias para melhorar as chamadas de vídeo. 

Para entender a fadiga das videochamadas, Bailenson, diretor fundador do Virtual Human Interaction Lab de Stanford, examinou décadas de estudos sobre comunicação e encontrou algumas causas principais. 

Por exemplo, ele diz que se o rosto de alguém aparece na sua esfera visual na vida real, geralmente significa que você está prestes a se identificar ou não. Então, você está alerta e hiperconsciente – reações automáticas e subconscientes – e sua frequência cardíaca aumenta. E nas videochamadas, geralmente há uma grade com o rosto de várias pessoas preenchendo as caixas. É muito para o sistema nervoso do seu corpo lidar, ele diz. 

Além disso, as pessoas estão constantemente interpretando os movimentos dos olhos, a postura dos outros, como suas cabeças estão inclinadas e atribuindo significado a essas dicas não verbais. Os pesquisadores da década de 1960 assistiram a vídeos de grupos quadro a quadro, diz Bailenson, e descobriram uma dança complexa e intrigante: uma pessoa virava a cabeça e a outra recuava um pouco, por exemplo. 

Mas em uma videochamada, esses movimentos não são diagnósticos, diz ele, o que significa que não são informações precisas sobre o que está acontecendo. Uma pessoa pode procurar a outra em busca de uma resposta, mas como todos estão organizados de maneira diferente na tela de cada participante em uma exibição em grade, não está claro para mais ninguém para quem eles estão realmente olhando. 

“É um beco sem saída em que você está sendo sufocado com dados não verbais, mas nenhum desses dados é diagnóstico”, diz Bailenson. “O modo Juntos coloca a verdade de volta no gesto. Quando os movimentos da cabeça têm um significado real, alinhado com a intenção das pessoas, as coisas ficam menos confusas e isso reduz a fadiga porque você não fica mais perplexo com o que está acontecendo.  

Mary Czerwinski, psicóloga cognitiva da Microsoft, diz que sinais sociais não verbais são tão automáticos que os membros da plateia podem até sincronizar sua respiração com a do falante. 

“Existem todos os tipos de pistas sutis – acenos de cabeça, pistas faciais, linguagem corporal – que usamos para mostrar que temos um problema ou queremos falar, ou concordamos ou não”, diz Czerwinski. 

Usando o modo Juntos, ela diz: “vi pessoas se inclinarem e se baterem. Vi pessoas fazerem contato visual umas com as outras que não estavam sentadas próximas uma da outra. Agora as pessoas podem praticar algumas das sinalizações sociais que fariam na vida real.” 

A exibição do modo Juntos é a mesma para todos na reunião e não muda, ao contrário das exibições em grade que mostram os vídeos dos participantes em locais diferentes na tela de cada pessoa e que movem as caixas durante a chamada com base em quem está falando. Como uma área inteira do cérebro é dedicada à memória espacial, a consistência do modo Juntos é uma ótima maneira de reduzir a carga cognitiva de uma videochamada, diz Czerwinski. 

Kori Inkpen tem trabalhado em como a tecnologia pode apoiar a colaboração – ao proporcionar uma sensação de estar juntos – desde o início dos anos 90, quando passou um verão como estudante de pós-graduação assistindo crianças jogando videogame em um museu de ciências. Ela pesquisa agora a colaboração humana de IA para a Microsoft, mas voltou à sua primeira paixão pela videoconferência quando Lanier pediu ajuda. 

“Estamos sempre tentando visualizar o futuro e trabalhar nas coisas muito antes que as pessoas pensem que podem precisar delas, e muitas vezes no caminho haverá uma necessidade disso em nossos produtos e podemos retirá-lo da prateleira e dizer: ‘ei, fizemos isso há cinco anos, é útil agora?”, diz Inkpen. “Sempre houve um empecilho ao longo dos anos por fazer qualquer coisa virtualmente, e fomos criticados por pessoas que disseram: ‘Por que você gostaria que seus filhos brincassem virtualmente?’. Mas a ideia era que pudéssemos construir ferramentas para que as crianças pudessem brincar juntas de uma maneira natural, mesmo quando não pudessem estar juntos. Ninguém jamais imaginou uma pandemia que obrigaria todos a se isolarem.” 

Reunir-se pessoalmente é inegavelmente mais agradável do que um ambiente de vídeo, diz Inkpen, mas o modo Juntos cria a percepção do espaço compartilhado para oferecer “uma sensação de união que é realmente atraente”. O novo recurso lembra Inkpen de um estudo que ela fez uma década atrás, onde as crianças podiam se ver com os amigos em vídeo e disseram a ela que sentiam que estavam todas brincando juntas na TV. Ela os ajudou a se comportarem de maneira mais natural, lembra ela, porque seus cérebros não precisavam mapear onde estavam as coisas ou inverter as imagens para manter os brinquedos no lugar certo para a câmera, por exemplo. 

“Quando você trabalha com tecnologia colaborativa, é fácil pensar que, se construirmos uma ferramenta realmente interessante, as pessoas trabalharão juntas como uma fábrica hiper eficiente“, diz Jeff Teper, o visionário por trás do Microsoft Teams, SharePoint e OneDrive. “Mas os seres humanos são seres sociais que se conectam emocionalmente usando linguagem corporal e dicas verbais para criar sentimentos de confiança, e parte do que faz uma equipe ser uma equipe é um objetivo e um senso de confiança compartilhados. O modo Juntos está enraizado na psicologia e sociologia humanas.” 

A pressão nos últimos anos pelo diretor executivo da Microsoft, Satya Nadella, de promover a colaboração e o brainstorming entre diferentes grupos foi fundamental para o novo recurso, diz Teper, permitindo que a equipe de especialistas de formação diversa e com origens muito diferentes entre em ação devido à urgência da nova necessidade. 

“Temos tanta tecnologia cognitiva para visão e fala, e a parte mais difícil é como aproveitá-la para resolver problemas humanos e agregar valor humano, além de ser apenas legal”, diz Lan Ye, que lidera o grupo de chamadas, reuniões e dispositivos das equipes. “Mas aqui, nós criamos esses problemas de conexão humana com esse novo modo de trabalhar, então vimos isso e percorremos 160 quilômetros por hora para construí-lo”. 

O novo recurso e a velocidade com que ele se uniu são exemplos de como a pesquisa pode render dividendos no futuro. 

Os engenheiros de software David Zhao, Henrik Turbell e Walid Boumerdassi construíram um protótipo do modo Juntos em apenas um fim de semana, tendo como base o trabalho que fizeram há dois anos para um projeto Microsoft Hackathon. Esse design teve origem na equipe de Inkpen e essencialmente removeu uma pessoa do ambiente de vídeo e a sobrepôs ao plano de fundo de outra. Boumerdassi, que é da França, mas mora em Seattle, lembra-se da diversão de ligar para sua família por videochamade ver todos juntos em uma tela – sem quadrados – com a Torre Eiffel ao fundo. 

YouTube Video 

O modo Juntos se baseia no trabalho iniciado no primeiro dia de Turbell com a Microsoft em Estocolmo, sete anos atrás, quando ele viajou para Londres para se encontrar com a equipe da pesquisadora Jamie Shotton no laboratório da Microsoft, em Cambridge, Reino Unido, para falar sobre o futuro da segmentação de vídeo. Esse é um método de dividir trechos de vídeo – como primeiro plano e segundo plano – que podem ser usados ​​para criar uma experiência mais compartilhada do que colocar as pessoas em uma grade. 

No modo Juntos, os participantes podem se encontrar em espaços sobrepostos e até “tocar” as pessoas ao seu redor. A ausência de barreiras cria uma maior consciência social e um senso de jornada compartilhada. 

Essa mudança única conquistou prontamente os desenvolvedores do novo recurso ao testá-lo em casa. 

O cansaço por vídeo se instalou rapidamente para Boumerdassi quando ele começou a trabalhar em seu apartamento em Seattle, trocando a sede da Microsoft em Redmond, Washington. Ele começou a ter reuniões apenas com áudio, mas não gostou do quanto essa comunicação limitada. 

Imagem O engenheiro de software da Microsoft, David Zhao, recrutou sua filha para ajudar a testar o projeto Hackathon de 2018 que usava a segmentação para separar os participantes do ambiente em uma videochamada e colocá-los juntos - nesse caso, colocando-a em seu escritório em casa. (Captura de tela fornecida por Zhao.) 
Imagem O engenheiro de software da Microsoft, David Zhao, recrutou sua filha para ajudar a testar o projeto Hackathon de 2018 que usava a segmentação para separar os participantes do ambiente em uma videochamada e colocá-los juntos – nesse caso, colocando-a em seu escritório em casa. (Captura de tela fornecida por Zhao.) 

Quando ele começou a testar o modo Juntos, ele notou uma mudança imediata nas conversas. Fluíram mais naturalmente. As pessoas não monopolizavam o tempo, porque começaram a aprender a linguagem corporal e sabiam quando os outros queriam falar. Boumerdassi descobriu que já não se observava automaticamente no vídeo como costumava ver na grade, imaginando nervosamente quem mais poderia estar olhando para ele. Em vez disso, ele esqueceu que estava no vídeo e se concentrou nas pessoas ao seu redor, o que significava que ele estava menos distraído e mais focado nas reuniões. 

“Como engenheiros, o fizemos funcionar, mas não sabíamos qual seria o impacto”, diz Boumerdassi. “Mas Jaron entendeu o potencial, ele foi o primeiro a colocá-lo em palavras, e sua visão disso convenceu todos a buscar isso como uma característica. É muito mágico, e é por isso que estamos todos animados com isso. “ 

Zhao, que iniciou sua carreira em 2007 como o segundo desenvolvedor de vídeo do Skype e criou o recurso de chamada em grupo para a empresa, considerou a experiência no modo Juntos um “avanço” para videoconferência. 

“Este é realmente apenas o começo”, concorda Ye. “Temos muitas ideias que queremos desenvolver neste andaime que nos permitirá mudar realmente a forma como as reuniões são hoje”. 

O modo Juntos não é para todas as situações. É tão natural e cria uma presença tão compartilhada que, se as pessoas estão fazendo multitarefas e olhando para suas mesas, outras pessoas podem pensar que estão olhando para a pessoa abaixo delas, brinca Bailenson. 

Mas trazer a consciência social para reuniões remotas da mesma forma que o modo Juntos “terá um efeito dramático em termos de aumento da coesão social, respeito e confiança”, diz Czerwinski. “Quanto melhor fizermos isso, mais entenderemos e apreciaremos um ao outro. 

“Então isso é uma coisa enorme para a sociedade. E quem sabe quanto tempo ficaremos nessa situação de pandemia. “ 

Imagem superior: O modo Juntos, mostrado aqui com um background de auditório, foi retirado do trabalho de uma equipe pouco formada de especialistas da Microsoft com diferentes origens, incluindo (da esquerda para a direita, de cima para baixo) Kori Inkpen, Henrik Turbell, Walid Boumerdassi, Jeff Teper Mary Czerwinski, David Zhao, Jaron Lanier e Lan Ye. Ilustração fotográfica da Microsoft. 

Tags: , ,

Posts Relacionados