Ir para a página inicial

Como a Microsoft está cortando o barulho para criar um “mundo sonoro” mais útil e bonito

Talvez você nunca tenha pensado sobre os sons que o seu computador emite quando chega um e-mail, a bateria está fraca ou quando um lembrete de reunião aparece na tela. Mas Matthew Bennett pensou. E muito.

Bennett compôs, executou e manipulou digitalmente mais de 400 versões do som de alerta do calendário do Windows 10 antes de escolher o perfeito.

“Foi exatamente o tempo necessário para acertar”, disse Bennett com um encolher de ombros durante uma visita recente ao seu estúdio em Redmond, Washington. A sala, com iluminação ambiente e som abafado, possui um mixador, múltiplos monitores de estúdio e grandes telas de LCD, e, frontal e central, um teclado sintetizador com várias oitavas.

Como diretor de criação de áudio para um grande portfólio de softwares e dispositivos da Microsoft, Bennett tem desempenhado um papel fundamental no design de som da empresa há 15 anos. Ele tem opiniões fortes e filosofias bem desenvolvidas sobre o som, além de um vocabulário altamente especializado para discuti-lo.

Resumindo seu papel, ele refletiu: “Nossa responsabilidade com os clientes é, em primeiro lugar, não causar danos – sem áudio irritante! Segundo, torná-lo funcional e, terceiro, deixá-lo bonito. Beleza e função andam de mãos dadas. Quanto mais bonito o design, melhor ele apoiará as experiências que estamos criando.”

A família de sons do Windows 10 levou muitos meses para ser aperfeiçoada, já que ele colaborou de perto com os principais membros de sua equipe, incluindo designers visuais, pesquisadores, gerentes de projeto e engenheiros. “Repetimos muito para ter certeza de que todo som está correto”, disse.

Um compositor de música clássica e improvisada, que realizou uma extensa pesquisa sobre culturas musicais não-ocidentais, Bennett conduziu um trabalho de Ph.D. em etnomusicologia (antropologia da música) na Universidade de Washington, antes de deixar o programa para aceitar sua primeira posição em tempo integral na Microsoft. Depois de um período de cinco anos, ele criou sua própria agência e, na década seguinte, dedicou-se a criar partituras para cinema e televisão, bem como design de marca para empresas da Fortune 500. Mas ele acabou ficando insatisfeito com a música que estava criando.

Buscando uma nova inspiração, ele deixou de compor para estudar o canto medieval e as culturas musicais da África Ocidental, Índia, Oriente Médio e Indonésia. Quando ele gradualmente retomou a composição, seu objetivo era criar uma linguagem musical pessoal – “um mundo sonoro com o qual eu pudesse conviver”, como ele mesmo descreve. Estes exemplos mostram os resultados.

De volta à Microsoft, Bennett se esforçou muito. Agora seu trabalho pode ser ouvido não apenas em toda a plataforma Windows, mas também no sistema operacional Xbox e em produtos como Office, Surface, Cortana e Skype. Ter uma filosofia de design de som e um ponto de vista criativo ajuda a unificar o cenário sonoro dos produtos Microsoft, assim como os princípios de interface do usuário tentam criar uma continuidade visual e funcional em toda a empresa e seus produtos.

Além disso, o ambiente de desenvolvimento Fluent Sound and Sensory Design da Microsoft busca influenciar o design de som no setor de tecnologia de forma mais ampla.

“Usamos o som para moldar o ritmo e a textura emocional da experiência do usuário”, contou Bennett. “O som é um elemento que está integrado a outras experiências sensoriais como toque, textura e movimento. Estamos mudando a maneira como pensamos sobre o design de som na Microsoft e esperamos que a indústria em geral também. Nosso objetivo é ajudar a orquestrar harmonia entre dispositivos e sentidos.”

Rick Senechal, arquiteto de soluções de mídia da Microsoft, trabalha com Bennett há 20 anos. Senechal dirige um serviço de música mundial para equipes e agências da empresa. A cada ano, o serviço oferece quatro mil músicas para eventos, vídeos, podcasts e produtos.

Bennett tem seu tempo e é extremamente consciente, revela Senechal.

“Matthew é a pessoa mais focada com quem já trabalhei”, afirmou. “Ele tem uma visão longa e profunda de seu ofício e realmente pensa sobre as coisas. Não está apenas fazendo sons e dizendo: ‘Oh, isso soa bem.’ Há uma lógica e inteligência por trás dos sons e texturas que ele cria.”

Bennett é rápido em declarar o que os sons da Microsoft não são.

“Não somos efeitos sonoros, sons de jogos, genéricos (bips e bloops), inovadores (cães e buzinas), futuristas, música alta ou alarmes”, afirma. “Os sons dos nossos produtos não são músicas ao vivo ou samples de instrumentos reais, como um piano, violão ou sintetizador analógico, porque eles evocam estilos musicais específicos e memória emocional, o que é muito subjetivo entre indivíduos e entre culturas. Essas abordagens de design não fazem sentido para os tipos de experiências digitais modernas que nossas equipes estão criando. Nosso objetivo é desenvolver uma linguagem de design de som que pareça única, autêntica e profundamente integrada com nossos produtos e dispositivos.”

Os sons em versões mais antigas do Windows eram bem diferentes dos do Windows 10, observou Bennett. Por um lado, havia muito mais deles. Sons triunfantes denotando uma inicialização bem-sucedida “não são mais necessários”, revela. “Não precisamos mais celebrar o fato de que nossos dispositivos estão ligados. Isso é algo que podemos dar como garantido neste momento.”

Muitos sons de produtos modernos tendem a ser mais curtos. Sons anteriores, como o sinal de desligamento no Windows NT Workstation 4.0 (1996), duravam oito segundos – intermináveis ​​pelos padrões atuais, que exigem sons menos intrusivos medidos em milissegundos (1/1.000 de segundo). E, como os sons de inicialização, os sons de desligamento são uma coisa do passado, considerados apenas mais um tipo de poluição sonora induzida pela tecnologia.

O som de inicialização no Windows NT Workstation 5 (2000), com quase 12 segundos de duração, soou como um esquadrão de caças decolando, seguido por cintilantes marimbas. Os sons de hoje são “mais integrados ao produto e calmos, silenciosos e não intrusivos”, explica Bennett.

Longe estão os sons que os especialistas chamam de skeuomorphic – aqueles que replicam os seus homólogos do mundo real, como um pedaço de papel sendo amassado quando um documento é excluído ou o estalido do século 19, teclas de máquina de escrever mecânicas que denotam as teclas digitadas na tela.

“Nos estágios iniciais, esses sons ajudaram as pessoas a se familiarizarem com a tecnologia, mas não precisamos mais delas. Elas não aumentam mais a experiência e tendem a se sentir mais confusas agora”, disse Bennett. “Há muitos anos, o mundo do design visual vem reduzindo a desordem e usando mais espaço”, observou. “Agora, o som está começando a fazer o mesmo.”

O Windows 7 tinha cerca de 40 sons. O Windows 10 tem cerca de oito, embora os sons legados sejam incluídos no sistema operacional para garantir compatibilidade retroativa, explica ele. “Quando eu comecei, haviam sete sons de erro de sistema diferentes. Eles tinham acumulado ao longo dos anos e ninguém sabia o que eles significavam. Não havia diretrizes claras para parceiros ou para nós mesmos. Nos livramos do conjunto e os substituímos por dois sons mais focados – uma notificação de fundo suave e outro som mais urgente.”

Uma técnica de design desenvolvida por Bennett envolve a extensa gravação e comparação de contornos vocais – os aspectos melódicos e rítmicos da fala – de muitas línguas diferentes, para identificar padrões universais que podem ajudar a criar uma linguagem de design de som. Por exemplo, uma frase que significa “Pronto para ir?” pode ter um padrão de som muito semelhante quando falado em inglês, francês, japonês, mandarim, espanhol ou russo. É basicamente “para cima, para baixo e um pequeno salto”, diz ele.

Bennett usou esse contorno vocal específico e replicou-o musicalmente, para que ele pudesse ser ouvido no aviso de alerta de calendário do Windows 10, de 2,5 segundos. Essa técnica moldou todo o conjunto de sons do Windows 10. “Os contornos da linguagem estão profundamente integrados, não destinados a serem ouvidos literalmente ou conscientemente”, conta. “Eles devem apenas ser sentidos intuitivamente para criar uma conexão emocional que pareça natural, instintiva.”

Bennett acredita que os melhores sons do sistema operacional devem estar integrados aos eventos para os quais eles contribuem. Por exemplo, o envio de mensagens de texto é mais sensível ao tempo do que o envio por e-mail, portanto, o som das mensagens de texto do Windows 10 “te puxa um pouco para frente e te deixa um pouco mais alerta”, afirma. Para um novo e-mail, “você ainda quer saber se algo está chegando, mas o som diminui um pouco. É um pouco mais relaxado.”

Ele chama suas criações de “música”?

“No sentido mais amplo, sim. Eu os descreveria como ‘paramusical’”, disse. “Eles utilizam elementos musicais – ritmo, melodia e harmonia – para fazer sons que parecem bonitos, mas nunca devem chamar a atenção para si mesmos como uma peça musical”, comenta.

Conceitos musicais certamente desempenham um papel importante no pensamento de design de Bennett.

“O tom de mensagem de erro usa um nono intervalo menor, que é definitivamente um pouco dissonante e diz: ‘Você realmente precisa prestar atenção a isso'”, alerta.

Enquanto mais empresas de tecnologia estão empregando diretores de áudio como Bennett, “como disciplina, o design de som ainda fica um pouco atrás do hardware e do design visual”, lembra. “Tradicionalmente, não estamos integrados às equipes de design de produto, além dos jogos. A Microsoft foi uma das primeiras empresas a perceber o valor da incorporação de designers de som a equipes de produtos.”

Além de influenciar o design da Microsoft e da tecnologia de forma mais ampla, Bennett acredita que a disciplina do design de som tem uma obrigação para com o mundo em geral. O The New York Times, em uma reportagem de 9 de fevereiro de 2018, observou a cacofonia produzida pelos dispositivos eletrônicos onipresentes de hoje, afirmando que “barulhos inorgânicos bombásticos e que chamam a atenção se tornam a norma [e] alertas sonoros disruptivos desencadeiam o feedback pavloviano.”

Bennett ouviu isso.

“Existem tantos sons de dispositivos em nosso ambiente agora. Os sons do Windows sozinhos são ouvidos centenas de milhões de vezes por dia em todo o mundo”, conta. “Isso é um monte de som que afeta muitas vidas. Mesmo que eles sejam relativamente curtos, todo som tem um impacto emocional, quer estejamos cientes disso ou não. Temos a responsabilidade de abordar isso como um sistema e ajudar a criar uma ecologia de áudio que apoia relacionamentos saudáveis ​​entre pessoas e tecnologia.”

A Organização Mundial de Saúde reconheceu que sons altos inesperados podem causar estresse e ansiedade, que são prejudiciais à saúde pública, e que sons desnecessários e volume excessivo são apenas outra forma de poluição.

“Em uma floresta tropical, há uma incrível quantidade de informação sendo transmitida através do som, com muitas camadas em movimento simultaneamente – pássaros, insetos, árvores, plantas, água e vento. E tudo muito inteligível porque o design acústico de uma floresta tropical evoluiu para que seja naturalmente orquestrado, com uma harmonia profunda que permita que todas as camadas respirem e funcionem juntas. Essa é uma poderosa metáfora de como devemos projetar o som.”

Perto do fim de nossa conversa, fiz uma confissão a Matthew: não operava meu computador Windows com os sons ligados desde, oh, por volta de 1990. Achei-os desnecessários e até mesmo irritantes.

Perguntei a ele o que eu estava perdendo – se há algum aspecto sutil do sistema operacional que está sendo perdido.

Ele respondeu: “Os sons certos no momento certo, podem ajudar em uma experiência mais eficiente e agradável. Eles podem transmitir informações importantes e melhorar o ritmo e o fluxo de atenção, que é realmente nosso recurso mais importante. Podem transmitir informações cruciais quando estamos longe da tela. Melhoram a maneira como nossa tecnologia é sentida. Queremos que as pessoas saibam que é bom reativar seus sons. Nossa abordagem moderna ao design de som é muito respeitosa. Não vamos inicializar em voz alta em uma reunião ou na biblioteca, não vamos incomodar as pessoas ao seu redor, não será um ruído aleatório, será um pequeno conjunto de belos sons cuidadosamente selecionados para comunicar informações importantes de maneira muito eficiente para se adaptar bem em seu ambiente.”

Um pequeno lembrete

Matthew Bennett na criação do som de alerta de calendário do Windows 10

Muitas pessoas sentem certa ansiedade em relação aos sons do calendário, porque isso significa que há algo que precisam fazer. Alguns deles dizem que é como responder a alarmes de incêndio durante todo o dia. Precisávamos de algo que fosse alerta, mas não um causador de ansiedade. E queríamos obter a quantidade certa de otimismo e energia, levando o usuário para a próxima atividade, mas com a sensação de um amigo calmo e solidário.

Esse som deve ser ouvido em volumes mais baixos e ser mais sentido do que ouvido. Tem um começo, meio e fim. Se você ouvir atentamente, ouvirá que é um ritmo de sete pulsos iguais. Começa baixo e lento, com três pulsos projetados para serem sentidos mais do que ouvidos. E dura muito tempo para um som de interface do usuário – 2,5 segundos – mas no volume normal você só ouve parte do som porque os três primeiros tons são suaves. Eles são como uma respiração, uma resgate musical, para que você saiba que algo está prestes a acontecer. Então o volume incha um pouco, floresce, para tornar a seção intermediária mais audível. E, no final, há uma longa cauda de reverberação, caindo, que parece muito transparente e leve, mas também pode melhorar a audibilidade em determinados contextos barulhentos ou quando os usuários estão longe de seus dispositivos.

Então é um som longo, mas muito aberto. Definitivamente não é alarmante. Parece leve e agradável e tem uma boa textura emocional.

Há também um sutil movimento da esquerda para a direita no campo de som que você pode ouvir por meio de fones de ouvido ou alto-falantes, como aqueles em um bom laptop ou tablet.

Existem camadas de primeiro plano e plano de fundo no som finalizado. O primeiro plano é arrancado digitalmente e a percussão sintonizada. As texturas parecem familiares, mas não são instrumentos do mundo real.

Há um toque de três elementos nesse som e em muitos outros no Windows 10. Com o passar dos anos, os sons que geralmente parecem mais fluidos e que podem equilibrar as qualidades certas de energia e calma, tendem a ser resolvidos a um ritmo tripleto subjacente. Então, esse pulso, essa subestrutura rítmica, tornou-se parte do nosso DNA.

Queremos soar orgânicos e integrais. Isso significa que, definitivamente, não queremos que os sons pareçam ter sido programados em um computador. Mas também não queremos soar como um ser humano executando uma pequena peça de música dentro do seu dispositivo. Então, usamos uma grade temporal sutil, para nos sentirmos um pouco como máquinas, enquanto ainda mantemos um pouco da alma.

Fotos: Brian Smale