Ir al contenido principal

El hombre del sonido

Matthew Bennett

Cómo Microsoft ha cortado el ruido para crear un ‘mundo sonoro’ más útil y atractivo

Tal vez nunca hayan pensado acerca de los sonidos que su computadora emite cuando llega un email, su batería está baja o aparece un recordatorio de reunión en su pantalla. Matthew Bennett sí lo ha hecho. Mucho.

Bennett compuso, tocó y manipuló de manera digital más de 400 versiones del sonido de alerta de calendario de Windows 10 antes de elegir la elegida.

“Eso fue lo que tomó llegar a la adecuada”, comentó Bennett mientras se encogía de hombros, durante una visita reciente a su estudio de sonido en Redmond, Washington. La habitación insonorizada y con iluminación ambiental cuenta con una mezcladora, múltiples monitores de estudio de alta tecnología y grandes pantallas LCD, y al frente y al centro, un teclado sintetizador de octavas múltiples.

Como director creativo de audio para un gran portafolio de software y dispositivos Microsoft, Bennett ha jugado un rol clave por 15 años en el diseño de sonido de la compañía. Él tiene firmes opiniones y filosofías bien desarrolladas acerca del sonido, así como un vocabulario con una alta especialización para discutirlas.

Para resumir su rol, él reflexiona acerca de lo siguiente, “Nuestra responsabilidad con los clientes es, primero, no hacer no daño, ¡No tener audios molestos! Segundo, hacerlo funcional, y tercero, hacerlo hermoso. Belleza y funcionalidad van de la mano. Entre más hermoso sea el diseño, soportará mejor a las experiencias que vamos a crear”.

A la familia de sonidos de Windows 10 le tomó meses llegar a la perfección, después de que él colaboró de manera cercana con miembros clave de su equipo, entre los que se encuentran diseñadores visuales, investigadores, gerentes de proyecto e ingenieros. “Realizamos muchas iteraciones para asegurarnos que cada sonido era el adecuado”, comentó.

Escuchen el sonido de la alerta de calendario de Windows:

Bennet, compositor de música clásica e improvisada que ha realizado extensas investigaciones en culturas musicales no occidentales, cuenta con un trabajo de doctorado en etnomusicología (la antropología de la música) en la Universidad de Washington, antes de dejar el programa para aceptar su primer trabajo de tiempo completo en Microsoft. Después de un periodo de cinco años, se aventuró a formar su propia agencia, y durante la década siguiente se dedicó a crear partituras para cine y televisión, así como diseño de sonido para marcas de compañías de Fortune 500. Pero pronto dejó de sentirse satisfecho con la música que creaba.

En búsqueda de nueva inspiración, dejó la composición para estudiar cánticos medievales y las culturas musicales de África Occidental, India, Medio Este e Indonesia. Cuando de manera gradual retomó la composición, su meta era crear un lenguaje musical personal, “un mundo de sonidos con el cual pudiera vivir”, como él mismo lo describe. Estos ejemplos muestran los resultados.

Una vez que regresó a Microsoft, Bennett puso manos a la obra. Ahora su trabajo puede ser escuchado no sólo a través de la plataforma Windows, sino también en el sistema operativo de Xbox y en productos que incluyen a Office, Surface, Cortana y Skype. Contar con una firme filosofía de diseño de sonido y un punto de vista creativo al centro busca ayudar a unificar el paisaje sonoro de los productos de Microsoft, justo como los principios de diseño de la interfaz de usuario buscan crear una continuidad visual y funcional entra todos los productos de toda la compañía.

Queremos orquestar una armonía entre los dispositivos y los sentidos.

Más allá de esto, el ambiente de desarrollo de Sonido Fluido y Diseño Sensorial de Microsoft busca ejercer una influencia más amplia en el diseño de sonido de la industria tecnológica.

“Utilizamos el sonido para dar forma al ritmo y a la textura emocional de la experiencia de usuario”, comentó Bennett. “El sonido es un elemento que está integrado con otras experiencias sensoriales como el tacto, la textura y el movimiento. Hemos cambiado nuestra forma de pensar acerca del diseño de sonido en Microsoft, y esperamos hacerlo también en toda la industria. Nuestra meta es ayudar a orquestar una armonía entre los dispositivos y los sentidos”. 

Rick Senechal, arquitecto de soluciones de medios en Microsoft, ha trabajado con Bennett por 20 años. Senechal dirige un servicio musical mundial para los equipos y agencias de la compañía.  Cada año el servicio brinda 4 mil canciones para eventos, videos, podcasts y productos.

Bennett se toma su tiempo y es muy reflexivo, comentó Senechal.

“Matthew es la persona más enfocada con la que he trabajado”, comentó. Él da un largo y profundo vistazo a su creación y se toma su tiempo para pensar las cosas. No solo hace sonidos y dice, ‘Oh, eso suena bien’. Hay una lógica y un razonamiento detrás de los sonidos y texturas que él crea”.

Bennett tiene muy claro lo que no son los sonidos de Microsoft.

Hay una lógica y un razonamiento detrás de los sonidos y texturas que él crea.

“No somos efectos de sonido, sonidos de juego, sonidos genéricos (beeps y bloops), sonidos de moda (perros o bocinas de niebla), sonidos futuristas, música o alarmas que cubren todo el espacio”, comentó. “Nuestros sonidos de producto no son músicos en vivo o bits de sampleos de instrumentos reales, como un piano o una guitarra o un sintetizados análogo, porque estos evocan estilos musicales específicos y memoria emocional, lo que es muy subjetivo entre individuos y entre culturas. Estos enfoques de diseño no hacen sentido para los tipos de experiencias digitales modernas que nuestros equipos crean. Nuestra meta es desarrollar un lenguaje de diseño de sonido que se sienta como algo único y auténtico y esté integrado a profundidad con nuestros productos y servicios”.

Los sonidos en versiones anteriores de Windows fueron un poco diferentes a aquellos que están en Windows 10, anotó Bennett. Por un lado, había muchos más. Los sonidos triunfantes que denotaban un reinicio exitoso “ya no son necesario”, mencionó. “Ya no necesitamos celebrar el hecho de que nuestros dispositivos han encendido. Eso es algo que en este punto ya damos por hecho”.

Muchos sonidos modernos de producto tienden a ser más cortos. Los sonidos anteriores, como la señal de apagado en Windows NT Workstation 4.0 (1996), duraban 8 segundos, algo interminable para los estándares actuales, que demandan sonidos menos intrusivos que son medidos en milisegundos (una milésima de un segundo). Y, como los sonidos de arranque, los sonidos de apagado son cosa del pasado, considerados sólo otro factor innecesario a la contaminación auditiva inducida por la tecnología.

El sonido de arranque en Windows NT Workstation 5 (200), de casi 12 segundos de duración, sonaba como el despegue de un escuadrón de aviones de combate, seguido por el centelleo de una marimba. Los sonidos actuales están “integrados más a profundidad con el producto y tan calmos, discretos y poco intrusivos como sea posible”, comentó Bennett.

Los sonidos que los especialistas llaman “esqueumorfos” se han ido, aquellos sonidos que replican a sus contrapartes del mundo real, como una pieza de papel que se arruga cuando un documento es eliminado o el golpeteo de las teclas de máquinas de escribir mecánicas del siglo XIX que denotaban los golpes de tecla en pantalla.

Matthew Bennett en los Estudios de Producción de Microsoft con Dan Charette, ingeniero de audio.

“En etapas anteriores, esos sonidos ayudaban a la gente a familiarizarse con la tecnología, pero ya no los necesitamos. Ya no agregan nada a la experiencia, y ahora tienden a sentirse mucho barullo”, comentó Bennett. “Con el paso de los años, el mundo del diseño visual ha reducido el desorden y ha utilizado más espacio”, observó. “Ahora el diseño de sonido ha comenzado a hacer lo mismo”.

Windows 7 tenía cerca de 40 sonidos. Windows 10 tiene alrededor de 10, aunque los sonidos legados están incluidos en el OS para asegurar la retrocompatibilidad, comentó. “Cuando comencé, había siete diferentes sonidos de error de sistema. Se habían acumulado con el paso de los años y nadie sabía lo que significaban. No había una guía clara para los socios o para nosotros mismos. Nos deshicimos de todo el conjunto de sonidos y los reemplazamos con dos sonidos mucho más enfocados, una gentil notificación de fondo y otro sonido más urgente”. 

Una técnica de diseño que Bennett ha desarrollado involucra la extensiva grabación y comparación de siluetas vocales (los aspectos melódicos y rítmicos del habla) de diferentes idiomas, para identificar patrones universales que puedan ayudar a crear un lenguaje de diseño de sonido. Por ejemplo, una declaración que significa “¿Ya estás listo?”, puede tener un patrón de tono muy similar cuando se usa en inglés, francés, japonés, mandarín, español o ruso. De manera básica es “arriba, abajo, y un pequeño salto”, comentó.

Bennett tomó esa particular silueta vocal y la replicó de manera musical, para que pudiera ser escuchada como base del aviso de alerta de calendario de 2.5 segundos en Windows 10. Esta técnica ha dado forma a todo el conjunto de sonidos de Windows 10. “Las siluetas de lenguaje están integradas a profundidad, no tienen la intención de ser escuchadas de manera literal o consciente”, mencionó. “Deben sentirse de manera intuitiva para crear una conexión emocional que se sienta natural e instintiva”.

Bennett cree que los mejores sonidos de sistema operativo deben estar integrados a profundidad con los eventos a los que dan soporte. Por ejemplo, los mensajes de texto son más urgentes que los email, así que el sonido de mensajes de texto de Windows 10 “te empuja un poco y suena más como una alerta”, mencionó. Para un email nuevo, “también quieres saber que algo ha llegado, pero el sonido va un poco más atrás. Es un poco más relajado”.

¿Llama “música” a sus creaciones?

Diseñamos el sonido con el silencio en mente.

“En el sentido más amplio, sí. Aunque las describiría como paramusicales”, comentó. Utilizan elementos musicales (ritmo, melodía y armonía) para hacer sonidos que se sientan hermosos, pero no deben atraer la atención hacia ellos como una pieza de música”, mencionó.

Sin duda, los conceptos musicales juegan un enorme rol en el pensamiento de diseño de Bennett.

“El tono de mensaje de error utiliza un intervalo de 9ª menor, que en definitiva es un poco disonante y dice, ‘En verdad necesitas prestar atención a esto’”, comentó.

Aunque más compañías tecnológicas han empleado a directores de audio como Bennett, “como disciplina, el diseño de sonido todavía está rezagado con respecto al hardware y al diseño visual”, comentó. “De manera tradicional, no nos hemos integrado a fondo con los equipos de diseño de producto, aparte de los juegos. Microsoft fue una de las primeras compañías que se dio cuenta del valor de integrar diseñadores de sonido con los equipos de producto”.

Además de influir en el diseño de Microsoft y la tecnología de manera más amplia, Bennett piensa que la disciplina del diseño de sonido tiene una obligación con el mundo en general. En una historia del 9 de febrero de 2018, el New York Times señaló la cacofonía producida por los dispositivos electrónicos ubicuos de la actualidad, y afirmó que, “esos ruidos inorgánicos, altisonantes, que atrapan la atención se volvieron la norma [y] las alertas sónicas disruptivas desencadenan una retroalimentación pavloviana”.

Bennett escuchó eso.

“Ahora hay demasiados sonidos de dispositivos en nuestro ambiente. Tan solo los sonidos de Windows son escuchados cientos de millones de veces al día en todo el mundo”, mencionó. “Esa es una gran cantidad de sonidos que afectan a muchas vidas. Incluso si son cortos en teoría, cada sonido tiene un impacto emocional, estemos o no conscientes de ellos. Tenemos una responsabilidad de afrontar esto como un sistema y ayudar a crear una ecología de audio que apoye las relaciones saludables entre la gente y la tecnología.

La Organización Mundial de la Salud ha reconocido que los sonidos fuertes e inesperados pueden causar estrés y ansiedad, los cuales van en detrimento a la salud pública, y que los sonidos innecesarios y el volumen excesivo son solo otra forma de contaminación.

“En un bosque, hay una increíble cantidad de información que es comunicada a través del sonido, con muchas capas que se encuentran en movimiento de manera simultánea: aves, insectos, árboles, plantas, agua y viento. Y todo es muy comprensible debido a que el diseño acústico del bosque ha evolucionado para ser orquestado de manera natural, con una profunda armonía que permite a todas las capas respirar y funcionar en conjunto. Esa es una poderosa metáfora sobre cómo debemos diseñar el sonido”.

Hacia el final de nuestra conversación, le hice una confesión a Matthew: No he operado mi computadora Windows con los sonidos activados desde, más o menos 1990. Los considero innecesarios e incluso irritantes.

Le pregunté de qué me había perdido, si hay algún aspecto sutil del OS que me haya perdido.

Él respondió, “Los sonidos correctos en el momento adecuado, pueden dar soporte a una experiencia de usuario más eficiente y más placentera. Pueden transmitir información crucial cuando estamos lejos de la pantalla. Pueden mejorar la manera en que se siente nuestra tecnología. Queremos que la gente sepa que ESTÁ BIEN encender de nuevo sus sonidos. Nuestro moderno enfoque hacia el diseño de sonido tiene un profundo respeto. No vamos a arrancar de manera ruidosa en una reunión o en la librería, no vamos a molestar a la gente a tu alrededor. No va a ser un ruido aleatorio. Va a ser un pequeño conjunto de hermosos sonidos que han sido curados de manera cuidadosa para comunicar información importante de manera muy eficiente y que se adapten bien en tu ambiente”.

Un gentil recordatorio

Matthew Bennett habla acerca de la creación de la alerta de sonido de calendario de Windows 10

Mucha gente siente ansiedad con los sonidos de su calendario, porque significa que hay algo que tienen que hacer. Muchos dicen que es como responder a alarmas de incendio todo el día. Necesitábamos algo que tuviera un sentido de alerta pero sin que provocara ansiedad. Y queríamos obtener la cantidad correcta de optimismo y energía, empujar al usuario hacia su siguiente actividad, pero con la sensación de que lo hace un amigo calmado y alentador.

Este sonido fue creado para ser escuchado a volúmenes bajos y para ser más sentido que escuchado. Tiene un inicio, una mitad y un final. Si lo escuchan con atención, escucharán que es un ritmo de siete pulsos iguales. Comienza bajo y lento, con tres pulsos que fueron diseñados para ser sentidos, más que escuchados. Y tiene una duración larga para un sonido de interfaz de usuario (2.5 segundos) pero a un volumen normal sólo escucharán parte de ese sonido porque esos primeros tres tonos son muy suaves. Son como una respiración, una recogida musical, para hacerles saber que algo está por suceder. Luego el volumen aumenta un poco, florece, para hacer más audible la sección media. Y al final hay una larga cola de reverberación que cae, que se siente muy transparente y ligera pero que también puede mejorar la audición en ciertos contextos de ruido o cuando los usuarios están lejos de su dispositivo.

Es un sonido largo, pero muy abierto. En definitiva no es alarmante. Se siente ligero y placentero y tiene una agradable textura emocional.

También hay un sutil movimiento de izquierda a derecha en el campo sonoro que pueden escuchar a través de audífonos o de una buenas bocinas, como las que están integradas en una buena laptop o tableta.

Hay capas en primer plano y al fondo, horneadas en el sonido terminado. El primer plano fue esculpido de manera digital con una percusión afinada y arrebatadora. Las texturas suenan familiares pero no son instrumentos del mundo real.

Hay una sensación triple a este sonido y a muchos de los otros sonidos en Windows 10. Con el paso de los años, los sonidos que por lo general sentimos que son los más fluidos, y que pueden balancear las calidades correctas de energía y calma, han tendido a resolverse en un ritmo triple subyacente. Así que ese pulso, esa subestructura rítmica, se ha vuelto parte de nuestro ADN.

Queremos sonar orgánicos e integrales. Esto significa que en definitiva no queremos que los sonidos parezcan programados por una computadora. Pero tampoco queremos que suenen como si un ser humano tocara una pequeña pieza de música dentro de su dispositivo. Así que nos decidimos por una sutil red temporal, para que se sienta un poco mecánica pero a la vez que mantenga un poco de sentimiento.