Ir al contenido principal

¿Y si pudieran entrenar a su navegador para enseñarle qué hacer? Un asistente digital personalizable gana el primer Hackathon virtual de Microsoft

Se podría decir que todo comenzó porque a Sam Sun no le gustan las compras.

El equipo de Sun en Microsoft ha trabajado en una función para el navegador Microsoft Edge que puede mejorar la experiencia de compra en línea a través de la extracción de entidad web. Puede tomar datos relevantes desde varios sitios, para permitir al usuario comparar precios, encontrar ofertas y ver cuando algo está en rebaja o regresa a inventario, por ejemplo.

Pero Sun no vio cómo una característica así podría ser tan útil para él a nivel personal, así que él y su equipo comenzaron a cuestionarse si había una manera de utilizar la arquitectura para crear una herramienta más versátil que pudiera ayudar a más personas con una gama más amplia de tareas.

Esa pregunta fue respondida por el equipo de Sun durante el Hackathon global de este año, un evento anual producido por Microsoft Garage. El equipo de 13 personas, liderado por el colega laboral de Sun, Steven McMurray, creó un asistente digital personalizable, construido como una extensión para Microsoft Edge, al que un usuario puede enseñar a hacer cualquier cantidad de tareas. El proyecto recibió el primer lugar del Hackathon.

¿Qué es lo que puede hacer un asistente personalizable?

McMurray dijo que lo entrenaría para que lo mantuviera informado del conteo de polen de ambrosía, un alérgeno al que es en particular sensible.

Sun lo utilizará para encontrar y clasificar investigaciones

Kelsey Juraschka, que también forma parte del equipo, lo utilizará para vigilar las reservas de los parques nacionales y un muy solicitado permiso.

Otros miembros dijeron que podrían agendar un tiempo libre tan pronto como estuviera disponible, agregar el conteo de mensajes no leídos en diferentes plataformas de redes sociales o dar seguimiento al mercado de valores.

Sus diferentes ideas para aplicar la herramienta demostraron qué tan útil podría ser un asistente digital si el usuario le muestra qué hacer.

Así que, ¿Cómo lo utilizarían? El equipo ofrece la oportunidad de compartir comentarios y solicitar una invitación para un acceso temprano al proyecto (Disponible sólo en Estados Unidos).

‘Una ventana al mundo’

Dado que varios miembros del equipo del Hackathon trabajan en Microsoft Edge en sus trabajos diarios, estaban posicionados de manera única para entender las diversas necesidades que la gente tiene cuando se trata de utilizar un navegador, de acuerdo con Guru Singh, miembro del equipo.

Singh dijo que él ve al navegador como una “ventana al mundo”.

“Tienes acceso a todo tipo de recursos”, comentó. “Algunas de las cosas que hacemos a diario son monótonas y podrían ser automatizadas. Pensamos que podíamos transferir el poder de la automatización a la gente, con muy poco esfuerzo”.

McMurray dijo que fue Sun quien notó que era poco probable que el equipo de Microsoft Edge pudiera descubrir todas las diferentes cosas que la gente quiere hacer en línea, y Singh fue quien mencionó que el equipo debía enfocarse en el concepto de enseñar si en verdad querían ayudar a la gente.

“Las personas son heterogéneas”, comentó Sun. “No todos quieren que su asistente personal realice el mismo conjunto de pequeñas tareas”.

Pensamos que podíamos transferir el poder de la automatización a las personas, con muy poco esfuerzo.

El conjunto de tareas que los asistentes digitales y los dispositivos inteligentes saben hacer por nosotros es pequeño, porque cada uno debe ser programado de manera específica. Esto significa que sólo aquellas habilidades que se consideran útiles para un amplio rango de usuarios llegarán a un producto.

Para superar ese cuello de botella de ingeniería, este asistente inicia sin ningún conocimiento prestablecido.

“Se trata de un lienzo en blanco con el que trabajas y le enseñas cómo ayudarte”, mencionó McMurray.

Esa enseñanza se lleva a cabo por cada usuario individual a través de aprendizaje automático. A diferencia del aprendizaje automático tradicional, que se apoya en grandes cantidades de datos para alcanzar la precisión, cada modelo del usuario puede aprender de manera rápida con muy poca información, debido a que todos los datos que el usuario brinda son precisos y de alta relevancia para ese modelo en particular.

El enfoque pone al consumidor en control.

“No tienes que ser un mago del código”, comentó Singh. “No creemos que la automatización deba requerir un conocimiento sofisticado de cómo funciona esto”.

Ayúdame a ayudarte

Digamos que, por ejemplo, quieren dar seguimiento al nivel de polen. Deben navegar al sitio web donde existe esa información, dar clic en el dato específico al que quieren dar seguimiento, luego salvar la página con un pin dentro de la extensión del asistente.

El nivel de polen se proyectará en el tablero de su asistente personal, y será actualizado a medida que nueva información esté disponible. Podría ser uno de una decena de tipos de información a los que su asistente personal da seguimiento y presenta, desde seguimiento a paquetes, emails sin leer, hasta la disponibilidad de un sitio para acampar. Y pueden pedir ser notificados si ese nivel de polen llega a cierto nivel o que su asistente agende de manera automática un sitio para acampar y les haga saber que lo hizo.

Esas notificaciones pueden venir en el mismo navegador o a través de una aplicación, que todavía no ha sido construida; esto es posible porque el navegador corre en la nube y usa WebDrive para simular la navegación básica de navegador, como dar clic o desplazarse. Para tareas como revisar email, las cookies del usuario podrían ser pasadas de manera segura a la nube, y utilizadas para actualizar los datos.

Pero claro, su nuevo asistente apenas ha comenzado a conocerlos a ustedes y a sus necesidades, así que tal vez no haga todo bien en el primer intento.

Es por eso que otra pieza clave del proyecto es la capacidad del usuario de buscar información a través de su propio lenguaje natural, y de dar retroalimentación continua para entrenar al asistente personal y que se vuelva más útil con el tiempo.

Así que, si teclean “¿Cuál es el nivel de polen de ambrosía hoy?” en la barra de búsqueda del tablero de su asistente personal, o de manera eventual, preguntarle en voz alta a través de la aplicación, su asistente personal deberá mostrar lo que piensa que es la información que buscan. Si lo hace mal, háganselo saber.

Con el tiempo, el asistente personal no sólo se vuelve más preciso, también aprende de su estilo específico de búsqueda.

“La capacidad de recibir entrenamiento de este modelo en verdad es convincente”, comentó Jeff Ramos, que lidera Microsoft Garage. “En verdad podría destacar a Edge en el espacio de los navegadores e incluso automatizar tareas entre plataformas”.

Una incubadora ideal

El Hackathon dio al equipo la oportunidad de probar algo que no tenían la certeza de que fuera a funcionar. Esa no es una experiencia nueva para McMurray, que trabajó en una startup por tres años antes de unirse a Microsoft. Él trajo esa energía a su rol en Microsoft, y en particular a este proyecto.

“Tuvimos la capacidad de pensar de manera libre y abierta, y de tomar grandes riesgos y no tener miedo a fracasar”, comentó McMurray. “Construyamos algo increíble y veamos si lo conseguimos”.

Esa libertad es una enorme razón por la que el evento anual atrae a tanta gente. Este año, el Hackathon fue virtual por completo y tuvo a más de 66,500 participantes. Para motivar la creciente participación, Garage añadió funciones a su sitio interno HackBox, agregó un nuevo portal de recursos en línea y transmisión de video, y dio a la gente la oportunidad de contribuir en nuevas maneras, más allá del hackeo tradicional: Se pudieron ofrecer como voluntarios para ser consultados como expertos en un tema, ofrecer ideas de proyectos o integrarse a proyectos existentes.

Ramos comentó que esos cambios fueron una bendición para la inclusión.

“Nuestra presencia digital hizo a la gente sentir que el Hackathon era un campo más nivelado para los que trabajaban fuera de los grandes centros de desarrollo”, mencionó.

Tuvimos la capacidad de pensar de manera libre y abierta, y de tomar grandes riesgos y no tener miedo a fracasar.

El formato virtual presentó algunos desafíos, incluso para el equipo ganador, ubicado en Redmond. Sun, que ha participado casi cada año en el Hackathon, dijo que las lluvias de ideas son más sencillas cara a cara. Nancy Li, parte del equipo, que participó en dos Hackathones previos como practicante en Microsoft, dijo que el equipo tenía que ser más proactivo sobre contactarse entre ellos. Ambos le dan el crédito a McMurray por crear grupos de trabajo y tareas claras, que fueron delineadas desde el inicio.

Gráfico que representa la naturaleza global del hackathon

Todos los miembros del equipo reconocen las contribuciones de los demás, y está claro que tuvieron la confianza necesaria para trabajar en paralelo en sus componentes individuales del proyecto antes de unir todo.

“El Hackathon es un gran medio para que la gente tome el conjunto de habilidades que dominan a fondo y lo aplique a un interés que los apasione”, comentó Ed Essey, director de incubación para Microsoft Garage.

Y en algunos casos, el Hackathon es una oportunidad de aprender algo nuevo. Li, que no trabaja en el equipo de Microsoft Edge en su trabajo regular, aprendió JavaScript para poder ayudar con la depuración. También jugó un papel importante en armar el video demo del equipo.

Singh no estaba seguro de qué esperar del Hackathon, su primero en Microsoft. Se sintió complacido con lo colaborativa que fue la experiencia.

“Toda esta gente de diferentes antecedentes vino con ideas”, mencionó. “Hace que surjan la diversidad de pensamiento y de enfoques”.

El proyecto es un reconocimiento de la individualidad del consumidor, comentó Essey, que ahora trabajará de cerca con el equipo para explorar lo que pasará a continuación con su idea.

“Puedes agregar estas cosas que tienen en cuenta todas nuestras necesidades mientras se unen a todas estas increíbles fuentes alrededor del mundo”, mencionó. “El momento es adecuado para ese tipo de integración”.

Regístrense aquí para actualizaciones del proyecto.

Foto

Fila superior de izquierda a derecha: Steven McMurray, Sam Sun, Qiaofei Ye, Nancy Li

Fila de en medio de izquierda a derecha: Steven Lengieza, Sophors Khut, Kelsey Juraschka, Peter Weiler

Fila inferior de izquierda a derecha: Austin Orion, Guru Singh, Deepti Hariharan

No aparecen en la foto: Irene Huang, Veronika Hanson