15 hitos que dieron forma a la visión de Microsoft para la IA

Si bien puede parecer que la IA surgió en los últimos años como una tecnología formada por completo, preparada para ayudar a cambiar la forma en que interactuamos con el mundo que nos rodea, la realidad es que el desarrollo de la IA ha llevado décadas de trabajo, y avances tempranos en áreas como el aprendizaje automático y el procesamiento del lenguaje natural, con muchos más avances por venir.

Incluso si Bill Gates no pensaba en específico en la IA durante su primer día en la oficina en 1975, no hay duda de que los avances tecnológicos y las innovaciones que Microsoft ha guiado en los últimos 50 años fueron pasos críticos en el camino que conduce a la era actual de la IA.

Desde el lanzamiento del primer sistema operativo en 1985 hasta el memorándum Tidal Wave de Gates 10 años después que predijo el poder de Internet, la superpotencia de la compañía siempre ha sido abrazar el cambio y apuntar hacia el futuro. Eso continuó con documentos fundacionales escritos por Microsoft Research sobre redes bayesianas y el demostrador del teorema Z3 que allanaron el camino para los desarrollos de IA por venir.

A medida que la IA se vuelve más integral en la vida cotidiana, exploremos cómo varios hitos clave de Microsoft ayudaron a sentar las bases de donde estamos hoy y cómo la compañía planea desarrollar la plataforma, las herramientas y la infraestructura de IA más confiables para el futuro.

Bing se lanza con capacidades de lenguaje natural

Con una evolución que comienza a partir de Windows Live Search, el lanzamiento de Bing en 2009 introdujo varias características notables de aprendizaje automático en su inicio, incluidas las sugerencias de búsqueda durante la entrada de consultas y una lista de búsquedas relacionadas, conocida como el «panel Explorar». Estas características aprovecharon la tecnología semántica de Powerset, una empresa que Microsoft adquirió en 2008.

El proyecto Oxford sienta las bases para la amplitud de las capacidades de IA en Azure

Muchos de los avances técnicos de Microsoft se basan en el éxito de Azure. Este proyecto con nombre en clave, lanzado en 2015, proporcionó a los desarrolladores un conjunto de tecnologías inteligentes utilizadas para crear aplicaciones más inteligentes con detección de rostros, reconocimiento de voz y comprensión del idioma. Ahora se conoce como Azure AI Foundry.

«Gran parte de esto se remonta a Bing», dijo Eric Boyd, vicepresidente corporativo de Microsoft Azure AI Platform, quien comenzó su recorrido en Microsoft en el desarrollo de Bing Ads. «Construimos toda esta infraestructura sobre cómo entrenar modelos de IA, cómo iterar y experimentar para ver qué modelo de IA en realidad funcionaba mejor. Toda esa infraestructura se convirtió en piezas y componentes de cosas que ahora servimos a través de Azure AI».

El número de productos críticos que surgieron de Azure incluye el desarrollo de aplicaciones de IA conversacional, Microsoft Cognitive Services, una suite de herramientas de IA responsable y Azure OpenAI Service, que combina modelos de lenguaje eficaces con las capacidades empresariales de Azure. En la actualidad, más de 60 mil organizaciones utilizan Azure AI Foundry y el 65% de las empresas de la lista Fortune 500 han adoptado Azure OpenAI Service.

Un nuevo marco impulsa el entrenamiento y el rendimiento de las redes neuronales profundas

Un avance de Microsoft Research, Deep Residual Networks, también conocido como ResNet, se presentó en 2015. El marco de aprendizaje residual mejoró de manera significativa el entrenamiento de redes neuronales profundas, lo que permitió el desarrollo de arquitecturas más profundas con un mejor rendimiento. Ayudó a abrir la puerta a una amplia gama de aplicaciones prácticas, muchas de las cuales son fundamentales para nuestras vidas actuales.

«ResNet estableció el estándar para la visión por computadora que se usa en todas partes», dijo Peter Lee, presidente de Microsoft Research. «Si tienes un coche autónomo, utiliza la IA basada en ResNet. Si te haces una resonancia magnética en la clínica, esa máquina de resonancia magnética también tiene tecnología basada en ResNet».

Imagen con íconos de volumen, diálogo y un cartel con las letras "Breakthroughs in speech, translation and understanding"

Un salto en el aprendizaje multisensorial y multilingüe

En un período de cinco años a partir de 2015, Microsoft logró la paridad de rendimiento humano en varios puntos de referencia en reconocimiento de voz conversacional, traducción automática, respuesta a preguntas conversacionales, comprensión de lectura automática y subtitulado de imágenes.

Estos cinco avances fueron clave para producir un salto en las capacidades de la IA, para lograr un aprendizaje multisensorial y multilingüe que está más en línea con la forma en que los humanos aprenden y entienden. Estos avances condujeron al desarrollo del código XYZ de Microsoft, la intersección de tres atributos de la cognición humana: texto monolingüe (X), señales sensoriales auditivas o visuales (Y) y multilingüe (Z), y se integraron en los servicios de IA de Azure para ayudar a los clientes a acelerar sistemas de IA más potentes e integradores.

Mejorar la accesibilidad al hacer que el mundo visual sea audible

Con el objetivo de crear tecnología que aumente la accesibilidad, Microsoft presentó Seeing AI en 2016. Este ejemplo del mundo real de IA utiliza la visión por computadora y el procesamiento del lenguaje natural para describir el entorno de una persona, leer texto, responder preguntas, identificar monedas e incluso describir a las personas que lo rodean y las expresiones faciales.

La función Find My Things ayuda a las personas ciegas o con baja visión a personalizar su experiencia al enseñar a la herramienta a reconocer los artículos que en verdad usan y que pueden extraviar. Estos pueden incluir artículos pequeños como llaves de casa o auriculares.

La accesibilidad hace que las herramientas y tecnologías de Microsoft sean más fáciles para todos y acelera la innovación para el mundo, incluidos productos como Reading Coach, que ayuda a los estudiantes a aprender a leer y apoya a los lectores emergentes y a los estudiantes con dislexia.

Imagen con íconos de ondas, procesadores, y átomos, con el letrero "Project Brainwave"

Cambiar la velocidad de procesamiento de la IA

2017 marcó la llegada de Brainwave, una plataforma de aceleración de aprendizaje profundo diseñada para ejecutar cargas de trabajo de IA en tiempo real a escala en la infraestructura en la nube de Microsoft. Brainwave combina matrices de puertas programables en campo (FPGA, por sus siglas en inglés) con software de alto rendimiento, lo que aumenta de manera significativa el rendimiento de los modelos de IA, en especial para tareas como el reconocimiento de imágenes y el procesamiento del lenguaje natural. Brainwave marcó un salto importante en la forma en que Microsoft abordó el hardware de IA y la inferencia de IA basada en la nube.

Iconos de un foco encendido, texto, una maceta, y el letrero "Turuing-NLG)

Preparar el escenario para la innovación en modelos de lenguaje grandes

En 2020, Microsoft lanzó Turing-NLG (Natural Language Generation), uno de los modelos de lenguaje más grandes de esa época con 17 mil millones de parámetros. Esto demostró el liderazgo de Microsoft en el desarrollo de la IA para la comprensión del lenguaje natural y precedió al desarrollo de otros modelos fundamentales como Florence para el reconocimiento visual.

Gráfico abstracto de cerebro pixelado con íconos médicos y científicos, y texto 'Inteligencia clínica ambiental'.

Nuance presenta la primera solución de inteligencia clínica ambiental para el cuidado de la salud

DAX Copilot, ahora integrado en Dragon Copilot, fue un paso importante en el campo de la atención médica, ya que utilizó IA habilitada por voz para permitir a los médicos documentar los encuentros con los pacientes durante una conversación natural entre el médico, el paciente y las familias, lo que permitió a los médicos prestar toda la atención cuando estaban con sus pacientes y reducir la cantidad de trabajo fuera del horario laboral.

En 2020, DAX pasó a estar disponible para el público en general, y en 2023, DAX Express se convirtió en la primera solución que combina la IA conversacional y ambiental con GPT-4. En la actualidad, más de 600 de los principales sistemas sanitarios confían en la solución de IA ambiental. Produce más de 3 millones de episodios de atención por mes y sigue en aumento.

Ilustración de un servidor con diferentes íconos sobre nubes, y el letrero "Azure AI supercomputer"

Una infraestructura de supercomputación sin precedentes en Azure acelera los avances de OpenAI

También en 2020, Microsoft presentó una nueva supercomputadora alojada en Azure para OpenAI, para establecer una nueva infraestructura para entrenar grandes modelos de IA y un primer paso para hacerlos disponibles como plataforma. En el momento de su lanzamiento, en comparación con otras máquinas que figuran en el TOP500 de supercomputadoras en el mundo, la supercomputadora de Microsoft se ubicó entre las cinco primeras. En los años siguientes, Microsoft amplió esta infraestructura con supercomputadoras de IA de una escala sin precedentes para lograr importantes avances en el rendimiento de las aplicaciones para el entrenamiento y la inferencia de IA.

La asociación con OpenAI se formó sobre la base de ideales compartidos y un impulso para avanzar de manera responsable en el estado del arte de la IA con más ambición que nadie. Juntas, las dos compañías construyeron una infraestructura de supercomputación sin precedentes en Azure para acelerar los avances de OpenAI y, a través de esa colaboración, han podido comprender mejor no solo cómo armar la mejor plataforma de IA del mundo, sino, lo que es más importante, cómo brindar sus beneficios a los clientes y al mundo.

Abrir la puerta a una nueva forma de codificar con IA

La adquisición de GitHub por parte de Microsoft llevó a la eventual creación de GitHub Copilot en 2021. El asistente de codificación impulsado por IA, que permite a los desarrolladores elegir entre modelos como Claude 3.5 Sonnet de Anthropic, Google Gemini 2.0 Flash y o3-mini y GPT-4o de OpenAI, ayuda a los desarrolladores a escribir código de manera más eficiente a través de fragmentos de código sugeridos y respuestas de chat contextuales. Fue un paso más para proporcionar una plataforma de IA de clase mundial para empoderar a los clientes, las personas y los creadores de todo el mundo. Desde entonces, GitHub Copilot se ha convertido en la herramienta de codificación de IA elegida por más de 77 mil organizaciones en todas las regiones e industrias, y evoluciona de manera rápida hacia un programador de pares agéntico con características como el modo de agente y la revisión de código.

La IA reinventa la búsqueda y pone en marcha una ola de innovación en la vida y el trabajo

En 2023, Bing y Edge pasaron a ser impulsados por la IA, lo que ayudó a crear un cambio sísmico en la forma en que las personas usaban la búsqueda. También condujo a una rápida evolución e integración de Copilot en toda la pila de Microsoft durante el próximo año. Copilot continuó su evolución, convirtiéndose no solo en una herramienta informativa, sino también en un verdadero compañero de IA con el lanzamiento de la aplicación Copilot actualizada para los consumidores. La introducción de Voice and Vision permite a Copilot adaptarse al usuario y proporcionar respuestas, aliento y consejos a medida que las personas navegan por los desafíos cotidianos de la vida.

Tras el lanzamiento inicial en Bing en 2023, Microsoft integró de manera rápida Copilot en toda su cartera de productos. Microsoft 365 Copilot ayudó a las personas a ser más productivas, mientras que Dynamics 365 y Power Platform ayudaron a transformar los procesos empresariales.

Innovación rápida con Copilot

7 de febrero de 2023: Copilot en Bing
6 de marzo de 2023: Microsoft Dynamics 365 Copilot
16 de marzo de 2023: Microsoft 365 Copilot
16 de marzo de 2023: Copilot en Power Platform
22 de marzo de 2023: GitHub Copilot X
28 de marzo de 2023: Microsoft Security Copilot
20 de abril de 2023: Copilot en Microsoft Viva
23 de mayo de 2023: Copilot en Windows
15 de enero de 2024: Copilot Pro
21 de mayo de 2024: Herramientas de Copilot Studio para crear agentes autónomos
4 de enero de 2024: Clave Copilot incluida en dispositivos con Windows 11
1 de octubre de 2024: Actualización de la experiencia del consumidor de Copilot con Vision and Voice
15 de enero de 2025: Microsoft 365 Copilot Chat + Agentes
16 de enero de 2025: Copilot en suscripciones personales y familiares de Microsoft 365
25 de marzo de 2025: Razonamiento profundo en Microsoft 365

Imagen con una Copilot+ PC, rodeada de iconos y el letrero "Copilot+ PCs"

Introducción de una nueva categoría de PC con Windows diseñada para la IA

Sobre la base del trabajo iniciado en 2019 con la introducción de Surface Pro X, los PC Copilot+ introdujeron en 2024 una arquitectura de sistema nueva por completo, para reunir la potencia de la CPU, la GPU y una nueva unidad de procesamiento neuronal (NPU, por sus siglas en inglés) de alto rendimiento. Con el aprovechamiento de las capacidades de la NPU, los PC Copilot+ lograron un nivel de rendimiento nunca visto: hasta 20 veces más potente y hasta 100 veces más eficiente para ejecutar cargas de trabajo de IA. Esto marcó el comienzo de una serie de nuevas experiencias de IA que antes eran imposibles, lo que hizo que hacer las cosas en una PC fuera más rápido, sencillo y personalizado.

Imagen con un robot color verde, rodeado de iconos, y con el letrero "AutoGen"

Un nuevo marco para crear agentes de IA

Lanzado en 2023, AutoGen es un marco de programación de código abierto para crear agentes de IA y facilitar la cooperación entre múltiples agentes para resolver tareas. AutoGen tiene como objetivo proporcionar un marco flexible y fácil de usar para acelerar el desarrollo y la investigación sobre la IA agentica. La respuesta de la comunidad de desarrolladores a AutoGen ha ayudado a sentar las bases e identificar casos de uso clave para las ofertas de agentes de Microsoft.

Imagen con iconos que denotan letras, y el letrero "Phi Small Language Model series"

Pioneros en la categoría de modelos de lenguaje pequeños con Phi

Esta innovación de investigación a producto de 2024 fue pionera en la categoría de modelos de lenguaje pequeños para desbloquear la innovación de modelos rentables y personalizados y hacer que la IA sea accesible para más personas, por ejemplo, en teléfonos inteligentes y otros dispositivos móviles que operan «en el entorno» y no conectados a la nube. Desde entonces, Microsoft ha introducido más iteraciones de Phi en el catálogo de modelos de Azure AI Foundry, incluidos modelos de Phi específicos del sector para ayudar a los clientes a abordar casos de uso específicos.

Imagen con un control de Xbox, rodeado de juegos, con el letrero "Muse: World Human Action Model"

Un modelo de IA generativa único en su tipo para gaming

Un gran avance en la ideación del juego, el modelo Muse, lanzado en 2025, desarrolla una comprensión profunda del entorno, incluida su dinámica y cómo evoluciona con el tiempo en respuesta a las acciones. Las capacidades de ChatGPT y GPT-4 para aprender el lenguaje humano ahora se igualan con la capacidad de la IA para aprender la mecánica de cómo funcionan las cosas, para desarrollar en efecto una comprensión práctica de las interacciones en el mundo. Esto desbloquea la capacidad de iterar, remezclar y crear con rapidez en videojuegos para que los desarrolladores puedan, de manera eventual, crear entornos inmersivos y dar rienda suelta a toda su creatividad.

Estos avances solo arañan la superficie del compromiso de Microsoft con la IA y su potencial para ayudar a lograr la misión de empoderar a cada persona y cada organización en el planeta para lograr más a través de la colaboración y la innovación. Desde la mejora de la atención médica hasta la protección de la biodiversidad y la transformación del aprendizaje, las posibilidades y el impacto de la IA siguen siendo infinitos.

«Lo que es en verdad importante en la investigación no es solo avanzar en el estado del conocimiento en términos técnicos, sino garantizar que estos avances también puedan permitir un ecosistema más amplio», dijo Lee.

«Es más importante que nunca, ya que el ritmo del cambio ha aumentado de manera importante. Una de las cosas que me inspiran de Microsoft, como empresa de plataforma, es que avanzamos en el estado de la IA al mismo tiempo que ayudamos a nuestros clientes a aprovechar esta tecnología transformadora».