3 nuevos modelos MAI de clase mundial ya disponibles en Foundry

Imagen con el texto: Image-2, Transcribe-1, Voice-1, sobre un fondo color crema y diferentes imágenes alrededor del texto

Por: Mustafa Suleyman.

Presentamos MAI-Transcribe-1, junto a MAI-Voice-1 y MAI-Image-2. Calidad de clase mundial a velocidades relámpago, ahora disponibles a los precios más competitivos.

Disponibles ahora en Microsoft Foundry y MAI Playground.

MAI-Transcribe-1 ofrece transcripción de voz a texto de última generación en los 25 idiomas más utilizados1, según el estándar industrial de FLEURS.2 Diseñado para ofrecer calidad de clase mundial en entornos reales y desordenados, su velocidad de transcripción por lotes es 2,5 veces superior a la de Microsoft Azure Fast que ya ofrece. Además, es muy eficiente, lo que hace que MAI-Transcribe-1 no solo sea el más preciso, sino también ultrarrápido. Ahora está disponible en Foundry con el mejor precio de cualquier proveedor de nube grande.

Gráfico de barras con la tasa de error por palabra en lenguajes de modelos

MAI-Voice-1 es nuestro modelo de generación de voz de primera gama. Construido para generar un habla natural y realista, rica en matices, rango emocional y expresión que preserva la identidad del hablante incluso en contenido de formato largo.

Hoy añadimos la capacidad de crear su propia voz personalizada de manera segura y protegida en Microsoft Foundry con solo unos segundos de audio. MAI-Voice-1 puede transformar la facilidad con la que los desarrolladores pueden crear experiencias y agentes de voz, con alta calidad y alta velocidad.

El modelo puede generar 60 segundos de audio en solo un segundo, y un uso muy eficiente de la GPU ofrece esa calidad y velocidad de forma asequible. Oír es creer, así que vívanlo por ustedes mismos con Copilot Audio Expressions o Copilot Podcasts.

MAI-Image-2 tiene un rendimiento y velocidad turbo en generación de imágenes en Copilot tras debutar como una de las 3 familias de modelos más destacadas en la clasificación de Arena.ai. Los usuarios experimentan tiempos de generación al menos el doble de rápidos en Foundry y Copilot con una calidad similar, basándose en datos reales de tráfico de producción. También se llevaban a cabo despliegues faseados en Bing y PowerPoint.

MAI-Image-2 fue creado con fotógrafos, diseñadores y narradores visuales que exigen luz natural, tonos y texturas de piel precisos, y texto claro dentro de la imagen para diagramas, maquetaciones y gráficos. Una vez más, la velocidad y la calidad no tienen costes elevados: MAI-Image-2 se ofrece a un precio competitivo por desempeño.

Los clientes ya han comenzado a adoptar MAI-Image-2 para trabajos creativos. WPP, uno de los mayores grupos de marketing y comunicación del mundo, es uno de los primeros socios empresariales que construyen a gran escala con MAI-Image-2.

«MAI-Imagen-2 es un verdadero cambio de juego. Es una plataforma que no solo responde a la compleja sutileza de la dirección creativa, sino que respeta a profundidad la pura destreza que implica generar imágenes reales listas para la campaña», dijo Rob Reilly, director creativo global de WPP. «WPP tiene algunos de los mejores talentos creativos del mundo y MAI-Image-2 los hace aún mejores.»

Modelos MAI: Mejores, más rápidos y más baratos que nuestros competidores.

Desplegamos estos modelos de primera gama con rapidez, para alimentar nuestros propios productos de consumo y comerciales. Estamos entusiasmados de compartir las mejoras en calidad, velocidad y eficiencia con nuestros clientes de Microsoft Foundry con precios muy competitivos.

· MAI-Transcribe-1 empieza en 0,36 dólares la hora.

· MAI-Voz-1 empieza en 22 dólares por cada 1 millón de caracteres.

· MAI-Image-2 comienza en 5 dólares por cada 1 millón de tokens para entrada de texto y 33 dólares por 1 millón de tokens para la salida de imagen.

Disponible ya en Microsoft Foundry y MAI Playground.

A partir de hoy, cualquier desarrollador puede construir con modelos MAI, incluido MAI-Transcribe-1, a través de Microsoft Foundry. También pueden probarlos en el MAI Playground (solo en EE. UU.).

¿Les interesan los modelos MAI pero no tienen acceso a Foundry? Rellenen este formulario y nos pondremos en contacto.

Modelos diseñados para ser mejores desde dentro hacia fuera.

En Microsoft AI, construimos una IA Humanista. Tenemos una visión distinta al crear nuestros modelos de IA: poner a los humanos en el centro, optimizar la manera en que las personas se comunican en verdad, entrenar para un uso práctico. Pronto verán más modelos nuestros en Foundry y directo en los productos y experiencias de Microsoft.

En consonancia con nuestro compromiso con una IA segura y responsable, estos modelos MAI fueron desarrollados, probados y seleccionados de manera rigurosa en equipo rojo. A través de Microsoft Foundry, los desarrolladores disponen de barreras integradas, gobernanza y controles empresariales diseñados para apoyar un despliegue seguro y conforme a gran escala.

Tarjetas modelo

Descargar Tarjeta Modelo para MAI-Transcribe-1

Descargar tarjeta modelo para MAI-Voice-1

Descargar Tarjeta de Modelo para MAI-Imagen-2

1. Los 25 principales idiomas por uso de productos de Microsoft.

2. De entre las 25 principales lenguas globales, MAI-Transcribe-1 ocupa el primer lugar por FLEURS en 11 idiomas principales. Gana contra Whisper-large-v3 en los 14 restantes y contra Gemini 3.1 Flash en 11 de esos 14.

Español (España)
Icono de exclusión de opciones de privacidad Tus opciones de privacidad
Privacidad de la salud del consumidor Ponte en contacto con Microsoft Privacidad Gestionar cookies Condiciones de uso Marcas registradas Sobre nuestra publicidad Docs de cumplimiento de la UE Informes regulatorios