Microsoft présente Maia 200: un nouvel accélérateur d’inférence d’IA améliore les performances de l’IA dans Azure

Microsoft a franchi une nouvelle étape dans le développement de ses propres puces avec la présentation de Maia 200. Ce nouvel accélérateur d’IA est principalement axé sur l’inférence, c’est-à-dire l’utilisation opérationnelle de modèles d’IA dans des applications. Son architecture associe une puissance de calcul élevée à un système de mémoire nouvellement conçu et à une structure réseau évolutive. Grâce à ces nouvelles puces, Microsoft prépare son infrastructure cloud mondiale à la prochaine génération de charges de travail d’IA. Maia 200 est spécialement conçu pour l’inférence d’IA très intensive en calcul et s’intègre de manière transparente à Microsoft Azure.

Les principales nouveautés en un coup d’œil

  • Maia 200 atteint plus de 10 pétaFLOPS en précision 4 bits (FP4) et plus de 5 pétaFLOPS en précision 8 bits (FP8), en s’appuyant sur une technologie de pointe en 3 nanomètres. L’architecture réseau évolue via Ethernet standard jusqu’à 6 144 accélérateurs d’IA par cluster.
  • Cela signifie qu’un Maia 200 peut exécuter sans difficulté les plus grands modèles d’IA actuels, tout en offrant une marge confortable pour des modèles encore plus vastes à l’avenir.
  • Maia 200 sera d’abord déployé dans les régions américaines du cloud Microsoft Azure et utilisé pour les modèles d’IA de l’équipe Superintelligence de Microsoft. Il accélérera des projets tels que Azure AI Foundry (la plateforme d’IA Microsoft intégrée et interopérable pour le développement d’applications et d’agents d’IA) et prendra en charge Microsoft 365 Copilot.
  • Ce modèle intégré de Microsoft – combinant puces, modèles d’IA et applications – crée un avantage concurrentiel unique : en exploitant certaines des charges de travail d’IA les plus exigeantes au monde, Microsoft peut étroitement aligner la conception du puces, le développement des modèles et l’optimisation au niveau des applications.
  • En parallèle du lancement de Maia 200, Microsoft propose une version préliminaire du kit de développement logiciel Maia (SDK). Celui-ci prend en charge les principaux frameworks d’IA et aide les développeurs à optimiser leurs modèles spécifiquement pour une utilisation sur les systèmes Maia. Le nouveau SDK Maia comprend le compilateur Triton, la prise en charge de PyTorch, la programmation NPL ainsi qu’un simulateur et un calculateur de coûts.

Lisez l’article original complet en anglais de Scott Guthrie, vice-président exécutif – Cloud et IA chez Microsoft, consacré au lancement de Maia 200, ici.