Par Elliott Smith 

Certains tendent à penser que l’IA est apparue il y a 2 ans, telle une technologie déjà aboutie, avec l’arrivée des premiers chatbots basés sur l’intelligence artificielle générative. La promesse d’une transformation de notre façon d’interagir avec le monde qui nous entoure était faite. Alors la réalité est pourtant tout autre : le développement de l’intelligence artificielle repose sur des décennies de recherche et développement – avec des avancées majeures dans le deep learning ou le traitement du langage naturel. Et le potentiel d’évolution est encore grand. 

Si Bill Gates n’avait pas spécifiquement en tête l’intelligence artificielle en 1975 à la création de Microsoft, il ne fait aucun doute que les avancées technologiques et les innovations portées par Microsoft au cours des 5 décennies suivantes ont conduit à l’intelligence artificielle que nous connaissons aujourd’hui. 

Du lancement du premier système d’exploitation en 1985 au mémo « Tidal Wave » de Bill Gates dix ans plus tard, qui prédisait la puissance d’Internet, la véritable force de l’entreprise a toujours été sa capacité à embrasser le changement et à se tourner vers l’avenir. Cette dynamique s’est poursuivie avec des publications fondatrices de Microsoft Research sur les Bayesian Networks et les Z3 theorem prover qui ont ouvert la voie aux avancées futures de l’intelligence artificielle.  

Alors que l’IA est de plus en plus présente dans notre quotidien, explorons quelques-unes des étapes clés de Microsoft qui ont contribué à poser les bases de là où nous en sommes aujourd’hui — et découvrons comment l’entreprise prévoit de développer la plateforme, les outils et l’infrastructure d’IA les plus fiables possible pour l’avenir.   

 

Bing

Lancement de Bing avec des capacités en langage naturel

Evolution de Windows Live Search, Bing, lancé en 2009, a introduit dès le départ plusieurs fonctionnalités basées sur le machine learning, qu’il s’agisse des suggestions de recherche lors de la saisie d’une requête et de la liste de recherches associées, appelée le « volet Explorer ». Ces fonctionnalités s’appuyaient sur la technologie sémantique de Powerset, une entreprise acquise par Microsoft en 2008.

Project Oxford

Avec le projet Oxford, Azure se dote de fondations solides pour l’IA à grande échelle

Bon nombre des avancées techniques de Microsoft reposent sur la plateforme Azure. Ce projet, lancé en 2015 sous le nom de code Project Oxford, offrait aux développeurs un ensemble de technologies intelligentes pour créer des applications plus performantes, intégrant notamment la détection de visages, la reconnaissance vocale et la compréhension du langage. Ce projet est aujourd’hui connu sous le nom d’Azure AI Foundry.

« Beaucoup de choses remontent à Bing, » explique Eric Boyd, vice-président corporate de la plateforme Azure AI chez Microsoft, qui a débuté son parcours chez Microsoft dans le développement des publicités Bing. « Nous avons construit toute cette infrastructure pour entraîner des modèles d’IA, itérer, expérimenter et identifier ceux qui donnaient les meilleurs résultats. Toute cette infrastructure est ensuite devenue les briques et composants que nous proposons aujourd’hui via Azure AI. »

Parmi les produits majeurs issus d’Azure figurent notamment le développement d’applications conversationnelles, un ensemble de services cognitifs sur étagères (transcription voix-texte, reconnaissance d’images…), une suite d’outils IA responsables ainsi que Azure OpenAI Service, qui combine la puissance des modèles de langage avec les fonctionnalités de scalabilité et de sécurité d’Azure. Aujourd’hui, plus de 60 000 organisations utilisent Azure AI Foundry et 65 % des entreprises du Fortune 500 ont adopté Azure OpenAI Service.

ResNet

Un nouveau cadre améliore l’entraînement et la performance des deep neural network

Issu d’une avancée majeure de Microsoft Research, le Deep Residual Networks, aussi connu sous le nom de ResNet, a été introduit en 2015. Ce cadre d’apprentissage résiduel a considérablement amélioré l’entraînement des réseaux neuronaux profonds, permettant le développement d’architectures plus profondes et plus performantes. Il a ainsi ouvert la voie à un large éventail d’applications concrètes, dont beaucoup jouent aujourd’hui un rôle essentiel dans notre quotidien.

« ResNet a défini le standard de la vision par ordinateur, utilisé partout aujourd’hui, » déclare Peter Lee, president of Microsoft Research. « Si vous êtes dans une voiture autonome, elle utilise de l’IA basée sur ResNet. Si vous passez une IRM en clinique, cette machine intègre également une technologie fondée sur ResNet. »

Un bond en avant dans l’apprentissage multisensoriel et multilingue

Entre 2015 et 2020, Microsoft a atteint la parité des performances humaines sur plusieurs référentiels : conversational speech recognition, machine translation, conversational question answering, machine reading comprehension et image captioning.

Ces cinq percées ont été déterminantes pour permettre un bond en avant des capacités de l’IA, en atteignant un apprentissage multisensoriel et multilingue plus proche du fonctionnement de l’apprentissage et de la compréhension humains. Elles ont conduit Microsoft à développer XYZ-code, qui représente l’intersection de trois attributs de la cognition humaine : le texte monolingue (X), les signaux sensoriels audio ou visuels (Y) et le multilingue (Z). Ce cadre a été intégré aux services Azure AI afin d’aider les clients à accélérer le développement de systèmes d’IA plus puissants et intégrés.

SeeingAI

Améliorer l’accessibilité en rendant le monde visuel audible

Afin de favoriser l’accessibilité, Microsoft a lancé Seeing AI en 2016. Cet exemple concret d’IA utilise la vision par ordinateur et le traitement du langage naturel pour décrire l’environnement d’une personne, lire du texte, répondre à des questions, identifier des billets de banque, et décrire les personnes et leurs expressions faciales.

La fonctionnalité Find My Things  aide les personnes atteintes de cécité ou malvoyantes à personnaliser leur expérience en apprenant à l’outil à reconnaître les objets qu’elles utilisent réellement et qu’elles peuvent égarer, comme des clés ou des écouteurs.

L’accessibilité permet de rendre les outils et technologies Microsoft plus faciles à utiliser pour tous et accélère l’innovation à l’échelle mondiale — avec des produits comme Reading Coach, qui aide les élèves à apprendre à lire et soutient les lecteurs débutants ou ceux atteints de dyslexie.

Project Brainwave

Changer la vitesse de traitement de l’IA

L’année 2017 a marqué l’arrivée de Brainwave, une plateforme d’accélération de l’apprentissage profond conçue pour exécuter des charges de travail d’IA en temps réel à grande échelle sur l’infrastructure cloud de Microsoft. Brainwave combine des circuits logiques programmables (FPGAs) avec des logiciels haute performance, améliorant de manière significative les performances des modèles d’IA, notamment pour des tâches telles que la reconnaissance d’images et le traitement du langage naturel. 
Brainwave a représenté une avancée majeure dans la manière dont Microsoft aborde le matériel dédié à l’IA et l’inférence IA dans le cloud.

Turing-NLG

Préparer le terrain pour l’innovation dans les grands modèles de langage (LLM)

En 2020, Microsoft a lancé Turing-NLG (Natural Language Generation), l’un des plus grands modèles de langage de son époque, avec 17 milliards de paramètres. Ce lancement a démontré le leadership de Microsoft dans le développement de l’IA pour la compréhension du langage naturel, et a précédé l’émergence d’autres modèles fondamentaux comme Florence, dédié à la reconnaissance visuelle.

Ambient Clinical Intelligence

Nuance lance la première solution d’intelligence clinique ambiante pour le secteur de la santé

DAX Copilot, désormais intégré à Dragon Copilot, a marqué une avancée majeure dans le domaine de la santé. Cette solution utilise une IA vocale pour permettre aux professionnels de santé de documenter les consultations pendant une conversation naturelle entre le médecin, le patient et sa famille. Elle permet ainsi aux médecins d’accorder une attention totale à leurs patients, tout en réduisant la charge de travail après les heures de consultation.

En 2020, DAX est devenu disponible au grand public, et en 2023, DAX Express est devenu la première solution à combiner intelligence artificielle conversationnelle, IA ambiante et GPT-4. Aujourd’hui, cette solution d’IA ambiante est utilisée par plus de 600 grands établissements de santé aux aux États-Unis, et génère plus de 3 millions de comptes rendus médicaux par mois, un chiffre en constante augmentation.

Azure AI supercomputer

Une infrastructure de supercalcul sans précédent dans Azure accélère les avancées d’OpenAI

Également en 2020, Microsoft a dévoilé un superordinateur sur Azure conçu pour OpenAI, établissant ainsi une infrastructure avancée dédiée à l’entraînement des grands modèles d’IA, première étape vers leur déploiement en tant que plateforme.

Au moment de son lancement, ce superordinateur se classait parmi les cinq premiers au monde selon le classement  TOP500 supercomputers. Au fil des années, Microsoft a étendu cette infrastructure avec des superordinateurs d’IA à une échelle inédite, permettant des avancées majeures en matière de performance des applications pour l’entraînement et l’inférence des modèles d’IA.

Le partenariat avec OpenAI repose sur des valeurs communes et une volonté partagée de faire progresser l’IA de manière responsable, avec plus d’ambition que quiconque. Ensemble, les deux entreprises ont construit une infrastructure de supercalcul sans précédent dans Azure afin d’accélérer les innovations d’OpenAI. Cette collaboration a permis non seulement de créer la meilleure plateforme d’IA au monde, mais surtout de réfléchir à la meilleure manière d’en faire bénéficier les clients… et le monde entier.

GitHub Copilot

Ouvrir la voie à une nouvelle façon de coder avec l’IA

L’acquisition de GitHub par Microsoft a conduit à la création de GitHub Copilot en 2021. Cet assistant de programmation alimenté par l’IA permet aux développeurs de choisir parmi plusieurs modèles, tels que Claude 3.5 Sonnet d’Anthropic, Gemini 2.0 Flash de Google, ainsi que o3-mini et GPT-4o d’OpenAI. Il aide les développeurs à coder plus efficacement grâce à des suggestions de blocs de code et des réponses contextuelles en langage naturel. Ce lancement a marqué une nouvelle étape dans la volonté de Microsoft de proposer une plateforme d’IA de premier plan, au service des clients, des particuliers et des créateurs du monde entier. Depuis, GitHub Copilot est devenu l’outil de codage IA de référence pour plus de 77 000 organisations, tous secteurs et régions confondus, et évolue rapidement vers un coéquipier de programmation agentique, avec des fonctionnalités telles que le mode agent ou encore la relecture automatisée du code.

L’IA réinvente la recherche et déclenche une vague d’innovation dans la vie quotidienne et au travail

En 2023, Bing et Edge sont devenus des outils propulsés par l’IA, marquant un véritable tournant dans la manière dont les utilisateurs interagissent avec la recherche en ligne. Ce changement a également accéléré l’évolution de Copilot, rapidement intégré dans l’ensemble de l’écosystème Microsoft au cours de l’année suivante. Copilot a continué de se transformer, devenant bien plus qu’un simple outil d’information : il s’est imposé comme un véritable compagnon d’IA avec le lancement de la nouvelle application Copilot destinée au grand public. L’introduction des fonctions vocales et visuelles permet à Copilot de s’adapter à l’utilisateur, en fournissant des réponses, du soutien et des conseils personnalisés face aux défis du quotidien.

À la suite de son lancement initial dans Bing en 2023, Microsoft a intégré Copilot à l’ensemble de son portefeuille de produits. Microsoft 365 Copilot a amélioré la productivité individuelle, tandis que Dynamics 365 et Power Platform ont contribué à transformer les processus métiers.

Innovation accélérée avec Copilot

7 février 2023

Copilot dans Bing

6 mars 2023

Microsoft Dynamics 365 Copilot

16 mars 2023

Microsoft 365 Copilot

16 mars 2023

Copilot dans Power Platform

22 mars 2023

GitHub Copilot X

28 mars 2023

Microsoft Security Copilot

20 avril 2023

Copilot dans Microsoft Viva

23 mai 2023

Copilot dans Windows

4 janvier 2024

Touche Copilot sur les PC Windows 11

15 janvier 2024

Copilot Pro

21 mai 2024

Copilot Studio tools to build autonomous agents

1er octobre 2024

Mise à jour de l’expérience utilisateur Copilot avec Vision et Voice

15 janvier 2025

Microsoft 365 Copilot Chat + Agentes

16 janvier 2025

abonnements Copilot dans Microsoft 365 personnel et famille

25 mars 2025

Deep reasoning dans Microsoft 365
Copilot+ PCs

Lancement d’une nouvelle catégorie de PC Windows conçus pour l’IA

S’appuyant sur les travaux initiés en 2019 avec l’introduction du Surface Pro X, les PC Copilot+, lancés en 2024, ont inauguré une architecture système totalement repensée combinant la puissance du CPU, du GPU et d’une nouvelle unité de traitement neuronal haute performance (NPU). Grâce aux capacités de cette NPU, les Copilot+ PCs ont atteint un niveau de performance inédit — jusqu’à 20 fois plus puissants et 100 fois plus efficaces pour exécuter des charges de travail en IA. Cette avancée a ouvert la voie à toute une série de nouvelles expériences IA jusque-là impossibles, rendant l’usage du PC plus rapide, plus simple et plus personnalisé que jamais.

AutoGen

Un nouveau cadre pour la création d’agents IA

Lancé en 2023, AutoGen est un framework de programmation open source destiné à créer des agents d’IA et à faciliter la coopération entre plusieurs agents pour résoudre des tâches. AutoGen a pour objectif de fournir un cadre flexible et facile à utiliser afin d’accélérer le développement et la recherche autour de l’intelligence artificielle agentique. La réponse enthousiaste de la communauté des développeurs à AutoGen a permis de poser les bases et d’identifier les cas d’usage clés pour les futures offres d’agents proposées par Microsoft.

Pionnier dans la catégorie des petits modèles de langage avec Phi

Cette innovation, lancé en 2024 et issue de la recherche, a permis à Microsoft d’ouvrir la voie à la catégorie des small language models afin de favoriser une innovation plus économique, personnalisée et de rendre l’IA accessible au plus grand nombre. Cela inclut notamment les smartphones et autres appareils mobiles capables de faire fonctionner l’IA directement, sans nécessiter de connexion permanente au cloud Depuis, Microsoft a introduit plusieurs nouvelles versions de Phi dans le catalogue de modèles d’Azure AI Foundry, y compris des modèles Phi adaptés à des secteurs d’activité spécifiques, afin d’aider les clients à répondre à des cas d’usage ciblés.

Un modèle d’IA générative inédit pour le jeu vidéo

Véritable avancée dans la conception de gameplay, le modèle Muse, lancé en 2025, développe une compréhension approfondie de l’environnement, de sa dynamique et de son évolution en fonction des actions entreprises. Les capacités de ChatGPT et GPT-4 à comprendre le langage humain sont désormais égalées par celles de l’IA à apprendre le fonctionnement des environnements. Cela ouvre la voie à des itérations plus rapides et variées et stimule la créativité dans les jeux vidéo, permettant aux développeurs de concevoir des environnements toujours plus immersifs et de libérer pleinement leur créativité.

Ces avancées ne sont qu’un aperçu de l’engagement de Microsoft en matière d’intelligence artificielle et de son potentiel à contribuer à la réalisation de sa mission : donner à chaque individu et à chaque organisation les moyens de réaliser ses ambitions grâce à la collaboration et à l’innovation. Qu’il s’agisse d’améliorer les soins de santé, de protéger la biodiversité ou de transformer l’apprentissage, les possibilités et l’impact de l’IA sont infinis.  

« Ce qui est vraiment important dans la recherche, ce n’est pas seulement de faire progresser l’état des connaissances sur le plan technique, mais aussi de s’assurer que ces avancées puissent bénéficier à un écosystème plus large, » a déclaré Peter Lee, president of Microsoft Research  

« C’est plus important que jamais, car le rythme du changement s’est considérablement accéléré. Ce que je trouve inspirant chez Microsoft, en tant qu’entreprise de plateforme, c’est que nous faisons progresser les capacités de l’IA tout en aidant nos clients à tirer parti de cette technologie transformationnelle. »