Passer au contenu principal

Les 3 évolutions de l’IA à suivre en 2024

L’IA générative a connu une année 2023 de tous les records, en passant du monde de la recherche au quotidien de millions de personnes grâce, notamment, à des outils comme ChatGPT ou Microsoft Copilot. L’IA devrait encore continuer à évoluer cette année en devenant plus accessible, plus précise et plus intégrée au sein de technologies qui facilitent les activités quotidiennes, mais contribuent aussi à relever certains des défis les plus complexes de notre monde.

Voici trois tendances de l’IA à suivre cette année.

 

Les petits modèles de langage (ou SLM)

Si vous avez déja utilisé Copilot pour répondre à des questions complexes, vous avez déjà pu tester la puissance des grands modèles de langage (Large Language Model ou LLM).

L’apprentissage d’un grand modèle de langage (LLM) mobilise d’importantes ressources informatiques pour fonctionner. C’est pourquoi, on fait de plus en plus appel aux petits modèles de langage (Small Language Model ou SLM).

Les SLM demeurent tout de même d’une taille importante et sont constituées de plusieurs milliards de paramètres – ce qui est moindre au regard des centaines de milliards de paramètres des LLM – mais ils sont suffisamment compacts pour fonctionner sur un téléphone hors ligne, par exemple. Les paramètres étant des variables, des éléments modulables, qui définissent le comportement d’un modèle.

“Les petits modèles de langage peuvent rendre l’IA plus accessible du fait de leur taille et de leur prix abordable”, explique Sébastien Bubeck, qui dirige le groupe Machine Learning Foundations au sein de Microsoft Research. “Nous découvrons en même temps de nouvelles façons de les rendre aussi puissants que les grands modèles de langage. »

Les chercheurs de Microsoft ont développé et dévoilé deux SLM – Phi et Orca – qui rivalisent voir surpassent les grands modèles de langage sur certaines tâches, remettant en question l’idée selon laquelle l’échelle est nécessaire pour la performance.

Contrairement aux LLM entraînés sur de vastes quantités de données provenant d’internet, les modèles plus petits utilisent des données d’entraînement sélectionnées avec soin et de haute qualité, les chercheurs trouvant de nouveaux seuils pour la taille et la performance. Cette année, vous pouvez vous attendre à voir des modèles plus puissants, conçus pour alimenter la recherche et l’innovation.

 

L’IA multimodale

La plupart des LLM sont des modèles entrainés pour ne manipuler qu’un seul type de données, le texte. De leur côté, les modèles multimodaux peuvent traiter des informations provenant de différentes sources, telles que le texte, les images, l’audio et la vidéo. Cette capacité permet aux outils de recherche, comme aux applications de créativité, d’être plus riches, plus précis et plus fluides.

Copilot est par exemple capable de comprendre ce qui se passe dans une image que vous lui auriez envoyée, grâce à un modèle multimodal combinant images, langage naturel et données de recherche Bing. Copilot peut ainsi fournir des informations utiles sur la signification historique d’un monument apparaissant sur votre photo.

L’IA multimodale alimente également Microsoft Designer, une application de conception graphique qui peut générer des images à partir d’une description de ce que vous souhaitez. Elle permet également de créer des voix neuronales personnalisées, c’est-à-dire des voix naturelles utiles pour les lecteurs de texte et les outils destinés aux personnes souffrant de troubles vocaux.

“La multimodalité a le pouvoir de créer des expériences plus proches de l’humain qui peuvent mieux tirer parti de l’éventail des sens que nous utilisons en tant qu’êtres humains, tels que la vue, la parole ou l’ouïe”, déclare Jennifer Marsman, ingénieure principale au sein de l’équipe de Kevin Scott, CTO de Microsoft.

 

L’IA dans le domaine des sciences

Les experts prévoient des avancées considérables dans le domaine des outils d’IA conçus pour accélérer les découvertes scientifiques. Une grande partie des travaux concernés visant à résoudre des problèmes modiaux tels que le changement climatique, les crises énergétiques et les maladies.

Pour atténuer le changement climatique et aider les agriculteurs à travailler plus efficacement, les chercheurs de Microsoft utilisent l’IA pour élaborer de meilleures prévisions météorologiques, des estimateurs de carbone et d’autres outils pour favoriser une agriculture durable. Ils développent également des technologies basées sur l’IA visant à assister les agriculteurs sur le terrain, notamment un chatbot capable d’aider les agriculteurs à identifier les mauvaises herbes inconnues ou comparer l’efficacité de différentes méthodes d’irrigation en utilisant des données propres à chaque exploitation.

Dans le domaine des sciences de la vie, les chercheurs travaillent sur le plus grand modèle d’IA basé sur l’image au monde pour lutter contre le cancer. Ils utilisent une IA de pointe pour trouver de nouveaux médicaments, pour lutter contre des maladies infectieuses ainsi que de nouvelles molécules pour transformer les traitements.

L’IA transforme également la science des matériaux, un vaste domaine axé sur la création de nouveaux matériaux aux propriétés spécifiques. Une avancée récente a par exemple mobilisé la puissance de l’IA et du calcul à haute performance pour accélérer la recherche de matériaux moins toxiques pour la création de batteries.

“L’intelligence artificielle est à l’origine d’une révolution dans la découverte scientifique”, déclare Chris Bishop, directeur de l’équipe AI4Science chez Microsoft Research. “Cela pourrait bien devenir l’application la plus passionnante, et en fin de compte la plus importante, de l’IA.”

Illustrations imaginées par Makeshift Studios / Michal Bednarski