Un nouvel outil Copilot permettra aux chercheurs de l’Institut Curie de consacrer plus de temps à la recherche sur le cancer
Curie : pour tout à chacun, ce nom est synonyme de recherche de pointe et de découvertes scientifiques majeures. En 1909, à sa création par Marie Curie, l’Institut Curie se positionne dès ses débuts comme un laboratoire d’excellence. Plus d’un siècle plus tard, l’Institut Curie, en tant que premier centre de recherche et de traitement du cancer en France, se situe toujours à l’avant-garde. Fort de trois sites à Paris, Saint-Cloud et Orsay, d’un centre de recherche à la renommée internationale et d’un groupe hospitalier de pointe, l’Institut Curie traite tous les cancers, y compris les formes les plus rares. 56 000 patients y sont accueillis et soignés chaque année, ce qui en fait l’un des principaux centres de traitement du cancer en France et à travers le monde.
Alors quand on exerce le métier de chercheur et qu’on combat le cancer, le temps passé sur des tâches administratives peut être une source de frustration. C’est pourquoi l’Institut Curie s’appuie sur l’intelligence artificielle pour assister, au quotidien, les chercheurs dans ces dernières.
Les collaborateurs de l’institut utilisent déjà Microsoft 365, notamment depuis la pandémie du Covid-19, pour communiquer rapidement, organiser des réunions et partager des documents. C’est donc tout naturellement que l’Institut Curie, Microsoft et Witivio, partenaire de Microsoft, ont collaboré pour explorer le champ des possibles ouvert par Microsoft 365 Copilot. Avec un objectif : rendre du temps aux chercheurs. C’est ainsi qu’est né Copilot for Researcher, un agent capable de soulager les chercheurs des tâches administratives chronophages du quotidien.
« Le prévalence du cancer dépend d’une grande quantité de facteurs très différents, et il est crucial de consacrer le maximum de temps possible à la recherche d’une solution », explique Pascal Hersen, responsable du laboratoire de physique de l’Institut Curie et directeur de recherche au Centre National de la Recherche Scientifique (CNRS). « Quelle que soit la distance qui nous sépare du remède, il est nécessaire d’être plus efficace. »
« Le prévalence du cancer dépend d’une grande quantité de facteurs très différents, et il est crucial de consacrer le maximum de temps possible à la recherche d’une solution », explique Pascal Hersen, responsable du laboratoire de physique de l’Institut Curie et directeur de recherche au Centre National de la Recherche Scientifique (CNRS). « Quelle que soit la distance qui nous sépare du remède, il est nécessaire d’être plus efficace. »
L’atmosphère au sein des laboratoires de l’institut vibre de l’intensité du travail des équipes : chercheurs en blouses blanches qui manipulent sous des microscopes ou qui transfèrent méticuleusement leurs échantillons d’un équipement à l’autre. La présence de douches de sécurité et de stations de rinçage des yeux rappelle la criticité des travaux menés. Dans les bureaux ensoleillés et égayés de plantes, des panneaux en anglais et en français incitent les employés à recycler – l’institut emploie des collaborateurs de plus de 70 nationalités. À l’entrée principale, qui dessert à la fois l’institut de recherche et l’hôpital, des femmes vont et viennent ; elles portent des foulards pour couvrir leur perte de cheveux due au traitement, témoins que la recherche ne va pas assez vite pour nombre de patients. Une recherche dans laquelle l’Institut Curie montre la voie depuis plus d’un siècle.
Marie et Pierre Curie ont découvert le polonium et le radium, deux éléments radioactifs, et sont à l’origine de l’invention de la radiothérapie pour le cancer. L’institut qui porte leur nom a poursuivi leur approche pluridisciplinaire en matière de recherche fondamentale, de recherche appliquée et de traitement des patients atteints de cancer.
Pascal Hersen mène des travaux de recherche fondamentale en physique pour comprendre la vie, et s’appuie sur des méthodes quantitatives et des modélisations pour étudier les propriétés émergentes des réseaux génétiques, des protéines, des cellules et des tissus afin de mieux comprendre les causes du cancer. Une de ses collègues, Céline Vallot, est directrice de recherche au CNRS et dirige le groupe sur la dynamique de la plasticité épigénétique dans le cancer, en se concentrant sur le cancer du sein triple négatif, l’un des sous-types les plus agressifs. Les changements épigénétiques font référence à la façon dont les comportements et l’environnement affectent le fonctionnement des gènes sans être des mutations. « Tout ce qui sort du champ des mutations propres représente un espoir en cancérologie parce qu’il s’agit de phénomènes partiellement réversibles », explique-t-elle. En comprenant ces mécanismes, l’ambition est de pouvoir les inverser.
« Tout ce qui sort du champ des mutations propres représente un espoir en cancérologie parce qu’il s’agit de phénomènes partiellement réversibles. »
Depuis plus d’une décennie, l’Institut Curie recourt à l’IA notamment pour développer des modèles d’apprentissage profond sur des scans médicaux, faciliter la reconnaissance de tumeurs et aider aux diagnostics. Il y a deux ans, Julien Dufour, directeur de la transformation numérique de l’Institut Curie, a lancé un plan de transformation numérique à l’échelle de l’organisation. « Ce qui constitue aujourd’hui la nouveauté, c’est la démocratisation des outils d’IA, comme ceux de Microsoft et notamment Microsoft 365, et leur déploiement auprès des collaborateurs. Les tâches quotidiennes et administratives sont partie intégrante du travail des chercheurs, mais ils perdent encore beaucoup trop de temps à les accomplir. C’est donc naturellement le premier cas d’usage de l’IA auquel nous avons pensé. »
Une recherche scientifique améliorée
Les chercheurs peuvent aussi avoir besoin de comprendre comment d’autres chercheurs ont abordé une problématique similaire ou les étapes qu’ils ont suivies pour mener une expérience. Pour ce faire, ils consultent, à l’aide de mots-clés, des bases de données scientifiques telles que l’archive biomédicale PubMed, bioRxiv, ScienceDirect ou HAL.
Copilot for Researcher, en étant connecté à ces mêmes bases de données, permettra aux chercheurs d’utiliser des commandes en langage naturel pour obtenir des résultats plus pertinents. Si chaque article scientifique possède déjà un résumé, le chercheur peut vouloir trouver des informations situées au cœur de l’article – informations qui ne figurent pas dans le résumé. Copilot for Researcher sera ainsi capable de dénicher ces informations, de les résumer et de fournir une citation pour la bibliographie si le chercheur décide d’utiliser ces informations plus tard, soulageant ainsi le chercheur d’un fastidieux copier-coller.
« Si je dois passer du temps à chercher un chiffre au milieu de 100 articles, je sais le faire », déclare Pascal Hersen. « Mais mon temps peut être mieux utilisé. C’est pareil pour tous les postes, même pour un doctorant ou un étudiant en master. Ils ont étudié dans les meilleures universités pendant trois, cinq, dix ans, et leur temps devrait être mieux utilisé que pour faire des recherches aussi basiques. »
« Si je dois passer du temps à chercher un chiffre au milieu de 100 articles, je sais le faire », déclare Pascal Hersen. « Mais mon temps peut être mieux utilisé. C’est pareil pour tous les postes, même pour un doctorant ou un étudiant en master. Ils ont étudié dans les meilleures universités pendant trois, cinq, dix ans, et leur temps devrait être mieux utilisé que pour faire des recherches aussi basiques. »
Pour répondre à un appel à projets de l’Union européenne dont les financements dépassent le million d’euros, Céline Vallot doit ainsi produire un document d’environ 20 pages. Celui-ci comprend une revue de littérature pour documenter qui s’est passé autour du sujet ces dernières années, les arguments en faveur du projet, les sujets non explorés ou encore les potentiels champs de recherche. « Il s’agit d’un véritable travail de fourmi pour d’abord chercher les documents, puis les analyser et ensuite proposer de nouvelles idées », dit-elle. « Nous y consacrons beaucoup de temps et c’est justement l’une des missions que nous voulons que cet agent Copilot réalise – non pas de rédiger mon projet de recherche, mais de réunir les articles pertinents avec leurs résumés. Chercher quatre articles n’est pas la meilleure utilisation que je pourrais faire de mon cerveau. »
Dans le même ordre d’idées, les chercheurs sont régulièrement sollicités pour évaluer le travail de leurs pairs, ou pour aider à décider si un projet de recherche doit être financé. Cela implique de chercher dans les bases de données pour s’assurer que l’idée est nouvelle. Ou peut-être que le sujet n’est pas directement dans le domaine d’expertise du chercheur et qu’il a besoin de plus s’informer. Tout ceci repose actuellement sur des recherches par mots-clés qui sont fastidieuses, mais qui pourraient être réalisées beaucoup plus rapidement avec Copilot for Researcher, qui serait, en outre, capable de fournir, par exemple, des résumés d’une page.
« Vous avez toujours le contrôle. Vous pouvez toujours revenir à l’article source. Vous pouvez toujours résoudre les problèmes par vous-mêmes, mais vous gagnez là un premier niveau d’analyse, qui, s’il n’est en soit pas si difficile à produire, s’avère extrêmement chronophage », déclare Pascal Hersen.
En plus d’être des chercheurs, ils sont rédacteurs, éditeurs, évaluateurs, recruteurs, gestionnaires, chefs de projets, comptables… Beaucoup enseignent aussi.
« Plus ils publient des contenus de qualité, plus ils sont reconnus dans leur domaine, plus ils deviennent experts et plus ils doivent produire, souvent sans être payés davantage », déclare Tatiana Malherbe, directrice adjointe du centre de recherche de l’Institut Curie.
Une meilleure gestion de l’approvisionnement
Afin de réduire les coûts mais aussi leur empreinte environnementale, ils vérifient au préalable si des collègues disposent de stocks disponibles, utilisés pour d’autres expériences. L’Institut Curie compte 1 200 chercheurs répartis sur trois sites en région parisienne, il ne suffit donc pas de traverser le couloir pour poser la question de vive voix à un collègue et obtenir la précieuse information. Au lieu de cela, les chercheurs envoient aujourd’hui un email à un alias général appelé TLM pour « Tout le monde ». Et si le collègue qui possède le matériel recherché n’est pas disponible, qu’il est en déplacement pour une conférence ou tout simplement qu’il n’est pas à jour dans ses e-mails, l’affaire se complique.
Pourtant, toutes les informations sur ces produits se trouvent dans les bons de commande et les factures de l’institut, qui listent le produit, la date, la quantité et le chercheur qui a passé la commande. Mais les fournisseurs utilisant différents formats pour les reçus et les bons de commande, cette mine d’informations n’était pas exploitable – en tout cas, pas avant l’arrivée de l’IA. Et justement, l’IA de Copilot for Researcher sera capable de recouper les résultats avec l’annuaire interne, permettant au premier chercheur de chatter facilement avec le second via Teams ou Outlook, sans surcharger les boîtes de réception de tout le monde. C’est ce qu’explique Nicolas Humann, dirigeant de Witivio, une startup basée à Lyon qui crée des applications axées sur le service aux employés. Copilot for Researcher pourra également recouper les produits avec des articles de recherche, pour identifier les noms de collègues qui les ont utilisés avec succès et qui pourraient être en mesure de fournir des conseils.
Cet agent Copilot permettra aux stocks de mieux circuler, économisant ainsi du temps, de l’argent et réduisant l’impact environnemental. Il pourra également aider à identifier une équipe ayant déjà réalisé l’analyse dont il a besoin sur un échantillon existant en quantité limité. « Même si des chercheurs peuvent parfois être en concurrence, nous travaillons tous pour le même institut. Donc quand s’il s’agit d’un échantillon disponible en quantité restreinte, il vaut mieux faire une analyse différente ou utiliser les résultats du test qui a déjà été fait », déclare Tatiana Malherbe.
Une recherche scientifique visuelle
« Si je pouvais demander à Copilot for Researcher, ‘trouve-moi les articles qui montrent ce type de cellule dans ce contexte et donne-moi les graphiques,’ cela me ferait gagner beaucoup de temps car ces informations ne se trouvent pas dans leur résumé », déclare Paul Hersen. « Elles ne sont d’ailleurs indexées par aucun autre moteur de recherche. Donc pour y accéder, je dois télécharger le PDF, puis aller lire l’article. »
Sans parler du temps perdu lorsque l’article téléchargé ne contient pas les informations exactes recherchées.
Copilot for Researcher sera également capable de rechercher dans des bases de données telles que UniProt et Human Protein Atlas, deux référentiels en libre accès contenant des informations sur les protéines, y compris des représentations graphiques, précise Nicolas Humann de Witivio.
« La curiosité scientifique, l’exactitude scientifique, c’est le savoir-faire d’un médecin ou d’un chercheur, » explique-t-il. « Quand on utilise un outil, c’est pour accélérer la recherche et tout ce qui est produit par l’IA doit absolument être validé. »
Mieux se concentrer sur l’avenir
Julien Dufour voit Copilot for Researcher comme la première étape d’une révolution à grande échelle. Les tâches administratives fastidieuses servent un objectif – garantir que les meilleurs projets obtiennent un financement, que les fonds soient correctement dépensés et que les revues scientifiques publient des articles de pointe. Copilot for Researcher aidera les chercheurs à respecter ce niveau d’exigence, tout en y consacrant beaucoup moins de temps, leur laissant plus de temps pour la science. Copilot for Researcher devrait être déployé par l’Institut Curie en décembre et être disponible en open source sur GitHub peu de temps après.
Le directeur de la transformation numérique de l’institut identifie des cas d’usages complémentaires à l’avenir et de nouveaux outils d’IA, du côté médical notamment, pour simplifier les tâches administratives auxquelles les médecins et les assistants médicaux sont actuellement confrontés. La qualité de ce travail administratif est déterminante, par exemple pour suivre les traitements reçus par un patient. Aujourd’hui, les médecins dictent des notes résumant les consultations, celles-ci étant ensuite transcrites. Une option serait de générer des rapports médicaux ou même des transcriptions de conversations entre un médecin et un patient en temps réel grâce à la reconnaissance vocale. L’IA peut également produire des rapports structurés, dont le médecin vérifie et valide le rendu final – des rapports qui pourraient être semblables, voire plus détaillés que ceux produits par le praticien mais en lui prenant beaucoup moins de temps. Ces rapports sont essentiels pour la traçabilité et pour la communication avec d’autres médecins que le patient pourrait consulter.
Julien Dufour insiste sur le fait que l’IA reste un outil et que toute personne qui l’utilise, chercheur, médecin ou assistant par exemple, doive toujours être aux commandes. « La curiosité scientifique, l’exactitude scientifique, c’est le savoir-faire d’un médecin ou d’un chercheur, » explique-t-il. « Quand on utilise un outil, c’est pour accélérer la recherche et tout ce qui est produit par l’IA doit absolument être validé. » Et de préciser que toutes les données de l’Institut Curie restent au sein de l’institut et ne sont pas utilisées pour entraîner des modèles d’IA.
L’ambition de Copilot for Researcher, comme celle des futurs outils d’IA, c’est de renforcer la ressource la plus précieuse de l’Institut Curie – ses équipes – en les libérant des tâches les plus terre-à-terre afin qu’elles consacrent davantage de temps à ce qui est le plus important. ■