Wie Künstliche Intelligenz die Genauigkeit der Gen-Bearbeitung verbessert

KI in der Gentechnik: Wissenschaftler arbeiten jeden Tag daran, die Zukunft der Menschen zu gestalten, sie zu verbessern, sie lebenswert zu machen. Ihr Ziel ist es, künftigen Herausforderungen, die sich zum Beispiel aus der wachsenden Bevölkerung und der zunehmenden Ressourcenknappheit ergeben, zu begegnen. Informatikern und Biologen aus verschiedenen US-Forscherteams ist es nun gelungen, ein Tool namens „Elevation“ zu entwickeln, das die Genauigkeit der Gen-Bearbeitung mit der CRISPR-Methode mittels KI verbessert.

Hierbei setzt das Tool auf Machine Learning, einen Zweig der Künstlichen Intelligenz. Die CRISPR-Methode, deren Fehleranfälligkeit durch Elevation verringert wird, ist eine relativ junge Technik der Gen-Modifikation, die seit ein paar Jahren verschiedene Industrien – vom Gesundheitswesen bis hin zur Landwirtschaft – in Aufruhr versetzt. Nicht zuletzt, weil sie zu bahnbrechenden Lösungen führen könnte, indem sie beispielsweise Krebszellen verändert oder die Produktion von ertragreichen, dürretoleranten Nutzpflanzen ermöglicht.

Die CRISPR/CAS9-Methode in der Gen-Bearbeitung

 Im Gegensatz zu herkömmlichen Methoden der Gen-Bearbeitung können Wissenschaftler mit dem CRISPR/Cas9-System bestimmtes DNA-Material verändern, indem sie zielgenau einzelne DNA-Teile aus dem Gen herausschneiden. So kann man sich das CRISPR/Cas9-System als eine Art „Flickwerkzeug“ in Nanogröße vorstellen. Ihren Ursprung hat die relativ junge Vorgehensweise im Jahr 2012, als Molekularbiologen herausfanden, wie man sich das natürliche Abwehrsystem von Bakterien zur Bekämpfung von Viren zunutze machen kann. Denn Bakterien sind in der Lage, sich die DNA-Sequenzen bestimmter Krankheitserreger zu „merken“ und diese dann bei einer erneuten Infektion mit Hilfe des Proteins Cas9, das man sich wie eine molekulare Schere vorstellen kann, zu zerschneiden. Welche Sequenz nun zerschnitten werden soll, teilt eine beigefügte Erkennungs-RNA mit.

Diesen natürlichen Abwehrvorgang nutzen Wissenschaftler nun, um bestimmte DNA-Sequenzen in speziellen Genen zu finden und zu zerschneiden. Das funktioniert, indem sie eine synthetische Erkennungs-RNA entwerfen, die dem Cas9-Protein vorgibt, welche DNA-Sequenz zerschnitten werden soll.

Fehleranfälligkeit des CRISPR-Systems

 Trotz des ausgeklügelten Systems stellen stark ähnliche Genregionen nach wie vor eine große Herausforderung dar. So ist es durchaus möglich, dass das nanogroße „Nähset“ versehentlich am falschen Gen ansetzt, was zu Fehlern und Defekten, den sogenannten Off-Target-Effekten, führen kann. Ebenso hängt das Gelingen der Vorgehensweise damit zusammen, welche Erkennungs-RNA die Forscher für ein bestimmtes Experiment auswählen. Denn jedes Erkennungs-RNA besteht aus etwa 20 Bausteinen, den Nukleotiden, was bedeutet, dass hunderte von potenziellen Auswahlmöglichkeiten für jedes Zielgen existieren, jedoch nicht alle zu dem gewollten Ergebnis –  dem Knock-Out einer zuvor festgelegten DNA-Sequenz – führen.

KI in der Gentechnik: Zweistufiger Machine-Learning-Prozess erleichtert die Auswahl der Erkennungs-RNA

„Die Regeln für die Auswahl eines geeigneten Erkennungs-RNA wurden bislang immer individuell von den Forschungsteams festgelegt“, so Nicolo Fusi, ein Wissenschaftler des Microsoft-Forschungslabors in Cambridge, Massachusetts. „Wir haben uns entschieden, dieses Problem mit maschinellem Lernen anzugehen.“ Hierfür haben Nicolo Fusi und die ehemalige Microsoft-Kollegin Jennifer Listgarten in einem zweistufigen Lernprozess eine Künstliche Intelligenz geschult. In einem ersten Lerndurchlauf, dem sogenannten „First-Layer-Machine-Learning-Modell“, wurde die Maschine mit einem Datensatz, der Informationen über alle Aktivitäten aller möglichen Gen-Zielregionen mit einem nicht passenden RNA-Bestandteil enthielt, geschult. Im zweiten Durchlauf, dem sogenannten „Second-Layer-Modell“ erfolgte das maschinelle Lernen mit einem weiteren Datensatz, der dazu diente, das erste Modell zu verfeinern und speziell die Fälle zu erfassen, in denen es mehr als ein nicht übereinstimmendes Nukleotid gibt. „Diese zweite Ebene ist vor allem deshalb wichtig, weil die Off-Target-Effekte mit mehr als einer Nichtübereinstimmung auftreten können“, so Listgarten von der University of California. Im Anschluss wurde das zweistufige Modell anhand von öffentlich zugänglichen Datensätzen erweitert, die von Mitarbeitern der Harvard Medical School und des Massachusetts Hospitals generiert wurden.

Das Ergebnis: Der cloudbasierte Dienst Elevation

Mithilfe der Künstlichen Intelligenz wurde das Tool Elevation zur Vorhersage von Off-Target-Effekten entwickelt, das in Kombination mit dem Vorhersage-Tool für On-Target-Effekte (Azimuth) künftig die Auswahl der geeigneten Erkennungs-RNA erleichtert. Für jede mögliche Entscheidung werden den Forschern nun verschiedene Scores geboten, die bestimmte Wahrscheinlichkeiten abbilden, die durch Machine Learning errechnet wurden. Für jeden einzelnen Erkennungs-RNA errechnet Elevation hundert bis tausende mögliche Off-Target-Scores. Da es jedoch für die Forscher unmöglich ist, einen Überblick über die unzähligen Möglichkeiten zu erhalten, errechnet der Dienst ebenfalls eine Gesamtpunktzahl, die alle Off-Target-Scores zusammenfasst und angibt, wie wahrscheinlich es ist, dass bestimmte Erkennungs-RNAs nicht zur Ziel-Zelle passen. Mit Hilfe dieser Berechnungswerkzeuge können Forscher nun den Namen eines bestimmten Gen-Bestandteils eingeben, das sie modifizieren möchten, und die cloudbasierte Suchmaschine gibt eine Liste von RNA-Guides zurück, welche die Forscher nach den von der Künstlichen Intelligenz vorhergesagten Effekten sortieren können.

Die Dienste „Elevation“ sowie „Azimuth“ sind sowohl auf Microsoft Azure als auch über einen Open-Source-Code ausgeführt und öffentlich verfügbar.

Verwandte Themen


Ein Beitrag von Christina Sailer
Trainee Business and Consumer Communications

Christina Sailer: KI in der Gentechnik

Tags:

Weitere Infos zu diesem Thema

11. Februar 2025
Safer Internet Day 2025: Mit Bildung und Empowerment gegen schädliche KI-generierte Inhalte

Der Safer Internet Day bietet jedes Jahr einen guten Anlass, um über den aktuellen Stand der Sicherheit im Internet nachzudenken – darüber, wie weit wir gekommen sind und was wir weiter verbessern können. Microsoft nutzt dieses Datum seit fast einem Jahrzehnt dazu, Forschungsergebnisse darüber zu veröffentlichen, wie Menschen aller Altersgruppen Online-Risiken im Internet wahrnehmen.

28. Januar 2025
Initiativen für Wahlsicherheit und gegen Desinformation im Rahmen der Bundestagswahl 

Technologie verändert und gestaltet unser Leben kontinuierlich neu. Und so wie sich alltägliche Prozesse durch und mit der technologischen Entwicklung ändern, hat sie auch Auswirkungen auf die Politik und den demokratischen Prozess. Im besten Fall helfen digitale Technologie den Wählern, fundierte und informierte Entscheidungen zu treffen, und gewährleistet die Integrität und Sicherheit von Wahlen.

23. Januar 2025
Copilot für alle – Einführung von Microsoft 365 Copilot Chat

Heute stellen wir Microsoft 365 Copilot Chat vor, ein neues Angebot, das verbrauchsbasierte Agents (Pay as you go) zu unserem bestehenden kostenlosen Chat-Erlebnis für kommerzielle Microsoft 365-Kunden hinzufügt. Copilot Chat ermöglicht es der gesamten Belegschaft – von Kundendienstmitarbeitenden über Marketingleiter*innen bis hin zu Techniker*innen – ab sofort Copilot und Agents zu verwenden.