KI in der Gentechnik: Wissenschaftler arbeiten jeden Tag daran, die Zukunft der Menschen zu gestalten, sie zu verbessern, sie lebenswert zu machen. Ihr Ziel ist es, künftigen Herausforderungen, die sich zum Beispiel aus der wachsenden Bevölkerung und der zunehmenden Ressourcenknappheit ergeben, zu begegnen. Informatikern und Biologen aus verschiedenen US-Forscherteams ist es nun gelungen, ein Tool namens „Elevation“ zu entwickeln, das die Genauigkeit der Gen-Bearbeitung mit der CRISPR-Methode mittels KI verbessert.
Hierbei setzt das Tool auf Machine Learning, einen Zweig der Künstlichen Intelligenz. Die CRISPR-Methode, deren Fehleranfälligkeit durch Elevation verringert wird, ist eine relativ junge Technik der Gen-Modifikation, die seit ein paar Jahren verschiedene Industrien – vom Gesundheitswesen bis hin zur Landwirtschaft – in Aufruhr versetzt. Nicht zuletzt, weil sie zu bahnbrechenden Lösungen führen könnte, indem sie beispielsweise Krebszellen verändert oder die Produktion von ertragreichen, dürretoleranten Nutzpflanzen ermöglicht.
Die CRISPR/CAS9-Methode in der Gen-Bearbeitung
Im Gegensatz zu herkömmlichen Methoden der Gen-Bearbeitung können Wissenschaftler mit dem CRISPR/Cas9-System bestimmtes DNA-Material verändern, indem sie zielgenau einzelne DNA-Teile aus dem Gen herausschneiden. So kann man sich das CRISPR/Cas9-System als eine Art „Flickwerkzeug“ in Nanogröße vorstellen. Ihren Ursprung hat die relativ junge Vorgehensweise im Jahr 2012, als Molekularbiologen herausfanden, wie man sich das natürliche Abwehrsystem von Bakterien zur Bekämpfung von Viren zunutze machen kann. Denn Bakterien sind in der Lage, sich die DNA-Sequenzen bestimmter Krankheitserreger zu „merken“ und diese dann bei einer erneuten Infektion mit Hilfe des Proteins Cas9, das man sich wie eine molekulare Schere vorstellen kann, zu zerschneiden. Welche Sequenz nun zerschnitten werden soll, teilt eine beigefügte Erkennungs-RNA mit.
Diesen natürlichen Abwehrvorgang nutzen Wissenschaftler nun, um bestimmte DNA-Sequenzen in speziellen Genen zu finden und zu zerschneiden. Das funktioniert, indem sie eine synthetische Erkennungs-RNA entwerfen, die dem Cas9-Protein vorgibt, welche DNA-Sequenz zerschnitten werden soll.
Fehleranfälligkeit des CRISPR-Systems
Trotz des ausgeklügelten Systems stellen stark ähnliche Genregionen nach wie vor eine große Herausforderung dar. So ist es durchaus möglich, dass das nanogroße „Nähset“ versehentlich am falschen Gen ansetzt, was zu Fehlern und Defekten, den sogenannten Off-Target-Effekten, führen kann. Ebenso hängt das Gelingen der Vorgehensweise damit zusammen, welche Erkennungs-RNA die Forscher für ein bestimmtes Experiment auswählen. Denn jedes Erkennungs-RNA besteht aus etwa 20 Bausteinen, den Nukleotiden, was bedeutet, dass hunderte von potenziellen Auswahlmöglichkeiten für jedes Zielgen existieren, jedoch nicht alle zu dem gewollten Ergebnis – dem Knock-Out einer zuvor festgelegten DNA-Sequenz – führen.
KI in der Gentechnik: Zweistufiger Machine-Learning-Prozess erleichtert die Auswahl der Erkennungs-RNA
„Die Regeln für die Auswahl eines geeigneten Erkennungs-RNA wurden bislang immer individuell von den Forschungsteams festgelegt“, so Nicolo Fusi, ein Wissenschaftler des Microsoft-Forschungslabors in Cambridge, Massachusetts. „Wir haben uns entschieden, dieses Problem mit maschinellem Lernen anzugehen.“ Hierfür haben Nicolo Fusi und die ehemalige Microsoft-Kollegin Jennifer Listgarten in einem zweistufigen Lernprozess eine Künstliche Intelligenz geschult. In einem ersten Lerndurchlauf, dem sogenannten „First-Layer-Machine-Learning-Modell“, wurde die Maschine mit einem Datensatz, der Informationen über alle Aktivitäten aller möglichen Gen-Zielregionen mit einem nicht passenden RNA-Bestandteil enthielt, geschult. Im zweiten Durchlauf, dem sogenannten „Second-Layer-Modell“ erfolgte das maschinelle Lernen mit einem weiteren Datensatz, der dazu diente, das erste Modell zu verfeinern und speziell die Fälle zu erfassen, in denen es mehr als ein nicht übereinstimmendes Nukleotid gibt. „Diese zweite Ebene ist vor allem deshalb wichtig, weil die Off-Target-Effekte mit mehr als einer Nichtübereinstimmung auftreten können“, so Listgarten von der University of California. Im Anschluss wurde das zweistufige Modell anhand von öffentlich zugänglichen Datensätzen erweitert, die von Mitarbeitern der Harvard Medical School und des Massachusetts Hospitals generiert wurden.
Das Ergebnis: Der cloudbasierte Dienst Elevation
Mithilfe der Künstlichen Intelligenz wurde das Tool Elevation zur Vorhersage von Off-Target-Effekten entwickelt, das in Kombination mit dem Vorhersage-Tool für On-Target-Effekte (Azimuth) künftig die Auswahl der geeigneten Erkennungs-RNA erleichtert. Für jede mögliche Entscheidung werden den Forschern nun verschiedene Scores geboten, die bestimmte Wahrscheinlichkeiten abbilden, die durch Machine Learning errechnet wurden. Für jeden einzelnen Erkennungs-RNA errechnet Elevation hundert bis tausende mögliche Off-Target-Scores. Da es jedoch für die Forscher unmöglich ist, einen Überblick über die unzähligen Möglichkeiten zu erhalten, errechnet der Dienst ebenfalls eine Gesamtpunktzahl, die alle Off-Target-Scores zusammenfasst und angibt, wie wahrscheinlich es ist, dass bestimmte Erkennungs-RNAs nicht zur Ziel-Zelle passen. Mit Hilfe dieser Berechnungswerkzeuge können Forscher nun den Namen eines bestimmten Gen-Bestandteils eingeben, das sie modifizieren möchten, und die cloudbasierte Suchmaschine gibt eine Liste von RNA-Guides zurück, welche die Forscher nach den von der Künstlichen Intelligenz vorhergesagten Effekten sortieren können.
Die Dienste „Elevation“ sowie „Azimuth“ sind sowohl auf Microsoft Azure als auch über einen Open-Source-Code ausgeführt und öffentlich verfügbar.
Verwandte Themen
- Mehr über Elevation in der Nature Biomedical Engineering
- Mehr über Azimuth in der Nature Biotechnology
- Mehr über CRISPR.ML, der End-to-End-Guide Design Service
- Molecular biology meets computer science tools in new system for CRISPR
- #digitalfueralle im Gesundheitswesen
Ein Beitrag von Christina Sailer
Trainee Business and Consumer Communications