Wie Künstliche Intelligenz die Genauigkeit der Gen-Bearbeitung verbessert

KI in der Gentechnik: Wissenschaftler arbeiten jeden Tag daran, die Zukunft der Menschen zu gestalten, sie zu verbessern, sie lebenswert zu machen. Ihr Ziel ist es, künftigen Herausforderungen, die sich zum Beispiel aus der wachsenden Bevölkerung und der zunehmenden Ressourcenknappheit ergeben, zu begegnen. Informatikern und Biologen aus verschiedenen US-Forscherteams ist es nun gelungen, ein Tool namens „Elevation“ zu entwickeln, das die Genauigkeit der Gen-Bearbeitung mit der CRISPR-Methode mittels KI verbessert.

Hierbei setzt das Tool auf Machine Learning, einen Zweig der Künstlichen Intelligenz. Die CRISPR-Methode, deren Fehleranfälligkeit durch Elevation verringert wird, ist eine relativ junge Technik der Gen-Modifikation, die seit ein paar Jahren verschiedene Industrien – vom Gesundheitswesen bis hin zur Landwirtschaft – in Aufruhr versetzt. Nicht zuletzt, weil sie zu bahnbrechenden Lösungen führen könnte, indem sie beispielsweise Krebszellen verändert oder die Produktion von ertragreichen, dürretoleranten Nutzpflanzen ermöglicht.

Die CRISPR/CAS9-Methode in der Gen-Bearbeitung

 Im Gegensatz zu herkömmlichen Methoden der Gen-Bearbeitung können Wissenschaftler mit dem CRISPR/Cas9-System bestimmtes DNA-Material verändern, indem sie zielgenau einzelne DNA-Teile aus dem Gen herausschneiden. So kann man sich das CRISPR/Cas9-System als eine Art „Flickwerkzeug“ in Nanogröße vorstellen. Ihren Ursprung hat die relativ junge Vorgehensweise im Jahr 2012, als Molekularbiologen herausfanden, wie man sich das natürliche Abwehrsystem von Bakterien zur Bekämpfung von Viren zunutze machen kann. Denn Bakterien sind in der Lage, sich die DNA-Sequenzen bestimmter Krankheitserreger zu „merken“ und diese dann bei einer erneuten Infektion mit Hilfe des Proteins Cas9, das man sich wie eine molekulare Schere vorstellen kann, zu zerschneiden. Welche Sequenz nun zerschnitten werden soll, teilt eine beigefügte Erkennungs-RNA mit.

Diesen natürlichen Abwehrvorgang nutzen Wissenschaftler nun, um bestimmte DNA-Sequenzen in speziellen Genen zu finden und zu zerschneiden. Das funktioniert, indem sie eine synthetische Erkennungs-RNA entwerfen, die dem Cas9-Protein vorgibt, welche DNA-Sequenz zerschnitten werden soll.

Fehleranfälligkeit des CRISPR-Systems

 Trotz des ausgeklügelten Systems stellen stark ähnliche Genregionen nach wie vor eine große Herausforderung dar. So ist es durchaus möglich, dass das nanogroße „Nähset“ versehentlich am falschen Gen ansetzt, was zu Fehlern und Defekten, den sogenannten Off-Target-Effekten, führen kann. Ebenso hängt das Gelingen der Vorgehensweise damit zusammen, welche Erkennungs-RNA die Forscher für ein bestimmtes Experiment auswählen. Denn jedes Erkennungs-RNA besteht aus etwa 20 Bausteinen, den Nukleotiden, was bedeutet, dass hunderte von potenziellen Auswahlmöglichkeiten für jedes Zielgen existieren, jedoch nicht alle zu dem gewollten Ergebnis –  dem Knock-Out einer zuvor festgelegten DNA-Sequenz – führen.

KI in der Gentechnik: Zweistufiger Machine-Learning-Prozess erleichtert die Auswahl der Erkennungs-RNA

„Die Regeln für die Auswahl eines geeigneten Erkennungs-RNA wurden bislang immer individuell von den Forschungsteams festgelegt“, so Nicolo Fusi, ein Wissenschaftler des Microsoft-Forschungslabors in Cambridge, Massachusetts. „Wir haben uns entschieden, dieses Problem mit maschinellem Lernen anzugehen.“ Hierfür haben Nicolo Fusi und die ehemalige Microsoft-Kollegin Jennifer Listgarten in einem zweistufigen Lernprozess eine Künstliche Intelligenz geschult. In einem ersten Lerndurchlauf, dem sogenannten „First-Layer-Machine-Learning-Modell“, wurde die Maschine mit einem Datensatz, der Informationen über alle Aktivitäten aller möglichen Gen-Zielregionen mit einem nicht passenden RNA-Bestandteil enthielt, geschult. Im zweiten Durchlauf, dem sogenannten „Second-Layer-Modell“ erfolgte das maschinelle Lernen mit einem weiteren Datensatz, der dazu diente, das erste Modell zu verfeinern und speziell die Fälle zu erfassen, in denen es mehr als ein nicht übereinstimmendes Nukleotid gibt. „Diese zweite Ebene ist vor allem deshalb wichtig, weil die Off-Target-Effekte mit mehr als einer Nichtübereinstimmung auftreten können“, so Listgarten von der University of California. Im Anschluss wurde das zweistufige Modell anhand von öffentlich zugänglichen Datensätzen erweitert, die von Mitarbeitern der Harvard Medical School und des Massachusetts Hospitals generiert wurden.

Das Ergebnis: Der cloudbasierte Dienst Elevation

Mithilfe der Künstlichen Intelligenz wurde das Tool Elevation zur Vorhersage von Off-Target-Effekten entwickelt, das in Kombination mit dem Vorhersage-Tool für On-Target-Effekte (Azimuth) künftig die Auswahl der geeigneten Erkennungs-RNA erleichtert. Für jede mögliche Entscheidung werden den Forschern nun verschiedene Scores geboten, die bestimmte Wahrscheinlichkeiten abbilden, die durch Machine Learning errechnet wurden. Für jeden einzelnen Erkennungs-RNA errechnet Elevation hundert bis tausende mögliche Off-Target-Scores. Da es jedoch für die Forscher unmöglich ist, einen Überblick über die unzähligen Möglichkeiten zu erhalten, errechnet der Dienst ebenfalls eine Gesamtpunktzahl, die alle Off-Target-Scores zusammenfasst und angibt, wie wahrscheinlich es ist, dass bestimmte Erkennungs-RNAs nicht zur Ziel-Zelle passen. Mit Hilfe dieser Berechnungswerkzeuge können Forscher nun den Namen eines bestimmten Gen-Bestandteils eingeben, das sie modifizieren möchten, und die cloudbasierte Suchmaschine gibt eine Liste von RNA-Guides zurück, welche die Forscher nach den von der Künstlichen Intelligenz vorhergesagten Effekten sortieren können.

Die Dienste „Elevation“ sowie „Azimuth“ sind sowohl auf Microsoft Azure als auch über einen Open-Source-Code ausgeführt und öffentlich verfügbar.

Verwandte Themen


Ein Beitrag von Christina Sailer
Trainee Business and Consumer Communications

Christina Sailer: KI in der Gentechnik

Tags:

Weitere Infos zu diesem Thema

16. April 2021
Lasst uns wieder neugierig sein: 6 Tipps für das Lernen im digitalen Zeitalter

RESET. RETHINK. RESTART. – Unter diesem Motto findet diese Woche der Karrierekongress WomenPower im Rahmen der Hannover Messe statt. Viele spannende Sprecher*innen teilen Einblicke in ihre Themen in ganz verschiedenen, digitalen Workshops und Diskussionsrunden. In meiner Keynote spreche ich darüber, wie sich lebenslanges Lernen in den Alltag integrieren lässt – und was Neugier damit zu tun hat.

15. April 2021
Emojis, Screenshots, Game Bar: Die 10 besten Tastenkombinationen auf Windows 10 für mehr Produktivität (und Spaß)

Fast jeder liebt sie, denn sie machen die Arbeit mit Windows 10 Geräten nicht nur schneller, sondern auch produktiver – und manchmal bringen sie auch ein bisschen Spaß in den Arbeitsalltag. Die Rede ist von Tastenkombinationen. Gängige Shortcuts wie [STRG] + [C] oder [STRG] + [V] kennt fast jeder Windows Nutzer – ich verrate hier meine zehn liebsten Windows 10 Tastenkombinationen, die vielleicht (noch) etwas unbekannter, aber (mindestens) genauso nützlich, sind.

14. April 2021
KI gestalten mit: Gesa Biermann

Gesa Biermann vom ClimateTech Startup Pina spricht in unserer Reihe „KI gestalten mit“ darüber, wie wir mit der Unterstützung von KI unsere Wälder schützen können.

13. April 2021
Optimiert für digitale Meetings: Microsoft kündigt Surface- und Zubehör-Neuheiten an

Microsoft hat heute Surface Laptop 4 angekündigt. Das Nachfolger-Modell im bekannten Design gibt es wahlweise mit Intel Core Prozessor oder AMD Ryzen Chip Surface Edition. Surface Laptop 4 wird in Deutschland ab einem Preis von 1.129 Euro* ab dem 27. April 2021 erhältlich sein und ist ab sofort vorbestellbar. Die neuen Surface Headphones 2+ for Business mit Microsoft Teams Zertifizierung werden ab 11. Mai 2021 zum Preis von 329,99 Euro für Unternehmenskunden verfügbar. Es wurden darüber hinaus zwei für Microsoft Teams zertifizierte Headsets, ein Speaker und eine Webcam vorgestellt. Das neue PC-Zubehör wird im Sommer für Privat- und Firmenkunden verfügbar.