Drei große KI-Trends, die 2024 wichtig sein werden

2023 war ein sehr bedeutendes Jahr für generative KI (GenAI): In diesem Jahr hat GenAI den Weg aus den Forschungslaboren in die Praxis gefunden. Millionen von Menschen in der ganzen Welt haben zum ersten Mal Tools wie ChatGPT und Microsoft Copilot ausprobiert und sofort genutzt.

Wir erwarten, dass KI in diesem Jahr noch zugänglicher und vielseitiger in seiner Anwendung wird, wodurch einerseits alltägliche Aufgaben und andererseits einige der größten Probleme der Welt gelöst werden können. Hier sind drei wichtige KI-Trends, die wir im Jahr 2024 im Auge behalten sollten:

Small Language Models (SLMs) helfen, Ressourcen zu sparen

Wer bereits Copilot zur Beantwortung komplexer Fragen verwendet, hat die Leistungsfähigkeit von Large Language Models (LLMs) schon kennengelernt. Diese Modelle sind allerdings so groß, dass ihre Ausführung erhebliche Rechenressourcen erfordert. Daher ist es naheliegend, die Einführung von SLMs zu forcieren, um diese Ressourcen einzusparen.

SLMs sind mit mehreren Milliarden Parametern immer noch groß – im Vergleich mit den Hunderten von Milliarden bei LLMs aber schon klein genug, um zum Beispiel offline auf einem Smartphone ausgeführt werden zu können. (Parameter sind Variablen oder einstellbare Elemente, die das Verhalten eines Modells bestimmen.)

„Small Language Models können KI aufgrund ihrer Größe und Erschwinglichkeit noch zugänglicher machen“, erläutert Sebastien Bubeck, der bei Microsoft Research die Gruppe Machine Learning Foundations leitet. „Gleichzeitig entdecken wir gerade neue Möglichkeiten, um sie so leistungsfähig wie große Sprachmodelle zu machen.“

Microsoft-Forscher*innen haben zwei SLMs entwickelt und auf den Markt gebracht, die in bestimmten Bereichen schon genauso gut oder sogar besser sind als große Sprachmodelle. Sie heißen Phi und Orca und widerlegen die Vorstellung, dass die Größe über die Leistungsfähigkeit bei KI-Modellen entscheidet.

Im Gegensatz zu LLMs, die auf Basis riesiger Mengen von unspezifischen Daten trainiert werden, verwenden kleinere Modelle kuratierte Trainingsdaten. Der wichtigste Beitrag der Forscher*innen war es, neue Schwellenwerte für das Verhältnis von Größe und Leistung zu finden. In diesem Jahr versprechen SLMs verbesserte Modelle zu sein, die mehr Forschung und Innovation ermöglichen.

Multimodale KI versteht mehr

Die meisten LLMs können nur einen Datentyp verarbeiten: Text. Multimodale Modelle verstehen dagegen Informationen aus verschiedenen Datentypen wie Text, Bilder, Audio und Video. Diese Fähigkeit macht zum Beispiel Suchwerkzeuge oder Kreativitätsanwendungen noch reichhaltiger, genauer und nahtloser nutzbar.

Dank eines multimodalen Modells, das Bilder, natürliche Sprache und Bing-Suchdaten
verarbeiten kann, kann Copilot beispielsweise herausfinden, was in einem Bild passiert. Copilot kann aus einem Foto relevante Informationen generieren, etwa die historische Einordnung eines dort gezeigten Denkmals.

Multimodale KI verbessert auch Microsoft Designer, unsere Grafikdesign-App, die Bilder auf der Grundlage einer Beschreibung des Motivs generieren kann. Und sie ermöglicht benutzerdefinierte neuronale oder natürlich klingende Stimmen, die in Textlesern und Tools für Menschen mit Sprachbehinderungen nützlich sind.

„Multimodalität hat das Potenzial, Erfahrungen zu erschaffen, die das Spektrum der menschlichen Sinne wie Sehen, Sprechen und Hören stärker ansprechen“, sagt Jennifer Marsman, leitende Ingenieurin im Büro von Kevin Scott, Chief Technology Officer von Microsoft.

KI sorgt für eine Revolution in der Wissenschaft

Expert*innen erwarten große Fortschritte bei KI-Tools, die wissenschaftliche Entdeckungen begleiten, bei denen es vor allem um die Bewältigung globaler Probleme wie Klimawandel, Energiekrisen und Krankheiten geht.

Um den Klimawandel einzudämmen und Landwirt*innen zu helfen, effizienter zu arbeiten, setzen Microsoft- Forscher*innen KI ein, um bessere Wettervorhersagen, CO₂-Rechner und andere Werkzeuge für eine nachhaltige Landwirtschaft zu entwickeln. Zudem schaffen sie KI-Technologien, die Landwirt*innen auf dem Acker helfen, darunter zum Beispiel ein Chatbot, der bei der Identifikation schädlicher oder unbekannter Pflanzen hilft oder die Effizienz unterschiedlicher Bewässerungsmethoden anhand von betriebsspezifischen Daten ermittelt.

In den Life Sciences arbeiten Forschende gemeinsam am weltweit größten bildbasierten KI-Modell zur Krebsbekämpfung. Sie nutzen fortschrittliche KI-Technologien, um neue Wirkstoffe für Infektionskrankheiten oder neue Moleküle für bahnbrechende Medikamente zu finden. Die Technologie reduziert die Anzahl wissenschaftlicher Versuche (und Fehler) – Prozesse, die früher Jahre gedauert haben – auf nur wenige Wochen oder Monate.

Die KI verändert auch die äußerst komplexe Thematik der Materialwissenschaft, die sich mit der Entwicklung neuer Stoffe mit spezifischen Eigenschaften beschäftigt. Bei einem kürzlich erzielten Durchbruch haben Forschende die Leistungsfähigkeit von KI in Kombination mit Hochleistungscomputern genutzt, um die Suche nach neuen Batteriematerialien zu beschleunigen.

„Künstliche Intelligenz bedeutet für die Forschung eine echte Revolution“, sagt Chris Bishop, Direktor des AI4Science-Teams bei Microsoft Research. „Diese Kooperation könnte sich als die aufregendste und letztlich wichtigste Anwendung von KI in den kommenden Jahren erweisen.“

Den Originalbeitrag von Vanessa Ho in englischer Sprache finden Sie hier.

Illustrationen von Makeshift Studios / Michal Bednarski

Small Language Models (SLMs) helfen, Ressourcen zu sparen

Multimodale KI versteht mehr

KI sorgt für eine Revolution in der Wissenschaft

Mehr Geschichten

Mentale Gesundheit bei Microsoft Deutschland

Sieben Wege, wie KI unser Leben einfacher macht

Wie KI helfen kann, schlechte Meetings zu vermeiden

Wie Menschen mit KI ihre Ideen verwirklichen