Realitätstest mit ChatGPT, Sprachmodellen und Generativer KI

Seit etwa einem halben Jahr hält der Hype um ChatGPT und Co. nun schon an und ein Ende ist nicht abzusehen. Inzwischen haben viele ChatGPT, Aleph Alpha und andere Tools selbst getestet und konnten sich dabei von der hohen sprachlichen Qualität der Ergebnisse überzeugen – aber auch davon, dass die Modelle »halluzinieren«, also immer wieder auch Falschaussagen erzeugen. Wir haben uns deshalb genauer angeschaut, ob und wie wir die aktuellen Sprachmodelle beim Textverstehen einsetzen können und welche Vorteile sich dabei ergeben.

Wofür kann man generative Sprachmodelle einsetzen?

OpenAI stellt mit ChatGPT einen Chatbot zur Verfügung, mit dem man sich in natürlicher Sprache unterhalten kann. Chatbots sind aber nur eine von vielen Möglichkeiten, generative Sprachmodelle einzusetzen. Weitere denkbare Nutzungsszenarien sind die Vervollständigung von Texten und das Beantworten von Fragen (»Question Answering«). Die aktuellen Sprachmodelle können mittels »Downstream Task Adaption« an verschiedene Aufgabenstellungen angepasst werden, sodass viele weitere Nutzungsszenarien möglich sind.

Erste derartige Anwendungen gibt es bereits. So hat Microsoft die KI von OpenAI in seine Suchmaschine Bing integriert, so dass neben einer verbesserten Suchfunktion auch Chats und das Erstellen von Texten möglich sind. Der GitHub Copilot unterstützt Programmierer mit der Erstellung von Vorschlägen für Programmcode. Und die Stadt Heidelberg unterstützt ihre Bürger bei Behördenanliegen mit der KI-Bürgerassistenz Lumi, die auf dem KI-Modell Luminous des Heidelberger Startups Aleph Alpha basiert.

Generative KI und Merkmalsextraktion aus Texten – Anwendungsfälle für die Praxis

Als »Generative KI« werden KI-Anwendungen bezeichnet, die selbst neue Inhalte erzeugen. Das ist zum Beispiel bei der Beantwortung von Fragen der Fall. Bereits bei unseren ersten Tests am Fraunhofer IAO haben wir festgestellt, dass es damit möglich ist, gezielt bestimmte Informationen aus Texten zu extrahieren – und zwar selbst dann, wenn wir die Modelle noch gar nicht an eine bestimmte Domäne angepasst haben, sondern einfach dadurch, dass die sprachlichen Zusammenhänge in den Dokumenten gut erkannt werden.

Ein relevanter Anwendungsfall aus unseren Projekten ist das Auffinden der Schadenursache in Versicherungsgutachten. Die Schadenursachen sind vielfältig, werden von den Gutachtern in immer wieder anderen Formulierungen verfasst und können in verschiedenen Abschnitten der Dokumente vorkommen. Um solche Merkmale mit KI zu extrahieren, haben wir bisher eine Vielzahl von Trainingsdokumenten benötigt, d. h. es war nötig, das Vorkommen der Merkmale in einer großen Anzahl von Dokumenten (typischerweise mehrere hundert oder sogar tausend) von Hand zu annotieren. Wir sind noch dabei, das im Detail zu evaluieren, aber die ersten Ergebnisse sehen vielversprechend aus. Mit diesem Ansatz können wir in Zukunft unsere KI-Lösung Aikido zur Merkmalsextraktion aus Texten anhand weniger Beispieldokumente trainieren. Damit wird eine wesentliche Einstiegshürde für den Einsatz von KI entfallen.

Screenshot Aikido Schadensursache

Ausblick: Weitere Einsatzszenarien für generative KI-Modelle

Auch in anderen Bereichen ergeben sich durch generative KI neue Möglichkeiten. So ist es mit anderen Modellen wie z. B. Midjourney möglich, realistische Bilder zu generieren. Die Kollegen vom Fraunhofer IPA beschäftigen sich intensiv mit Bilddaten und auf dem Open Lab Day am 30. März 2023 haben wir uns zu den Nutzungsmöglichkeiten in beiden Bereichen ausgetauscht. Das IPA nutzt generative KI-Modelle, um ausgehend von wenigen Beispielbildern umfassende Bilddatensätze zu erzeugen, mit denen anschließend eine KI z. B. für die Fehlteileerkennung trainiert werden kann.

Herausfinden, was alles möglich ist

Natürlich gibt es noch offene Fragen, z. B. zum Datenschutz und wie sich das oben bereits angesprochene »Halluzinieren« sicher vermeiden lässt. Aber die Geschwindigkeit, mit der aus den neuen Sprachmodellen erste erfolgreiche Anwendungen entstanden sind, ist enorm, die Anwendungsmöglichkeiten sind zahlreich und immer mehr leistungsfähige KI-Modelle sind verfügbar. Damit können in naher Zukunft viele Arbeiten, die bis jetzt von Hand ausgeführt werden, entweder erheblich vereinfacht oder sogar ganz automatisiert werden. Es sieht also ganz so aus, als ob der aktuelle Hype um die generativen KI-Modelle tatsächlich berechtigt ist.

Wir wollen das Nutzenpotenzial der generativen Modelle genauer bewerten. Deshalb sind wir gerade dabei, weitere Einsatzmöglichkeiten für die neuen Sprachmodelle zu identifizieren und zu evaluieren. Dazu brauchen wir möglichst realistische Anwendungsfälle und Beispieldokumente. Wenn Sie eine entsprechende Idee und vielleicht sogar einige Beispieldokumente haben, würden wir uns freuen, von Ihnen zu hören.

Leselinks:

Jens Drawehn

Jens Drawehn ist wissenschaftlicher Mitarbeiter im Team Angewandte Künstliche Intelligenz am Fraunhofer IAO. Seine Themenschwerpunkte sind Data Science, Textverstehen und Prozessanalysen.

Autorenprofil - Website - Xing

Kategorien: Digitalisierung, Künstliche Intelligenz
Tags: ChatGPT, KI - Künstliche Intelligenz