KI-Halluzinationen (Factual Errors)

KI-Halluzinationen bezeichnen das Phänomen, dass Large Language Models (LLMs) und andere generative KI-Systeme sachlich falsche, erfundene oder nicht verifizierbare Aussagen mit scheinbarer Selbstsicherheit als Fakten ausgeben, ohne dies zu markieren.

Rubrik: GenAI & Content Creation · Unterrubrik: KI-Ethik & Gesellschaft · Niveau: Fortgeschritten Synonyme / Auch bekannt als: AI Hallucination, Konfabulation, Factual Errors in LLMs, AI Fabrication, LLM-Fehler

Was sind KI-Halluzinationen?

Der Begriff „Halluzination" ist in der KI-Forschung ein Fachbegriff (keine psychologische Metapher): Er beschreibt den Zustand, in dem ein Sprachmodell Ausgaben produziert, die grammatisch korrekt, stilistisch überzeugend und faktisch falsch sind. Das System „erfindet" Fakten, Zitate, Gerichtsurteile, Personennamen, Studienergebnisse, historische Daten, die nicht existieren oder falsch sind. Dies ist kein Fehler in einem trivialen Sinne, sondern ein strukturelles Merkmal gegenwärtiger LLM-Architektur.

Erklärung

Technische Ursachen: LLMs wie GPT-4, Claude, Gemini oder Llama sind statistisch-prädiktive Systeme: Sie berechnen, welches Token (Worteinheit) wahrscheinlich als nächstes folgen sollte, basierend auf Milliarden von Trainingstextbeispielen. Sie haben kein echtes Weltmodell, keine interne Datenbank mit verifizierten Fakten und keinen Mechanismus, der zwischen „Ich weiß das" und „Ich rate plausibel" unterscheidet. Wenn ein LLM nach einem Gerichtsurteil gefragt wird, das in seinen Trainingsdaten nicht explizit vorhanden ist, interpoliert es aus benachbarten Mustern, und produziert ein plausibel klingendes, aber erfundenes Ergebnis.

Arten von Halluzinationen:

Faktische Halluzinationen: Erfundene Fakten, nicht existente Gerichtsurteile, falsche Statistiken, erfundene Zitate von realen Personen, fehlerhafte historische Daten.

Attributions-Halluzinationen: Korrekte Aussagen werden falschen Quellen, Autoren oder Personen zugeschrieben.

Konfabulation bei langen Kontexten: Bei sehr langen Dokumenten oder Gesprächen verlieren LLMs den Überblick und widersprüchliche Aussagen oder Inkonsistenz nehmen zu.

Obsequious Hallucination: Modelle bestätigen falsche Behauptungen des Nutzers, um gefällig zu sein, auch wenn sie die Falschheit „wissen" sollten.

Prominente Fälle: Im Mai 2023 wurde bekannt, dass ein US-Anwalt (Mata v. Avianca) ChatGPT für juristische Recherchen nutzte, ohne die Ergebnisse zu verifizieren. ChatGPT hatte sechs vollständig erfundene Gerichtsurteile zitiert; der Anwalt reichte diese in einem echten Fall ein. Das Gericht verhängte Bußgelder. Der Fall wurde global bekannt als Warnung vor blindem Vertrauen in LLM-Outputs.

Reduktionsstrategien:

Retrieval-Augmented Generation (RAG): Das Modell wird mit einer externen, verifizierten Wissensdatenbank gekoppelt; Antworten werden aus abrufbaren Dokumenten generiert und können zurückverfolgt werden. Dies reduziert Halluzinationen erheblich, eliminiert sie aber nicht vollständig.

Chain-of-Thought Prompting: Das Modell wird angewiesen, Schritt für Schritt zu argumentieren, was Fehlerquellen sichtbarer macht.

Grounded Generation: Modelle werden trainiert, bei Unsicherheit explizit „Ich weiß das nicht" zu antworten.

Fact-Checking-Tools: Post-hoc-Systeme wie Perplexity AI oder Bing Chat integrieren Web-Suche zur Echtzeitverifikation.

Relevanz für Medien und Rechtliches: Halluzinierende KI-Outputs sind nicht nur ärgerlich, sondern können erheblichen Schaden anrichten: Falsche juristische Informationen, falsche medizinische Ratschläge, falsche Personenattributionen (potenziell rufschädigend). Unter DSGVO und Persönlichkeitsrecht können falsche Aussagen über reale Personen Haftung auslösen. Der EU AI Act fordert für Hochrisiko-Systeme Genauigkeit und Robustheit als Pflichtmerkmale.

Beispiele

Mata v. Avianca (New York, 2023): Anwälte nutzten ChatGPT für juristische Recherche, ohne Ergebnisse zu prüfen. ChatGPT zitierte sechs nicht existente Gerichtsurteile als real. Das Bundesgericht verhängte Bußgelder; der Fall wurde zum globalen Warnsignal.
Falsche Wissenschafts-Zitate: Forscher der University of Glasgow (2023) zeigten, dass ChatGPT bei der Anfrage nach wissenschaftlicher Literatur zu einer Hälfte der Treffer nicht existente Studien mit erfundenen Autoren und Titeln generierte.
Wikipedia-ähnliche Falschinformationen: Redaktionen, die KI für Wikipedia-artige Zusammenfassungen nutzten, berichteten von regelmäßig erfundenen Biografie-Details, korrekte Struktur, falsche Fakten.
AI-generierte medizinische Falschauskunft: Ein Test 2023 des Deutschen Instituts für Vertrauen und Sicherheit im Internet (DIVSI) zeigte, dass gängige Chatbots auf medizinische Fragen teils lebensbedrohlich falsche Antworten gaben.
Persönlichkeitsrechtsverletzung durch Halluzination: In mehreren Fällen haben KI-Systeme Personen fälschlicherweise mit strafbaren Handlungen in Verbindung gebracht. Ein australischer Bürgermeister drohte 2023 OpenAI mit Klage, nachdem ChatGPT behauptet hatte, er sei wegen Korruption verurteilt worden, ein erfundenes Urteil.

In der Praxis

Für Content-Ersteller und Journalisten: KI ist kein Recherche-Ersatz. Jede sachliche Aussage, jedes Zitat, jede Statistik aus KI-Outputs muss durch unabhängige Quellen verifiziert werden. Das gilt insbesondere für Namen, Daten, Gerichtsurteile, wissenschaftliche Studien und Zitate realer Personen.

Für Unternehmen: KI-generierte Inhalte ohne Faktenprüfung zu veröffentlichen, ist ein Reputationsrisiko. Implementieren Sie QA-Prozesse: menschliches Lektorat, Faktencheck-Software, RAG-Systeme für sachkritische Anwendungen.

Best-Practice-Prompting zur Reduktion von Halluzinationen: Fragen Sie nach Quellen (das Modell gibt sie zwar nicht immer korrekt an, aber die Anforderung erhöht die Präzision). Nutzen Sie Formulierungen wie „Antworte nur, wenn du sicher bist, sonst sage explizit, dass du es nicht weißt." Nutzen Sie RAG-gestützte Systeme für faktenkritische Anwendungen.

Vergleich & Abgrenzung

Halluzinationen vs. [KI-Bias und Diskriminierung](/wiki/genai-content-creation/ki-ethik/ki-bias/): Halluzinationen sind sachlich falsche Aussagen; Bias sind wertend verzerrte, aber möglicherweise „faktisch" formulierte Aussagen. Ein rassistisches Stereotyp in einem KI-Output ist Bias; eine erfundene Statistik ist eine Halluzination. Beide können gleichzeitig auftreten.

Halluzinationen vs. Obsoleszenz: Manche „Fehler" von LLMs sind keine Halluzinationen, sondern veraltete Informationen (Knowledge Cutoff). Das Modell gibt an, was zum Zeitpunkt seines Trainings korrekt war, das ist ein anderes Problem als das Erfinden von Fakten.

Halluzinationen vs. Prompt Injection: Bei Prompt Injection manipulieren Externe das Modell durch bösartige Eingaben. Halluzinationen sind ohne externe Manipulation ein inhärentes Systemmerkmal.

Häufige Fragen (FAQ)

Was muss ich als Kreativer bei KI-Halluzinationen beachten? Behandeln Sie KI-Outputs bei sachlichen Fragen wie Quellen, die einer Gegenkontrolle bedürfen. Etablieren Sie einen Vier-Augen-Prozess für alle KI-generierten Inhalte mit Faktenanspruch. Nutzen Sie RAG-gestützte Tools (Perplexity, Bing Chat) wenn Web-Aktualität wichtig ist. Kommunizieren Sie gegenüber Kunden transparent, wenn KI im Content-Erstellungsprozess beteiligt ist.

Wie entwickelt sich die Halluzinationsproblematik technisch weiter? Neue Modellgenerationen (GPT-4o, Gemini Ultra, Claude 3.5) zeigen deutlich reduzierte Halluzinationsraten gegenüber früheren Versionen. RAG und Grounding-Techniken verbessern sich schnell. Ein vollständiges Eliminieren von Halluzinationen ist bei statistischen LLMs prinzipbedingt schwierig; Reduktion auf akzeptable Fehlerquoten bei verifizierten Anwendungen ist das realistischere Ziel.

Weiterführend

Maynez, J. et al.: „On Faithfulness and Factuality in Abstractive Summarization", ACL, 2020
Rawte, V. et al.: „A Survey of Hallucination in Large Foundation Models", arXiv, 2023
Huang, L. et al.: „A Survey on Hallucination in Large Language Models", arXiv, 2023
OpenAI: „GPT-4 Technical Report", 2023 (inkl. Diskussion Halluzinationen)
Stiftung Warentest: „KI-Assistenten im Test: Halluzinationen und Fehleranfälligkeit", 2024

Was sind KI-Halluzinationen?

Erklärung

Beispiele

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

KI-Halluzinationen (Factual Errors)

Was sind KI-Halluzinationen?

Erklärung

Beispiele

In der Praxis

Vergleich & Abgrenzung

Häufige Fragen (FAQ)

Verwandte Einträge

Weiterführend

Sei am Mittwoch dabei.Bring Eltern oder Freunde mit.

Platz beim Infotag reservieren

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.