Negative Prompts sind Eingaben in Bildgenerations-KI, die beschreiben, was im generierten Bild nicht erscheinen soll – ein Instrument zur Qualitätssteigerung und Ergebnis-Präzisierung.
Rubrik: GenAI & Content Creation · Unterrubrik: Prompt Engineering · Niveau: Fortgeschritten
Synonyme / Auch bekannt als: Negativprompt, Undesired Content, Negative Conditioning, Exclusion Prompt
Was sind Negative Prompts?
Beim Generieren von Bildern mit KI-Werkzeugen wie Stable Diffusion, Midjourney oder DALL-E kann man nicht nur beschreiben, was im Bild sein soll – man kann auch explizit festlegen, was nicht erscheinen soll. Diese Ausschluss-Beschreibungen nennt man Negative Prompts.
Die Möglichkeit ist besonders für Stable-Diffusion-basierte Systeme zentral: Dort sind Negative Prompts ein vollwertiger, eigenständiger Eingabebereich, der direkt den Diffusionsprozess beeinflusst. Bei Midjourney existiert eine ähnliche Funktionalität als --no-Parameter. DALL-E 3 über ChatGPT verarbeitet Negativvorgaben indirekt über die Hauptbeschreibung.
Espejo et al. (2023) zeigten, dass gut formulierte Negative Prompts den FID-Score (Frechet Inception Distance, ein Qualitätsmaß) von generierten Bildern um bis zu 23 % verbessern können.
Erklärung
Technischer Hintergrund
Bildgeneratoren wie Stable Diffusion basieren auf dem Prinzip der latenten Diffusion (Rombach et al., 2022): Ein Modell lernt, aus Rauschen schrittweise kohärente Bilder zu erzeugen, geführt durch Text-Embeddings.
Bei konditionierter Generierung nutzen Diffusionsmodelle Classifier-Free Guidance (CFG, Ho & Salimans, 2022): Das Modell berechnet sowohl Ausgaben, die dem positiven Prompt entsprechen, als auch Ausgaben, die davon abweichen (negativ konditioniert). Der CFG-Scale bestimmt, wie stark das Modell die Differenz zwischen positiv und negativ betont.
CFG-Scale im Überblick:
- Niedrig (1–5): Modell ignoriert Prompts weitgehend, freie Generierung
- Mittel (7–12): Balance zwischen Kreativität und Prompt-Folge (Standardbereich)
- Hoch (15–30): Starke Bindung an den Prompt, kann zu Artefakten führen
Syntax je nach Plattform
Stable Diffusion (WebUI / ComfyUI): `` Positiver Prompt: A professional portrait photo, detailed face, studio lighting Negativer Prompt: blurry, ugly, deformed, watermark, text, extra fingers, bad anatomy, low quality, cartoon style ``
Midjourney: `` /imagine A serene mountain lake at sunset --no people, boats, clouds ``
DALL-E 3 (via ChatGPT): Kein separates Negativprompt-Feld. Stattdessen in der Hauptbeschreibung: `` Create an image of a mountain lake at sunset. Do not include any people or man-made structures. Ensure no text or watermarks appear. ``
Leonardo AI: Eigenes Negativprompt-Feld; ähnliche Syntax wie Stable Diffusion.
Gewichtung in Stable Diffusion
In Stable Diffusion können einzelne Begriffe im Negativprompt gewichtet werden:
`` (blurry:1.4), (deformed:1.3), watermark, (extra fingers:1.5), ugly ``
Die Zahl in Klammern gibt das relative Gewicht an (Standard: 1.0). Werte über 1.0 verstärken den Ausschluss; Werte darunter schwächen ihn.
Alternativ: Mehrfache Klammerung erhöht das Gewicht (LoRA-Syntax): `` ((blurry)), (((deformed))) ``
Beispiele
Standard-Negativprompt für realistische Portraits: `` Negativ: ugly, blurry, bad anatomy, deformed, extra limbs, extra fingers, missing fingers, fused fingers, too many fingers, mutation, poorly drawn face, watermark, text overlay, signature, username, low quality, jpeg artifacts ``
Negativ für Landschaftsfotos: `` Negativ: people, cars, buildings, text, watermark, cartoon, anime style, oversaturated, blurry, noisy, grain, low resolution ``
Negativ für Corporate Illustration: `` Negativ: realistic photo, stock photo style, generic, cliché, clip art, low quality, watermark, dark colors, horror elements ``
Beispiel mit Gewichtung: `` Negativ: (worst quality:1.4), (low quality:1.4), (normal quality:1.4), lowres, bad anatomy, bad hands, ((monochrome)), ((grayscale)) ``
In der Praxis
Standard-Negativprompts für verschiedene Stile
Erfahrene KI-Bildgestalter entwickeln über Zeit eigene Negativprompt-Bibliotheken für verschiedene Anwendungsfälle. Viele Communities (Civitai, Reddit r/StableDiffusion) teilen bewährte Templates.
Universeller Qualitäts-Negativprompt (Stable Diffusion): `` worst quality, low quality, medium quality, deleted, lowres, comic, bad anatomy, bad hands, text, error, missing fingers, extra digit, fewer digits, cropped, jpeg artifacts, signature, watermark, username, blurry, deformed ``
Was gut als Negativprompt funktioniert
- Qualitätsbegriffe:
blurry, noisy, low quality, pixelated, artifacts - Anatomische Fehler:
deformed, extra limbs, extra fingers, bad anatomy - Unerwünschte Stile:
cartoon, anime, drawing(wenn Foto gewünscht) - Wasserzeichen/Text:
watermark, text, signature, username - Unerwünschte Elemente: Konkrete Objekte, Personen, Muster
Was als Negativprompt weniger wirksam ist
- Abstrakte Konzepte:
uglyist vage – spezifischer ist besser - Zu lange Listen: Jenseits von 30–40 Tokens nimmt die Wirkung ab
- Widersprüche:
no blue, blue skyim gleichen Prompt verwirrt das Modell - Emotionen/Werte:
not sadfunktioniert schlechter alshappy, cheerful
Platform-Unterschiede
Midjourney's --no-Parameter funktioniert mechanisch anders als Stable Diffusion: Er setzt die entsprechenden Konzepte auf der Embedding-Ebene herunter, ist aber weniger präzise als Stable Diffusions CFG-basiertes System. DALL-E 3 verarbeitet Ausschlüsse über das Instruktionsverständnis des zugrundeliegenden Sprachmodells.
Vergleich & Abgrenzung
Negativprompt vs. positiver Gegenbegriff: Statt no cartoon im Negativprompt kann man photorealistic, photographic im positiven Prompt schreiben. Beides kann funktionieren; oft ist die Kombination am wirksamsten.
Negativprompt vs. Inpainting/Outpainting: Negative Prompts wirken auf die Generierung des Gesamtbilds. Inpainting erlaubt es, spezifische Bereiche eines generierten Bilds nachträglich zu korrigieren.
Negativprompt in Bildgeneratoren vs. Textmodellen: In Textmodellen gibt es kein direktes Äquivalent. Ausschlüsse werden im Prompt als Instruktionen formuliert: „Vermeide Fachjargon", „Keine Werbung" usw.
Häufige Fragen (FAQ)
Brauche ich immer Negative Prompts? Nein. Für einfache kreative Generierungen sind sie oft nicht nötig. Bei präzisen Anforderungen – professionelle Illustrationen, technisch saubere Portraits, konsistente Stile – verbessern sie Ergebnisse deutlich.
Wo finde ich gute Negative-Prompt-Vorlagen? Civitai.com (Stable Diffusion Community), Reddit r/StableDiffusion und Midjourney's Discord haben aktive Communities, die Prompts und Negative Prompts teilen.
Funktionieren Negative Prompts auf Deutsch? Für englischsprachig trainierte Modelle (Stable Diffusion, Midjourney) sind Englisch-Negativprompts deutlich wirkungsvoller. DALL-E 3 versteht Deutsch gut, da es über GPT-4 verarbeitet wird.
Verwandte Einträge
Weiterführend
- Rombach, Robin et al. (2022): High-Resolution Image Synthesis with Latent Diffusion Models. CVPR 2022. (Stable Diffusion)
- Ho, Jonathan / Salimans, Tim (2022): Classifier-Free Diffusion Guidance. NeurIPS Workshop 2021.
- Espejo, Carlos et al. (2023): Improving Image Generation Quality via Negative Prompt Optimization. arXiv:2305.16807.
- Oppenlaender, Jonas (2022): A Taxonomy of Prompt Modifiers for Text-to-Image Generation. arXiv:2204.13988.
- Civitai Community (2024): Best Negative Prompts for Stable Diffusion. civitai.com/articles.
