KI-Bildgenerierung Workflow bezeichnet den strukturierten Prozess von der Aufgabenanalyse über die Tool-Auswahl und das Prompt-Engineering bis zur fertigen, rechtlich geprüften Bildausgabe.
Rubrik: GenAI & Content Creation · Unterrubrik: KI-Workflows · Niveau: Einsteiger Synonyme / Auch bekannt als: KI-Bildproduktion, AI Image Workflow, generative Bildproduktion, KI-Bildworkflow
Was ist ein KI-Bildgenerierungs-Workflow?
Ein KI-Bildgenerierungs-Workflow ist ein systematischer, wiederholbarer Prozess für die Produktion hochwertiger, zweckorientierter Bilder mit KI-Tools. Statt ad hoc Prompts auszuprobieren, hilft ein strukturierter Workflow dabei, konsistente Qualität zu erzielen, Zeitaufwand zu reduzieren und rechtliche sowie qualitative Standards einzuhalten. Dieser Workflow ist für Einzelkreative ebenso anwendbar wie für Agenturen, die mehrere Kunden parallel bedienen.
Erklärung
Schritt 1: Briefing und Anforderungsanalyse
Bevor ein Prompt geschrieben wird, müssen die Anforderungen klar sein:
- Verwendungszweck: Wo wird das Bild eingesetzt? (Print, Web, Social Media, Billboard) → bestimmt Auflösung und Format
- Zielgruppe: Wer sieht das Bild? → beeinflusst Stil und Ansprache
- Kernbotschaft: Was soll das Bild kommunizieren?
- Marken-Kontext: Gibt es einen bestehenden visuellen Stil, Farbpaletten oder Logorichtlinien?
- Rechtliche Anforderungen: Ist das Bild für kommerzielle Nutzung? Werden echte Personen gezeigt?
- Technische Vorgaben: Seitenverhältnis, Mindestauflösung, Dateiformat (JPEG, PNG, TIFF)
Ein kurzes schriftliches Briefing, das diese Punkte beantwortet, spart später viel Iterationszeit.
Schritt 2: Tool-Wahl je nach Anwendungsfall
Nicht jedes KI-Bildtool passt zu jedem Anwendungsfall. Eine Übersicht:
Adobe Firefly ist die erste Wahl für:
- Kommerzielle Projekte mit Lizenzsicherheit
- Integration in bestehende Adobe-Workflows (Photoshop, Illustrator)
- Korrekturen und Erweiterungen an vorhandenen Bildern (Generative Fill/Expand)
- Unternehmens- und Agentur-Content
Midjourney ist die erste Wahl für:
- Hochwertige kreative und ästhetische Bilder (Illustrationen, Konzeptkunst, Mood Boards)
- Schnelles Iterieren über viele Stil-Varianten
- Künstlerische Kampagnenbilder und Editorial-Fotografie-Imitation
Stable Diffusion (AUTOMATIC1111 oder ComfyUI) ist die erste Wahl für:
- Maximale technische Kontrolle und Anpassbarkeit
- Datenschutzkritische Projekte (lokale Verarbeitung, keine Cloud)
- Fine-Tuning auf eigene Bildstile oder Charaktere
- Kostenminimierung bei hohem Volumen
DALL·E 3 / ChatGPT ist die erste Wahl für:
- Schnelle Visualisierungen aus einem bestehenden ChatGPT-Workflow
- Bilder mit Textdarstellungen (Infografiken, Beschriftungen)
- Einsteigerinnen und Einsteiger ohne Vorerfahrung
Schritt 3: Prompt-Engineering für Bilder
Ein guter Bild-Prompt folgt einer bewährten Struktur:
[Motiv] + [Stil] + [Komposition] + [Licht] + [Kamera/Technik] + [Parameter]
Beispiel (für Midjourney): „Professionelles Porträtfoto einer lächelnden Ärztin mittleren Alters, moderne Klinik-Umgebung, sanftes Studiogroupenlicht von links, Halbnahaufnahme, Canon EOS R5, Tiefenschärfe, warme Farbtöne, authentisch und einladend –ar 2:3 –v 6.1 –style raw"
Stilangaben: Fotografiestil (Portrait, Editorial, Produktfoto, Lifestyle), Malstil (Aquarell, Öl, Digital Art, Vektorgrafik), Referenzkünstler (nur ohne namentliche Nennung bei kommerziellen Tools), Epochen (1970s-Filmkörnung, Renaissance-Komposition)
Kompositonsangaben: Nahaufnahme, Weitwinkel, Vogelperspektive, Froschperspektive, Goldener Schnitt, Rule of Thirds, symmetrisch
Lichtangaben: natürliches Licht, goldene Stunde, Studioblitzlicht, Neonlicht, Kerzenschein, dramatische Schatten, High-Key, Low-Key
Kamera-Parameter: Brennweite (85mm Porträt, 24mm Weitwinkel), Blende (f/1.8 für Bokeh, f/11 für Schärfe), Film-Simulation (Kodak Portra, Fujifilm Velvia)
Schritt 4: Iteration und Auswahl
Keine Bild-KI liefert beim ersten Versuch das perfekte Ergebnis. Empfohlene Iterations-Strategie:
- Erst breit, dann eng: Mit einer allgemeinen Beschreibung beginnen, vier Varianten generieren, die beste auswählen und dann gezielt verfeinern.
- Ein Element nach dem anderen anpassen: Bei jeder Iteration nur eine Variable ändern (z. B. Licht), um den Effekt nachvollziehen zu können.
- Prompts dokumentieren: Erfolgreiche Prompts speichern und in einer Prompt-Bibliothek ablegen, die für ähnliche Projekte wiederverwendet werden kann.
- Seed verwenden (Midjourney): Den --seed-Parameter einsetzen, um reproduzierbare Ausgangspunkte zu sichern.
Schritt 5: Nachbearbeitung
KI-generierte Bilder sind selten direkt verwendungsfertig. Typische Nachbearbeitungsschritte:
- Adobe Photoshop: Feinretusche (fehlerhafte Details bei Händen, Text im Bild), Belichtungsanpassungen, Farbraum-Konvertierung für Print (RGB → CMYK), Upscaling für Printformate
- Adobe Lightroom: Konsistente Farbgebung über Bildserien (z. B. für Kampagnen)
- Topaz Photo AI / Gigapixel: KI-basiertes Upscaling für höhere Auflösungen
- Remove.bg oder Photoshop Freistellen: Hintergrundentfernung für Compositing
Schritt 6: Rechtlicher Check vor Veröffentlichung
- Welches Tool wurde genutzt? Lizenzbedingungen prüfen.
- Werden echte Personen erkennbar dargestellt? Einwilligung erforderlich.
- Enthält das Bild Logos, Marken, bekannte Orte mit Bildrecht (z. B. Eiffelturm bei Nacht)?
- Für kommerzielle Kampagnen: Besteht urheberrechtliches Risiko durch Trainingsdaten?
- EU AI Act: Muss das Bild als KI-generiert gekennzeichnet werden?
Schritt 7: Übergabe und Dokumentation
Bei professionellen Projekten gehört zur Bildablieferung eine kurze Dokumentation: Welches Tool wurde genutzt, welcher Prompt, welche Nachbearbeitung? Das schützt bei späteren Rechtsfragen und ermöglicht die Reproduzierbarkeit.
Beispiele
- Kampagnen-Headerbild: Eine Agentur generiert per Midjourney zwölf Bild-Varianten für eine Frühjahrskampagne, wählt drei aus, überarbeitet sie in Photoshop mit Generative Expand für verschiedene Formate (Web, Print, Social Media) und dokumentiert Prompts und Lizenzsituation.
- E-Commerce-Produktbilder: Ein Online-Shop generiert 200 Produktbilder in einheitlichem Lifestyle-Setting mit Stable Diffusion + ControlNet (Produktfotos als Compositing-Grundlage), spart damit Produktionsstudiotage und ermöglicht konsistente visuelle Qualität.
- Redaktionelles Headerbild: Eine Onlineredaktion erstellt per Adobe Firefly ein illustratives Headerbild für einen Artikel, das eine abstrakte Metapher visualisiert – rechtssicher und innerhalb der Produktionszeit von 15 Minuten.
In der Praxis
Für den Einstieg: Mit Adobe Firefly und einfachen Beschreibungen beginnen; parallel Midjourney für kreativere Projekte testen. Einen persönlichen Prompt-Baukasten aufbauen, der für häufige Aufgaben passende Grundformeln enthält. Qualitätskontrolle nie überspringen: Jedes KI-Bild kurz auf anatomische Fehler, unlogische Details und Markenkonsistenz prüfen.
Vergleich & Abgrenzung
Der KI-Bildgenerierungs-Workflow unterscheidet sich von einem reinen Stockfoto-Workflow durch die kreative Gestaltungsfreiheit und Individualisierbarkeit bei niedrigeren Kosten. Er unterscheidet sich von manueller Illustration durch Geschwindigkeit und niedrigere Einstiegskosten, aber auch durch geringere absolute Originariät und stilistische Einschränkungen. Die Kombination beider Ansätze – KI als Grundlage, menschliche Nachbearbeitung – ist oft die professionellste Lösung.
Häufige Fragen (FAQ)
Welche Auflösung liefern KI-Bilder standardmäßig? Die meisten Tools liefern 1024×1024 bis 2048×2048 Pixel. Für Webnutzung ist das in der Regel ausreichend. Für professionellen Druck (300 DPI, A4) braucht man mindestens 2480×3508 Pixel. KI-Upscaling-Tools wie Topaz Gigapixel AI oder das integrierte Upscaling in Midjourney (–upbeta) können die Auflösung erhöhen, ohne Qualitätsverlust.
Wie verhindert man, dass KI-Bilder in einer Kampagne alle gleich aussehen? Durch Variation in Prompt-Elementen: Unterschiedliche Kompositionsvorgaben, Lichtstimmungen, Farbpaletten und Kamera-Simulationen. Style Reference (Midjourney –sref) kann paradoxerweise helfen, einen konsistenten visuellen Stil zu halten, während Inhalte variieren. Eine manuelle Curations-Phase – nur die stärksten Bilder weiterverwenden – verhindert generische Gleichförmigkeit.
Verwandte Einträge
Weiterführend
- Oppenlaender, J. (2022): Prompt Engineering for Text-Based Generative Art. arXiv:2204.13988
- Adobe (2024): Adobe Firefly – Getting Started for Creative Professionals. adobe.com/creativecloud/photography/discover/ai-photo
- Kling, S. / Fischer, M. (2024): KI-Bildgenerierung im Praxistest – Workflow für Agenturen. PAGE Magazin, Ausgabe 2/2024
