Flux ist die Bildgeneratoren-Familie des deutschen Start-ups Black Forest Labs, gegründet 2024 von ehemaligen Stable-Diffusion-Entwickler:innen, mit den drei Modellen Flux Pro, Flux Dev und Flux Schnell als neuen State of the Art bei Bild-KI.
Rubrik: GenAI & Content Creation · Unterrubrik: KI-Bildgeneratoren · Niveau: Fortgeschritten Synonyme / Auch bekannt als: FLUX.1, BFL, Black Forest, Flux Pro/Dev/Schnell
Was ist Flux?
Flux ist eine Reihe von text-zu-bild-generativen KI-Modellen, entwickelt vom 2024 in Freiburg gegründeten Start-up Black Forest Labs. Das Team besteht aus Forscher:innen, die zuvor an Stable Diffusion bei Stability AI gearbeitet haben (u.a. Robin Rombach, Andreas Blattmann, Dominik Lorenz). Flux gilt aktuell als eines der leistungsstärksten Open-Source-Bildmodelle und konkurriert direkt mit Midjourney V6 und DALL·E 3.
Erklärung
Flux wurde im August 2024 in drei Varianten veröffentlicht, die unterschiedliche Lizenz- und Nutzungsstufen abdecken:
| Modell | Lizenz | Stärke | Geeignet für |
|---|---|---|---|
| Flux Pro | Kommerziell, API-only | Höchste Qualität, beste Prompt-Treue | Agenturen, Produktion |
| Flux Dev | Non-commercial / Forschung | Sehr hoch, lokal nutzbar | Tüftler, ComfyUI-User |
| Flux Schnell | Apache 2.0 (offen) | Schnell, gute Qualität | Tests, kommerzielle Open-Source-Nutzung |
Architektonisch nutzt Flux einen Rectified Flow Transformer mit 12 Milliarden Parametern – deutlich mehr als SDXL (3,5 Mrd.) und in der Familie der Multimodal Diffusion Transformer (MM-DiT), dieselbe Architektur-Idee wie SD3, aber mit deutlich verbesserter Implementation.
Stärken von Flux:
- Außerordentliche Prompt-Treue: Komplexe, lange Prompts werden präziser umgesetzt als bei SDXL und oft besser als bei Midjourney V6.
- Text-Rendering: Eingebetteter Text in Bildern (Schilder, Buchtitel, Beschriftungen) funktioniert deutlich zuverlässiger als bei SD-Modellen.
- Anatomie: Hände, Finger und Augen werden mit weniger Artefakten generiert.
- Stil-Vielfalt: Foto, Illustration, 3D-Render werden alle in hoher Qualität geliefert, ohne dass spezielle LoRAs nötig sind.
Schwächen:
- Hardware-Anforderungen: Flux Dev braucht mindestens 24 GB VRAM (RTX 4090, A100); reduzierte Quantisierungen (Q4_K, NF4) ermöglichen Betrieb auf 12-GB-Karten, aber mit Qualitätsverlust.
- Lizenz: Flux Dev darf nicht direkt kommerziell genutzt werden – kommerzielle Nutzung erfordert Flux Pro oder Flux Schnell (Apache 2.0).
- Geschwindigkeit: Flux Dev braucht auf einer RTX 4090 etwa 15–30 Sekunden pro Bild bei 1024×1024 – langsamer als SDXL.
Im Oktober 2024 wurde Flux 1.1 Pro veröffentlicht, im Dezember 2024 Flux 1.1 Pro Ultra (4-Megapixel-Modus). Im Open-Source-Bereich folgten Flux Tools (Inpaint, Outpaint, Depth, Canny – Pendants zu ControlNet) und Flux Redux für Bildvariationen.
Beispiele
- Beispiel 1 (Werbebild mit Text): „Movie poster for 'Quantum Echoes', large title text, sci-fi atmosphere, neon city" – Flux schreibt den Titel direkt ins Bild, in lesbarer Typografie.
- Beispiel 2 (Komplexes Prompt-Setup): „A bearded chef with a blue apron is holding a knife, slicing red tomatoes on a wooden cutting board, sunlight streaming through a window on the left" – Flux liefert exakt diese Komposition, während Midjourney und SDXL oft Details verfehlen.
- Beispiel 3 (Hochaufgelöstes Produkt-Visual): Flux 1.1 Pro Ultra erzeugt 4-Megapixel-Bilder (2048×2048) ohne Upscaling, ideal für Print und große Banner.
- Beispiel 4 (Lokaler ComfyUI-Workflow): Flux Dev in ComfyUI mit T5-Text-Encoder + CLIP-L + VAE, ausgeführt auf einer RTX 4090, mit GGUF-Quantisierung für 16-GB-Karten.
- Beispiel 5 (Schneller Iterations-Workflow): Flux Schnell läuft mit 4 Diffusion-Steps in unter 3 Sekunden auf einer RTX 3090 – ideal für Echtzeit-Mockups.
- Beispiel 6 (LoRA-Training): Flux Dev wird zunehmend mit eigenen LoRAs trainiert (Replicate, fal.ai, lokale Tools wie Kohya SS); Charakterkonsistenz für Branding und IP-Content wird damit möglich.
In der Praxis
Wer Flux produktiv einsetzen will, hat drei Wege: über API-Anbieter (Replicate, fal.ai, Together.ai, Black Forest Labs API), lokal via ComfyUI (mit Flux Dev oder Schnell GGUF-Files) oder über Frontends wie Krea, Freepik Pikaso, Leonardo und Glif, die Flux integriert haben.
Für Studios empfiehlt sich Flux Pro über die offizielle BFL-API für maximale Qualität (ab ca. $0,05/Bild) oder Flux 1.1 Pro Ultra für Print-Anwendungen. Open-Source-Nutzer:innen wählen Flux Dev (für eigene Experimente, nicht-kommerziell) oder Flux Schnell (offene Lizenz, kommerziell nutzbar).
ComfyUI ist das natürliche Heimat-Tool für Flux: Workflows mit Flux + ControlNet (Flux Canny, Depth, Pose) + LoRA + Image-to-Image sind dort etablierter Standard. Tools wie InvokeAI und Forge unterstützen Flux ebenfalls.
Bei lokalem Betrieb auf weniger als 24 GB VRAM ist eine Quantisierung (FP8, NF4, Q4KM) unverzichtbar – Modelle wie „flux1-dev-Q4KS.gguf" laufen auf 12-GB-Karten, mit etwa 20% Qualitätsverlust gegenüber FP16.
Vergleich & Abgrenzung
| Merkmal | Flux Pro | Midjourney V6 | SDXL | DALL·E 3 |
|---|---|---|---|---|
| Prompt-Treue | Sehr hoch | Hoch | Mittel | Sehr hoch |
| Text im Bild | Sehr gut | Schwach | Schwach | Sehr gut |
| Open Source | Nur Schnell/Dev | Nein | Ja | Nein |
| Lokal nutzbar | Dev/Schnell | Nein | Ja | Nein |
| Preis | API ab $0,05 | Abo ab $10/Mt | Kostenlos | API |
Flux ersetzt für viele Nutzer:innen SDXL als „Standard-Open-Source-Modell" und tritt im Premium-Bereich gegen Midjourney an. Für stilisierte Illustration bleibt Midjourney teils überlegen, für Foto-Realismus und Text-Treue gilt Flux mittlerweile als Maßstab.
Häufige Fragen (FAQ)
Darf ich Flux Dev kommerziell nutzen? Nein – Flux Dev hat eine eigene Non-Commercial-Lizenz. Für kommerzielle Nutzung gibt es zwei Optionen: Flux Schnell (Apache 2.0, frei nutzbar) oder Flux Pro über die BFL-API mit kommerziellen Nutzungsrechten. Bei Replicate und fal.ai sind die Lizenzbedingungen jeweils in den ToS geregelt.
Was sind die Hardware-Anforderungen für Flux lokal? Flux Dev in voller FP16-Präzision braucht ca. 24 GB VRAM (RTX 4090, A6000). Mit GGUF-Quantisierung (Q4KM) reichen 12 GB (RTX 3060 12GB), allerdings bei reduzierter Qualität. Flux Schnell ist genügsamer, läuft mit FP8 auf 16-GB-Karten flüssig.
Wo finde ich gute Flux-LoRAs? Civitai (civitai.com) ist die größte Sammlung, mit eigener Flux-Kategorie. fal.ai und Replicate bieten gehostete LoRA-Trainings. Beim Download auf die Lizenz des Basismodells achten – LoRAs für Flux Dev können nur in nicht-kommerziellen Settings genutzt werden.
Weiterführend
- Black Forest Labs (2024): Announcing FLUX.1 – Official Launch Blog. blackforestlabs.ai/announcing-black-forest-labs
- Esser, Patrick et al. (2024): Scaling Rectified Flow Transformers for High-Resolution Image Synthesis. arxiv.org/abs/2403.03206
- Black Forest Labs (2024): Flux.1 Model Card. huggingface.co/black-forest-labs/FLUX.1-dev
- ComfyUI Documentation (2024): Flux Workflows. comfyanonymous.github.io/ComfyUI_examples/flux
