Sampler und Scheduler in Stable Diffusion definieren gemeinsam den mathematischen Algorithmus, mit dem das Modell in jedem Schritt Rauschen entfernt — sie bestimmen Qualität, Geschwindigkeit und stilistische Charakteristika der Ausgabe.
Rubrik: GenAI & Content Creation · Unterrubrik: Stable Diffusion · Niveau: Fortgeschritten
Was sind Sampler und Scheduler?
Das Kernprinzip von Stable Diffusion ist iteratives Denoising: In jedem Step entfernt das Modell einen Teil des Rauschens aus dem Latent. Welcher mathematische Algorithmus dabei zur numerischen Integration der Differentialgleichung genutzt wird, bestimmt der Sampler. In welchem Rhythmus das Rauschpegel über die Steps abnimmt, bestimmt der Scheduler (auch: Noise Schedule).
Die Unterscheidung ist wichtig: Sampler und Scheduler sind in modernen Frameworks (Diffusers, A1111) oft kombiniert benannt (z. B. „DPM++ 2M Karras"), aber konzeptionell separate Komponenten. Karras ist ein Scheduler; DPM++ 2M ist der Sampler.
Erklärung
Sampler-Kategorien
ODE-basierte Sampler (deterministische, konvergente):
Euler (A): Einfachster ODE-Löser (Euler-Methode). Schnell, stabil, gute Qualität ab 20 Steps. Breite Kompatibilität mit allen Modellen. „Euler A" ist die ancestrale Variante (stochastisch, nie vollständig konvergent — kann bei vielen Steps qualitative Unterschiede zeigen).
Heun: Verbesserte Euler-Methode (Runge-Kutta 2. Ordnung). Bessere Qualität pro effektivem Step, aber doppelt so langsam wie Euler.
DPM-2: Diffeomorphic Posterior Sampling, 2. Ordnung. Gute Qualität, ~doppelt so langsam wie Euler.
DPM++ 2M (Karras): „Diffusion Probabilistic Model Sampler", Multi-Step, 2. Ordnung, mit Karras-Schedule. De-facto-Standard für qualitative Ergebnisse. Sehr gute Qualität ab 20–25 Steps.
DPM++ SDE Karras: Stochastische Differentialgleichung — leicht unterschiedliche, manchmal weichere Ergebnisse. Langsamer als DPM++ 2M.
DPM++ 2M SDE Karras: Kombination — oft als bester Allrounder für SD 1.5 angesehen.
Distillation-Sampler (für destillierte Modelle):
LCM (Latent Consistency Model): Designed für LCM-destillierte Modelle. 4–8 Steps bei guter Qualität. Funktioniert nur korrekt mit LCM-Modellen oder LCM-LoRA.
DPM++ SDE (für SDXL-Lightning): Optimiert für 4-Step-Generierung mit Lightning-Modellen.
Euler (für Flux): Flow-Matching-basierte Modelle wie Flux sind auf Euler-ODE-Löser optimiert.
Scheduler-Typen
Karras: Nichtlinearer Rauschpegel-Abfall — stärkeres Denoising am Anfang, feineres am Ende. Liefert bei den meisten Modellen bessere Details und klarere Kanten. Standard-Empfehlung.
Exponential: Ähnlich wie Karras, leicht andere Kurve. Teils bevorzugt für Flux-Modelle.
SGM Uniform: Ursprünglicher linearer Scheduler. Einfacher, weniger optimiert.
Align Your Steps (AYS): Neuerer Scheduler mit optimierten Step-Zeitpunkten für bestimmte Modelltypen.
Beta: Neuester Karras-Verwandter mit weiterer Optimierung der Rauschabnahme-Kurve.
Steps und Qualität
Die Anzahl der Denoising-Steps beeinflusst Qualität und Generierungszeit:
| Steps | Qualität | Zeit (A1111, RTX 3080) |
|---|---|---|
| 10 | Grob, oft inkohärent | ~2 Sek. |
| 15 | Akzeptabel für Previews | ~3 Sek. |
| 20 | Gut — oft ausreichend | ~4 Sek. |
| 25 | Sehr gut | ~5 Sek. |
| 30 | Exzellent, Standardempfehlung | ~6 Sek. |
| 50 | Minimal besser als 30 | ~10 Sek. |
| 100 | Kaum Unterschied zu 50 | ~20 Sek. |
Mehr Steps liefern für ODE-Sampler (Euler, DPM++) ab ~30 Steps kaum Qualitätssteigerung. Ancestrale Sampler (Euler A, DPM++ SDE) verändern sich jedoch bei mehr Steps und konvergieren nie vollständig.
Schritt-für-Schritt / Einrichtung
Sampler-Auswahl in AUTOMATIC1111
``` Empfohlene Sampler nach Anwendungsfall:
Allgemeiner Standard (SD 1.5 / SDXL): → DPM++ 2M Karras, 25 Steps
Fotorealismus: → DPM++ SDE Karras, 30 Steps
Künstlerische Illustration: → Euler A, 25–30 Steps (stochastisch, variierter)
Schnelle Previews: → Euler, 15 Steps
LCM/Turbo/Lightning (4-Step-Modelle): → LCM / Euler, 4–8 Steps
Flux.1: → Euler, 20–30 Steps ```
X/Y/Z-Plot für Sampler-Vergleich (A1111)
``` Script: X/Y/Z Plot X-Type: Sampler X-Values: Euler, DPM++ 2M Karras, DPM++ SDE Karras, DDIM, LMS Karras Y-Type: Steps Y-Values: 15, 20, 25, 30
→ Erzeugt Vergleichsgrafik aller Kombinationen → Optimale Parameter für das spezifische Modell/Prompt finden ```
Beispiele (5 konkrete Anwendungsfälle)
- Produktionsworkflow mit Konsistenz: Ein Content-Team nutzt für alle Projekt-Bilder denselben Sampler (DPM++ 2M Karras, 25 Steps, Karras-Schedule), um reproduzierbare, konsistente Ergebnisse zu gewährleisten. Parameteränderungen werden nur begründet eingeführt.
- Schnelle Iterations-Previews: Während der Prompt-Entwicklung nutzt der Nutzer Euler mit 12 Steps für 1-Sekunden-Previews. Wenn ein Prompt gefällt, wird auf 30 Steps + DPM++ 2M Karras für die finale Qualität gewechselt.
- Artistisches, variationsreiches Generieren: Für kreative Explorationen wird Euler A (ancestral, stochastisch) genutzt — bei jedem Run entstehen leicht unterschiedliche Bilder auch bei fixem Seed, was neue kreative Richtungen eröffnet.
- Real-Time-Generierung mit LCM-LoRA: Für Live-Demonstrationen oder interaktive Anwendungen wird eine LCM-LoRA mit dem LCM-Sampler in 4–6 Steps kombiniert — Bilder entstehen in unter einer Sekunde auf einer RTX-GPU.
- Flux-Produktionspipeline: Ein Medienunternehmen nutzt Flux.1 Schnell mit Euler-Sampler und 8 Steps für kommerzielle Batch-Generierung — optimale Balance zwischen Apache-2.0-Lizenz, Qualität und Generierungsgeschwindigkeit.
In der Praxis
Sampler-Empfehlungen nach Modellgeneration
SD 1.5: DPM++ 2M Karras (Qualität) oder Euler A (Variationen)
SDXL: DPM++ 2M Karras oder DPM++ 2M SDE Exponential; für Schnell-Modelle: Euler mit entsprechendem Schedule
Flux: Euler mit Exponential- oder Linear-Schedule; 20–30 Steps für Dev, 4–8 für Schnell
Scheduler-Kompatibilität
Nicht alle Scheduler funktionieren mit allen Samplern. In A1111 wird dies automatisch validiert. In ComfyUI (KSampler-Node) sind Scheduler als separate Dropdown-Liste konfigurierbar — Falschkombinationen können zu Artefakten führen.
Vergleich & Abgrenzung
| Sampler | Steps (min.) | Qualität | Speed | Stochastisch |
|---|---|---|---|---|
| Euler | 20 | Gut | Sehr schnell | Nein |
| Euler A | 20 | Gut | Sehr schnell | Ja |
| DPM++ 2M Karras | 20 | Sehr gut | Schnell | Nein |
| DPM++ SDE Karras | 25 | Sehr gut | Mittel | Ja |
| Heun | 20 | Gut | Langsam (2× Eval.) | Nein |
| LCM | 4 | Mittel (für 4 Steps) | Sehr schnell | Nein |
| DDIM | 30 | Gut | Mittel | Nein |
Häufige Fragen (FAQ)
F: Was ist der Unterschied zwischen DPM++ 2M und DPM++ 2M Karras? Der Unterschied liegt ausschließlich im Scheduler (Noise Schedule): DPM++ 2M ohne Karras nutzt einen linearen Rauschpegel-Abfall; DPM++ 2M Karras nutzt den nichtlinearen Karras-Schedule, der mehr Denoising-Kapazität in den frühen Steps konzentriert, wo grobe Strukturen entstehen. In der Praxis liefert die Karras-Variante konsistent bessere Ergebnisse — daher sollte immer „Karras" bevorzugt werden.
F: Welchen Sampler verwendet Midjourney? Midjourney nutzt einen proprietären Sampler, der nicht direkt mit SD-Samplern vergleichbar ist. Midjourney ist auf höchste Out-of-the-Box-Qualität optimiert, ohne Parameter-Kontrolle für Nutzer. SD-Nutzer haben dagegen volle Kontrolle über Sampler, Steps und Schedule — auf Kosten der Einarbeitungszeit.
Verwandte Einträge
- CFG Scale — Der andere Schlüsselparameter neben Sampler und Steps
- Stable Diffusion Grundlagen — Wie der Denoising-Prozess grundlegend funktioniert
- ComfyUI Workflows — Sampler-Konfiguration in ComfyUI's KSampler-Node
Weiterführend
- Karras, T. et al. (2022). Elucidating the Design Space of Diffusion-Based Generative Models. NeurIPS.
- Song, Y. et al. (2020). Denoising Diffusion Implicit Models (DDIM).
- LCM: Luo, S. et al. (2023). Latent Consistency Models.
- A1111 Sampler-Wiki:
