← Zurück zu GenAI & Content Creation
Checkpoints (auch: Modelle) in Stable Diffusion sind trainierte Gewichtsdateien, die alle gelernten Parameter eines Bildgenerierungsmodells enthalten — von der offiziellen Stability-AI-Basis bis zu Community-Fine-Tunes für spezifische Stile.

Rubrik: GenAI & Content Creation · Unterrubrik: Stable Diffusion · Niveau: Fortgeschritten


Was sind Modelle und Checkpoints?

Ein Checkpoint ist eine vollständige Momentaufnahme der Modellgewichte zu einem bestimmten Trainingsstand. Bei Stable Diffusion umfasst das die Gewichte des U-Nets, des CLIP-Encoders und (oft) des VAEs — zusammen mehrere Gigabyte pro Datei.

Die Open-Source-Natur von Stable Diffusion hat ein riesiges Ökosystem an Community-Fine-Tunes geschaffen. Auf Plattformen wie Civitai und Hugging Face sind Tausende spezialisierter Modelle für Fotorealismus, Anime, Fantasy-Illustration, Architektur und mehr verfügbar.


Erklärung

Modell-Kategorien

Basis-Modelle (Official):

  • SD 1.4, SD 1.5: Die ursprünglichen Stability-AI-Modelle. Breite Kompatibilität, solide Qualität, riesiges Fine-Tune-Ökosystem.
  • SD 2.0, SD 2.1: Verbesserte Architektur, aber geringere Community-Adoption wegen schwächerer Out-of-the-Box-Ergebnisse.
  • SDXL 1.0: Aktuelle Stability-AI-Basis, 1024px nativ, sehr viele Community-Fine-Tunes.
  • Flux.1 Dev/Schnell: Black Forest Labs, 12 Mrd. Parameter, nächste Generation.

Fotorealismus-Modelle (Community):

  • Realistic Vision V6: Sehr verbreitetes SD-1.5-basiertes Fotorealismus-Modell
  • AbsoluteReality: Photorealistische Portraitgenerierung
  • Juggernaut XL V9: SDXL-basiert, exzellenter Fotorealismus
  • RealVisXL V5: Weitere SDXL-Fotorealismusvariante

Künstlerische/Illustrative Modelle:

  • Deliberate: Detailreiche, düstere Illustrationen (SD 1.5)
  • DreamShaper XL: Vielseitiger Allrounder (SDXL)
  • Playground v2.5: Sehr qualitative Bildkomposition (SDXL-Basis)

Anime/Manga-Modelle:

  • AnythingV5, AbyssOrangeMix3: SD-1.5-basierte Anime-Modelle
  • Animagine XL 3.0: SDXL-basiertes Anime-Modell

Spezialmodelle:

  • Inpainting-Checkpoints (z. B. SD-inpainting-1.5): Für Inpainting optimiert
  • Pix2Pix-Modelle: Für bildgesteuerte Transformation
  • Cascaded-Modelle (Stable Cascade): Dreistufige Architektur für hohe Qualität

Dateiformat: Safetensors vs. CKPT

CKPT (Pickle-Format): Das ursprüngliche PyTorch-Checkpoint-Format. Problematisch: CKPT-Dateien können beliebigen Python-Code einbetten, der beim Laden ausgeführt wird — ein ernsthaftes Sicherheitsrisiko (Code Execution Exploit).

Safetensors: Von Hugging Face entwickeltes sicheres Format. Enthält ausschließlich Tensordaten, kein ausführbarer Code. Schnelleres Laden, geringerer Speicherbedarf. Inzwischen Industriestandard.

Empfehlung: Ausschließlich .safetensors-Dateien herunterladen. CKPT-Dateien nur aus absolut vertrauenswürdigen Quellen (Stability AI offizielle Releases) akzeptieren.


Schritt-für-Schritt / Einrichtung

Modelle von Civitai laden

```

  1. civitai.com → Models → Typ: Checkpoint
  2. Filter nach Base Model: SD 1.5 / SDXL 1.0 / Flux
  3. Modell-Seite: Auf Safetensors-Datei achten
  4. Direkt herunterladen oder:

Extensions → Civitai Helper Modell-URL eingeben → Download → Lädt automatisch in richtigen Ordner

```

Modelle von Hugging Face laden

```bash pip install huggingfacehub huggingface-cli download stabilityai/stable-diffusion-xl-base-1.0 \ sdxlbase1.0.safetensors \ --local-dir ./models/Stable-diffusion/

```

Checkpoint-Merging in AUTOMATIC1111

`` Checkpoint Merger Tab: Primary model: ModelA.safetensors Secondary model: ModelB.safetensors Tertiary model: (optional) ModelC.safetensors Multiplier: 0.5 (50% A, 50% B) Interpolation method: - Weighted sum: Einfachste Methode, Standardwahl - Sigmoid: Glattere Gewichtungsverteilung - Inverse sigmoid: Inverse Glättung - Add difference: C = A + (B - C) × multiplier ``


Beispiele (5 konkrete Anwendungsfälle)

  1. Markenstil via spezifischem Checkpoint: Eine Agentur wählt DreamShaper XL für Fantasie-Imagery und Juggernaut XL für fotorealistische Kampagnen. Zwei Modelle für zwei klar getrennte Bildsprachen — konsistente Qualität ohne Prompt-Anpassungen.
  2. Modell-Merging für Hybrid-Ästhetik: Zwei Modelle — ein Fotorealismus-Checkpoint und ein Anime-Stil-Checkpoint — werden 70/30 gemerged. Das Ergebnis: Anime-Charaktere mit fotorealistischen Beleuchtungseigenschaften.
  3. Safetensors-Migration alter Projekte: Ältere CKPT-Modelle werden mit dem A1111-Checkpoint-Merger (Primary = CKPT, kein Secondary, Multiplier 0) in Safetensors-Format konvertiert — sicher und schneller ladend.
  4. Fine-Tune-Evaluation vor Produktion: Bevor ein neues Community-Modell produktiv eingesetzt wird, wird es auf einem standardisierten Test-Prompt-Set evaluiert: Photorealismus-Test, Anatomie-Test (Hände, Gesichter), Stil-Konsistenz, NSFW-Neigung.
  5. Modell-Zoo für Team-Workflows: Ein Content-Team hält einen kuratierten Ordner mit 5–8 getesteten Modellen für verschiedene Einsatzzwecke bereit. Jedes Modell hat eine README-Notiz mit optimalen Parametern, empfohlenen VAEs und bekannten Schwächen.

In der Praxis

Modell-Dateigröße und VRAM

ModellDateigrößeVRAM (FP16)
SD 1.5~2,0 GB4–6 GB
SDXL 1.0 Base~6,5 GB8–10 GB
SDXL + Refiner~13 GB12–16 GB
Flux.1 Dev~23,8 GB12–16 GB
Flux.1 Dev NF4~8 GB8–10 GB

Modell-Versionierung

Modelle auf Civitai werden oft in mehreren Versionen veröffentlicht (V1, V2, V3...). Neuere Versionen sind nicht automatisch besser für jeden Anwendungsfall. Vor dem Wechsel: Beispielbilder und Community-Feedback vergleichen.

Sicherheits-Checkliste für neue Modelle

  • Nur .safetensors herunterladen
  • Civitai oder Hugging Face als Quellen bevorzugen (Modell-Scanning aktiv)
  • Modell-Kommentare und Bewertungen lesen
  • NSFW-Status des Modells vor Team-Nutzung prüfen
  • Lizenz-Angabe beachten (CreativeML OpenRAIL, MIT, kommerziell/nicht-kommerziell)

Vergleich & Abgrenzung

FormatSicherheitLadegeschwindigkeitVerbreitung
.safetensorsSehr hochSehr schnellIndustrie-Standard
.ckptGering (Code-Exec.)LangsamerLegacy
.ptGeringMittelSelten (Embeddings)
GGUF (Flux)HochSchnellWachsend (Flux)

Häufige Fragen (FAQ)

F: Sind alle Civitai-Modelle sicher zum Download? Civitai scannt Modelle automatisch mit ClamAV und eigenen Sicherheitstools. Safetensors-Dateien sind per Design sicher (kein ausführbarer Code). CKPT-Dateien sollten auch von Civitai nur nach sorgfältiger Prüfung heruntergeladen werden. Das Hauptrisiko auf Civitai sind nicht Malware, sondern Urheberrechtsfragen (Modelle, die unerlaubt auf urheberrechtlich geschütztem Material trainiert wurden).

F: Kann ich Modelle kommerziell nutzen? Das hängt von der jeweiligen Lizenz ab. SD 1.5 und SDXL stehen unter CreativeML OpenRAIL-Lizenzen, die kommerzielle Nutzung erlauben (mit Einschränkungen). Viele Community-Modelle haben identische oder freizügigere Lizenzen. Flux.1 Dev ist nicht-kommerziell; Flux.1 Schnell (Apache 2.0) ist kommerziell. Immer die Lizenz des spezifischen Modells prüfen.


Verwandte Einträge

  • LoRA Training — LoRAs als kleinere Modell-Ergänzungen
  • VAE — Der VAE-Anteil im Checkpoint
  • Flux — Die nächste Modell-Generation

Weiterführend

  • Rombach, R. et al. (2022). High-Resolution Image Synthesis with Latent Diffusion Models. CVPR.
  • Civitai Modell-Plattform:
  • Hugging Face Model Hub:
  • Safetensors Format:
  • Stability AI offizielle Modelle:
← Zurück zu GenAI & Content Creation
Infotag · 13. Mai · 15:00 Uhr · Vor Ort

Sei am Mittwoch dabei.
Bring Eltern oder Freunde mit.

Ein halber Nachmittag, der dir drei Jahre Klarheit bringen kann. Kostenlos, unverbindlich, ehrlich.

  • Rundgang durch Studios, Schnitträume und Tonstudio
  • Echte Absolventenfilme sehen
  • 1:1-Beratung zu Bewerbung & BAföG
  • Studierende direkt fragen
  • Kaffee, kein Sales-Pitch
  • Auch online möglich

Platz beim Infotag reservieren

Dauert 30 Sekunden. Bestätigung per E-Mail.
100 % kostenlos · keine Verpflichtung · jederzeit absagbar