`/blend` ist ein Midjourney-Befehl, der zwei bis fünf hochgeladene Bilder visuell zu einem neuen Hybrid-Bild verschmilzt – ohne Text-Prompt, ausschließlich basierend auf den visuellen Eigenschaften der Quellen.
Rubrik: GenAI Content Creation · Unterrubrik: Midjourney · Niveau: Fortgeschritten Synonyme / Auch bekannt als: Image Blending, Bilder mischen, Midjourney-Hybrid, Blend-Befehl, MJ Blend
Was ist /blend?
Mit /blend lassen sich in Midjourney bis zu fünf Bilder hochladen, die das Modell zu einem einzigen neuen Bild kombiniert. Anders als bei /imagine mit Image-Prompts wird kein Text-Prompt eingegeben – das Modell analysiert nur die visuellen Merkmale (Farbe, Komposition, Motiv, Stimmung) der Eingaben und erzeugt eine visuelle Mischung. /blend ist besonders nützlich, wenn man eine ästhetische Synthese will, aber Schwierigkeiten hat, sie in Worten zu formulieren.
Erklärung
/blend wurde mit V4 eingeführt und wird auf Mobilgeräten und im Discord-Workflow besonders gern genutzt, weil das Hochladen von Bildern dort einfacher ist als das Tippen langer Prompts. Der Befehl lautet /blend, danach öffnet sich ein Upload-Dialog: zwei Slots sind Standard, drei bis fünf können über die Optionen hinzugefügt werden. Optional lassen sich Seitenverhältnis (Portrait, Landscape, Square) und Dimensionen wählen.
Im Hintergrund extrahiert Midjourney aus jedem Bild eine semantische und visuelle Repräsentation (ähnlich einem CLIP-Embedding) und kombiniert sie. Das Ergebnis ist nie eine simple Überlagerung, sondern eine echte stilistische und motivische Synthese – ein Porträt wird mit einer Landschaft kombiniert und ergibt eine Figur in dieser Landschaft, oder die Texturen und Farben mischen sich.
Wichtig zu verstehen: /blend versteht keine Text-Anweisungen. Wer feine Kontrolle braucht („das Gesicht von Bild A, der Hintergrund von Bild B"), sollte zu Image-Prompts via /imagine mit URLs greifen, ergänzt durch --cref (Character Reference) und --sref (Style Reference). /blend ist eher ein „kreatives Würfeln", das überraschende ästhetische Ergebnisse liefert.
Seit V6 und V7 wurde der visuelle Synthese-Mechanismus deutlich verbessert. Die kombinierten Bilder wirken kohärenter, weniger wie ein Frankenstein-Mix. Bei stark unterschiedlichen Quellen (etwa Foto plus Strichzeichnung) entstehen aber weiterhin Effekte, die schwer vorhersagbar sind – was Teil des Reizes ist.
Beispiele
- Beispiel 1: Foto einer Berglandschaft + Foto eines Pferdes = Pferd in dieser Berglandschaft, gleicher Lichtton.
- Beispiel 2: Foto eines Strickpullovers + Foto einer Vase = Vase mit Strick-Textur.
- Beispiel 3: Aquarell-Illustration + Foto eines Stadtplatzes = Stadtplatz im Aquarell-Stil.
- Beispiel 4: Porträt einer Frau + Foto einer Sonnenbrille im Retro-Look = die Frau mit dieser Sonnenbrille (Achtung: das Gesicht ähnelt nur grob).
- Beispiel 5: Drei Mode-Editorial-Shots = ein vierter, neuer Editorial-Shot in derselben Ästhetik.
- Beispiel 6: Foto eines Schmuckstücks + Foto einer Strandszene = Schmuckstück in dieser Strandszene fotografiert.
In der Praxis
/blend eignet sich besonders für: Stimmungsboards (Mood Synthesis), Variations-Experimente, schnelle Ideenfindung ohne Prompt-Schreiben, Stil-Übertragungen und für Nutzer, die visuell stärker denken als sprachlich. In Agenturen wird /blend oft im Pitch-Prozess eingesetzt, um aus Referenzbildern des Kunden eine eigene visuelle Richtung abzuleiten.
Tipps für gute Ergebnisse: Bilder sollten thematisch oder farblich eine gemeinsame Basis haben, sonst wird das Ergebnis beliebig. Identische Seitenverhältnisse der Eingaben verbessern die Komposition. Wer mehr Kontrolle braucht, kombiniert /blend nicht direkt, sondern nutzt die Bild-URLs in einem /imagine-Prompt mit ergänzendem Text und Gewichtungen über --iw (Image Weight).
Limitierungen: Text in den Quellbildern wird nicht reproduziert. Gesichter werden nur grob übernommen – wer ein bestimmtes Gesicht braucht, sollte --cref (Character Reference) verwenden. Auch wird /blend keine exakten Logos oder Produktdetails übertragen.
In professionellen Workflows ist /blend selten das Endwerkzeug, aber ein hervorragender Ausgangspunkt: aus dem Blend-Ergebnis Promptideen ableiten, dann mit /imagine finalisieren.
Vergleich & Abgrenzung
/blend wird oft mit Image-Prompts via /imagine verwechselt – beide nutzen Bilder, aber unterschiedlich.
| Merkmal | /blend | /imagine mit Image-Prompt | --sref |
|---|---|---|---|
| Eingabe | nur Bilder | Bilder + Text-Prompt | Bilder als Stil-Referenz |
| Kontrolle | gering, visuell | hoch, textgesteuert | mittel |
| Typische Nutzung | Mood-Mix, Hybride | gezielter Bildaufbau | Stil-Übertragung |
| Bildanzahl | 2–5 | bis zu mehrere URLs | 1–3 sref-Bilder |
Häufige Fragen (FAQ)
Wie viele Bilder kann ich mit /blend kombinieren? Zwei bis maximal fünf Bilder. Standard sind zwei Slots, weitere werden über die Optionen aktiviert. Mehr als fünf Bilder ergeben in Tests selten bessere Ergebnisse – das Modell verliert dann an Kohärenz.
Kann ich /blend mit Text-Prompts kombinieren? Nein, /blend akzeptiert keine Text-Eingabe. Wer Bilder UND Text kombinieren will, nutzt /imagine mit Bild-URLs am Anfang des Prompts und Text dahinter. Beispiel: /imagine [URL1] [URL2] portrait in golden hour --v 6.1.
Welches Seitenverhältnis ist optimal? Wenn alle Quellbilder dasselbe Verhältnis haben, wirkt das Ergebnis kohärenter. Bei stark unterschiedlichen Formaten kann Midjourney Komposition oder Inhalt ungewollt zuschneiden. Im Blend-Dialog lässt sich das Zielformat aber unabhängig wählen.
Funktioniert /blend mit Logos und Text auf Bildern? Schlecht. Text und Logos werden in der Regel nicht erkennbar reproduziert, sondern als abstrakte grafische Elemente uminterpretiert. Für Markenmaterial sollte man andere Tools (Adobe Firefly, Photoshop Generative Fill) nutzen.
Weiterführend
- Midjourney Inc. (2025): Official Documentation: /blend Command. docs.midjourney.com/docs/blend
- Stable Diffusion Art (2024): Image Blending Strategies in Generative AI. stable-diffusion-art.com
- Midjourney Community (2024): Prompt Cookbook. midjourney.com/community
