Image Prompts in Midjourney ermöglichen es, eine Bild-URL als visuelle Eingabe zu verwenden, die neben dem Textprompt als Stil- oder Inhaltsreferenz in die Generierung einfließt.
Rubrik: GenAI & Content Creation · Unterrubrik: Midjourney · Niveau: Fortgeschritten Synonyme / Auch bekannt als: Bildreferenz, Image URL Input, Visual Prompt, Bild-als-Prompt
Was sind Image Prompts?
Image Prompts sind eine Kernfunktion in Midjourney, mit der ein oder mehrere vorhandene Bilder als visuelle Eingabe in den Generierungsprozess eingebunden werden. Das Bild wird gemeinsam mit dem Textprompt verarbeitet und beeinflusst Stil, Farbpalette, Komposition oder Inhalt des generierten Ergebnisses.
Im Gegensatz zu den neueren --sref- und --cref-Parametern, die gezielt Stil bzw. Charakter extrahieren, wirkt ein Image Prompt ganzheitlich auf die Ausgabe.
Erklärung
Syntax: `` /imagine prompt: [BILD-URL] [Textbeschreibung] [Parameter] ``
Die Bild-URL steht am Anfang des Prompts, vor dem Text. Mehrere Bilder können nacheinander aufgeführt werden: `` /imagine prompt: [URL1] [URL2] [Textbeschreibung] [Parameter] ``
Bild hochladen: Da Midjourney externe URLs benötigt, muss das Bild zuerst zugänglich sein:
- Discord: Bild direkt in den Discord-Chat hochladen → Rechtsklick → „Linkadresse kopieren"
- Midjourney Web: Über das Web-Interface direkt hochladbar
- Externe URL: Jede öffentlich zugängliche Bild-URL (HTTPS) funktioniert
Wie beeinflusst das Bild die Generierung?
Das Referenzbild wird intern in einen Vektor-Embedding-Raum transformiert und mit dem Text-Prompt-Embedding kombiniert. Die Stärke dieses Einflusses wird durch --iw (Image Weight) gesteuert:
| --iw Wert | Bildeinfluss |
|---|---|
| 0 | Kein Einfluss des Referenzbildes |
| 0.5 | Schwacher Einfluss |
| 1 (Standard) | Ausgeglichener Einfluss |
| 1.5 | Starker Bildeinfluss |
| 2 | Maximaler Bildeinfluss, Bild dominiert |
Syntax mit --iw: `` /imagine prompt: [BILD-URL] [Textbeschreibung] --iw 1.5 ``
Was wird aus dem Referenzbild extrahiert?
- Farbpalette und Tonung
- Kompositionsprinzipien (z. B. Drittelregel, Symmetrie)
- Stilelemente (malerisch, fotografisch, illustriert)
- Stimmung und Atmosphäre
- Bei hohem
--iw: auch spezifische inhaltliche Elemente
Mehrere Bilder kombinieren: Bei mehreren Bild-URLs werden die visuellen Eigenschaften gemittelt. Zwei Bilder mit sehr unterschiedlichem Stil können zu interessanten Hybrid-Ergebnissen führen.
Image Prompts vs. --sref und --cref: Mit V6 wurden die spezialisierteren Referenz-Parameter eingeführt:
--srefextrahiert ausschließlich den visuellen Stil (nicht Inhalt/Charaktere)--crefextrahiert ausschließlich Charaktereigenschaften einer Person- Image Prompt am Prompt-Anfang beeinflusst alles ganzheitlich
Für präzise Anwendungen sind --sref und --cref empfehlenswerter; Image Prompts eignen sich für ganzheitliche visuelle Inspiration.
Beispiele
1. Stilübertragung mit Image Prompt `` /imagine prompt: https://example.com/monet-painting.jpg impressionist landscape, rolling hills, summer --iw 1.2 --v 6.1 `` Ergebnis: Neues Landschaftsbild im Stil des Referenzgemäldes.
2. Farbpalette übernehmen `` /imagine prompt: https://example.com/brand-colors.jpg product photography, coffee cup --iw 0.8 --style raw --v 6.1 `` Ergebnis: Produktbild mit Farbstimmung des Markenbildes.
3. Zwei Bilder als Stilmix `` /imagine prompt: https://example.com/photo1.jpg https://example.com/photo2.jpg architectural concept building --iw 1 --v 6.1 `` Ergebnis: Architekturvisualisierung mit gemischten Stilmerkmalen beider Referenzbilder.
4. Hochgewichteter Image Prompt für enge Anlehnung `` /imagine prompt: https://example.com/reference.jpg similar scene, different season --iw 2 --v 6.1 `` Ergebnis: Stark am Original orientiertes Bild, nur die Jahreszeit geändert.
5. Schwaches Image Prompt für Farbinspiration `` /imagine prompt: https://example.com/color-palette.jpg futuristic city, same color palette --iw 0.5 --v 6.1 `` Ergebnis: Zukunftsstadtbild mit Farbstimmung des Referenzbildes.
In der Praxis
Empfohlene --iw Werte:
- Stilreferenz:
--iw 0.8–1.2 - Kompositionsreferenz:
--iw 1–1.5 - Farbpalette:
--iw 0.5–0.8 - Enge Stilkopie:
--iw 1.5–2
Urheberrechts-Hinweis: Bei der Nutzung urheberrechtlich geschützter Bilder als Image Prompts gelten dieselben rechtlichen Überlegungen wie bei direkter Stilkopie. Für kommerzielle Projekte eigene oder lizenzfreie Referenzbilder verwenden.
Vergleich & Abgrenzung
- Image Prompt vs. --sref:
--srefextrahiert ausschließlich visuellen Stil, nicht Bildinhalt; präziser für Stilübertragung - Image Prompt vs. --cref:
--crefist auf Charakterkonsistenz spezialisiert - Image Prompt vs. /blend:
/blendmischt zwei Bilder direkt; Image Prompt nutzt ein Bild als Inspirationsquelle für neuen Output - DALL-E 3: Bild-zu-Bild-Generierung über ChatGPT Interface möglich; ähnliche Logik
Häufige Fragen (FAQ)
Wie verwende ich Image Prompts korrekt? Stelle sicher, dass die URL direkt auf eine Bilddatei zeigt (endet auf .jpg, .png, .webp). Die URL muss öffentlich zugänglich sein – private oder passwortgeschützte Links funktionieren nicht. Setze --iw bewusst: Für Stilinspiration niedrig (0.5–1), für enge Anlehnung hoch (1.5–2). Kombiniere immer mit einem beschreibenden Textprompt für beste Ergebnisse.
Was sind typische Fehler bei Image Prompts? Häufige Fehler sind nicht-öffentliche Bild-URLs, das Verwenden sehr niedrig aufgelöster Referenzbilder (reduziert Stilextraktion), fehlender Textprompt (Image allein ohne Text produziert oft unklare Ergebnisse) und zu hohe --iw-Werte, die eigene Prompt-Beschreibungen vollständig überschreiben.
Weiterführend
- Midjourney Image Prompts Dokumentation
- Midjourney --iw Parameter
