Wie erstelle ich in Midjourney konsistente Charaktere?

Innerhalb von zwei Jahren hat die Bild-KI die Art und Weise, wie wir mit Bildern und Grafiken arbeiten, radikal verändert. Noch vor Kurzem waren wir entweder auf langweilige und sich wiederholende Stockbilder angewiesen oder mussten teure Fotoshootings bezahlen, wenn wir unsere Beiträge im Web und auf Social Media mit visuellen Elementen bereichern wollten. Heute jedoch ermöglichen uns Tools wie Midjourney oder Dall-E, unsere visuellen Ideen in Sekundenschnelle zu realisieren

Ich habe schon vor mehreren Monaten darüber geschrieben, wie rasant sich die Qualität der in Midjourney generierten Bilder verbessert hat.

Ein Problem blieb jedoch trotz aller Updates bestehen: Es war nur mit Mühe möglich konsistente Charaktere zu generieren. Diese Funktion ist jedoch alternativlos, wenn man Midjourney dazu verwenden will, um beispielsweise Comics oder Illustrationen mit dem selben Charakter zu erstellen.

Ich persönlich betreibe zum Beispiel einen History-YouTube-Kanal, der historische Persönlichkeiten vorstellt. Bisher stand ich beim Erstellen der Videos immer vor dem Problem, dass die Charaktere in jeder Szene anders aussahen. 

Doch nun  gehört auch diese Schwierigkeit der Vergangenheit an, denn mit dem neusten Midjourney Update, ermöglicht das Tool nun endlich auch die Erstellung von konsistente Charaktere

Wie erstelle ich in Midjourney konsistente Charaktere?

Um das Feature zu nutzen, muss ich in Midjourney ein Referenzbild hochladen und im Prompt den Befehl — cref gefolgt von dem Link zum Bild innerhalb einer Klammer hinzufügen.

Der fertige Prompt sieht folgendermaßen aus:

/imagine Prompt Text –cref {https://linktext}

Mit dem Befehl –cw 0-100 kann ich außerdem das Niveau der Details, die übernommen werden sollen, spezifizieren. — cw 100 würde alle Details des Charakters bis hin zur Kleidung übernehmen, während bei —cw 0 nur das Gesicht übernommen wird.

Das ist nützlich für die Erstellung von Charakteren mit unterschiedlichen Kleidungsstilen.

Konsistente Charaktere können in Midjourney Alpha oder auch traditionell in Diskord erstellt werden.

In Diskord muss das Bild hochgeladen werden und dann per Rechtsklick auf das Bild und Auswahl von “Bild im neuen Tab öffnen” das Bild geöffnet werden. Nun kann die URL kopiert und in den Prompt eingefügt werden.

Leichter erfolgt der Vorgang in Midjourney Alpha. Hier muss einfach nur das Bild hochgeladen und dann im Hover-Menü die Option “Use as Charakter Ref” ausgewählt werden (Alternativ stehen noch die Optionen “Use as Style Ref” and “Use as Image” zur Verfügung).

Wie gut funktioniert das Erstellen von konsistenten Charakteren in Midjourney?

Wie wir sehen ist es sehr leicht, mit den Befehlen —cref und —cw zu arbeiten. Doch wie gut sind die Ergebnisse?

Um diese Frage zu beantworten, habe ich die letzten Tage intensiv mit dieser Funktion herumgespielt. Angefangen habe ich mit meinem persönlichen Profilbild. Mein Ziel war es, zu sehen, ob ich mich mit diesem Bild einfach in neuen Situationen platzieren kann. Dadurch könnte ich zum Beispiel neue Bilder für meine Website erstellen, ohne ein langwieriges und teures Fotoshooting zu buchen.

Das folgende Bild wählte ich als Referenzfoto:

Daraus generierte ich die folgenden Bilder (die Prompts findest du in der Bildbeschreibung):

Ein junger, dynamischer Mann, 25 Jahre alt, in futuristischer Kleidung, vor dem Hintergrund einer belebten Tokio-Skyline bei Nacht im Jahr 2040. Die Kamera ist eine Sony Alpha A7R IV. Die Beleuchtung imitiert das bunte, pulsierende Neonlicht der Stadt. — ar 2:3 — style raw –cref https://cdn.midjourney.com/u/06d11e1c-f4ab-452c-b6d2-7dc9bc912855/1bb6eaf05e72466e00779dd2b1a7766ca92b19a6d2e525a2c162a169753b1a7f.jpg –cw 80
Ein eleganter Herr im Alter von 40 Jahren, gekleidet in einen feinen viktorianischen Anzug, auf den nebligen Straßen Londons im späten 19. Jahrhundert. Fotografiert mit einer klassischen Daguerreotyp-Kamera. Die Beleuchtung erzeugt eine geheimnisvolle und dramatische Atmosphäre. — ar 2:3 — style raw –cref https://cdn.midjourney.com/u/06d11e1c-f4ab-452c-b6d2-7dc9bc912855/1bb6eaf05e72466e00779dd2b1a7766ca92b19a6d2e525a2c162a169753b1a7f.jpg –cw 0
Ein entspannter junger Mann, 20 Jahre alt, in legerer Strandbekleidung, am sonnigen Ufer von Malibu in den 1970er Jahren. Aufnahme mit einer Polaroid SX-70. Das Licht ist natürlich und unterstreicht die ungezwungene, sommerliche Stimmung. — ar 2:3 — style raw –cref https://cdn.midjourney.com/u/06d11e1c-f4ab-452c-b6d2-7dc9bc912855/1bb6eaf05e72466e00779dd2b1a7766ca92b19a6d2e525a2c162a169753b1a7f.jpg –cw 50

Wie gut finde ich persönlich die Ergebnisse? Der generierte Midjourney-Charakter sieht definitiv anders aus als ich am Original-Referenzfoto. Dennoch ist der Charakter relativ konsitent über die verschiedenen Bilder hinweg.

Was passiert, wenn ich mehrere Bilder von mir als Referenzbilder verwende?

In diesem Fall, müssen wir nur mehrere Bilder in Midjourney Alpha hochladen und diese als Charakter Referenz markieren.

Und hier ist das Ergebnis:

Das bin noch immer nicht ich, dennoch sieht diese Variante mir schon sehr viel ähnlicher.

Wir sehen: Durch das Hochladen von mehreren Referenzbildern, kann ich deutlich bessere Ergebnise erzielen, auch wenn die erzielten Resultate noch nicht perfekt sind.

Die Empfehlung von Midjourney lautet übrigens, dass diese Funktion am besten mit von Midjourney generierten Bildern funktioniert.

Auch das habe ich ausprobiert. Als Referenzphoto nahm ich diese junge Frau aus der Midjourney Explore Gallerie:

Mit ihr erstellte ich die folgenden Bilder:

Eine erfolgreiche Geschäftsfrau, Mitte 30, in eleganter Business-Kleidung, steht in einem modernen Büro mit Blick auf die Skyline einer Großstadt bei Sonnenuntergang. Die Aufnahme mit einer Canon EOS 5D Mark IV fängt das warme Licht ein, das ihr Gesicht beleuchtet und die Silhouetten der Stadt im Hintergrund konturiert. — ar 2:3 — style raw –cref https://s.mj.run/CCjo4GCvFO8 –cw 100
Eine tapfere Kriegerin, Mitte 20, in einer maßgeschneiderten Rüstung, steht auf einem windgepeitschten Berggipfel. Ihre Pose ist kraftvoll, der Blick entschlossen in die Ferne gerichtet. Die Kamera, eine Sony Alpha A7 III, fängt das dramatische Spiel von Wolken und Licht ein, das ihre Silhouette umgibt. — ar 2:3 — style raw –cref https://s.mj.run/CCjo4GCvFO8 –cw 10

Auch hier wurde das Originalbild nicht 100% übernommen für das Erstellen von konsistenten Charakteren für Illustrationen oder Comics sind die Resultate gut genug, wobei man natürlich mit fremden Charakteren weniger kritisch ist, als mit seinen eigenen Abbildern.

Fazit: Konsistente Charaktere in Midjourney

Die Funktion funktioniert noch nicht perfekt, aber gut genug, um sie für einfache Projekte wie zum Beispiel meinen YouTube Kanal zu verwenden. Derzeit lautet die offizielle Empfehlung, diese Funktion mit von Midjourney generierten Bildern zu verwenden, wie ich gezeigt habe, sind die Ergebnisse aber auch mit Bildern von echten Personen relativ konsistent, sie spiegeln nur nicht die Person zu 100% wider.

Klar ist jedoch, dass wir bei generierten Personen weniger kritisch sind, als bei Bildern von echten Personen oder uns selbst. Die Ergebnisse wurden außerdem deutlich besser, als ich mehrere Referenzfotos verwendete.

Betrachtet man die beeindruckende Entwicklung von Midjourney seit 2022, bin ich zuversichtlich, dass dieses Funktion schon bald noch deutlich verbesserte Ergebnisse liefern wird.