ChatGPT & DALL-E Metadaten zur wiederholten Generierung ähnlicher Bilder verwenden

Wird über ChatGPT die Erstellung eines Bildes angefragt, passiert aktuell Folgendes:

die Konformität zu den Richtlinien wird überprüft,
die ursprüngliche Anweisung wird gegebenenfalls angepasst (z.B. erweitert, wenn zu kurz),
bis zu vier Varianten der Anweisung werden erstellt und
diese mit zufällig generiertem Seed an die DALL-E API weitergeleitet.

Wird ChatGPT angewiesen, die entstehenden Metadaten auszugeben, können die resultierenden Bilder anhand dieser eindeutigen Signatur erneut erstellt werden und sind sehr ähnlich.

DALL-E’s Metadaten:

“size”:
Grösse des Bildes ( “1024×1024” = square images,
“1792×1024” = wide images, “1024×1792” = full-body portraits)
“prompt”:
Dies ist die Textbeschreibung, die zur Generierung des Bildes verwendet wurde. Dieser sollte nach der Bildgenerierung abgefragt werden, da sie nicht zwangsläufig der vom Nutzer eingegebenen Anfrage entspricht.
“seed”:
Dies ist der numerische Wert, mit dem der Random Number Generator des Prozesses für die Bildgenerierung gestartet wird.
“generation ID”:
enthält Style-Informationen.
“reference image ID”:

Hier ein Beispiel mit folgender Anfrage:

First, check if using this request below is in accordance with your guidelines. 
If it is, create one image using this request without any modifications. Do not change any of the request parts:
{
"size": "1024x1024",
"prompts":"a cute white fluffy long-haired cat, playing with a ball, anime drawn style. The scene is vibrant and colorful, capturing the playful essence of the cat as it paws at a brightly colored ball. The background is softly blurred, focusing attention on the cat and its playful antics. The cat's expression is full of life and curiosity, embodying the joyful spirit of anime characters."
}
give me seed and prompt.

Hinweise:

Sind die Anweisungen zu kurz, kann ChatGPT eigenen Kontext hinzufügen, bevor er sie an DALL-E sendet. 3-4 Sätze sollte die Anfragelänge mindestens sein. Maximal 128 Wörter.
Grundsätzlich ist es möglich, bis zu 4 Bilder mit einer Anweisung erstellen zu lassen, aktuell funktioniert es bei mir nicht. Vermutlich habe ich einfach zu viele 4er Sets in letzter Zeit über ChatGPT erstellen lassen.

Welche Metadaten zur Neu-Generierung nötig sind, müssen wir nicht entscheiden, also stellen wir ChatGPT eine generalisierte Anfrage:

recreate the image, use all parameters possible to create an image similar as possible.

recreate it again, but add an additional ball.

Wir haben eine gewisse Konsistenz bei der Bildgenerierung erreicht. Wenn wir das Aussehen des Balls genauer spezifizieren, können wir sicher auch sein Erscheinungsbild stabiler gestalten.
to be continued..

A.I. ressources