Individuelle Presets zu erstellen war schon immer der leistungsstärkste Weg, Ihre Ausgabe zu steuern — aber 15+ Felder manuell ausfüllen? An diesem Punkt sind die meisten Nutzer ausgestiegen. Wir haben es in den Daten gesehen: Teams blieben bei Standard-Kategorien, statt eigene zu erstellen, selbst wenn ihre Marke etwas anderes brauchte.

Einige Power-User entdeckten einen Workaround — Referenzbilder in ChatGPT einfügen und nach unserem JSON-Format fragen. Clever, aber umständlich. Wir haben uns entschieden, diesen Workflow direkt in die Plattform zu bringen.

Extract from Image

Der neue From Image-Button im Preset-Erstellungsassistenten erlaubt Ihnen, ein beliebiges Modefoto hochzuladen oder auszuwählen und die KI automatisch alle Stil-Einstellungen in ein sofort verwendbares Preset extrahieren zu lassen. Ein Bild rein, ein Preset raus.

Das passiert unter der Haube: Das Bild wird an unsere KI-Pipeline gesendet, die das Foto analysiert und strukturierte Werte für jedes Preset-Feld zurückgibt — Pose, Hintergrund, Stil, Ausdruck, Stimmung, Farbpalette, Kameraeinstellungen und Beleuchtungs-Setup.

Das Ergebnis landet direkt im Visual Editor mit allen ausgefüllten Feldern. Von dort können Sie prüfen, anpassen und speichern.

So funktioniert es

Schritt 1 — Den Preset-Assistenten öffnen

Navigieren Sie zu Presets und klicken Sie auf New Preset. Füllen Sie die Grundlagen aus (Name, Beschreibung, Kategorie, Typ) und fahren Sie mit dem Schritt Style & Settings fort.

Schritt 2 — „From Image" klicken

In der oberen rechten Ecke des Style & Settings-Schritts klicken Sie auf From Image. Daraufhin öffnet sich die Asset-Auswahl, wo Sie entweder:

Aus Ihrer Bibliothek auswählen — ein bereits hochgeladenes Bild wählen
Ein neues Bild hochladen — per Drag & Drop oder Klick ein Referenzfoto hochladen

Schritt 3 — Bestätigen und extrahieren

Nach der Bildauswahl sehen Sie eine Bestätigungsnachricht: „Dies wird 1 Credit verwenden, um Preset-Einstellungen zu extrahieren." Klicken Sie auf Confirm und die KI analysiert das Foto in wenigen Sekunden.

Nach Abschluss wechselt der Assistent zum Visual Editor mit allen ausgefüllten Feldern:

Kreativfelder — Pose, Hintergrund, Stil, Ausdruck, Stimmung, Farbpalette
Kameraeinstellungen — Bildausschnitt, Winkel, Objektiv, Blende
Beleuchtungs-Setup — Richtung, Qualität, Komplexität

Die KI schlägt außerdem einen Preset-Namen und eine Beschreibung basierend auf dem Bildinhalt vor.

Das extrahierte Preset ist ein Ausgangspunkt, kein Endprodukt. Prüfen Sie die Felder im Visual Editor und passen Sie alles an, was nicht Ihrer Absicht entspricht — die KI bringt Sie 90 % des Weges.

Was macht ein gutes Referenzbild aus?

Die Qualität der Extraktion hängt von der Eingabe ab. Für beste Ergebnisse:

Verwenden Sie hochauflösende Fotos — die KI muss Details wie Lichtrichtung und Schärfentiefe erkennen können
Wählen Sie Bilder mit klarer, sichtbarer Beleuchtung — dramatische oder klar definierte Beleuchtungs-Setups liefern spezifischere Ergebnisse
Ganzkörper- oder Dreiviertelaufnahmen funktionieren am besten — diese geben der KI genug Kontext für Pose, Bildausschnitt und Hintergrund
Jeder Mode-Fotografie-Stil funktioniert — Editorial, Street, Studio, Lifestyle, E-Commerce. Die KI passt sich an, was Sie ihr geben

Die Extraktion kostet 1 Credit pro Bild. Wenn Sie mit dem Ergebnis nicht zufrieden sind, passen Sie die Felder manuell an und probieren Sie ein anderes Referenzbild — jede Extraktion ist unabhängig.

In Aktion — vom Referenzbild zur Ausgabe

Hier ein reales Beispiel. Wir haben ein Produktfoto aus dem Online-Shop von Ralph Lauren genommen — eine lässige Streetwear-Aufnahme mit hartem natürlichem Sonnenlicht, einer sportlichen Pose und einem Outdoor-Setting mit einem alten SUV. Die Art von aspirativer Lifestyle-Fotografie, in die Marken wie Ralph Lauren, Nike und ASOS stark investieren. Wir haben Extract from Image verwendet, um daraus ein Preset zu erstellen, und dieses Preset dann auf unser eigenes Produkt mit Paul als KI-Model angewendet:

Was die KI extrahiert hat:

extracted-preset.json

{
  "pose": "leaning forward slightly, dribbling a basketball",
  "background": "outdoor setting with a white old SUV and a building",
  "style": "casual sportswear lifestyle",
  "expression": "neutral, confident with sunglasses",
  "mood": "active and laid-back",
  "color_palette": "navy blue, crisp white, and warm earth tones",
  "camera": {
    "framing": "mid-shot, thigh up",
    "angle": "slightly high angle looking down",
    "lens": "35mm wide angle",
    "aperture": "f/8 deep focus"
  },
  "lighting": {
    "direction": "strong side lighting from the left",
    "quality": "hard natural sunlight",
    "complexity": "natural ambient daylight"
  }
}

Referenz vs. generierte Ausgabe:

Reference streetwear photo — casual athletic pose with basketball and sunglasses in outdoor setting — Referenz

AI-generated output using extracted preset — Paul wearing On-Model branded t-shirt in matching streetwear style with sunglasses — Generiert

Gleiche Pose, gleiches Outdoor-Setting mit altem SUV, gleiches hartes Seitenlicht, gleiche Sonnenbrille, gleicher Kamerawinkel — aber mit unserem Produkt und unserem KI-Model. Die visuelle Sprache, die das Kreativteam von Ralph Lauren für diese Aufnahme entwickelt hat, ist jetzt in einem wiederverwendbaren Preset erfasst.

Die Flat-Lay-Eingabe und generierte Ausgabe:

Input

Generiert

Paul wearing On-Model branded t-shirt — generated using extracted preset from reference photo

Instruction: Preset extracted from reference photo — casual sportswear lifestyle, outdoor setting, hard natural sunlight

Der gesamte Prozess dauerte weniger als eine Minute: Referenz hochladen, Extraktion bestätigen (1 Credit), Preset überprüfen und generieren.

Wechseln Sie jederzeit zum JSON-Tab, um die rohe Extraktion einzusehen oder zu bearbeiten. Das ist besonders nützlich, wenn Sie das Preset kopieren und Variationen erstellen möchten.

Bonus — das Referenzbild als Eingabe verwenden

Hier ein Trick, der das Ganze noch weiter bringt: Sie können das Referenzbild selbst als Eingabe-Asset zusammen mit Ihrem Produkt verwenden. Die KI nutzt sowohl das extrahierte Preset als auch die visuelle Referenz, um eine Ausgabe zu erzeugen, die dem Original noch näher kommt.

Wir haben denselben Job erneut ausgeführt — gleiches Preset, gleiches T-Shirt, gleiche Identität — aber diesmal haben wir das Referenz-Streetwear-Foto als zweite Eingabe hinzugefügt:

Inputs

Reference streetwear photo — casual athletic pose with basketball and sunglasses — Referenz

Generiert (mit Referenz)

Paul wearing On-Model branded t-shirt — generated using extracted preset plus reference image as input

Instruction: Preset extracted from reference + reference image as input

Das Ergebnis übernimmt feinere Details aus der Referenz — Styling-Hinweise, räumliche Komposition und Atmosphäre — die der Preset-Text allein nicht vollständig erfassen kann. Stellen Sie es sich so vor: Sie geben der KI sowohl das Rezept (Preset) als auch ein Foto des fertigen Gerichts (Referenz).

Nebeneinander — Referenz vs. nur Preset vs. Preset + Referenz:

Original reference streetwear photo — Referenz

Generated with extracted preset only — Nur Preset

Generated with extracted preset plus reference image as input — Preset + Referenz

Dies funktioniert am besten, wenn das Referenzbild und das Preset aus demselben Foto extrahiert wurden. Die beiden Signale verstärken sich gegenseitig und geben der KI einen stärkeren Ankerpunkt für die Ausgabe.

Anwendungsfälle

Stil eines Wettbewerbers nachbilden — Sie sehen eine Produktaufnahme, die Sie bei Ralph Lauren, ASOS oder Zalando begeistert? Extrahieren Sie das Preset und wenden Sie es auf Ihre eigenen Produkte an
Von einem Referenz-Shooting standardisieren — verwenden Sie Ihr bestes vorhandenes Foto als Vorlage für alle zukünftigen Ausgaben
Schnelle Iteration — probieren Sie verschiedene Referenzbilder, um visuelle Richtungen schnell zu erkunden, bevor Sie sich auf einen vollständigen Batch festlegen
Neue Teammitglieder einarbeiten — statt Ihren Markenstil in Worten zu erklären, zeigen Sie einfach auf ein Referenzbild

„Visuelle Konsistenz ist der wichtigste Treiber für Markenvertrauen im E-Commerce. Wenn jedes Produktbild so wirkt, als gehöre es zum selben Fotoshooting, folgen die Conversion-Raten."

— Elena Marchetti, Leiterin der visuellen Produktion bei einem führenden europäischen Modehändler

Laut einer Studie von Shopify verlassen sich 75 % der Online-Käufer bei Kaufentscheidungen auf Produktfotos, und konsistente Bildsprache über einen Katalog hinweg kann die Conversion-Raten um bis zu 30 % steigern. Funktionen wie Extract from Image machen es möglich, diese Konsistenz zu erreichen, ohne mehrtägige Fotoshootings zu koordinieren — ein Prozess, der laut McKinsey bei traditioneller Fotografie 500–1.000 $ pro SKU kostet.

Jetzt ausprobieren

Gehen Sie zu Presets → New Preset und klicken Sie im Style & Settings-Schritt auf From Image. Wählen Sie ein beliebiges Modefoto — aus Ihrem eigenen Katalog, dem Shop eines Wettbewerbers oder einem Editorial, das Sie bewundern — und sehen Sie, was die KI extrahiert.

Sie nutzen bereits Presets? Lesen Sie unseren Presets-Leitfaden für mehr zu Kategorien, System-Presets und dem Erstellen eigener Fotoshooting-Briefings.

Quellen:

Shopify. (2025). Product Photography Statistics: Why Visuals Drive E-Commerce Sales. shopify.com
McKinsey & Company. (2024). The State of Fashion: Technology Edition. mckinsey.com
Baymard Institute. (2025). Product Image UX: How Image Consistency Impacts Conversion. baymard.com

KI-Presets aus jedem Modefoto erstellen