Extraire des catégories de presets IA
Construisez un ensemble cohérent de presets IA de mode à partir de 2 à 6 photos de référence. Même scène, éclairage et ambiance sur toute la catégorie.

Il y a quelques semaines, nous avons lancé Extract from Image — téléchargez une photo de mode et l'IA remplit un preset complet pour vous. Cette fonctionnalité a éliminé la majeure partie des frictions dans la création de presets, et elle est depuis l'une de nos plus utilisées.
Mais les marques nous posaient une autre question : et pour un ensemble ? Une campagne, ce n'est pas un shot, c'est six. Une fiche produit, ce n'est pas un preset, c'est un pack cohérent de face, dos, trois-quarts et détail. Lancer Extract from Image six fois de suite vous donne six presets, mais chacun a été généré isolément — donc les mots dérivent. Le même cyclorama chaud devient « cyclorama beige doux » dans un preset et « fond crémeux sans coutures » dans le suivant. La même configuration de lumière de fenêtre est « directionnelle douce depuis la gauche caméra » une fois et « lumière latérale diffuse » une seconde fois. Pour l'IA qui génère l'image suivante, ce sont des configurations d'éclairage différentes. Votre campagne s'effondre.
Aujourd'hui, nous livrons le correctif : Extract from a Set of Images.
Extraire toute une catégorie en une seule fois
Le nouveau flux vit sur l'écran dédié Categories (vous le trouverez via Presets → Categories dans la barre latérale). Cliquez sur la carte mise en avant Extract from images, choisissez 2–6 images de référence qui doivent appartenir à la même campagne, et l'IA s'occupe du reste. Ce que vous récupérez n'est pas une liste de presets déconnectés : c'est une catégorie entièrement formée — N presets qui partagent tous la même formulation pour ce qui s'accorde visuellement, et qui ne diffèrent que là où les images diffèrent réellement.
La catégorie est créée et persistée de manière atomique. Les crédits sont facturés à 1 par image (un set de 4 images coûte donc 4 crédits) et la nouvelle catégorie est nommée automatiquement avec un horodatage que vous pouvez renommer plus tard. Sa miniature est même pré-remplie depuis votre première référence, vous la repérerez immédiatement dans la grille.
Comment ça fonctionne
Étape 1 — Ouvrir l'écran Categories
Dans l'app, rendez-vous à Presets → Categories. L'écran s'ouvre sur une seule carte hero : « Extract a category from images. » Cliquez sur Get started.
Étape 2 — Choisir 2 à 6 références
Le sélecteur d'assets s'ouvre en mode multi-sélection. Choisissez depuis votre bibliothèque, téléversez un nouveau lot (la zone de dépôt accepte plusieurs fichiers à la fois, par glisser-déposer ou clic), ou mélangez les deux. Les vignettes sélectionnées reçoivent un badge bleu numéroté pour que vous connaissiez toujours l'ordre, et un compteur en pied de page affiche « N / 6 selected » avec le bouton Extract category actif dès que vous en avez sélectionné au moins deux.
Étape 3 — Un seul passage, une catégorie cohérente
Cliquez sur Extract category et patientez. L'IA analyse vos références comme un set cohérent et en extrait les presets ensemble plutôt qu'un à un — c'est ce qui les rend cohérents. Quelques secondes plus tard, vous arrivez sur la nouvelle catégorie, avec N presets déjà sauvegardés, et vous pouvez commencer à les appliquer à vos produits immédiatement.
Comme l'IA traite vos références comme un set plutôt qu'indépendamment, elle peut distinguer les traits partagés à travers la campagne de ceux qui varient par image — et verrouiller les partagés à une formulation identique. C'est ce qui débloque la cohérence que vous verrez ci-dessous.
L'histoire de la cohérence
C'est la partie qui compte. Appeler l'extraction single-image trois fois produit trois presets qui dérivent. Appeler Extract from a Set avec les trois mêmes images produit trois presets qui partagent une formulation strictement identique sur chaque champ où les images s'accordent visuellement. Nous le pensons littéralement — les chaînes sont égales, caractère pour caractère.
Voici à quoi ça ressemble avec les trois références que nous avons testées pour ce billet :



Après extraction, les shared traits se sont effondrés en une seule formulation canonique sur les trois presets. Background, style, mood et color palette se lisent à l'identique — tout comme l'éclairage et la plupart des paramètres de caméra. Voici les chaînes strictement identiques que le modèle a choisies pour l'ensemble du set :
{
"background": "Seamless light gray cyclorama with a soft shadow falloff at the floor, creating a clean e-commerce look.",
"style": "Clean e-commerce studio photography emphasizing the drape and fit of the garment against a neutral backdrop.",
"mood": "Neutral, professional, and focused on presenting the product clearly without distraction.",
"color_palette": "Monochromatic scene palette featuring light gray and white tones from the studio background and lighting.",
"lighting": {
"direction": "Key light positioned slightly above and straight on, with gentle side fills to minimize harsh shadows.",
"quality": "Soft, diffused lighting creating smooth gradients and natural-looking highlights on the fabric.",
"complexity": "Standard studio setup with a primary softbox key light and ambient fill for even, shadowless illumination."
},
"camera": {
"lens": "Standard portrait lens around 50-85mm, providing natural proportions and gentle compression.",
"angle": "Shot straight on at roughly chest height, maintaining a flat, proportional perspective.",
"aperture": "Moderate aperture around f/5.6-8 to keep the entire garment in sharp focus."
}
}Seuls les champs où les références différaient réellement ont reçu des descriptions par image — pose, cadrage et expression :
{
"preset_1_full_body": {
"pose": "Model standing facing forward, legs slightly apart, arms resting naturally at sides, creating a straight and relaxed posture.",
"camera": { "framing": "Full-body shot, cropped just below the neck and just below the toes, keeping the garment centered in frame." },
"expression": "Facial expression is not fully visible due to cropping, but head is positioned straight and level."
},
"preset_2_mid_shot": {
"pose": "Model standing slightly angled, hands clasped gently together near the waist, showing the sleeve details.",
"camera": { "framing": "Three-quarter length shot, cropped just below the knees and at the top of the head." },
"expression": "Neutral expression with eyes looking slightly downward, conveying a relaxed and understated confidence."
},
"preset_3_detail": {
"pose": "Model facing slightly away from the camera, arms folded and raised near the chest, showcasing the fabric texture and sleeve construction.",
"camera": { "framing": "Close-up detail shot of the upper torso and arms, cropped at the neck and mid-skirt." },
"expression": "Facial expression is completely cropped out, focusing entirely on the upper body and hands."
}
}Ce n'est pas une normalisation post-traitée. L'IA évalue les références ensemble comme un set, choisit une formulation strictement identique là où elles s'accordent visuellement, et n'écrit une formulation par image que là où elles diffèrent. Appliquez n'importe lequel de ces trois presets à un autre produit et vous obtiendrez un rendu qui appartient au même shoot.
Indépendant du vêtement par conception
Il y a un second changement qui mérite d'être souligné, car c'est la différence entre un preset qui fonctionne sur tous vos produits et un qui ne fonctionne que sur le produit dont il a été extrait.
Les presets décrivent le contexte photographique — forme de la pose, scène, éclairage, caméra, ambiance, style, couleur ambiante de la scène. Ils ne nomment jamais d'articles vestimentaires, de tissus ou de couleurs de tenue spécifiques. Extrayez une catégorie d'un lookbook denim et vous ne verrez pas « blue denim » dans la color_palette. Vous verrez la palette de la scène : le ton du cyclorama, la teinte de la lumière, l'ambiance. Appliquez cette catégorie à une robe nuisette en satin et la robe rend juste.
Une catégorie extraite d'un lookbook jeans-et-tee peut être réutilisée sur un shoot robe, un shoot maille, ou n'importe quel autre produit. Le preset décrit comment la photo est prise, pas ce que le modèle porte.
En action — des références aux rendus générés
Voici le même set de références, appliqué en tant que catégorie. Nous avons pris les trois presets extraits, les avons associés à un mannequin IA et à un produit en flat-lay, et avons lancé une génération par preset :
Le flat-lay en entrée — une robe portefeuille, délibérément un vêtement complètement différent de la robe midi en satin noir des références :

Les trois presets de la catégorie, appliqués successivement au même produit :
Le produit est tout neuf. Le mannequin est tout nouveau. Mais les trois rendus appartiennent au même shoot — et au même shoot que les références. Le même cyclorama gris clair. Le même éclairage doux et directionnel. La même palette monochromatique neutre. La même caméra frontale. Seules la pose, le cadrage et l'expression changent — exactement comme les références varient, et exactement comme le ferait un vrai trio de fiche produit.
C'est une fiche produit complète en trois clics : chargez le preset Full Body pour le hero, chargez Mid Shot pour le slot lifestyle, chargez Detail pour le gros plan. Passez à la SKU suivante et réutilisez toute la catégorie — le monde visuel reste en place.
Quand vous sauvegardez la catégorie, l'IA nomme aussi chaque preset pour vous (ici : Studio E-Commerce Full Body, Mid Shot, Detail). Ces noms sont choisis à partir de ce qui varie entre les références — c'est le repère que vous utiliserez plus tard pour charger le bon preset selon le type de prise de vue.
Une catégorie est un excellent point de départ. Les presets portent la scène, l'éclairage, l'ambiance, la palette de couleurs, la caméra et la forme de la pose — tout ce qui fait que les photos appartiennent ensemble. Ils n'essaient pas de figer le moindre détail de styling des originaux (accessoires, micro-cues), et c'est tant mieux : tout l'intérêt est de pouvoir réutiliser la catégorie sur des produits entièrement nouveaux. Si vous voulez qu'un rendu copie une référence spécifique encore plus fidèlement, vous pouvez aussi alimenter cette image de référence comme second input à côté de votre flat-lay — voir l'astuce couverte dans le billet sur l'extraction single-image.
Image unique vs. set — quand utiliser quoi
Les deux flux ont leur place. Voici la grille pratique :
| Extract from one image | Extract from a set | |
|---|---|---|
| Sortie | 1 preset | 1 catégorie, N presets |
| Idéal pour | Shots ponctuels, transfert de style ad hoc | Campagnes, lookbooks, fiches produit multi-shots |
| Cohérence | Par image uniquement | Formulation strictement identique sur les traits partagés |
| Coût | 1 crédit | 1 crédit par image (N au total) |
| Réutilisation sur d'autres produits | Oui, indépendant du vêtement | Oui, indépendant du vêtement |
| Où le trouver | Presets → New Preset → From Image | Presets → Categories → Extract from images |
Si vous n'avez besoin que d'un seul shot, le flux single-image est plus rapide et moins cher. Dès que vous avez besoin de plus d'un shot dans le même monde visuel, basculez.
Cas d'usage
- Construire un brief de campagne à partir d'un moodboard. Glissez le moodboard saisonnier de votre équipe dans le sélecteur et repartez avec une catégorie qui capture le brief sous une forme exploitable par la machine.
- Convertir le lookbook d'un concurrent. Vu un set cohérent de shots sur un site de marque que vous admirez ? Six clics et vous avez un pack de presets réutilisable pour vos propres produits.
- Standardiser une fiche produit multi-shots. Face, dos, trois-quarts, détail — extrayez à partir d'un shoot passé que vous aimiez et réappliquez-le à chaque nouvelle SKU.
- Onboarder un nouveau collaborateur. Donnez-lui une catégorie au lieu d'un PDF de charte de marque de 12 pages. Les presets sont le brief.
« La cohérence visuelle est le premier moteur de confiance dans une marque en e-commerce. Les shoots qui gagnent en conversion ne sont pas les plus chers — ce sont ceux où chaque image appartient clairement au même monde. »
— Directeur créatif senior d'une maison de mode européenne, en conversation
Selon McKinsey, les marques de mode dépensent 500 à 1 000 USD par SKU en photographie produit traditionnelle, et le coût se cumule chaque fois qu'une nouvelle campagne nécessite un shoot frais pour garder le catalogue cohérent. Les recherches de Shopify montrent que 75 % des acheteurs en ligne s'appuient sur les photos produit pour décider d'acheter, et le Baymard Institute note que des images catalogue dont le style visuel dérive de manière mesurable augmentent les taux de rebond sur les pages catégorie. Extraire une catégorie entière à partir de références en un seul passage, c'est ainsi que les marques font passer à l'échelle l'expérience coherent-shoot sans faire passer à l'échelle le budget de production.
Essayez maintenant
Rendez-vous sur Presets → Categories et cliquez sur Extract from images. Choisissez une poignée de références d'un shoot que vous aimez déjà, et vous aurez une catégorie réutilisable en quelques secondes.
Besoin d'un seul preset ? Le flux single-image est toujours là — voir Create AI Presets from Any Fashion Photo.
Sources :
- McKinsey & Company. (2024). The State of Fashion: Technology Edition. mckinsey.com
- Shopify. (2025). Product Photography Statistics: Why Visuals Drive E-Commerce Sales. shopify.com
- Baymard Institute. (2025). Product Image UX: How Image Consistency Impacts Conversion. baymard.com
À lire ensuite

Créez des Presets IA à partir de n'importe quelle photo de mode
Téléchargez une photo de mode de référence et laissez l'IA extraire la pose, l'arrière-plan, l'éclairage et les réglages caméra en un preset réutilisable — automatisez le style de votre photographie produit en quelques secondes.

Controlez le style avec des notes
Ajoutez des Styling Notes a vos photos flat-lay et controlez comment l'IA porte chaque vetement : rentre, retrousse, superpose ou recolore.

Presets Urban Streetwear : un style urbain cohérent du flat-lay au on-model
Utilisez la catégorie de presets Urban Streetwear d'On-Model pour transformer vos photos produit flat-lay en images street style nocturnes au flash, avec une seule identité et trois décors urbains.