Hace unas semanas lanzamos Extract from Image — sube una fotografía de moda y la IA rellena un preset completo por ti. Eliminó la mayor parte de la fricción en la creación de presets y, desde entonces, es una de nuestras funciones más usadas.

Pero las marcas seguían haciéndonos otra pregunta: ¿y para un set? Una campaña no es una toma, son seis. Una ficha de producto no es un preset, es un pack coherente de frente, espalda, tres cuartos y detalle. Lanzar Extract from Image seis veces seguidas te da seis presets, pero cada uno se generó aislado — así que las palabras se desvían. El mismo ciclorama cálido se llama «ciclorama beige suave» en un preset y «fondo cremoso sin costuras» en el siguiente. La misma configuración de luz de ventana es «direccional suave desde la cámara-izquierda» una vez y «luz lateral difusa» la siguiente. Para la IA que genera la siguiente imagen, son configuraciones de iluminación distintas. Tu campaña se desmorona.

Hoy lanzamos la solución: Extract from a Set of Images.

Extrae una categoría completa de una vez

El nuevo flujo vive en la pantalla dedicada Categories (la encuentras en Presets → Categories en la barra lateral). Haz clic en la card destacada Extract from images, escoge 2–6 imágenes de referencia que deban pertenecer a la misma campaña, y la IA hace el resto. Lo que recibes no es una lista de presets desconectados: es una categoría completamente formada — N presets que comparten todos la misma redacción para lo que coincide visualmente, y solo difieren donde las imágenes realmente difieren.

La categoría se crea y persiste de forma atómica. Los créditos se cobran a 1 por imagen (un set de 4 imágenes cuesta por tanto 4 créditos) y la nueva categoría se nombra automáticamente con un timestamp que puedes renombrar más tarde. Su miniatura incluso se rellena previamente desde tu primera referencia, así la identificarás de inmediato en la cuadrícula.

Cómo funciona

Paso 1 — Abre la pantalla Categories

En la app, ve a Presets → Categories. La pantalla arranca con una única card hero: «Extract a category from images.» Haz clic en Get started.

Categories screen on On-Model with the Extract from images hero card front and center — La pantalla Categories — Extract from images es el CTA principal

Paso 2 — Selecciona 2 a 6 referencias

El selector de assets se abre en modo multi-selección. Elige desde tu biblioteca, sube un nuevo lote (la zona de arrastre acepta varios archivos a la vez, drag-and-drop o clic) o mezcla ambas. Las miniaturas seleccionadas reciben un badge azul numerado para que siempre conozcas el orden, y un contador en el pie muestra «N / 6 selected» con el botón Extract category activo en cuanto hayas seleccionado al menos dos.

Multi-select asset picker on On-Model with several reference images selected and the Extract category footer button visible — El selector permite mezclar biblioteca y subida — Extract category se activa con 2 selecciones

Paso 3 — Una sola pasada, una categoría coherente

Haz clic en Extract category y espera. La IA analiza tus referencias como un set coherente y extrae los presets en conjunto en vez de uno a uno — eso es lo que los mantiene consistentes. Unos segundos después aterrizas en la nueva categoría, con N presets ya guardados, y puedes empezar a aplicarlos a tus productos inmediatamente.

Como la IA procesa tus referencias como un set en lugar de individualmente, puede distinguir los rasgos compartidos por la campaña de los que varían por imagen — y bloquear los compartidos en una redacción idéntica. Eso es lo que desbloquea la consistencia que verás abajo.

La historia de la consistencia

Esta es la parte que importa. Llamar a la extracción single-image tres veces produce tres presets que se desvían. Llamar a Extract from a Set con las mismas tres imágenes produce tres presets que comparten redacción byte-idéntica en cada campo donde las imágenes coinciden visualmente. Lo decimos literalmente — las cadenas son iguales, carácter por carácter.

Así se ve con las tres referencias que hemos probado para este artículo:

Reference image 1 — first shot in a coherent campaign — Referencia 1

Reference image 2 — second shot, same scene — Referencia 2

Reference image 3 — third shot, same scene — Referencia 3

Tras la extracción, los shared traits colapsaron a una única redacción canónica en los tres presets. Background, style, mood y color palette se leen idénticos — lo mismo iluminación y la mayoría de los ajustes de cámara. Estas son las cadenas byte-idénticas que el modelo eligió para el set entero:

shared-across-all-3-presets.json

{
  "background": "Seamless light gray cyclorama with a soft shadow falloff at the floor, creating a clean e-commerce look.",
  "style": "Clean e-commerce studio photography emphasizing the drape and fit of the garment against a neutral backdrop.",
  "mood": "Neutral, professional, and focused on presenting the product clearly without distraction.",
  "color_palette": "Monochromatic scene palette featuring light gray and white tones from the studio background and lighting.",
  "lighting": {
    "direction": "Key light positioned slightly above and straight on, with gentle side fills to minimize harsh shadows.",
    "quality": "Soft, diffused lighting creating smooth gradients and natural-looking highlights on the fabric.",
    "complexity": "Standard studio setup with a primary softbox key light and ambient fill for even, shadowless illumination."
  },
  "camera": {
    "lens": "Standard portrait lens around 50-85mm, providing natural proportions and gentle compression.",
    "angle": "Shot straight on at roughly chest height, maintaining a flat, proportional perspective.",
    "aperture": "Moderate aperture around f/5.6-8 to keep the entire garment in sharp focus."
  }
}

Solo los campos donde las referencias realmente diferían recibieron descripciones por imagen — pose, encuadre y expresión:

varying-per-preset.json

{
  "preset_1_full_body": {
    "pose": "Model standing facing forward, legs slightly apart, arms resting naturally at sides, creating a straight and relaxed posture.",
    "camera": { "framing": "Full-body shot, cropped just below the neck and just below the toes, keeping the garment centered in frame." },
    "expression": "Facial expression is not fully visible due to cropping, but head is positioned straight and level."
  },
  "preset_2_mid_shot": {
    "pose": "Model standing slightly angled, hands clasped gently together near the waist, showing the sleeve details.",
    "camera": { "framing": "Three-quarter length shot, cropped just below the knees and at the top of the head." },
    "expression": "Neutral expression with eyes looking slightly downward, conveying a relaxed and understated confidence."
  },
  "preset_3_detail": {
    "pose": "Model facing slightly away from the camera, arms folded and raised near the chest, showcasing the fabric texture and sleeve construction.",
    "camera": { "framing": "Close-up detail shot of the upper torso and arms, cropped at the neck and mid-skirt." },
    "expression": "Facial expression is completely cropped out, focusing entirely on the upper body and hands."
  }
}

No es normalización post-procesada. La IA evalúa las referencias en conjunto como un set, elige redacción byte-idéntica donde coinciden visualmente, y solo escribe redacción por imagen donde no lo hacen. Aplica cualquiera de estos tres presets a un producto distinto y obtendrás una salida que pertenece al mismo shoot.

Independiente de la prenda por diseño

Hay un segundo cambio que merece mención, porque es la diferencia entre un preset que funciona en cada producto que tienes y uno que solo funciona sobre el producto del que se extrajo.

Los presets describen el contexto fotográfico — forma de la pose, escena, iluminación, cámara, ambiente, estilo, color ambiental de la escena. Nunca nombran prendas específicas, tejidos o colores de outfit. Extrae una categoría de un lookbook de denim y no verás «blue denim» en la color_palette. Verás la paleta de la escena: el tono del ciclorama, el cast de la luz, el ambiente. Aplica esa categoría a un slip dress de satén y el vestido se lee fiel.

Una categoría extraída de un lookbook de jeans-y-tee se puede reutilizar en un shoot de vestido, un shoot de tejidos o cualquier otro producto. El preset describe cómo se toma la foto, no lo que la modelo lleva puesto.

En acción — de las referencias a las salidas generadas

Aquí está el mismo set de referencias, aplicado como categoría. Tomamos los tres presets extraídos, los emparejamos con un modelo IA y un producto en flat-lay, y lanzamos una generación por preset:

El flat-lay de entrada — un wrap dress, deliberadamente una prenda completamente diferente al midi de satén negro de las referencias:

Wrap dress flat-lay — the input product — Entrada — wrap dress

Los tres presets de la categoría, aplicados de forma encadenada al mismo producto:

AI Generated

Aisha wearing the wrap dress in a full-body studio e-commerce shot — same light gray cyclorama and soft directional lighting as the references — Full Body

Aisha wearing the wrap dress in a three-quarter mid-shot — same scene and lighting, hands clasped near the waist showing the dress drape — Mid Shot

Aisha wearing the wrap dress in a detail close-up — same scene and lighting, focused on the upper torso — Detail

El producto es totalmente nuevo. La modelo es totalmente nueva. Pero las tres salidas pertenecen al mismo shoot — y al mismo shoot que las referencias. El mismo ciclorama gris claro. La misma iluminación direccional suave. La misma paleta monocromática neutra. La misma cámara frontal. Solo cambian pose, encuadre y expresión — exactamente como varían las referencias, y exactamente como lo haría un trío real de PDP.

Esto es una ficha de producto completa en tres clics: carga el preset Full Body para el hero, carga Mid Shot para el slot lifestyle, carga Detail para el primer plano. Pasa a la siguiente SKU y reutiliza la categoría entera — el mundo visual se mantiene en pie.

Cuando guardas la categoría, la IA también nombra cada preset por ti (aquí: Studio E-Commerce Full Body, Mid Shot, Detail). Esos nombres se eligen a partir de lo que varía entre las referencias — son la pista que usarás más tarde para cargar el preset correcto para cada tipo de toma.

Una categoría es un punto de partida sólido. Los presets cargan escena, iluminación, ambiente, paleta de colores, cámara y forma de la pose — todo lo que hace que las fotos pertenezcan juntas. No intentan fijar el último detalle de styling de los originales (props, accesorios, micro-pistas de styling), y no deberían: la idea es que puedas reutilizar la categoría en productos completamente nuevos. Si quieres que una salida concreta copie una referencia específica aún más de cerca, también puedes alimentar esa imagen de referencia como segundo input junto a tu flat-lay — mira el truco cubierto en el artículo de extracción single-image.

Imagen única vs. set — cuándo usar cada una

Ambos flujos tienen su sitio. Aquí el desglose práctico:

	Extract from one image	Extract from a set
Salida	1 preset	1 categoría, N presets
Ideal para	Tomas únicas, transferencia de estilo ad-hoc	Campañas, lookbooks, fichas multi-toma
Consistencia	Solo por imagen	Redacción byte-idéntica en rasgos compartidos
Coste	1 crédito	1 crédito por imagen (N en total)
Reutilización en otros productos	Sí, independiente de la prenda	Sí, independiente de la prenda
Dónde encontrarlo	Presets → New Preset → From Image	Presets → Categories → Extract from images

Si solo necesitas una toma, el flujo single-image es más rápido y barato. En el momento en que necesitas más de una toma en el mismo mundo visual, cambia.

Casos de uso

Construye un brief de campaña a partir de un moodboard. Arrastra el moodboard estacional de tu equipo al selector y sales con una categoría que captura el brief en forma aplicable por la máquina.
Convierte el lookbook de un competidor. ¿Has visto un set coherente de tomas en una web de marca que admiras? Seis clics y tienes un pack de presets reutilizable para tus productos.
Estandariza una PDP multi-toma. Frente, espalda, tres cuartos, detalle — extrae de un único shoot pasado que te encantaba y reaplícalo a cada nueva SKU desde ahora.
Onboarda a un nuevo colaborador. Dale una categoría en lugar de un PDF de brand-style de 12 páginas. Los presets son el brief.

«La consistencia visual es el principal motor de confianza de marca en e-commerce. Los shoots que ganan en conversión no son los más caros — son aquellos en los que cada imagen pertenece claramente al mismo mundo.»

— Director creativo senior de una casa de moda europea, en conversación

Según McKinsey, las marcas de moda gastan 500–1.000 USD por SKU en fotografía de producto tradicional, y el coste se acumula cuando cada nueva campaña requiere un fresh shoot para mantener el catálogo coherente. La investigación de Shopify constata que el 75 % de los compradores online se apoya en las fotos de producto al decidir comprar, y Baymard Institute señala que las imágenes de catálogo cuyo estilo visual deriva de forma medible aumentan las tasas de rebote en las páginas de categoría. Extraer una categoría completa a partir de referencias en una sola pasada es la forma en que las marcas escalan la experiencia coherent-shoot sin escalar el presupuesto de producción.

Pruébalo ahora

Ve a Presets → Categories y haz clic en Extract from images. Selecciona un puñado de referencias de un shoot que ya te guste, y tendrás una categoría reutilizable en segundos.

¿Solo necesitas un preset? El flujo single-image sigue ahí — ver Create AI Presets from Any Fashion Photo.

Fuentes:

McKinsey & Company. (2024). The State of Fashion: Technology Edition. mckinsey.com
Shopify. (2025). Product Photography Statistics: Why Visuals Drive E-Commerce Sales. shopify.com
Baymard Institute. (2025). Product Image UX: How Image Consistency Impacts Conversion. baymard.com

Extrae categorías de presets IA desde fotos