Precedente
Prova il flusso di lavoro standard dell'app PhotoRobot Controls
PhotoRobot presenta come progettare prompt AI per generare sfondi fotografici personalizzati per le immagini catturate roboticamente.
L'utilizzo dell'intelligenza artificiale nella creazione di sfondi fotografici di prodotti è un modo per migliorare la fotografia catturata roboticamente da PhotoRobot. Mentre PhotoRobot è in grado di rimuovere automaticamente lo sfondo dalle foto dei prodotti, gli strumenti di intelligenza artificiale possono sostituire gli sfondi con un tocco accurato del marchio. Prendiamo, ad esempio, la sostituzione della rimozione precisa dello sfondo di PhotoRobot con uno sfondo che mostri visivamente la reputazione del prodotto.
Potrebbe trattarsi di una combinazione di colori che completa il marchio stesso o di una scena 3D completa che ospita il prodotto. Lo sfondo può essere un marmo venato bianco, un velluto rosso porpora intenso, seta rosso rubino o altre trame lussuose. Meglio ancora, alcuni sfondi del prodotto possono illustrare i componenti effettivi dell'articolo, come gli ingredienti specifici di un profumo.
In questo caso, gli strumenti di intelligenza artificiale possono far risparmiare drasticamente tempo nell'approvvigionamento e nell'aggregazione di tutte le informazioni rilevanti sui prodotti, soprattutto se non sono a portata di mano. I team possono quindi utilizzare queste informazioni durante la progettazione di prompt di immagini AI per generare sfondi specifici del marchio e del prodotto. Perché non vedere di persona qui sotto? Scopri come gli studi basati su PhotoRobot stanno sfruttando gli strumenti di intelligenza artificiale per migliorare gli sfondi dei prodotti e per incorporarli nei flussi di lavoro di produzione in studio.
Produrre ottime foto di prodotti in meno tempo e con meno sforzo rimane la pietra angolare della missione di PhotoRobot. Questo è vero anche quando l'intelligenza artificiale può creare immagini fotorealistiche dei prodotti esclusivamente da prompt di testo. Il punto di partenza rimane una foto reale del prodotto di alta qualità. L'intelligenza artificiale può quindi arricchire la storia che la circonda.
Pertanto, i progressi dell'intelligenza artificiale moderna non fanno che espandere la cassetta degli attrezzi di PhotoRobot. La tecnologia si integra perfettamente anche nei flussi di lavoro fotografici automatizzati. Grazie all'ingegneria avanzata dei prompt, l'intelligenza artificiale può accelerare i flussi di prodotti in studio e migliorare le immagini dei prodotti reali che catturiamo roboticamente. L'acquisizione robotica garantisce l'alta qualità essenziale per le immagini dei prodotti. Funziona anche per produrre foto più compatibili per il miglioramento con gli strumenti di generazione delle immagini.
Ad esempio, l'utilizzo di illuminazione a LED con CRI basso produce foto in cui manca parte dello spettro dei colori. Questo porta a problemi critici per i generatori di immagini AI, che non possono ricreare ciò che non c'è. Tuttavia, PhotoRobot garantisce l'illuminazione perfetta, la rimozione dello sfondo e la post-elaborazione delle foto per eseguire in modo efficiente l'intelligenza artificiale. Le immagini risultanti sono quindi ottimali per ulteriori miglioramenti, come gli scambi di sfondo o l'ingegneria completa delle scene 3D.
Perché scattare foto reali quando l'intelligenza artificiale può generare le immagini dei prodotti? Certo, per un certo marketing di prodotto, le foto reali non sono sempre necessarie. Tuttavia, un'ispezione più approfondita delle immagini generate dall'intelligenza artificiale rivelerà spesso dei difetti. Questo è il motivo per cui tendono ad essere utili solo in applicazioni limitate.
I problemi più comuni che si verificano con le foto dei prodotti AI sono la tipografia strana e gli errori di dettaglio minori. Non è così male come vedere mani con sei dita, ma è comunque evidente.
L'intelligenza artificiale distorce comunemente le dimensioni, deludendo le aspettative di qualità o, a volte, non abbinando la pubblicità e i beni reali. Ciò può sollevare preoccupazioni sia etiche che legali, supportando la necessità di mantenere gli investimenti nella fotografia di prodotti reali.
Per molte aziende, la produzione di foto di prodotti su sfondi bianchi puri o trasparenti rimane adatta. In effetti, la maggior parte dei clienti di PhotoRobot richiede solo la rimozione precisa dello sfondo.
Tuttavia, alcune linee di prodotti richiedono semplicemente immagini di prodotti di qualità superiore. Pensate ai marchi di stilisti e di lusso con una reputazione superiore: Armani, Apple, Louis Vuitton, Rolex. Aziende come queste richiederanno foto professionali per la stampa su riviste e pubblicità su cartelloni pubblicitari. Questo, così come le immagini per gli annunci online e le pagine dei prodotti. In tutti i casi, l'elemento deve rimanere al centro della messa a fuoco nelle foto. Tuttavia, lo sfondo può anche fungere da richiamare l'attenzione sull'annuncio e distinguere un prodotto da quello della concorrenza.
Lo sfondo può corrispondere alla combinazione di colori del marchio stesso o enfatizzare il materiale, la trama e il design di un articolo. Prendi, ad esempio, l'aggiunta di toni ombreggiati allo sfondo per illuminare l'argento, l'oro e altri prodotti luminosi o riflettenti. Sfondi come questi sono spesso popolari nelle foto di orologi da polso firmati, occhiali da sole, collezioni di gioielli e altri beni di lusso. Tuttavia, l'obiettivo principale dello sfondo rimane quello di completare l'oggetto e non distrarsi da esso.
Nella maggior parte dei casi, l'obiettivo delle immagini di prodotto è quello di trasferire un oggetto reale nel mondo digitale. Allo stesso tempo, l'oggetto dovrebbe rimanere realistico, informativo e accattivante.
I grandi marchi spesso lo fanno investendo in modelli di prodotto 3D altamente avanzati e pipeline di rendering di modelli 3D. In questo modo, le risorse diventano più coinvolgenti, mentre gli articoli sono anche facili da posizionare su qualsiasi tipo di sfondo del prodotto. La visualizzazione 3D consente inoltre alle aziende di dimostrare configurazioni di prodotto intercambiabili, in movimento o interattive. Prendiamo ad esempio i modelli 3D incorporabili di PhotoRobot in uso con le piattaforme di hosting di modelli 3D, come la nostra Emersya di lunga data.
Anche così, gli occhi esperti possono distinguere tra una fotografia reale e un rendering 3D. Lo stesso vale per le immagini completamente generate dall'intelligenza artificiale. L'autenticità è semplicemente carente, a volte in vari aspetti che l'occhio umano discerne facilmente. Ciò limita la redditività in alcuni casi. Tuttavia, ciò non significa che i rendering 3D e la generazione di immagini AI non abbiano alcun posto nella fotografia di prodotto.
In PhotoRobot, gli obiettivi rimangono gli stessi: foto autentiche con flussi di lavoro di produzione più veloci, più semplici e più scalabili.
Nonostante i rapidi progressi nei generatori di immagini AI, PhotoRobot rimane la soluzione più veloce e affidabile, con un maggiore ritorno sull'investimento. Non ci sono preoccupazioni per quanto riguarda la coerenza o la qualità dei risultati, mentre l'affidabilità e la fedeltà sono una garanzia.
Quando si utilizza l'intelligenza artificiale all'interno di flussi di lavoro basati su PhotoRobot, ci sono una serie di aree in cui l'intelligenza artificiale eccelle.
Ad esempio, un caso d'uso potrebbe essere quello di fotografare una collezione di profumi per un cliente. Tuttavia, immagina che lo studio abbia solo i prodotti a portata di mano, con informazioni limitate sul prodotto. Questo è il momento in cui i prompt dell'intelligenza artificiale possono facilmente recuperare dati rilevanti, catalogarli automaticamente e fornire metadati strutturati sugli elementi.
Gli studi possono quindi allegare i dati alle immagini del cliente e utilizzare le informazioni per sostituire la rimozione precisa dello sfondo di PhotoRobot. Potrebbe trattarsi di creare uno sfondo che sia più rappresentativo del marchio di un cliente o del prodotto per la sua reputazione.
A titolo dimostrativo, quello che segue è un caso di studio reale che fotografa una serie di profumi Armani Privé in PhotoRobot Studio. Il flacone di profumo vero e proprio è disponibile in studio, ma non ci sono metadati dettagliati con il prodotto.
In questo caso, un prompt di intelligenza artificiale può aggregare le informazioni rilevanti sul prodotto in un set di dati strutturato per la revisione. Inoltre, è possibile recuperare i dati su ogni articolo all'interno della collezione completa di fragranze.
Il prompt può recuperare il nome della fragranza, il nome della collezione e un codice EAN per ogni articolo. Può quindi includere istruzioni per creare i dati in due formati, ad esempio: un semplice file TXT e una tabella CSV strutturata.
Per recuperare un elenco di prodotti, prima chiediamo all'intelligenza artificiale di descrivere il progetto. Il prompt deve quindi specificare anche le informazioni da recuperare e come formattare i risultati. (Nota: il seguente esempio di ingegneria dei prompt AI e gli output reali risalgono a maggio 2025. Tieni presente che l'output varierà tra le diverse piattaforme e man mano che la tecnologia si evolve insieme ai flussi di lavoro di PhotoRobot.)
Il prompt, "recupera l'elenco dei prodotti":
Sto costruendo un set di dati strutturato di profumi da utilizzare in un ambiente di fotografia di prodotto e automazione AI.
Genera una panoramica completa della collezione di profumi della linea di profumi Armani Privé, raggruppata per collezione (ad esempio, Les Eaux, La Collection, Les Terres Précieuses, Les Mille et Une Nuits, Kogane Collection, ecc.).
Per ogni profumo, fornisci:
1. Nome della fragranza
2. Nome della collezione
3. Codice EAN – il codice a barre internazionale per il flacone standard da 100 ml
Genera il risultato in due formati:
- Un elenco di file TXT semplice e leggibile, raggruppato per collezione (per riferimento umano).
- Una tabella CSV strutturata con colonne: Collezione, Fragranza, EAN.
- Prepara i file per il download diretto.
Includi solo i profumi che esistono nella linea ufficiale Armani Privé. Se esistono più EAN per una fragranza, fornisci la versione standard da 100 ml (o la più vicina disponibile).
Non includere linguaggio o descrizioni di marketing: utilizza solo dati strutturati e fattuali.
Il prompt precedente fornisce sia un semplice file TXT che una tabella CSV strutturata. Include una panoramica strutturata dell'intera collezione di profumi, con nomi, raggruppamenti e codici EAN:
In questo modo si risparmiano ore di lavoro manuale per lo studio. Questo, o inutili avanti e indietro e talvolta comunicazioni ritardate tra lo studio e il cliente o il fornitore.
Dopo aver catturato le immagini con PhotoRobot, con sfondi puliti e illuminazione ottimale, è possibile migliorarle ulteriormente con l'intelligenza artificiale. Per questo, PhotoRobot integra perfettamente PhotoRoom tramite API nel sistema di controllo di PhotoRobot. Ciò consente:
Facendo un ulteriore passo avanti, la narrazione visiva è possibile attraverso il background del prodotto in diversi modi in cui l'intelligenza artificiale può aiutare. Prendiamo, ad esempio, la visualizzazione degli ingredienti chiave della fragranza intorno a ogni bottiglia di profumo.
Trovare ingredienti visualizzabili specifici per ogni profumo richiede un prompt AI più descrittivo. Il prompt deve richiedere che i risultati includano note chiave, temi visivi ed elementi di design per ogni elemento. Queste informazioni aiuteranno in seguito a generare immagini di sfondo accurate per il marchio e il prodotto.
Prendi ad esempio il seguente prompt. Iniziamo descrivendo il progetto e allegando il CSV di output dal primo prompt.
I am preparing a detailed dataset for building a mood board or artistic representation. The dataset must provide structured data to generate visual representations of perfumes using AI. Please provide a detailed CSV table for the perfumes in the following file:
- 2_armani_prive_overview_ean.csv (the output from prompt 1)
Select perfumes only in the dataset:
- La Collection
For each perfume, create the following columns:
1. Fragrance – The name of the perfume
2. Top Notes – Tangible, visualizable ingredients (e.g. flowers, resins, peels)
3. Heart Notes – Tangible, visualizable ingredients
4. Base Notes – Tangible, visualizable ingredients
5. Visual Themes – A short phrase describing the atmosphere and textures the perfume evokes (for artistic use, e.g. “stone walls, golden light”)
6. Bottle Design – A detailed description of the perfume bottle: color and material of the body, shape, color of the cap, and label
Also, keep all ingredients and design details clearly worded for use in image generation. Take for example: resins, woods, herbs, spices, flowers, fruits, leaves, roots, smoke, or textures – e.g., dry, mineral, creamy. Exclude abstract terms like “elegant”, “sophisticated”, or “sensual”. Focus on concrete visual elements like “black glass”, “gold plate label”, “ivory stone cap”, etc.
Additionally, briefly list the main visual themes or textures the perfume evokes (e.g. "golden glow", "stone walls", "church incense", "earthy forest", etc.) — anything useful for background styling or setting a graphic mood.
Prepare a CSV structure that will later be used to generate visual prompts for AI image models like DALL·E. Please format the output clearly and in full.
Il prompt sopra si traduce in una tabella dettagliata degli ingredienti secondo le specifiche in formato file CSV.
Ad esempio, i risultati del prompt includono quanto segue per il primo profumo.
Il secondo profumo ha quindi i suoi risultati specifici per l'articolo.
Questi dati strutturati su tutti i profumi della collezione forniranno le informazioni necessarie per iniziare a creare suggerimenti visivi.
Con l'elenco degli ingredienti visualizzabile, la fase successiva consiste nell'ingegnerizzare i prompt visivi per i generatori di immagini. Per questo, l'intelligenza artificiale può produrre una nuova colonna "Visual Prompt" per ogni diverso profumo nel CSV. Tuttavia, ciò richiede istruzioni molto dettagliate all'interno del nuovo prompt. Questo inizia prima con il caricamento dell'elenco degli ingredienti visualizzabili e poi con la descrizione del progetto. Il prompt deve quindi includere più livelli di comandi specifici. I comandi coprono i requisiti del prompt, gli errori comuni da evitare, le restrizioni come nella tipografia e nell'output, nonché le aspettative di qualità.
Il primo livello del prompt allega il file CSV per l'analisi e fornisce istruzioni generali sull'attività.
Ti viene fornito un file CSV contenente dati strutturati sui profumi della collezione Armani Privé La Collection. Ogni riga comprende:
- Fragranza (nome del profumo)
- Note di testa (ingredienti chiaramente visualizzabili)
- Note di cuore (ingredienti chiaramente visualizzabili)
- Note di fondo (ingredienti chiaramente visualizzabili)
- Temi visivi (atmosfera e texture evocate dal profumo)
- Design della bottiglia (materiale, colore, forma, etichetta e tappo)
- EAN (usato come nome del file immagine)
Il tuo compito è generare una nuova colonna chiamata "Visual Prompt" che contiene un prompt completo e diretto per gli strumenti di generazione di immagini AI (ad esempio, DALL· E o Midjourney).
Il secondo livello del prompt identifica i requisiti per ogni nuovo elemento nella nuova colonna del file CSV.
Ogni prompt dovrebbe descrivere come trasformare una foto del prodotto del profumo (denominata {EAN}.jpg) in un'immagine finale con le seguenti proprietà:
In terzo luogo, il prompt nomina restrizioni specifiche ed errori comuni da evitare.
Non menzionare il CSV o descriverne la struttura. Scrivi ogni prompt come se ti rivolgessi direttamente all'intelligenza artificiale per generare l'immagine per quel profumo.
Il risultato dovrebbe apparire premium, atmosferico e fedele all'identità della fragranza. Dovrebbe essere indistinguibile da una fotografia editoriale ritoccata professionalmente, ma completamente generata dall'intelligenza artificiale. Lo spettatore non dovrebbe essere in grado di dire che l'immagine è sintetica.
Inoltre, non menzionare o mostrare la generazione artificiale. L'immagine deve apparire autentica e fotorealistica.
La quarta parte del prompt condivide le istruzioni per lavorare con queste specifiche bottiglie di profumo. La tipografia è un problema comune per l'intelligenza artificiale, quindi è fondamentale fornire istruzioni molto chiare sul design delle etichette, sul marchio e sullo stile.
Pay special attention to the design of the front label on the bottle and its graphics accuracy. The gold plate must include the following exact text, as the original image, centered and aligned as on the real product.
- The slash symbol (" / ") between ARMANI and PRIVĒ is slightly taller than other letters and subtly stylized. It starts slightly below other characters, and ends slightly above the other characters, as on the original image.
- The character "Ē" in PRIVĒ must have a clearly visible horizontal accent mark, while the letter including the accent mark is the same height as other letters. There is a flat horizontal line above it (not an acute line). The line must be the same width as the E below it, not slanted. It must not resemble an É. This is not a diacritic or an accent – it is a flat macron (horizontal bar). In other words, the horizontal line on Ē must resemble a short flat line, like a hyphen, placed precisely above the E. It must not be diagonal like in É.
- Match the exact label design from the reference product photo.
- The label must be identical in typography, spacing, and accents. The label must be the same visual style as the original image, as it is crucial to the brand identity.
- The typography must be accurate and not estimated or replaced. Caution: the typography may be changed for a single character, so follow the details for each character individually.
- Do not change, shorten, or paraphrase any part of the label.
Il livello finale del prompt continua le aspettative per ogni prompt visivo e fornisce istruzioni per il nuovo file CSV.
Il piatto della bottiglia deve mantenere le proporzioni, la finitura superficiale e l'aspetto della stampa in rilievo in condizioni di illuminazione soffusa.
Questa etichetta è fondamentale per il marchio : trattala con la stessa fedeltà visiva di un logo o di un marchio.
La forma della bottiglia è fondamentale per il marchio : trattala con la stessa fedeltà visiva di un logo o di un marchio.
Non alterare il testo o approssimare il tipo: considera questa etichetta come un elemento di design critico per il marchio che deve essere accurato e nitido.
L'etichetta deve mantenere le sue proporzioni reali, la sua consistenza e la sua finitura dorata: è leggermente goffrata con una morbida lucentezza satinata sotto una luce soffusa.
Salva il risultato in un nuovo file CSV con tutte le colonne originali più la nuova colonna "Prompt visivo".
Alla fine, la tabella CSV risultante contiene l'elenco completo di profumi, nomi, EAN, ingredienti visualizzabili e suggerimenti visivi. I prompt visivi contengono suggerimenti completi e diretti per strumenti di generazione di immagini AI come DALL· E and Midjourney. Questi aiuteranno a creare sfondi e scene personalizzati che completano in modo creativo le foto reali delle bottiglie di profumo.
Dopo aver creato i prompt visivi per ogni elemento, il tuo generatore di immagini AI preferito può fare il resto. Tutto ciò che serve è caricare le immagini catturate da PhotoRobot e inserire i suggerimenti visivi dal CSV per creare sfondi personalizzati. Il generatore eseguirà il rendering dello sfondo in base all'ingegneria dei prompt e per il rendering in stili diversi.
Nel frattempo, le immagini dei prodotti PhotoRobot con rimozione precisa dello sfondo semplificano lo scambio di sfondi in entrata e in uscita. Se uno non corrisponde perfettamente, i team di controllo qualità possono crearne rapidamente uno che funzioni. Questo, o richiedere al generatore di intelligenza artificiale di regolare gli output fino a quando non sono soddisfacenti.
Infine, se si spingono i limiti della generazione di sfondo AI, è possibile anche il rendering completo della scena 3D. Tuttavia, questo va ben oltre i più semplici scambi di sfondo. Immagina di visualizzare un fantastico ambiente 3D con scenari accurati del marchio oltre agli ingredienti chiave. Per raggiungere questo obiettivo è necessario un suggerimento molto più ambizioso.
Per generare una scena 3D completa per una delle bottiglie di profumo, è necessario un altro prompt sofisticato. Deve tenere conto della composizione della scena, dei temi visivi, degli elementi atmosferici, delle tavolozze dei colori, dell'illuminazione e altro ancora. Prendi ad esempio il seguente prompt.
Dopo aver caricato l'immagine di un prodotto nell'intelligenza artificiale, avvia il prompt del generatore elencando tutti i requisiti per la scena di sfondo. Ciò includerà le informazioni per il prodotto dall'elenco degli ingredienti visualizzabili e i suggerimenti visivi.
Genera l'intera scena, inclusi lo sfondo, gli ingredienti, le trame e l'illuminazione artistica in armonia con il design della bottiglia.
Composizione della scena:
Costruisci un ambiente elegante e in stile editoriale intorno alla bottiglia utilizzando:
Aggiungi effetti atmosferici in primo piano come fumo o nebbia se una parte delle note, sovrapponendo parzialmente la bottiglia per renderla realistica. Mantieni l'equilibrio visivo, la profondità e la raffinatezza.
Mantieni una prospettiva frontale e un'angolazione della telecamera in stile studio.
Successivamente, specifica le istruzioni critiche per l'accuratezza grafica dell'etichetta e della bottiglia. Si tratta degli stessi comandi utilizzati nei prompt visivi per l'aspetto di ogni singolo elemento. Le istruzioni riguardano l'accuratezza della tipografia, il design dell'etichetta, la grafica e l'uso delle foto originali.
Infine, richiedi all'IA tutti i requisiti finali dell'immagine dal prompt visivo del singolo elemento. Ciò include la copia delle stesse istruzioni di prima su proporzioni, finiture, stampa in rilievo e illuminazione. Questi elencano i requisiti di qualità specifici per l'etichetta, la forma della bottiglia, il testo, la tipografia e altri elementi di design. In definitiva, l'output finale dovrebbe prendere forma come una scena 3D completa dietro l'oggetto, che rimane il centro dell'attenzione.
Giudica tu stesso la scena 3D risultante per lo sfondo del prodotto del profumo.
Nota: In questo caso, non c'è modo di integrare completamente la fotografia reale nel mondo 3D. È necessario che il generatore di intelligenza artificiale ridipinga invece l'oggetto digitalmente per posizionarlo all'interno della scena 3D. In questo caso, ci sono varie limitazioni, come l'assenza di una vera composizione multistrato come in Photoshop. Inoltre, i problemi tipografici rimangono con caratteri complessi. Tuttavia, problemi come questi non sempre persisteranno e potrebbero risolversi prima piuttosto che dopo con il progredire della tecnologia.
In sostanza, la fusione di fotografia automatizzata e strumenti di intelligenza artificiale può arricchire notevolmente l'esperienza del cliente in tutto il tuo portfolio. Sebbene la base rimanga una fotografia reale di alta qualità, l'intelligenza artificiale può espandere la narrazione attorno ad essa. La tecnologia supporta la visualizzazione tematica e può servire ad accelerare notevolmente i flussi di lavoro dello studio fotografico. Consente una rapida ricerca e sintesi delle informazioni, la catalogazione automatica e scambi di background efficaci (con conoscenze di ingegneria rapida). Per saperne di più, il team di PhotoRobot è sempre pronto ad aiutare le aziende a realizzare la loro visione creativa. Chiedi solo come potremmo aiutarti. Il tuo progetto potrebbe anche apparire nei futuri post del blog, se non in un flusso di lavoro segreto gelosamente custodito, ovviamente!