1. Introduzione al Modello DALL·E
Il modello DALL·E di OpenAI è un sistema di intelligenza artificiale in grado di generare immagini da prompt testuali. Le sue capacità vanno dalla semplice replicazione di immagini alla rielaborazione creativa di scene descritte nel testo. Il nome "DALL·E" è una fusione del pittore Salvador Dalí e del personaggio animato WALL·E, simboleggiando l'intersezione tra l'arte e l'automazione.
Il modello DALL·E è addestrato attraverso apprendimento profondo per comprendere prompt testuali e trasformarli in rappresentazioni visive. Che si tratti di fotografia, pittura, arte digitale o qualsiasi altra forma di immagine, DALL·E può generare immagini corrispondenti in base alle descrizioni.
2. Utilizzo di Base del Modello di Generazione di Immagini DALL·E
OpenAI fornisce un'interfaccia API per DALL·E, consentendo agli sviluppatori di integrare il modello nelle proprie applicazioni o servizi. Di seguito è riportato il processo di base e i significati dei parametri per generare immagini utilizzando le interfacce API DALL·E 3 e DALL·E 2:
curl -X POST https://api.openai.com/v1/images/generations \
-H "Authorization: Bearer LA_TUA_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "dall-e-2", # Versione del modello, può essere "dall-e-3" o "dall-e-2".
"prompt": "Prompt testuale", # Testo utilizzato per generare l'immagine.
"n": 1, # Numero di immagini da generare.
"size": "1024x1024", # Dimensione dell'immagine.
"quality": "standard" # Qualità dell'immagine, può essere "hd".
}'
-
model
: Specifica la versione del modello DALL·E da utilizzare. -
prompt
: Fornisce il prompt testuale per il modello, che viene utilizzato per generare le immagini. -
n
: Specifica il numero di immagini da generare. DALL·E 3 può generare solo 1 immagine alla volta, mentre DALL·E 2 può generare fino a 10 immagini contemporaneamente. -
size
: Dimensione dell'immagine generata. Per dall-e-2, deve essere una tra 256x256, 512x512 o 1024x1024. Per dall-e-3, deve essere una tra 1024x1024, 1792x1024 o 1024x1792. -
quality
: Imposta la qualità dell'immagine generata.standard
per qualità standard,hd
per qualità ad alta definizione.
3. Modifica delle Immagini e Generazione di Varianti (Solo DALL·E 2)
3.1. Modifica delle immagini (Modifica o Espansione delle Immagini)
Con la funzione di modifica delle immagini di DALL·E 2, è possibile caricare un'immagine e la relativa maschera. Le aree trasparenti nella maschera indicano le parti da modificare e il modello genererà contenuti in queste aree in base alle nuove indicazioni testuali. Questa funzione può creare nuovi elementi diversi dagli elementi dell'immagine originale, generando quindi versioni modificate.
Continua a utilizzare l'esempio di richiesta API con il comando curl:
curl -X POST https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer LA_TUA_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "model=dall-e-2" \
-F "prompt=Nuova descrizione testuale" \
-F "image=@/percorso_del_tuo_immagine_originale.png" \
-F "mask=@/percorso_della_tua_maschera.png" \
-F "n=1" \
-F "size=1024x1024"
-
image
: file contenente l'immagine originale. -
mask
: file contenente la maschera, in cui l'area trasparente indica la regione da processare mediante il modello. -
prompt
: nuova indicazione testuale che descrive l'intero contenuto della nuova immagine, non solo l'area cancellata.
È importante notare che l'immagine originale e la maschera caricate devono essere immagini PNG quadrate, non superiori a 4MB di dimensione e con le stesse dimensioni.
Esempio:
curl https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F image="@sunlit_lounge.png" \
-F mask="@mask.png" \
-F model="dall-e-2" \
-F prompt="Una zona riposante al chiuso illuminata dal sole con una piscina e un fenicottero all'interno" \
-F n=1 \
-F size="1024x1024"
Immagine Originale
Immagine Maschera
Immagine Generata
3.2. Generazione di Varianti delle Immagini
Utilizzando DALL·E 2 per generare varianti delle immagini si parte da un'immagine esistente per creare alcune versioni diverse per contenuto o stile. Questa funzione può essere utilizzata per esplorare diverse possibilità di un'immagine o per un'evoluzione creativa.
Analogamente, utilizza il comando curl per inviare una richiesta API:
curl -X POST https://api.openai.com/v1/images/variations \
-H "Authorization: Bearer LA_TUA_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "image=@/percorso_della_tua_immagine.png" \
-F "n=2" \
-F "size=1024x1024"
-
image
: file contenente l'immagine originale per la quale devono essere generate le varianti. -
n
: il numero di varianti da generare, che può essere controllato utilizzando questo parametro.
Come prima, l'immagine di input deve essere un file PNG quadrato, più piccolo di 4MB.