Pengenalan Model API DALL·E

1. Pengenalan Model DALL·E

Model DALL·E oleh OpenAI adalah sistem kecerdasan buatan yang dapat menghasilkan gambar dari teks. Kemampuannya berkisar dari replikasi gambar sederhana hingga memimaginasi ulang scene yang dijelaskan dalam teks. Nama "DALL·E" merupakan perpaduan antara pelukis Salvador Dalí dan karakter animasi WALL·E, melambangkan perpaduan seni dan otomatisasi.

Model DALL·E dilatih melalui deep learning untuk memahami teks dan mengubahnya menjadi representasi visual. Baik itu fotografi, lukisan, seni digital, atau bentuk gambar lainnya, DALL·E dapat menghasilkan gambar yang sesuai berdasarkan deskripsi.

2. Penggunaan Dasar Model Generasi Gambar DALL·E

OpenAI menyediakan antarmuka API untuk DALL·E, yang memungkinkan pengembang untuk mengintegrasikan model ke dalam aplikasi atau layanan mereka sendiri. Berikut adalah proses dasar dan arti parameter untuk menghasilkan gambar menggunakan antarmuka API DALL·E 3 dan DALL·E 2:

curl -X POST https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
        "model": "dall-e-2", # Versi model, dapat berupa "dall-e-3" atau "dall-e-2".
        "prompt": "Text prompt", # Teks yang digunakan untuk menghasilkan gambar.
        "n": 1, # Jumlah gambar yang akan dihasilkan.
        "size": "1024x1024", # Ukuran gambar.
        "quality": "standard" # Kualitas gambar, dapat berupa "hd".
      }'

model: Menentukan versi model DALL·E yang akan digunakan.
prompt: Memberikan teks sebagai prompt untuk model, yang digunakan untuk menghasilkan gambar.
n: Menentukan jumlah gambar yang akan dihasilkan. DALL·E 3 hanya dapat menghasilkan 1 gambar pada satu waktu, sementara DALL·E 2 dapat menghasilkan hingga 10 gambar secara bersamaan.
size: Ukuran gambar yang dihasilkan. Untuk dall-e-2, harus menjadi salah satu dari 256x256, 512x512, atau 1024x1024. Untuk dall-e-3, harus menjadi salah satu dari 1024x1024, 1792x1024, atau 1024x1792.
quality: Mengatur kualitas gambar yang dihasilkan. standard untuk kualitas standar, hd untuk kualitas high-definition.

3. Pengeditan Gambar dan Generasi Variasi (Hanya DALL·E 2)

3.1. Pengeditan Gambar (Mengedit atau Memperluas Gambar)

Dengan fitur pengeditan gambar dari DALL·E 2, Anda dapat mengunggah sebuah gambar beserta maskernya. Area transparan dalam masker menunjukkan bagian yang akan diedit, dan model akan menghasilkan konten dalam area ini berdasarkan petunjuk teks baru. Fitur ini dapat menciptakan elemen-elemen baru yang berbeda dari elemen gambar asli, sehingga menghasilkan versi yang sudah diedit.

Lanjutkan untuk menggunakan contoh permintaan API dengan perintah curl:

curl -X POST https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F "model=dall-e-2" \
  -F "prompt=Deskripsi teks baru" \
  -F "image=@/path_to_your_original_image.png" \
  -F "mask=@/path_to_your_mask.png" \
  -F "n=1" \
  -F "size=1024x1024"

image: file berisi gambar asli.
mask: file berisi masker, di mana area transparan menunjukkan wilayah yang akan diproses oleh model.
prompt: petunjuk teks baru yang menggambarkan seluruh konten dari gambar baru, bukan hanya area yang dihapus.

Penting untuk dicatat bahwa gambar asli dan masker yang diunggah harus berupa gambar PNG persegi, tidak melebihi ukuran 4MB, dan memiliki dimensi yang sama.

Contoh:

curl https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F image="@sunlit_lounge.png" \
  -F mask="@mask.png" \
  -F model="dall-e-2" \
  -F prompt="Area istirahat dalam ruangan yang terkena sinar matahari dengan kolam renang, dan seekor flamingo di dalamnya" \
  -F n=1 \
  -F size="1024x1024"

Gambar Asli Gambar Masker Gambar yang Dihasilkan

3.2. Generasi Variasi Gambar

Menggunakan DALL·E 2 untuk menghasilkan variasi gambar dimulai dari sebuah gambar eksisting untuk membuat beberapa versi yang berbeda dalam konten atau gaya. Fitur ini dapat digunakan untuk menjelajahi berbagai kemungkinan sebuah gambar atau untuk evolusi kreatif.

Sama seperti sebelumnya, gunakan perintah curl untuk mengirim permintaan API:

curl -X POST https://api.openai.com/v1/images/variations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F "image=@/path_to_your_image.png" \
  -F "n=2" \
  -F "size=1024x1024"

image: file berisi gambar asli untuk menghasilkan variasi.
n: jumlah variasi yang akan dihasilkan, yang dapat dikendalikan menggunakan parameter ini.

Seperti sebelumnya, gambar input harus berupa file PNG persegi, dengan ukuran kurang dari 4MB.

1. Pengenalan Model DALL·E

2. Penggunaan Dasar Model Generasi Gambar DALL·E

3. Pengeditan Gambar dan Generasi Variasi (Hanya DALL·E 2)

3.1. Pengeditan Gambar (Mengedit atau Memperluas Gambar)

3.2. Generasi Variasi Gambar

Tutorial Terkait