DALL·E Model API'ının Tanıtımı

1. DALL·E Modelının Tanıtımı

OpenAI tarafından geliştirilen DALL·E modeli, metin girdilerinden görüntüler oluşturabilen bir yapay zeka sistemidir. Yetenekleri, basit bir görüntü kopyalamadan metinde anlatılan sahneleri yaratıcı bir şekilde yeniden hayal etmeye kadar uzanmaktadır. "DALL·E" adı, ressam Salvador Dalí ve animasyon karakteri WALL·E'nin birleşiminden oluşur ve sanatın ve otomasyonun kesişimini simgeler.

DALL·E modeli, derin öğrenme yoluyla eğitilmiş olup metin girdilerini anlamak ve bunları görsel temsillemelere dönüştürmek için kullanılır. Fotoğrafçılık, resim, dijital sanat veya herhangi bir diğer görsel sanat türü olsun, DALL·E betimlemelere dayalı eşleşen görüntüler oluşturabilir.

2. DALL·E Görüntü Oluşturma Modelinin Temel Kullanımı

OpenAI, DALL·E modelini kendi uygulamalarına veya hizmetlerine entegre etmelerine izin vermek için bir API arayüzü sağlar. Aşağıda, DALL·E 3 ve DALL·E 2 API arayüzlerini kullanarak görüntü oluşturmak için temel işlem ve parametre anlamları bulunmaktadır:

curl -X POST https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
        "model": "dall-e-2", # Model versiyonu, "dall-e-3" veya "dall-e-2" olabilir.
        "prompt": "Metin girdisi", # Görüntü oluşturmak için kullanılan metin.
        "n": 1, # Oluşturulacak görüntü sayısı.
        "size": "1024x1024", # Görüntü boyutu.
        "quality": "standard" # Görüntü kalitesi, "hd" olabilir.
      }'

model: Kullanılacak DALL·E modelinin versiyonunu belirtir.
prompt: Model için metin girdisini sağlar, bu girdiyle görüntüler oluşturulur.
n: Oluşturulacak görüntü sayısını belirtir. DALL·E 3, aynı anda yalnızca 1 görüntü oluşturabilirken DALL·E 2, aynı anda en fazla 10 görüntü oluşturabilir.
size: Oluşturulan görüntünün boyutu. dall-e-2 için 256x256, 512x512 veya 1024x1024'ten biri olmalıdır. dall-e-3 için 1024x1024, 1792x1024 veya 1024x1792'den biri olmalıdır.
quality: Oluşturulan görüntünün kalitesini ayarlar. Standart kalite için standard, yüksek çözünürlük için hd.

3. Görüntü Düzenleme ve Varyant Oluşturma (Sadece DALL·E 2 İçin)

3.1. Görüntü Düzenleme (Görüntüleri Düzenleme veya Genişletme)

DALL·E 2'nin görüntü düzenleme özelliği ile bir görüntüyü ve buna karşılık gelen maskeyi yükleyebilirsin. Maskedeki şeffaf alanlar, düzenlenecek parçaları belirtir ve model, bu alanlardaki içeriği yeni metin yönergelerine dayalı olarak oluşturur. Bu özellik, orijinal görüntü öğelerinden farklı yeni unsurlar oluşturarak düzenlenmiş sürümler oluşturabilir.

Devam etmek için aşağıdaki örnek API isteğini curl komutuyla kullan:

curl -X POST https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer SENIN_API_ANAHTARIN" \
  -H "Content-Type: multipart/form-data" \
  -F "model=dall-e-2" \
  -F "prompt=Yeni metin açıklaması" \
  -F "image=@/path_to_orijinal_goruntu.png" \
  -F "mask=@/path_to_maske.png" \
  -F "n=1" \
  -F "size=1024x1024"

image: orijinal görüntüyü içeren dosya.
mask: şeffaf alanın işleneceğini belirten maskenin bulunduğu dosya.
prompt: yeni bir metin yönergesi, sadece silinmiş alanı değil, yeni görüntünün tüm içeriğini tanımlayan metin.

Yüklenen orijinal görüntü ve maske, 4MB'den büyük olmayan ve aynı boyuta sahip kare PNG görüntüleri olmalıdır.

Örnek:

curl https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F image="@sunlit_lounge.png" \
  -F mask="@mask.png" \
  -F model="dall-e-2" \
  -F prompt="Güneş ışığı alan iç mekanda bir yüzme havuzu ve içinde bir flamingo bulunuyor" \
  -F n=1 \
  -F size="1024x1024"

Orijinal Görüntü Maske Görüntü Oluşturulan Görüntü

3.2. Görüntü Varyantı Oluşturma

DALL·E 2'yi kullanarak görüntülerin varyantlarını oluşturmak, mevcut bir görüntüden farklı içerik veya tarzda bazı sürümler oluşturmaya başlar. Bu özellik, bir görüntünün farklı olasılıklarını keşfetmek veya yaratıcı evrim için kullanılabilir.

Benzer şekilde, API isteği göndermek için curl komutunu kullan:

curl -X POST https://api.openai.com/v1/images/variations \
  -H "Authorization: Bearer SENIN_API_ANAHTARIN" \
  -H "Content-Type: multipart/form-data" \
  -F "image=@/path_to_orijinal_goruntu.png" \
  -F "n=2" \
  -F "size=1024x1024"

image: varyantlar oluşturulacak orijinal görüntüyü içeren dosya.
n: bu parametre kullanılarak oluşturulacak varyant sayısı kontrol edilebilir.

Yine, giriş görüntüsü, 4MB'den küçük kare bir PNG dosyası olmalıdır.

1. DALL·E Modelının Tanıtımı

2. DALL·E Görüntü Oluşturma Modelinin Temel Kullanımı

3. Görüntü Düzenleme ve Varyant Oluşturma (Sadece DALL·E 2 İçin)

3.1. Görüntü Düzenleme (Görüntüleri Düzenleme veya Genişletme)

3.2. Görüntü Varyantı Oluşturma

İlgili Rehberler