1. DALL·E ماڈل کی تعارف

DALL·E ماڈل، اوپن اے آئی کا ایک خود کار مصنوعی ہوش ہے جو متنی درخواستوں سے تصاویر تخلیق کرسکتا ہے۔ اس کی صلاحیت سادہ تصویری ترجمے سے لے کر متن میں بیان کردہ مناظر کو خلاقانہ انداز میں دوبارہ تصور کرنے تک ہے۔ نام "DALL·E" کو پینٹر سلواڈور ڈالی اور انیمیٹڈ کردار WALL·E کا ملاپ سمجھا جاتا ہے، جو فنون اور خود کاری کے تقاطع کو ظاہر کرتا ہے۔

DALL·E ماڈل کو گہری مشقت سے ہدایت دی گئی ہے تاکہ وہ متنی درخواستوں کو سمجھ سکے اور انہیں تصوراتی تشکیلات میں تبدیل کر سکے۔ چاہے وہ فوٹوگرافی ہو، پینٹنگ ہو، ڈیجیٹل آرٹ ہو یا کسی اور قسم کی تصویر ہو، DALL·E تفصیلات کے مطابق مماثل تصاویر تخلیق کرسکتا ہے۔

2. DALL·E تصویری تخلیق ماڈل کا بنیادی استعمال

OpenAI نے DALL·E کے لئے API انٹرفیس فراہم کیا ہے، جو مصرعات یا پیغامات کو تصاویر میں تبدیل کرنے کیلئے ڈویلپرز کو اپنے اپلیکیشن یا خدمات میں شامل کرنے کی اجازت دیتا ہے۔ نیچے دی گئی ہے DALL·E 3 اور DALL·E 2 API انٹرفیس استعمال کرکے تصویریں تخلیق کرنے کا بنیادی طریقہ اور پیرامیٹر کی معنیاں:

curl -X POST https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer اپنی ایپی کی" \
  -H "Content-Type: application/json" \
  -d '{
        "model": "dall-e-2", # ماڈل ورژن، "dall-e-3" یا "dall-e-2" ہوسکتا ہے۔
        "prompt": "متنی مصرعہ", # تصویر تخلیق کرنے کے لئے متن استعمال ہو گا۔
        "n": 1, # تخلیق کرنے والی تصاویر کی تعداد۔ DALL·E 3 صرف ایک تصویر تخلیق کرسکتا ہے، جبکہ DALL·E 2 10 تصاویر ایک ساتھ تخلیق کر سکتا ہے۔
        "size": "1024x1024", # تخلیق کردہ تصویر کا سائز۔
        "quality": "standard" # تصویر کی کوالٹی، "hd" کے لئے "معیاری"۔
      }'
  • model: DALL·E ماڈل کی ورژن کو تعین کرتا ہے۔
  • prompt: ماڈل کے لئے متنی مصرعہ فراہم کرتا ہے، جس کا استعمال تصاویر تخلیق کرنے کے لئے کیا جاتا ہے۔
  • n: تخلیق کرنے والی تصاویر کی تعداد کو مخصوص کرتا ہے۔ DALL·E 3 صرف ایک تصویر کوئی ایک وقت میں تخلیق کرسکتا ہے، جبکہ DALL·E 2 10 تصاویر ایک ساتھ تخلیق کرسکتا ہے۔
  • size: تخلیق کردہ تصویر کا سائز۔ dall-e-2 کے لئے، اسے 256x256، 512x512 یا 1024x1024 میں سے ایک ہونا چاہئے۔ dall-e-3 کے لئے، 1024x1024، 1792x1024 یا 1024x1792 میں سے ایک ہونا چاہئے۔
  • quality: تخلیق کردہ تصویر کی کوالٹی کو مخصوص کرتا ہے۔ معیاری کو معیاری کوالٹی کے لئے، hd کو ہائی ڈیفنیشن کوالٹی کے لئے۔

3. تصویر سنوارنا اور متغیر تخلیق (صرف DALL·E 2 کے لئے)

3.1. تصویری ترمیم (ترمیم یا توسیع تصاویر)

DALL·E 2 کی تصویری ترمیم کی خصوصیت کے ساتھ، آپ ایک تصویر اور اس کے مطابقتی ماسک اپ لوڈ کر سکتے ہیں۔ ماسک میں شفاف علاقوں میں اصلاح کرنے والے حصوں کو ظاہر کرتی ہیں، اور ماڈل نئے متنی پرومٹس کی بنیاد پر ان حصوں میں مواد پیدا کرے گا۔ یہ خصوصیت اصل تصاویر کے عناصر سے مختلف نئے عناصر بنا سکتی ہے، جس سے ایڈیٹڈ ورژنز پیدا ہوتے ہیں۔

کرل کمانڈ کا API درخواست مثال کے ساتھ جاری رکھیں:

curl -X POST https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer آپ کا ایپی کلید" \
  -H "Content-Type: multipart/form-data" \
  -F "model=dall-e-2" \
  -F "prompt=نیا متنی بیان" \
  -F "image=@/path_to_your_original_image.png" \
  -F "mask=@/path_to_your_mask.png" \
  -F "n=1" \
  -F "size=1024x1024"
  • image: اصل تصویر کا مواد شامل فائل۔
  • mask: ماسک کا مواد شامل فائل، جہاں شفاف علاقہ علاقے کو ماڈل کے زریعہ پروسیس کرنے کے لئے ظاہر کرتی ہے۔
  • prompt: نئی متنی پرومٹ جو نئے تصویر کے مکمل مواد کا وضاحت دیتا ہے، صرف مٹائے گئے علاقے نہیں۔

اس بات کا اہم بیان کرنا ضروری ہے کہ اپ لوڈ کردہ اصل تصویر اور ماسک مربع PNG تصاویر ہونی چاہئیں، وزن 4MB سے زیادہ نہیں ہونا چاہئیں اور ان کی ابعاد ایک جیسی ہونی چاہئیں۔

مثال:

کرل https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F image="@sunlit_lounge.png" \
  -F mask="@mask.png" \
  -F model="dall-e-2" \
  -F prompt="ایک دھوپ سے روشن انڈور آرام کرنے کا علاقہ جس میں ایک سوئمنگ پول اور ایک فلیمنگو ہے" \
  -F n=1 \
  -F size="1024x1024"

اصل تصویر ماسک تصویر پیدا شدہ تصویر

3.2. تصویری مختلفیتیں پیدا کرنا

DALL·E 2 کا استعمال کرکے تصاویر کی مختلفیتوں کو پیدا کرنے کا آغاز، ایک موجودہ تصویر سے شروع ہوتا ہے تاکہ مواد یا اسلوب میں مختلف ورژن بنایا جا سکے۔ یہ خصوصیت ایک تصویر کے مختلف امکانات کا اکتشاف کرنے یا تخلیقی ترقی کے لئے استعمال کی جا سکتی ہے۔

اسی طرح، کرل کمانڈ کا استعمال کرکے ایک API درخواست بھیجیں:

curl -X POST https://api.openai.com/v1/images/variations \
  -H "Authorization: Bearer آپ کی API کی کلید" \
  -H "Content-Type: multipart/form-data" \
  -F "image=@/path_to_your_image.png" \
  -F "n=2" \
  -F "size=1024x1024"
  • image: مواد شامل فائل جو تصویر ہے جس کے ورژن پیدا کرنے ہیں۔
  • n: پیدا کرنے کے ورژنوں کی تعداد، جس کو اس پیرامیٹر کا استعمال کرکے کنٹرول کیا جا سکتا ہے۔

پچھلے طرح، داخلی تصویر ایک مربع PNG فائل ہونی چاہئی۔