1. مقدمة إلى نموذج DALL·E
يعتبر نموذج DALL·E الذي طورته OpenAI نظام ذكاء اصطناعي يمكنه توليد صور من الروابط النصية. تتراوح قدرته من استنساخ الصور البسيطة إلى إعادة تصوُّر مبدعة للمشاهد الموصوفة في النص. يجمع اسم "DALL·E" بين الرسام سلفادور دالي وشخصية الرسوم المتحركة وول-إي، مرمزاً التقاء الفن والتلقائية.
تُدرب نموذج DALL·E من خلال التعلم العميق لفهم الروابط النصية وتحويلها إلى تمثيلات بصرية. سواء كانت تصويراً فوتوغرافياً، رسماً فنياً، فن رقمي، أو أي شكل آخر من الصور، يمكن لـ DALL·E توليد صور متطابقة بناءً على الوصف.
2. الاستخدام الأساسي لنموذج توليد الصور DALL·E
توفر OpenAI واجهة برمجة تطبيقات (API) لـ DALL·E، مما يسمح للمطورين بدمج النموذج في تطبيقاتهم أو خدماتهم الخاصة. أدناه هو العملية الأساسية ومعاني المعلمات لتوليد الصور باستخدام واجهتي API DALL·E 3 و DALL·E 2:
curl -X POST https://api.openai.com/v1/images/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "dall-e-2", # إصدار النموذج، يمكن أن يكون "dall-e-3" أو "dall-e-2".
"prompt": "نص التحفيز", # النص المستخدم لتوليد الصورة.
"n": 1, # عدد الصور المراد توليدها.
"size": "1024x1024", # حجم الصورة.
"quality": "standard" # جودة الصورة، يمكن أن تكون "hd".
}'
-
model
: يحدد إصدار نموذج DALL·E الذي سيتم استخدامه. -
prompt
: يوفر التحفيز النصي للنموذج، الذي يستخدمه لتوليد الصور. -
n
: يحدد عدد الصور التي سيتم توليدها. يمكن لـ DALL·E 3 توليد صورة واحدة فقط في كل مرة، بينما يمكن لـ DALL·E 2 توليد ما يصل إلى 10 صور في وقت واحد. -
size
: حجم الصورة المولَّدة. بالنسبة لـ dall-e-2، يجب أن يكون أحد الأحجام: 256x256، 512x512، أو 1024x1024. بالنسبة لـ dall-e-3، يجب أن يكون أحد الأحجام: 1024×1024، 1792×1024، أو 1024×1792. -
quality
: يحدد جودة الصورة المولَّدة.standard
للجودة القياسية،hd
للجودة عالية الوضوح.
3. تحرير الصور وتوليد الأشكال المتغيرة (DALL·E 2 فقط)
٣.١. تحرير الصور (تحرير أو توسيع الصور)
مع ميزة تحرير الصور في DALL·E 2، يمكنك تحميل صورة وماسكها المقابل. تشير المناطق الشفافة في الماسك إلى الأجزاء التي يجب تحريرها، وسيقوم النموذج بتوليد محتوى في هذه المناطق بناءً على الاقتراحات النصية الجديدة. يمكن لهذه الميزة إنشاء عناصر جديدة مختلفة عن عناصر الصورة الأصلية، مما يؤدي إلى إنشاء نسخ محررة.
مواصلة استخدام مثال طلب API مع أمر الـ curl:
curl -X POST https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "model=dall-e-2" \
-F "prompt=وصف نصي جديد" \
-F "image=@/path_to_your_original_image.png" \
-F "mask=@/path_to_your_mask.png" \
-F "n=1" \
-F "size=1024x1024"
-
image
: ملف يحتوي على الصورة الأصلية. -
mask
: ملف يحتوي على الماسك، حيث تشير المنطقة الشفافة إلى المنطقة التي سيتم معالجتها بواسطة النموذج. -
prompt
: توجيه نصي جديد يصف محتوى الصورة الجديد بأكمله، وليس فقط منطقة المحو.
من المهم الإشارة إلى أن الصورة الأصلية والماسك التي تم تحميلها يجب أن تكونا صور PNG مربعة، ولا تتجاوزا 4 ميغابايت في الحجم وأن تكون لهما نفس الأبعاد.
مثال:
curl https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F image="@sunlit_lounge.png" \
-F mask="@mask.png" \
-F model="dall-e-2" \
-F prompt="منطقة داخلية مضاءة بأشعة الشمس مع حمام سباحة وفلامنغو بداخلها" \
-F n=1 \
-F size="1024x1024"
الصورة الأصلية
صورة الماسك
الصورة المُولًَّدة
٣.٢. توليد الإصدارات المتغايرة للصور
يبدأ استخدام DALL·E 2 لتوليد النسخ المتغايرة من الصور من صورة موجودة مسبقًا لإنشاء بعض الإصدارات المختلفة من حيث المحتوى أو الأسلوب. يمكن استخدام هذه الميزة لاستكشاف احتمالات مختلفة لصورة ما أو للتطور الإبداعي.
بنفس الطريقة، يمكنك استخدام أمر الـ curl لإرسال طلب API:
curl -X POST https://api.openai.com/v1/images/variations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "image=@/path_to_your_image.png" \
-F "n=2" \
-F "size=1024x1024"
-
image
: ملف يحتوي على الصورة الأصلية التي يتعين توليد إصدارات لها. -
n
: عدد الإصدارات التي يتعين توليدها، والتي يمكن التحكم فيها باستخدام هذا المعلم.
كما في السابق، يجب أن تكون الصورة الداخلية ملف PNG مربع، وأصغر من 4 ميغابايت.