1. DALL·E मॉडल का परिचय
ओपनएआई द्वारा डेवलप की गई DALL·E मॉडल एक कृत्रिम बुद्धिमत्ता प्रणाली है जो पाठीय प्रोम्प्ट्स से छवियाँ उत्पन्न कर सकती है। इसकी क्षमता साधारण छवि प्रतिलिपि से लेकर पाठ में वर्णित दृश्यों को रचनात्मक रूप से पुनर्कल्पित करने तक है। "DALL·E" नाम सल्वाडोर डाली और एनीमेटेड किरदार वॉल·E का मेल है, जो कलात्त्व और स्वचालन के संघटन की प्रतीकता करता है।
DALL·E मॉडल को गहरे सीखने के माध्यम से पाठीय प्रोम्प्ट्स को समझने और उन्हें दृश्यिक प्रतिष्ठानों में बदलने के लिए प्रशिक्षित किया जाता है। चाहे फोटोग्राफी हो, चित्रकला हो, डिजिटल कला हो, या किसी भी अन्य प्रकार की छवि हो, DALL·E पर वर्णनों के आधार पर मिलती-जुलती छवियाँ उत्पन्न कर सकता है।
2. DALL·E छवि उत्पन्न मॉडल का मूल उपयोग
OpenAI डाल-ई 3 और डाल-ई 2 एपीआई इंटरफेस के लिए एक एपीआई इंटरफेस प्रदान करता है, जो डेवलपरों को मॉडल को अपने खुद के अनुप्रयोगों या सेवाओं में सम्मिलित करने की अनुमति देता है। नीचे दिए गए हैं DALL·E 3 और DALL·E 2 एपीआई इंटरफेस का उपयोग करके छवियाँ उत्पन्न करने के लिए मूल प्रक्रिया और पैरामीटर का अर्थ:
curl -X POST https://api.openai.com/v1/images/generations \
-H "Authorization: Bearer आपकी एपीआई कुंजी" \
-H "Content-Type: application/json" \
-d '{
"model": "dall-e-2", # मॉडल संस्करण, "dall-e-3" या "dall-e-2" हो सकता है।
"prompt": "पाठीय प्रोम्प्ट", # छवि उत्पन्न करने के लिए उपयुक्त पाठ।
"n": 1, # उत्पन्न करने वाली छवियों की संख्या। DALL·E 3 केवल 1 छवि उत्पन्न कर सकता है, जबकि DALL·E 2 10 छवियाँ साथ ही उत्पन्न कर सकता है।
"size": "1024x1024", # उत्पन्न छवि का आकार। dall-e-2 के लिए, यह 256x256, 512x512, या 1024x1024 में से एक होना चाहिए। dall-e-3 के लिए, यह 1024x1024, 1792x1024, या 1024x1792 में से एक होना चाहिए।
"quality": "standard" # उत्पन्न छवि की गुणवत्ता, "hd" के लिए "standard"।
}'
-
model
: DALL·E मॉडल के संस्करण को निर्दिष्ट करता है। -
prompt
: मॉडल के लिए पाठीय प्रोम्प्ट प्रदान करता है, जिसे यह छवियाँ उत्पन्न करने के लिए उपयोग करता है। -
n
: उत्पन्न करने वाली छवियों की संख्या को निर्दिष्ट करता है। DALL·E 3 केवल एक वक्त छवि उत्पन्न कर सकता है, जबकि DALL·E 2 एक साथ तक 10 छवियाँ उत्पन्न कर सकता है। -
size
: उत्पन्न छवि का आकार। dall-e-2 के लिए, यह 256x256, 512x512, या 1024x1024 में से एक होना चाहिए। dall-e-3 के लिए, यह 1024x1024, 1792x1024, या 1024x1792 में से एक होना चाहिए। -
quality
: उत्पन्न छवि की गुणवत्ता को सेट करता है।standard
मानक गुणवत्ता के लिए,hd
उच्च परिभाषा गुणवत्ता के लिए।
3. छवि संपादन और परिवर्तन उत्पन्न करना (केवल DALL·E 2)
3.1. छवि संपादन (छवियों का संपादन या विस्तार)
DALL·E 2 की छवि संपादन सुविधा के साथ, आप एक छवि और उसके संबंधित मास्क अपलोड कर सकते हैं। मास्क में द्विरंगीय क्षेत्र संपादन करने के लिए संकेत करते हैं, और मॉडल इन क्षेत्रों में नए शब्दात्मक प्रसंगों पर आधारित सामग्री उत्पन्न करेगा। यह सुविधा मौजूदा चित्र तत्वों से भिन्न नए तत्वों बना सकती है, जिससे संपादित संस्करण उत्पन्न होते हैं।
जारी रखें एपीआई अनुरोध उदाहरण का उपयोग करते हुए कर्ल कमांड:
curl -X POST https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "model=dall-e-2" \
-F "prompt=नया शब्दात्मक वर्णन" \
-F "image=@/path_to_your_original_image.png" \
-F "mask=@/path_to_your_mask.png" \
-F "n=1" \
-F "size=1024x1024"
-
image
: मूल छवि की फ़ाइल। -
mask
: मास्क संग्रहित करने वाला फ़ाइल, जहां द्विरंगीय क्षेत्र से ट्रांसपैरेंट क्षेत्र क्षेत्र को प्रोसेस करने के लिए सूचित करता है। -
prompt
: नया शब्दात्मक प्रोम्ट जो नयी छवि के संपूर्ण सामग्री का वर्णन करता है, सिर्फ मिटाए गए क्षेत्र ही नहीं।
यह महत्वपूर्ण है कि अपलोड की गई मूल छवि और मास्क वर्गाकार पीएनजी छवियां हो, 4MB से अधिक नहीं हो और उनके आयाम समान हों।
उदाहरण:
curl https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F image="@sunlit_lounge.png" \
-F mask="@mask.png" \
-F model="dall-e-2" \
-F prompt="एक सनलाइट इंडोर आरामदायक क्षेत्र जिसमें एक स्विमिंग पूल और एक फ़्लेमिंगो है" \
-F n=1 \
-F size="1024x1024"
मूल छवि
मास्क छवि
उत्पन्न छवि
3.2. छवि वेरिएंट जनरेशन
DALL·E 2 का उपयोग छवियों के वेरिएंट उत्पन्न करने के लिए एक मौजूदा छवि से शुरू होता है जो सामग्री या स्टाइल में अलग है। इस सुविधा का उपयोग एक छवि के विभिन्न संभावनाओं का अन्वेषण के लिए या रचनात्मक परिणाम के लिए किया जा सकता है।
इसी तरह, एपीआई अनुरोध भेजने के लिए कर्ल कमांड का इस्तेमाल करें:
curl -X POST https://api.openai.com/v1/images/variations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "image=@/path_to_your_image.png" \
-F "n=2" \
-F "size=1024x1024"
-
image
: वेरिएंट उत्पन्न करने के लिए मूल छवि की फ़ाइल। -
n
: उत्पन्न करने हेतु वेरिएंटों की संख्या, जिसे इस पैरामीटर का उपयोग करके नियंत्रित किया जा सकता है।
जैसा पहले, इनपुट छवि एक वर्गाकार पीएनजी फ़ाइल होनी चाहिए, 4MB से छोटी।