1. ড্যাল·এ মডেলের পরিচিতি
ওপেনএআই দ্বারা তৈরি ড্যাল·এ মডেল হলো একটি কৃত্রিম বুদ্ধিমত্তা সিস্টেম যা পাঠ্যক্ষেত্রকে ছবি তৈরি করতে পারে। এর ক্ষমতা ছবি অনুপ্রেরণা থেকে শুরু করে পাঠ্যে বর্ণিত দৃশ্যগুলি পুনরায় রচনাবলী করতে পারে। "ড্যাল·এ" নামটি শিল্পী সালভাদোর ডালি এবং এনিমেটেড চরিত্র ওয়াল·এর সংমিশ্রণ হল, যা শিল্পকলা এবং স্বয়ংচালিততা এর ছেদছাটের প্রতীক।
ড্যাল·এ মডেলটি গভীর শিক্ষার মাধ্যমে পাঠ্যক্ষেত্রের উপদেশ বুঝে ছবি প্রতিনিধিত্বে পরিণত করার জন্য প্রশিক্ষিত হয়েছে। ছবি, চিত্রকলা, ডিজিটাল শিল্প, বা যে কোনও ছবির ধরণের জন্যই ড্যাল·এ বর্ণনা ভিত্তিক মেলানো ছবি জেনারেট করতে পারে।
2. ড্যাল·এ ইমেজ জেনারেশন মডেলের মৌলিক ব্যবহার
ওপেনএআই ড্যাল·এ এপিআই ইন্টারফেস সরবরাহ করে, যা ডেভেলপারদের তাদের নিজস্ব অ্যাপ্লিকেশন বা সেবায় মডেল সংযোগ করতে অনুমতি দেয়। নীচে ড্যাল·এ 3 এবং ড্যাল·এ 2 এপি ইন্টারফেস ব্যবহার করে ছবি তৈরি করার জন্য মৌলিক প্রক্রিয়া এবং প্যারামিটার অর্থ দেয়া হলে:
curl -X POST https://api.openai.com/v1/images/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "dall-e-2", # মডেল সংস্করণ, "dall-e-3" বা "dall-e-2" হতে পারে।
"prompt": "টেক্সট প্রম্পট", # ছবি জেনারেট করার জন্য ব্যবহৃত টেক্সট।
"n": 1, # উত্পন্ন করতে ছবির সংখ্যা। ড্যাল·এ 3 প্রতিবার শুধুমাত্র 1 টি ছবি উৎপন্ন করতে পারে, যখন ড্যাল·এ 2 এটি সময়ানুসারে 10 টি ছবি তৈরি করতে পারে।
"size": "1024x1024", # উৎপন্ন ছবির আকার। dall-e-2 এর জন্য, এটি অবশ্যই 256x256, 512x512, বা 1024x1024 এর মধ্যে একটি হতে হবে। dall-e-3 এর জন্য, এটি অবশ্যই 1024x1024, 1792x1024, বা 1024x1792 এর মধ্যে একটি হতে হবে।
"quality": "standard" # উৎপন্ন ছবির মান। "মান" মানে স্ট্যান্ডার্ড মান, "এইচডি" মানে হাই-ডেফিনিশন মান।
}'
-
model
: ব্যবহার করার জন্য ড্যাল·এ মডেলের সংস্করণ নির্ধারণ করে। -
prompt
: মডেলের জন্য পাঠ্যক্ষেত্রিক প্রম্পটটি সরবরাহ করে, যা তা ছবি তৈরি করতে ব্যবহার করে। -
n
: তৈরি করার জন্য ছবির সংখ্যা নির্ধারণ করে। ড্যাল·এ 3 প্রতিবার শুধুমাত্র 1 টি ছবি উৎপন্ন করতে পারে, যখন ড্যাল·এ 2 সর্বাধিক 10 টি ছবি সাথে প্রতিযোগিতাপূর্ণভাবে উৎপন্ন করতে পারে। -
size
: তৈরি করা ছবির আকার। dall-e-2 এর জন্য, এটি অবশ্যই 256x256, 512x512, বা 1024x1024 এর মধ্যে একটি হতে হবে। dall-e-3 এর জন্য, এটি অবশ্যই 1024x1024, 1792x1024, বা 1024x1792 এর মধ্যে একটি হতে হবে। -
quality
: তৈরি করা ছবির মান সেট করে।স্ট্যান্ডার্ড
ছবির মানের জন্য,এইচডি
হাই-ডেফিনিশন মানের জন্য।
3. ছবি সম্পাদনা এবং ভেরিয়েন্ট জেনারেশন (শুধুমাত্র DALL·E 2)
3.1. চিত্র সম্পাদনা (চিত্র সম্পাদনা বা প্রসারণ)
DALL·E 2 এর চিত্র সম্পাদনা বৈশিষ্ট্যের মাধ্যমে, আপনি একটি চিত্র এবং সাথে সাথে তার প্রায়োজিত মাস্ক আপলোড করতে পারেন। মাস্কে প্রান্তিক অঞ্চলগুলি সম্পাদনা করতে হবে, এবং মডেলটি এই অঞ্চলগুলিতে নতুন পাঠ্যিক প্রার্থনার ভিত্তিতে বিষয়বস্তু তৈরি করবে। এই বৈশিষ্ট্যটি মৌলিক চিত্র উপাদানগুলি থেকে ভিন্ন নতুন উপাদান তৈরি করতে পারে, তাছাড়া সম্পাদিত সংস্করণ তৈরি করতে পারে।
কার্ল কমান্ডের সাথে এপিআই অনুরোধ উদাহরণ ব্যবহার করে পরবর্তী:
curl -X POST https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "model=dall-e-2" \
-F "prompt=নতুন পাঠ্যিক বর্ণনা" \
-F "image=@/পাথ_টু_আপনার_মৌলিক_চিত্র.png" \
-F "mask=@/পাথ_টু_আপনার_মাস্ক.png" \
-F "n=1" \
-F "size=1024x1024"
-
image
: মৌলিক চিত্র ধারণ করা ফাইল। -
mask
: মাস্ক ধারণ করা ফাইল, যেখানে পারদর্শী অঞ্চলটি মডেল দ্বারা প্রসেস করতে। -
prompt
: নতুন পাঠ্যিক প্রম্পট, যেটি নতুন ছবির পূর্ণ বিষয়বস্তু বর্ণনা করে, কেবল মুছে ফেলার অঞ্চলটি নয়।
গুরুত্বপূর্ণ এখানে মনে রাখা যাক যে আপলোড করা মূল চিত্র এবং মাস্ক অবশ্যই বর্গীয় PNG চিত্র হতে হবে, 4MB-এর বেশি আকারের না হতে এবং একই মাত্রার হতে হবে।
উদাহরণ:
curl https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F image="@sunlit_lounge.png" \
-F mask="@mask.png" \
-F model="dall-e-2" \
-F prompt="একটি সূর্যালোকিত ঘরের অভ্যন্তরীণ বিশ্রাম এলাকা যাতে একটি সাঁতার পুল এবং একটি সাদা হাঁস রয়েছে" \
-F n=1 \
-F size="1024x1024"
মৌলিক ছবি
মাস্ক ছবি
তৈরি ছবি
3.2. চিত্র পরিবর্তন তৈরি
DALL·E 2 ব্যবহার করে চিত্রের বিভিন্ন রূপান্তর তৈরি করতে শুরু করা হয়, যা বিষয়বস্তু বা শৈলীতে ভিন্ন হয়। এই বৈশিষ্ট্যটি একটি চিত্রের বিভিন্ন সম্ভাবনাগুলি অন্বেষণ করতে বা সৃজনশীল বিবর্তনের জন্য ব্যবহার করা যেতে পারে।
একইভাবে, এপিআই অনুরোধ পাঠানোর জন্য কার্ল কমান্ড ব্যবহার করুন:
curl -X POST https://api.openai.com/v1/images/variations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "image=@/আপনার_চিত্রের_পাথ.png" \
-F "n=2" \
-F "size=1024x1024"
-
image
: চিত্রের মৌলিক ফাইলে ধারণ করা। -
n
: উৎপাদনের জন্য অনুপ্রাণিত সংখ্যা, এই প্যারামিটারটি ব্যবহার করে নিয়ন্ত্রণ করা যেতে পারে।
আগেরতেই, ইনপুট চিত্র একটি বর্গীয় PNG ফাইল হতে হবে, 4MB থেকে ছোট,।