1. แนะนำเกี่ยวกับโมเดล DALL·E
โมเดล DALL·E โดย OpenAI เป็นระบบปัญญาประดิษฐ์ที่สามารถสร้างภาพจากข้อความได้ ความสามารถของมันครอบคลุมตั้งแต่การทำซ้ำภาพไปจนถึงการสร้างภาพที่มีการจินตนาการอย่างสร้างสรรค์จากฉากที่อธิบายในข้อความ ชื่อ "DALL·E" เป็นการผสมระหว่างศิลปินซัลวาดอร์ ดาลี และตัวละครแอนิเมชัน WALL·E ซึ่งเป็นสัญลักษณ์ของการต่อสู้ระหว่างศิลปกรรมและอัตโนมัติ
โมเดล DALL·E ถูกฝึกด้วยการเรียนรู้ลึกเพื่อเข้าใจข้อความที่อธิบายและแปลงมันเป็นการแสดงผลทางภาพ ไม่ว่าจะเป็นการถ่ายภาพ วาดภาพ ศิลปะดิจิทัล หรือรูปแบบอื่น ๆ ของภาพ DALL·E สามารถสร้างภาพที่ตรงกับการอธิบายได้
2. การใช้งานพื้นฐานของโมเดลการสร้างภาพ DALL·E
OpenAI จัดการหน้าที่ API สำหรับ DALL·E โดยอนุญาตให้นักพัฒนานำโมเดลมาผนวกเข้ากับแอปพลิเคชันหรือบริการของตนเอง ด้านล่างนี้คือกระบวนการพื้นฐานและความหมายของพารามิเตอร์สำหรับการสร้างภาพโดยใช้อินเตอร์เฟซ API ของ DALL·E 3 และ DALL·E 2:
curl -X POST https://api.openai.com/v1/images/generations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "dall-e-2", # เวอร์ชันของโมเดล สามารถเป็น "dall-e-3" หรือ "dall-e-2"
"prompt": "ข้อความที่ใช้สร้างภาพ", # ข้อความที่ใช้สำหรับสร้างภาพ
"n": 1, # จำนวนของภาพที่จะสร้าง
"size": "1024x1024", # ขนาดของภาพ
"quality": "standard" # คุณภาพของภาพ สามารถเป็น "hd" ได้
}'
-
model
: ระบุเวอร์ชันของโมเดล DALL·E ที่จะใช้ -
prompt
: ให้คำทำนองข้อความสำหรับโมเดลซึ่งมันจะใช้สร้างภาพ -
n
: ระบุจำนวนภาพที่จะสร้าง DALL·E 3 สามารถสร้างเพียงภาพเดียวในเวลาใด ๆ ในขณะที่ DALL·E 2 สามารถสร้างภาพได้สูงสุด 10 ภาพพร้อม ๆ กัน -
size
: ขนาดของภาพที่สร้าง สำหรับ dall-e-2 จะต้องเป็น 256x256, 512x512 หรือ 1024x1024 สำหรับ dall-e-3 จะต้องเป็น 1024x1024, 1792x1024 หรือ 1024x1792 -
quality
: ตั้งค่าคุณภาพของภาพที่สร้างstandard
สำหรับคุณภาพมาตรฐานhd
สำหรับคุณภาพความละเอียดสูง
3. การแก้ไขภาพและการสร้างแบบแปลง (เฉพาะ DALL·E 2 เท่านั้น)
3.1. การแก้ไขรูปภาพ (แก้ไขหรือขยายรูปภาพ)
ด้วยคุณลักษณะการแก้อัตถุรูปภาพของ DALL·E 2 ท่านสามารถอัปโหลดรูปภาพและมาส์กที่สอดคล้องกันได้ ในการใช้งานนี้ พื้นที่โปร่งในมาส์กแสดงถึงส่วนที่จะถูกแก้ไข และโมเดลจะสร้างเนื้อหาในพื้นที่เหล่านี้โดยอ้างอิงจากข้อความใหม่ เครื่องมือนี้สามารถสร้างองค์ประกอบใหม่ที่แตกต่างจากองค์ประกอบรูปภาพเดิม ทำให้เกิดรูปภาพที่ได้รับการแก้ไข
ต่อไปเป็นตัวอย่างคำขอ API ด้วยคำสั่ง curl:
curl -X POST https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "model=dall-e-2" \
-F "prompt=คำอธิบายข้อความใหม่" \
-F "image=@/path_to_your_original_image.png" \
-F "mask=@/path_to_your_mask.png" \
-F "n=1" \
-F "size=1024x1024"
-
image
: ไฟล์ที่บรรจุภาพเริ่มต้น -
mask
: ไฟล์ที่บรรจุมาส์ก โดยพื้นที่โปร่งแสดงถึงภาคที่จะถูกประมวลผลโดยโมเดล -
prompt
: ข้อความใหม่ที่เขียนอธิบายเนื้อหารูปภาพใหม่ทั้งหมด ไม่ใช่เฉพาะพื้นที่ที่ถูกลบ
สำคัญที่ต้องทราบว่า รูปภาพเริ่มต้นและมาส์กที่อัปโหลดต้องเป็นไฟล์ PNG ที่มีขนาดสี่เหลี่ยมไม่เกิน 4 มีกะไบต์และมีขนาดเท่ากัน
ตัวอย่าง:
curl https://api.openai.com/v1/images/edits \
-H "Authorization: Bearer $OPENAI_API_KEY" \
-F image="@sunlit_lounge.png" \
-F mask="@mask.png" \
-F model="dall-e-2" \
-F prompt="พื้นที่พักผ่อนในร่มแสงอาทิตย์ที่มีสระว่ายน้ำ และนกฟลามิงโกอยู่ด้านใน" \
-F n=1 \
-F size="1024x1024"
รูปภาพเริ่มต้น
มาส์ก
รูปภาพที่สร้าง
3.2. การสร้างรูปแบบทางภาพ
การใช้ DALL·E 2 เพื่อสร้างรูปแบบทางภาพเริ่มจากรูปภาพที่มีอยู่ เพื่อสร้างเวอร์ชันที่แตกต่างกันในเนื้อหาหรือลักษณะ คุณลักษณะนี้สามารถใช้สำหรับการสำรวจความเป็นไปได้ต่าง ๆ ของรูปภาพหรือสำหรับการวิวัฒนาการที่เป็นลักษณะอันสร้างสรรค์
อย่างเดียวกับนี้ ใช้คำสั่ง curl เพื่อส่งคำขอ API:
curl -X POST https://api.openai.com/v1/images/variations \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: multipart/form-data" \
-F "image=@/path_to_your_image.png" \
-F "n=2" \
-F "size=1024x1024"
-
image
: ไฟล์ที่บรรจุรูปภาพเริ่มต้นที่ต้องการสร้างเวอร์ชัน -
n
: จำนวนเวอร์ชันที่ต้องการสร้าง ซึ่งสามารถควบคุมการใช้พารามิเตอร์นี้ได้
เช่นเดียวกัน รูปภาพที่นำเข้าต้องเป็นไฟล์ PNG ที่เป็นขนาดสี่เหลี่ยมและมีขนาดน้อยกว่า 4 มีกะไบต์ อย่างเดียวกับที่ทำไว้ก่อนหน้านี้