1. แนะนำเกี่ยวกับโมเดล DALL·E

โมเดล DALL·E โดย OpenAI เป็นระบบปัญญาประดิษฐ์ที่สามารถสร้างภาพจากข้อความได้ ความสามารถของมันครอบคลุมตั้งแต่การทำซ้ำภาพไปจนถึงการสร้างภาพที่มีการจินตนาการอย่างสร้างสรรค์จากฉากที่อธิบายในข้อความ ชื่อ "DALL·E" เป็นการผสมระหว่างศิลปินซัลวาดอร์ ดาลี และตัวละครแอนิเมชัน WALL·E ซึ่งเป็นสัญลักษณ์ของการต่อสู้ระหว่างศิลปกรรมและอัตโนมัติ

โมเดล DALL·E ถูกฝึกด้วยการเรียนรู้ลึกเพื่อเข้าใจข้อความที่อธิบายและแปลงมันเป็นการแสดงผลทางภาพ ไม่ว่าจะเป็นการถ่ายภาพ วาดภาพ ศิลปะดิจิทัล หรือรูปแบบอื่น ๆ ของภาพ DALL·E สามารถสร้างภาพที่ตรงกับการอธิบายได้

2. การใช้งานพื้นฐานของโมเดลการสร้างภาพ DALL·E

OpenAI จัดการหน้าที่ API สำหรับ DALL·E โดยอนุญาตให้นักพัฒนานำโมเดลมาผนวกเข้ากับแอปพลิเคชันหรือบริการของตนเอง ด้านล่างนี้คือกระบวนการพื้นฐานและความหมายของพารามิเตอร์สำหรับการสร้างภาพโดยใช้อินเตอร์เฟซ API ของ DALL·E 3 และ DALL·E 2:

curl -X POST https://api.openai.com/v1/images/generations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
        "model": "dall-e-2", # เวอร์ชันของโมเดล สามารถเป็น "dall-e-3" หรือ "dall-e-2"
        "prompt": "ข้อความที่ใช้สร้างภาพ", # ข้อความที่ใช้สำหรับสร้างภาพ
        "n": 1, # จำนวนของภาพที่จะสร้าง
        "size": "1024x1024", # ขนาดของภาพ
        "quality": "standard" # คุณภาพของภาพ สามารถเป็น "hd" ได้
      }'
  • model: ระบุเวอร์ชันของโมเดล DALL·E ที่จะใช้
  • prompt: ให้คำทำนองข้อความสำหรับโมเดลซึ่งมันจะใช้สร้างภาพ
  • n: ระบุจำนวนภาพที่จะสร้าง DALL·E 3 สามารถสร้างเพียงภาพเดียวในเวลาใด ๆ ในขณะที่ DALL·E 2 สามารถสร้างภาพได้สูงสุด 10 ภาพพร้อม ๆ กัน
  • size: ขนาดของภาพที่สร้าง สำหรับ dall-e-2 จะต้องเป็น 256x256, 512x512 หรือ 1024x1024 สำหรับ dall-e-3 จะต้องเป็น 1024x1024, 1792x1024 หรือ 1024x1792
  • quality: ตั้งค่าคุณภาพของภาพที่สร้าง standard สำหรับคุณภาพมาตรฐาน hd สำหรับคุณภาพความละเอียดสูง

3. การแก้ไขภาพและการสร้างแบบแปลง (เฉพาะ DALL·E 2 เท่านั้น)

3.1. การแก้ไขรูปภาพ (แก้ไขหรือขยายรูปภาพ)

ด้วยคุณลักษณะการแก้อัตถุรูปภาพของ DALL·E 2 ท่านสามารถอัปโหลดรูปภาพและมาส์กที่สอดคล้องกันได้ ในการใช้งานนี้ พื้นที่โปร่งในมาส์กแสดงถึงส่วนที่จะถูกแก้ไข และโมเดลจะสร้างเนื้อหาในพื้นที่เหล่านี้โดยอ้างอิงจากข้อความใหม่ เครื่องมือนี้สามารถสร้างองค์ประกอบใหม่ที่แตกต่างจากองค์ประกอบรูปภาพเดิม ทำให้เกิดรูปภาพที่ได้รับการแก้ไข

ต่อไปเป็นตัวอย่างคำขอ API ด้วยคำสั่ง curl:

curl -X POST https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F "model=dall-e-2" \
  -F "prompt=คำอธิบายข้อความใหม่" \
  -F "image=@/path_to_your_original_image.png" \
  -F "mask=@/path_to_your_mask.png" \
  -F "n=1" \
  -F "size=1024x1024"
  • image: ไฟล์ที่บรรจุภาพเริ่มต้น
  • mask: ไฟล์ที่บรรจุมาส์ก โดยพื้นที่โปร่งแสดงถึงภาคที่จะถูกประมวลผลโดยโมเดล
  • prompt: ข้อความใหม่ที่เขียนอธิบายเนื้อหารูปภาพใหม่ทั้งหมด ไม่ใช่เฉพาะพื้นที่ที่ถูกลบ

สำคัญที่ต้องทราบว่า รูปภาพเริ่มต้นและมาส์กที่อัปโหลดต้องเป็นไฟล์ PNG ที่มีขนาดสี่เหลี่ยมไม่เกิน 4 มีกะไบต์และมีขนาดเท่ากัน

ตัวอย่าง:

curl https://api.openai.com/v1/images/edits \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -F image="@sunlit_lounge.png" \
  -F mask="@mask.png" \
  -F model="dall-e-2" \
  -F prompt="พื้นที่พักผ่อนในร่มแสงอาทิตย์ที่มีสระว่ายน้ำ และนกฟลามิงโกอยู่ด้านใน" \
  -F n=1 \
  -F size="1024x1024"

รูปภาพเริ่มต้น มาส์ก รูปภาพที่สร้าง

3.2. การสร้างรูปแบบทางภาพ

การใช้ DALL·E 2 เพื่อสร้างรูปแบบทางภาพเริ่มจากรูปภาพที่มีอยู่ เพื่อสร้างเวอร์ชันที่แตกต่างกันในเนื้อหาหรือลักษณะ คุณลักษณะนี้สามารถใช้สำหรับการสำรวจความเป็นไปได้ต่าง ๆ ของรูปภาพหรือสำหรับการวิวัฒนาการที่เป็นลักษณะอันสร้างสรรค์

อย่างเดียวกับนี้ ใช้คำสั่ง curl เพื่อส่งคำขอ API:

curl -X POST https://api.openai.com/v1/images/variations \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: multipart/form-data" \
  -F "image=@/path_to_your_image.png" \
  -F "n=2" \
  -F "size=1024x1024"
  • image: ไฟล์ที่บรรจุรูปภาพเริ่มต้นที่ต้องการสร้างเวอร์ชัน
  • n: จำนวนเวอร์ชันที่ต้องการสร้าง ซึ่งสามารถควบคุมการใช้พารามิเตอร์นี้ได้

เช่นเดียวกัน รูปภาพที่นำเข้าต้องเป็นไฟล์ PNG ที่เป็นขนาดสี่เหลี่ยมและมีขนาดน้อยกว่า 4 มีกะไบต์ อย่างเดียวกับที่ทำไว้ก่อนหน้านี้