อัปเดตล่าสุดเมื่อวันที่ 20 มีนาคม 2023

หากคุณกำลังพยายามทำความเข้าใจเกี่ยวกับการพัฒนาใหม่ล่าสุดใน AI คุณอาจสงสัยว่า: เป็นอย่างไร Dall-E 2 ได้รับการฝึกฝนหรือไม่

Dall-E 2 เป็นโปรแกรม AI ที่สร้างภาพที่ทรงพลัง แต่ OpenAI จัดการพัฒนาโปรแกรมดังกล่าวได้อย่างไร? คุณเคยคิดบ้างไหม? มาเลย มาหาข้อมูลเพิ่มเติมเกี่ยวกับมันกัน

สิ่งที่ทำให้ Dall-E 2 น่าประทับใจมาก ?

Dall-E 2 สามารถสร้างภาพที่เหมือนจริงได้ด้วยเทคนิคที่ใช้ในระหว่างการพัฒนา

หนึ่งในเทคนิคหลักที่ใช้ในการฝึกของ Dall-E 2 คือ”ความเอาใจใส่”เทคนิคนี้ช่วยให้นางแบบสามารถโฟกัสไปที่ส่วนเฉพาะของคำอธิบายข้อความเมื่อสร้างรูปภาพ ตัวอย่างเช่น หากคำอธิบายข้อความมีคำว่า “ลายทาง” Dall-E 2 จะให้ความสนใจเป็นพิเศษกับรูปแบบในภาพเพื่อให้แน่ใจว่าเป็นลายทางที่ถูกต้อง เทคนิคที่สำคัญอีกประการหนึ่งในการฝึกของ Dall-E 2 คือ “การหลอมรวมหลายโมดอล” เทคนิคนี้ทำให้โมเดลสามารถรวมข้อมูลจากหลายๆ แหล่ง เช่น คำอธิบายข้อความของภาพและคุณลักษณะด้านภาพ เพื่อสร้างภาพที่แม่นยำยิ่งขึ้น Dall-E 2 สามารถสร้างภาพที่นอกเหนือไปจากคำอธิบายข้อความ ต้องขอบคุณเทคนิคที่เรียกว่า”การทำให้สมบูรณ์ของแนวคิด”ซึ่งช่วยให้โมเดลสามารถเติมรายละเอียดที่ขาดหายไปตามความเข้าใจของแนวคิดในคำอธิบายข้อความ

เทคนิคขั้นสูงเหล่านี้ทำให้ Dall-E 2 เป็นหนึ่งในโมเดล AI ที่น่าประทับใจที่สุดสำหรับการสร้างภาพ ความสามารถในการสร้างภาพที่เป็นธรรมชาติโดยขึ้นอยู่กับคำอธิบายข้อความทำให้นำไปใช้ในการโฆษณา การออกแบบ และความบันเทิงได้ไม่รู้จบ

Dall-E2 ได้รับการฝึกฝนมาอย่างไร

ต่อไปนี้เป็นขั้นตอนที่ OpenAi ใช้ในการพัฒนาและฝึกอบรมโปรแกรม AI ที่สะดวกสบายนี้

ขั้นตอนแรกในการฝึกอบรม Dall-E 2 คือการรวบรวมชุดข้อมูลขนาดใหญ่ของรูปภาพ ชุดข้อมูลนี้ประกอบด้วยภาพถ่ายต่างๆ ของวัตถุในชีวิตประจำวันพร้อมกับแนวคิดที่เป็นนามธรรมมากขึ้น

เมื่อคุณรวบรวมชุดข้อมูลแล้ว คำอธิบายข้อความจะถูกสร้างขึ้นสำหรับแต่ละภาพ รายละเอียดเหล่านี้อธิบายแต่ละภาพโดยสังเขป

บริษัทฝึกอบรม Dall-E 2 โดยใช้โครงข่ายประสาทเทียมพร้อมชุดข้อมูลและคำอธิบายข้อความ พวกเขาฝึกฝนโครงข่ายประสาทเทียมเพื่อสร้างภาพที่ตรงกับคำอธิบายข้อความโดยใช้ “การฝึกอบรมเชิงต่อต้านเชิงสร้างสรรค์”

หลังจากการฝึกอบรมเบื้องต้น นักพัฒนาซอฟต์แวร์ได้ปรับแต่งโมเดลเพิ่มเติมเพื่อปรับปรุงประสิทธิภาพ สิ่งนี้เกี่ยวข้องกับการปรับสถาปัตยกรรมโครงข่ายประสาทเทียมและการฝึกอบรมใหม่ในชุดข้อมูล

สุดท้าย บริษัทได้ตรวจสอบความถูกต้องของแบบจำลองเพื่อให้แน่ใจว่าสร้างผลลัพธ์ตามข้อกำหนด OpenAI ใช้ผู้ประเมินที่เป็นมนุษย์ในการให้คะแนนภาพในระดับ 1 ถึง 5 โดยพิจารณาจากความเข้ากันได้ดีเพียงใดกับคำอธิบายข้อความ

Dall-E 2 สร้างภาพได้อย่างไร

Dall-E 2 สามารถสร้างภาพโดยใช้คำอธิบายข้อความเป็นอินพุต โดยแบ่งคำอธิบายข้อความออกเป็นส่วนย่อยๆ เช่น ออบเจ็กต์และแอตทริบิวต์ แล้วใช้ส่วนเหล่านี้สร้างรูปภาพ

ตัวอย่างเช่น หากคำอธิบายข้อความเป็น”แถบสีแดงและสีเขียว เสื้อเชิ้ต” Dall-E 2 จะแบ่งสิ่งนี้ออกเป็น “เสื้อเชิ้ต” “สีแดง” “สีเขียว” และ “ลายทาง” จากนั้นจะใช้ข้อมูลนี้เพื่อสร้างภาพเสื้อเชิ้ตลายทางสีแดงและสีเขียว

บทสรุป

OpenAI ฝึกฝน Dall-E 2 โดยใช้ชุดข้อมูลขนาดใหญ่ของรูปภาพและคำอธิบายข้อความ นักพัฒนาใช้ชุดข้อมูลนี้เพื่อฝึกโครงข่ายประสาทเทียมเพื่อสร้างภาพ

จากนั้นบริษัทได้ปรับแต่งและตรวจสอบเพื่อให้แน่ใจว่าสร้างภาพคุณภาพสูง ด้วยการทำความเข้าใจวิธีที่บริษัทฝึกฝน Dall-E 2 เราจึงชื่นชมความสามารถที่น่าประทับใจของเทคโนโลยี AI ที่ล้ำสมัยนี้

OpenAI ได้ฝึกฝนโมเดล AI โดยใช้เทคนิคขั้นสูงเพื่อสร้างภาพคุณภาพสูงตามข้อความ คำอธิบาย ความสามารถของมันโดดเด่นอย่างแท้จริงและจะส่งผลต่อในด้านต่างๆ ต่อไป

By Maisy Hall

ฉันทำงานเป็นนักเขียนอิสระ ฉันยังเป็นวีแก้นและนักอนุรักษ์สิ่งแวดล้อมด้วย พอมีเวลาก็ตั้งใจทำสมาธิ