อัปเดตล่าสุดเมื่อวันที่ 13 มีนาคม 2023
การเปิดตัว GPT-4 โมเดลภาษาขนาดใหญ่ของ OpenAI ใกล้เข้ามาแล้ว หากคุณคาดหวังว่ารุ่นนี้จะมีฟีเจอร์ใหม่ๆ อะไรบ้าง คุณอาจสงสัยว่า GPT-4 เป็นมัลติโหมดหรือไม่
จากแหล่งข้อมูลออนไลน์ต่างๆ ดูเหมือนว่า GPT-4 จะเป็นมัลติโมดัล การประกาศโดย Microsoft ซึ่งเป็นนักลงทุนรายใหญ่ของพวกเขาอาจยืนยันสิ่งนี้ได้
เมื่อเปิดเผยรายละเอียดเกี่ยวกับ GPT-4 CTO ของพวกเขาในเยอรมนี Andreas Braun ระบุว่าบริษัทจะ “ มีโมเดลหลายรูปแบบที่จะนำเสนอความเป็นไปได้ที่แตกต่างกันโดยสิ้นเชิง”
อย่างไรก็ตาม บางคนยังคงอ้างว่า GPT-4 จะคล้ายกับ GPT-3 มากกว่าที่เราคาดไว้ เช่น Datacamp อ้างว่า GPT-4 จะเป็นรูปแบบข้อความเท่านั้น p>
เมื่อพิจารณาข้อมูลโดยตรงจาก Microsoft จะปลอดภัยที่จะเชื่อว่า GPT-4 จะมีความสามารถในการประมวลผลและส่งออกสื่อต่างๆ เช่น วิดีโอ รูปภาพ และเสียง แม้ว่าเราจะยังไม่แน่ใจทั้งหมดจนกว่า OpenAI จะเปิดตัวอย่างเป็นทางการในสัปดาห์นี้
รูปแบบต่อเนื่องหลายรูปแบบคืออะไร
แล้วรูปแบบต่อเนื่องหลายรูปแบบคืออะไร หากโมเดลเป็นแบบต่อเนื่องหลายรูปแบบ หมายถึงความสามารถในการทำงานโดยใช้สื่อหลายตัวซึ่งอาจรวมถึงวิดีโอ รูปภาพ หรือเสียง
ตัวอย่างเช่น รุ่นล่าสุดของ Microsoft, Kosmos-1 สามารถรายงานการจดจำข้อความภาพ ค้นหาเนื้อหาเฉพาะจากภาพ และแม้แต่ไขปริศนาภาพ ความจริงที่ว่าโมเดลนี้สามารถรับข้อมูลในรูปของรูปภาพและสามารถแสดงการตอบสนองในอีกรูปแบบหนึ่งได้ นั่นคือสิ่งที่ทำให้มันเป็นรูปแบบต่อเนื่องหลายรูปแบบ
OpenAI ได้พัฒนารูปแบบต่อเนื่องหลายรูปแบบของตัวเองแล้ว นั่นคือ DALL-E เครื่องมือ AI ที่ปฏิวัติวงการนี้สามารถสร้างภาพตามข้อความที่เขียนโดยมนุษย์
DALL-E เป็นศิลปินที่เก่งกาจและได้แสดงให้เห็นแล้วว่าสามารถสร้างภาพที่สะดุดตาอย่างมากโดยใช้ข้อความแจ้งเพียงไม่กี่คำ
ความคิดสุดท้าย
GPT ก็เช่นกัน-4 หลายรูปแบบ? ดูเหมือนว่ามันจะเป็น แม้ว่าเราจะไม่สามารถแน่ใจได้ทั้งหมด OpenAI ได้เก็บรายละเอียดมากมายเกี่ยวกับการเปิดตัวที่กำลังจะมาถึงไว้อย่างรัดกุม
ดังนั้น แม้ว่า GPT-4 จะกลายเป็นหลายรูปแบบ แต่ก็ไม่ชัดเจนว่าจะมีลักษณะอย่างไร หากคุณพบว่าบทความนี้น่าสนใจ ทำไมไม่ลองอ่านวันที่เผยแพร่ GPT-4: โมเดลใหม่จะเป็นเมื่อใด