อัปเดตล่าสุดเมื่อวันที่ 22 มีนาคม 2023

ถึงเวลาสำหรับการประลอง”TNGD”สุดคลาสสิก คราวนี้เป็นการต่อสู้ของ AI สองรุ่น GPT-3 Vs. GPT-2

GPT หรือ Generative Pre-trained Transformers กลายเป็นประเด็นร้อนแรง โดยเฉพาะในโลกของเทคโนโลยี เนื่องจากโปรแกรมเหล่านี้มีความสามารถในการแก้ปัญหาของมนุษย์มากขึ้นเรื่อยๆ และลดภาระของการทำงานหลายอย่างพร้อมกัน รุ่นที่ประสบความสำเร็จ 2 รุ่น ได้แก่ GPT-3 และ GPT-2 ได้รับการชื่นชมทั่วโลกทั้งในด้านเทคโนโลยีและที่ไม่ใช่เทคโนโลยี

ดังนั้น หากคุณไม่ใช่ คุ้นเคยหรือติดขัดว่ารุ่นไหนดีก็ไม่ต้องกังวลไป เรามีข้อมูลสำคัญทั้งหมดด้านล่างนี้

GPT-2 คืออะไร

OpenAI เปิดตัว GPT-2 ในปี 2019 เป็นโมเดลภาษา AI มันเป็นโมเดล AI แบบโอเพ่นซอร์สซึ่งได้รับการฝึกฝนบนพารามิเตอร์ 1.5 พันล้านตัวเพื่อทำนายคำถัดไปของประโยคใดๆ

นอกจากนี้ GPT-2 ยังสามารถสร้างข้อความจากมนุษย์ได้ด้วยความช่วยเหลือของการเรียนรู้อัลกอริทึมเชิงลึก สิ่งนี้ทำให้สามารถเรียนรู้บริบททั้งหมดที่จำเป็นในการสร้างข้อความ ตั้งแต่นั้นเป็นต้นมามีการใช้ในการตั้งค่าขององค์กร การศึกษา และรัฐบาลเพื่อช่วยในการเขียนงานที่ยากต่อการจัดการ

GPT-3 คืออะไร

GPT-3 เป็นโปรแกรมเว็บปัญญาประดิษฐ์ที่ยังคงได้รับความสนใจอย่างมากทั่วโลก OpenAI ยังพัฒนา GPT-3 มันถูกพิจารณาอย่างกว้างขวางว่าดีกว่ารุ่นก่อนมากเนื่องจากขนาดและขนาดของมัน จนกระทั่งมีการเปิดตัว GPT-4 ล่าสุด GPT-4 จึงเป็นโมเดล NLP แบบโอเพ่นซอร์สที่ก้าวหน้าและทรงพลังที่สุดเท่าที่โลกเคยเห็นมา

เทียบกับ 1.5 พันล้าน GPT-2 มีพารามิเตอร์ 175 พันล้านพารามิเตอร์พร้อมข้อมูลอีก 45GB ดังนั้น มันจึงสามารถสร้างเอาต์พุตที่เป็นข้อความเหมือนมนุษย์ ตอบคำถามหรือคำถามที่มนุษย์ทำ แปล สร้างรหัส และแม้แต่สรุปสิ่งต่าง ๆ ด้วยวิธีง่าย ๆ ผลลัพธ์ที่ได้จะแม่นยำและสอดคล้องกันมากขึ้นซึ่งแตกต่างจากรุ่นก่อนตรงที่ความเกี่ยวข้องมากกว่า

ความแตกต่างระหว่าง GPT-3 และ GPT-2

แล้ว GPT-3 เปรียบเทียบกับ จีพีที-2? GPT-3 ได้รับการฝึกโดยใช้ข้อมูลที่เป็นข้อความจำนวนมาก นั่นเป็นเหตุผลว่าทำไมมันจึงมีบั๊กน้อยกว่า GPT-2 อย่างไรก็ตาม ขนาดคือความแตกต่างที่สำคัญระหว่าง GPT-2 และ GPT-3 GPT-2 มีพารามิเตอร์เพียง 1.5 พันล้านพารามิเตอร์ ซึ่งน้อยกว่า 175 พันล้านพารามิเตอร์ของ GPT-3 ถึง 116 เท่า นั่นคือเหตุผลว่าทำไมจึงทำงานได้ดีกว่ามากในแง่ของความแม่นยำ ความเกี่ยวข้อง และความสอดคล้องกันเมื่อคาดเดาคำถัดไปของประโยค

ทำงานได้ดีเป็นพิเศษเมื่อเทียบกับ GPT-2 ในการตอบคำถาม เข้าใจภาษาธรรมชาติของเรา และการสรุปสิ่งต่างๆ

นอกเหนือจากนั้น สิ่งที่น่าสนใจยิ่งกว่าคือฟีเจอร์ใหม่ๆ เจ๋งๆ สองสามอย่างที่ GPT-3 สามารถนำเสนอได้ ซึ่งรวมถึงการวิเคราะห์ความรู้สึก การเชื่อมโยงเอนทิตี และแม้แต่การค้นหาความหมาย คุณลักษณะทั้งหมดเหล่านี้ร่วมกันปรับปรุงประสบการณ์ผู้ใช้ในแอปพลิเคชันต่างๆ

ข้อจำกัดของ GPT-3 และ GPT-2

แม้ว่าโมเดลภาษา AI ทั้งสองนี้จะประสบความสำเร็จอย่างมาก แต่ก็ยังมี ข้อ จำกัด เล็กน้อย GPT เหล่านี้จำเป็นต้องมีความสามารถมากขึ้นในการจัดการรูปแบบภาษาที่ยาวและซับซ้อน สมมติว่าคุณกำลังใช้คำเหล่านั้นในบริบทของประโยคหรือคำที่มีคำเฉพาะทาง เช่น ยา การเงิน หรือวรรณกรรมเป็นหลัก โมเดลทั้งสองนี้สามารถให้ผลลัพธ์ที่แม่นยำได้ก็ต่อเมื่อมีการฝึกอบรมอย่างเพียงพอล่วงหน้า

ยิ่งไปกว่านั้น เนื่องจากทั้งสองโมเดลมีพารามิเตอร์หลายพันล้านพารามิเตอร์ จึงต้องใช้ทรัพยากรคอมพิวเตอร์จำนวนมหาศาล ดังนั้น อาจมีวิธีแก้ปัญหาที่ดีกว่าสำหรับคนทั่วไปในการฝึกหรือเรียกใช้ร่วมกัน

บทสรุป

เวลาสำหรับผลลัพธ์ของ GPT-3 เทียบกับ GPT-2

ไม่ต้องสงสัยเลยว่า GPT-2 ได้รับความนิยมในช่วงเวลาที่วางจำหน่าย เนื่องจากสามารถช่วยผู้ใช้จำนวนมากในการคาดเดาคำที่ต้องการของประโยค การใช้จึงกลายเป็นเรื่องธรรมดาในระดับรัฐบาล อย่างไรก็ตาม เนื่องจากจำเป็นต้องมีความแม่นยำและเหนียวแน่นมากขึ้น หรือเพื่อจัดการเรื่องที่ซับซ้อน จึงจำเป็นต้องมีแบบจำลองที่ดีกว่านี้ ซึ่ง GPT-3 ตอบสนองแม้จะมีข้อจำกัดก็ตาม

By Henry Taylor

ฉันทำงานเป็นนักพัฒนาส่วนหลัง พวกคุณบางคนอาจเคยเห็นฉันที่การประชุมนักพัฒนาซอฟต์แวร์ เมื่อเร็ว ๆ นี้ฉันได้ทำงานในโครงการโอเพ่นซอร์ส