เมื่อเร็วๆ นี้ Microsoft ได้เปิดตัวรายงานการวิจัยเรื่อง จุดประกายของปัญญาประดิษฐ์ทั่วไป: การทดลองล่วงหน้ากับ GPT-4 ตามที่อธิบายโดย Microsoft:
เอกสารนี้รายงานเกี่ยวกับการตรวจสอบของเราเกี่ยวกับ GPT-4 เวอร์ชันก่อนหน้า ซึ่ง OpenAI ยังอยู่ในระหว่างการพัฒนา เราขอยืนยันว่า (รุ่นแรกของ) GPT-4 นี้เป็นส่วนหนึ่งของ LLM กลุ่มใหม่ (รวมถึง ChatGPT และ PaLM ของ Google เป็นต้น) ที่แสดงความฉลาดทั่วไปมากกว่า AI รุ่นก่อนหน้า
ในบทความนี้ มีหลักฐานสรุปที่แสดงให้เห็นว่า GPT-4 ไปไกลกว่าการท่องจำ และมีความเข้าใจอย่างลึกซึ้งและยืดหยุ่นเกี่ยวกับแนวคิด ทักษะ และขอบเขต ในความเป็นจริงแล้ว ความสามารถในการพูดโดยทั่วไปนั้นเกินกว่าความสามารถของมนุษย์ทุกคนที่มีชีวิตอยู่ในปัจจุบัน
ในขณะที่เราได้กล่าวถึงประโยชน์ของ AGI ก่อนหน้านี้ เราควรสรุปความเห็นพ้องต้องกันอย่างรวดเร็วว่าระบบ AGI คืออะไร โดยพื้นฐานแล้ว AGI เป็น AI ขั้นสูงประเภทหนึ่งที่สามารถสรุปเป็นภาพรวมในหลายๆ โดเมนได้ และไม่แคบในขอบเขต ตัวอย่างของ AI แบบแคบ ได้แก่ ยานพาหนะอัตโนมัติ แชทบอท บอทหมากรุก หรือ AI อื่นๆ ที่ออกแบบมาเพื่อวัตถุประสงค์เดียว
การเปรียบเทียบ AGI จะสามารถสลับไปมาได้อย่างยืดหยุ่นระหว่างสิ่งใดสิ่งหนึ่งข้างต้น หรือความเชี่ยวชาญด้านอื่นๆ เป็น AI ที่จะใช้ประโยชน์จากอัลกอริทึมใหม่ เช่น การถ่ายโอนการเรียนรู้ และการเรียนรู้เชิงวิวัฒนาการ ในขณะเดียวกันก็ใช้ประโยชน์จากอัลกอริทึมเดิม เช่น การเรียนรู้แบบเสริมแรงเชิงลึก
คำอธิบายข้างต้นของ AGI ตรงกับประสบการณ์ส่วนตัวของฉันในการใช้ GPT-4 เช่นเดียวกับหลักฐานที่ใช้ร่วมกันในรายงานการวิจัยที่เผยแพร่โดย Microsoft
คำแนะนำประการหนึ่งที่ระบุไว้ในเอกสารฉบับนี้คือให้ GPT-4 เขียนหลักฐานเกี่ยวกับจำนวนเฉพาะที่ไม่สิ้นสุดในรูปของ บทกวี
หากเราวิเคราะห์ข้อกำหนดในการสร้างบทกวีดังกล่าว เราตระหนักดีว่าต้องใช้เหตุผลทางคณิตศาสตร์ การแสดงออกทางกวี และการสร้างภาษาธรรมชาติ นี่เป็นความท้าทายที่เกินความสามารถโดยเฉลี่ยของมนุษย์ส่วนใหญ่
รายงานฉบับนี้ต้องการทำความเข้าใจว่า GPT-4 เป็นเพียงการผลิตเนื้อหาโดยอิงจากการท่องจำทั่วไป แทนที่จะเข้าใจบริบทและความสามารถในการใช้เหตุผล เมื่อถูกขอให้สร้างบทกวีในรูปแบบของเชกสเปียร์ขึ้นมาใหม่ก็สามารถทำได้ ซึ่งต้องอาศัยความเข้าใจหลายแง่มุมซึ่งเกินความสามารถของคนทั่วไป และรวมถึงทฤษฎีจิตใจ และอัจฉริยภาพทางคณิตศาสตร์
จะคำนวณ GPT-4 Intelligence ได้อย่างไร
คำถามจะกลายเป็นว่าเราจะวัดความฉลาดของ LLM ได้อย่างไร และ GPT-4 แสดงพฤติกรรมของการเรียนรู้ที่แท้จริงหรือการท่องจำอย่างเดียวหรือไม่
วิธีการทดสอบระบบ AI ในปัจจุบันคือการประเมินระบบด้วยชุดข้อมูลเปรียบเทียบมาตรฐาน และเพื่อให้แน่ใจว่าชุดข้อมูลเหล่านั้นเป็นอิสระจาก ข้อมูลการฝึกอบรมและครอบคลุมงานและโดเมนต่างๆ การทดสอบประเภทนี้แทบจะเป็นไปไม่ได้เลย เนื่องจาก GPT-4 มีข้อมูลเกือบไม่จำกัด
จากนั้นเอกสารจะเจาะลึกเข้าไปในขอบเขตของการสร้างงานที่แปลกใหม่และยาก รวมถึงคำถามที่พิสูจน์ได้อย่างน่าเชื่อถือว่า GPT-4 เป็นมากกว่าการท่องจำ และมีความเข้าใจอย่างลึกซึ้งและยืดหยุ่นเกี่ยวกับแนวคิด ทักษะ และขอบเขต
เมื่อพูดถึงความฉลาด GPT-4 สามารถสร้างเรื่องสั้น บทภาพยนตร์ และคำนวณได้ สูตรที่ซับซ้อนที่สุด
GPT-4 ยังสามารถเขียนโค้ดในระดับที่สูงมาก ทั้งในแง่ของการเขียนโค้ดจากคำสั่งและการทำความเข้าใจโค้ดที่มีอยู่ GPT-4 สามารถจัดการงานเขียนโค้ดได้หลากหลาย ตั้งแต่
ความท้าทายในการเขียนโค้ดไปจนถึงแอปพลิเคชันในโลกแห่งความเป็นจริง ตั้งแต่การประกอบในระดับต่ำไปจนถึงเฟรมเวิร์กระดับสูง ตั้งแต่โครงสร้างข้อมูลอย่างง่ายไปจนถึงโปรแกรมที่ซับซ้อน เช่น เกม GPT-4 ยังสามารถให้เหตุผลเกี่ยวกับการใช้โค้ด จำลองผลกระทบของคำสั่ง และอธิบายผลลัพธ์ด้วยภาษาธรรมชาติ GPT-4 ยังสามารถเรียกใช้รหัสจำลองได้อีกด้วย
GPT-4 สามารถให้การตอบสนองที่สมเหตุสมผลต่อข้อความแจ้งเกือบทั้งหมดที่ได้รับ ความจริงแล้ว ความฉลาดนั้นแทบจะไร้เทียมทานในความซับซ้อนของมัน
ข้อจำกัดของ GPT-4
จากนั้นกระดาษจะอธิบายวิธีที่พวกเขาตรวจสอบการตอบสนองและพฤติกรรมของ GPT-4 เพื่อตรวจสอบความสอดคล้อง การเชื่อมโยงกัน ความถูกต้อง และเปิดเผยข้อจำกัดและความลำเอียง
ข้อจำกัดที่ชัดเจนที่สุดคือแนวโน้มที่จะทำให้เกิดประสาทหลอน ต่อไปนี้คือตัวอย่างอาการประสาทหลอนที่ระบุในกระดาษซึ่ง GPT-4 มั่นใจในคำตอบซึ่งเป็นเท็จโดยสิ้นเชิง
ดูเหมือนว่าแม้แต่ GPT-4 ก็เข้าใจข้อจำกัดปัจจุบันของอาการประสาทหลอน เนื่องจากนี่เป็นคำตอบที่ได้รับเมื่อฉันถาม GPT ภาพหลอนคืออะไร:
ภาพหลอน GPT หมายถึงปรากฏการณ์ที่แบบจำลอง Generative Pre-trained Transformer (GPT) เช่นเดียวกับที่คุณกำลังโต้ตอบด้วย สร้างการตอบสนองที่ไม่ ตามข้อมูลที่เป็นข้อเท็จจริงหรือไม่สอดคล้องกับบริบทที่ให้ไว้ ภาพหลอนเหล่านี้เกิดขึ้นเมื่อโมเดลสร้างข้อความที่อาจดูน่าเชื่อถือ แต่จริงๆ แล้วไม่ถูกต้อง ทำให้เข้าใจผิด หรือไร้สาระ
กล่าวอีกนัยหนึ่ง เมื่อคุณฝึก LLM AI เกี่ยวกับข้อมูลของโลก คุณจะทำอย่างไร หลีกเลี่ยงไม่ให้ระบบเรียนรู้ข้อมูลที่ไม่ถูกต้อง? การเรียนรู้รูปแบบภาษาขนาดใหญ่และการสำรอกข้อมูลที่ผิดและทฤษฎีสมคบคิดอาจเป็นหนึ่งในหลุมพรางและภัยคุกคามที่ใหญ่ที่สุดที่มนุษยชาติเผชิญจากการยอมรับ LLM ในวงกว้าง นี่อาจเป็นหนึ่งในภัยคุกคามที่ใหญ่กว่าจาก AGI ซึ่งเป็นสิ่งที่พลาดไปอย่างน่าประหลาดใจเมื่อพูดถึงอันตรายของ AGI
หลักฐานการข่าวกรอง GPT-4
เอกสารนี้แสดงให้เห็นว่ามี ไม่ว่าจะมีคำสั่งที่ซับซ้อนประเภทใด GPT-4 ก็เกินความคาดหมาย ดังที่ระบุไว้ในบทความ:
ความเชี่ยวชาญในภาษาธรรมชาติที่ไม่มีใครเทียบได้ ไม่เพียงสร้างข้อความได้อย่างคล่องแคล่วและสอดคล้องกันเท่านั้น แต่ยังเข้าใจและจัดการในรูปแบบต่างๆ เช่น การสรุป การแปล หรือการตอบคำถามชุดกว้างมาก ยิ่งไปกว่านั้น การแปลไม่ได้หมายความเฉพาะระหว่างภาษาธรรมชาติต่างๆ เท่านั้น แต่ยังรวมถึงการแปลด้วยน้ำเสียงและรูปแบบ ตลอดจนการแปลข้ามโดเมน เช่น การแพทย์ กฎหมาย การบัญชี การเขียนโปรแกรมคอมพิวเตอร์ ดนตรี และอื่นๆ
จำลองบทวิจารณ์ทางเทคนิคให้กับ GPT-4 ซึ่งส่งผ่านความหมายได้อย่างง่ายดายในบริบทนี้ หากเป็นคนในอีกฟากหนึ่ง พวกเขาจะได้รับการว่าจ้างเป็นวิศวกรซอฟต์แวร์ทันที การทดสอบเบื้องต้นที่คล้ายคลึงกันเกี่ยวกับความสามารถของ GPT-4 ในการสอบ Multistate Bar แสดงให้เห็นความแม่นยำสูงกว่า 70% ซึ่งหมายความว่าในอนาคต เราสามารถทำให้งานหลายอย่างที่มอบให้กับทนายความเป็นไปโดยอัตโนมัติได้ อันที่จริง มีสตาร์ทอัพบางส่วนที่กำลังทำงานเพื่อสร้างนักกฎหมายหุ่นยนต์โดยใช้ GPT-4
การผลิตความรู้ใหม่ h2>
หนึ่งในข้อโต้แย้งในบทความนี้คือสิ่งเดียวที่เหลือสำหรับ GPT-4 ในการพิสูจน์ระดับความเข้าใจที่แท้จริงคือการให้ GPT-4 สร้างความรู้ใหม่ เช่น การพิสูจน์ทฤษฎีบททางคณิตศาสตร์ใหม่ เข้าถึง LLM ได้
และนี่คือจอกศักดิ์สิทธิ์ของ AGI แม้ว่าจะมีอันตรายจากการที่ AGI ถูกควบคุมโดยมือที่ไม่ถูกต้อง ประโยชน์ของ AGI ที่สามารถวิเคราะห์ข้อมูลในอดีตทั้งหมดได้อย่างรวดเร็วเพื่อค้นหาทฤษฎีบท การรักษา และการรักษาใหม่ๆ แทบไม่มีขีดจำกัด
AGI สามารถเป็นได้ การเชื่อมโยงที่ขาดหายไปในการหาวิธีรักษาโรคทางพันธุกรรมที่หายากซึ่งปัจจุบันยังขาดเงินทุนจากอุตสาหกรรมเอกชน ไปสู่การรักษามะเร็งให้หายขาด และเพื่อเพิ่มประสิทธิภาพของพลังงานหมุนเวียนเพื่อขจัดการพึ่งพาพลังงานที่ไม่ยั่งยืนของเรา ในความเป็นจริงมันสามารถแก้ปัญหาที่ตามมาที่ป้อนเข้าสู่ระบบ AGI นี่คือสิ่งที่ Sam Altman และทีมงาน OpenAI เข้าใจว่า AGI เป็นสิ่งประดิษฐ์สุดท้ายอย่างแท้จริง ซึ่งจำเป็นสำหรับการแก้ปัญหาส่วนใหญ่และเพื่อประโยชน์ของมนุษยชาติ
แน่นอนว่านั่นไม่ได้แก้ปัญหาปุ่มนิวเคลียร์ว่าใครเป็นผู้ควบคุม AGI และจุดประสงค์ของพวกเขาคืออะไร โดยไม่คำนึงถึง เอกสารนี้ ทำงานได้อย่างยอดเยี่ยมโดยอ้างว่า GPT-4 เป็นก้าวกระโดดไปสู่การบรรลุความฝันที่นักวิจัย AI มี ตั้งแต่ปี 1956 เมื่อโครงการ Dartmouth Summer Research Project on Artificial Intelligence ภาคฤดูร้อนเปิดตัวเป็นครั้งแรก
แม้ว่าจะเป็นที่ถกเถียงกันว่า GPT-4 เป็น AGI หรือไม่ แต่ก็สามารถโต้แย้งได้อย่างง่ายดายว่า เป็นครั้งแรกในประวัติศาสตร์ของมนุษย์ที่ระบบ AI สามารถผ่านการทดสอบทัวริงได้