Etienne Bernard เป็นผู้ร่วมก่อตั้งและซีอีโอของ NuMind บริษัทซอฟต์แวร์ที่ก่อตั้งขึ้นในเดือนมิถุนายน 2022 ซึ่งเชี่ยวชาญด้านการพัฒนาเครื่องมือแมชชีนเลิร์นนิง Etienne เป็นผู้เชี่ยวชาญด้าน AI และการเรียนรู้ของเครื่อง หลังจากจบปริญญาเอก (ENS) และ postdoc (MIT) ในฟิสิกส์เชิงสถิติ Etienne เข้าร่วม Wolfram Research ซึ่งเขาได้เป็นหัวหน้าฝ่ายการเรียนรู้ของเครื่องเป็นเวลา 7 ปี ในช่วงเวลานี้ Etienne เป็นผู้นำในการพัฒนาเครื่องมือการเรียนรู้อัตโนมัติ เฟรมเวิร์กการเรียนรู้เชิงลึกที่เป็นมิตรกับผู้ใช้ และแอปพลิเคชันการเรียนรู้ของเครื่องต่างๆ
อะไรทำให้คุณสนใจการเรียนรู้ของเครื่องในตอนแรก
ครั้งแรกที่ฉันได้ยินคำว่า”แมชชีนเลิร์นนิง”คือในปี 2009 ฉันเชื่อว่าต้องขอบคุณรางวัลจาก Netflix ฉันพบแนวคิดที่ว่าเครื่องจักรสามารถเรียนรู้ได้อย่างน่าทึ่งและมีประสิทธิภาพ สำหรับฉันแล้ว เห็นได้ชัดว่าสิ่งนี้จะนำไปสู่แอปพลิเคชันที่สำคัญมากมาย รวมถึงความเป็นไปได้ที่น่าตื่นเต้นในการสร้าง AI ฉันตัดสินใจดำดิ่งลงไปทันทีและไม่กลับมาอีกเลย
หลังจากได้รับปริญญาเอก (ENS) & postdoc (MIT) ในฟิสิกส์เชิงสถิติ คุณได้เข้าร่วม Wolfram Research ซึ่งคุณเป็นหัวหน้าฝ่ายการเรียนรู้ของเครื่องเป็นเวลา 7 ปี โครงการใดที่น่าสนใจบ้างที่คุณทำอยู่
โครงการประเภทโปรดของฉันที่ Wolfram คือการพัฒนาฟังก์ชันแมชชีนเลิร์นนิงอัตโนมัติสำหรับ Wolfram Language (a.k.a. Mathematica) อันแรกคือ Classify ซึ่งคุณเพียงแค่ให้ข้อมูลและส่งคืนตัวแยกประเภท สำหรับฉันแล้ว แมชชีนเลิร์นนิงเป็นเรื่องของการทำงานอัตโนมัติมาโดยตลอด คุณไม่ปรับแต่งพารามิเตอร์ไฮเปอร์ของนักเรียนที่เป็นมนุษย์ และคุณก็ไม่ควรปรับแต่งเครื่องของคุณเช่นกัน! ค่อนข้างท้าทายจากมุมมองทางวิทยาศาสตร์และวิศวกรรมซอฟต์แวร์ในการสร้างฟังก์ชันแมชชีนเลิร์นนิงอัตโนมัติที่แข็งแกร่งและมีประสิทธิภาพอย่างแท้จริง
การสร้างเฟรมเวิร์กเครือข่ายประสาทระดับสูงก็เป็นโครงการที่น่าสนใจเช่นกัน การตัดสินใจในการออกแบบที่ยากลำบากมากมายเกี่ยวกับวิธีแสดงโครงข่ายประสาทเทียมในเชิงสัญลักษณ์ วิธีทำให้เห็นภาพ และวิธีจัดการกับมัน (เช่น ความสามารถในการตัดชิ้นส่วน การติดกาวอื่นๆ เข้าด้วยกัน การแทนที่เลเยอร์ ฯลฯ) ฉันคิดว่าเราทำได้ดีโดย วิธีการ และถ้าเป็นโอเพ่นซอร์ส ฉันค่อนข้างแน่ใจว่ามันจะถูกใช้งานอย่างหนัก 😉
ในช่วงเวลานี้ คุณยังได้เขียนหนังสือชื่อเรื่อง “ความรู้เบื้องต้นเกี่ยวกับแมชชีนเลิร์นนิง” อะไรคือความท้าทายเบื้องหลังการเขียนหนังสือที่มีเนื้อหาครอบคลุมเช่นนี้?
โอ้ มีมากมาย! ใช้เวลาเขียนทั้งหมดสองปี ฉันตัดสินใจได้ว่าจะเขียนหนังสือ”วิธีการ”ซึ่งน่าจะง่ายกว่านี้ แต่ส่วนหนึ่งของการเดินทางที่ Wolfram นั้นเกี่ยวกับการเรียนรู้ของแมชชีนเลิร์นนิง และฉันรู้สึกว่าจำเป็นต้องถ่ายทอดสิ่งนั้น ดังนั้นความยากหลักคือการคิดให้ออกว่าจะพูดถึงเรื่องใด และลำดับอย่างไร เพื่อให้น่าสนใจและเข้าใจง่าย จากนั้นมีรายละเอียดการสอน: ฉันควรใช้สูตรคณิตศาสตร์สำหรับแนวคิดนี้หรือไม่ หรือรหัสบางอย่าง? หรือเป็นเพียงการสร้างภาพ? ฉันต้องการทำให้หนังสือเล่มนี้สามารถเข้าถึงได้มากที่สุดและสิ่งนี้ทำให้ฉันปวดหัวมาก โดยรวมแล้วฉันมีความสุขกับผลลัพธ์ ฉันหวังว่ามันจะเป็นประโยชน์กับหลายๆ คน!
คุณช่วยแบ่งปันเรื่องราวกำเนิดเบื้องหลัง NuMind ได้ไหม
เอาล่ะ ฉันต้องการสร้างการเริ่มต้นสักระยะหนึ่ง เดิมทีในปี 2012 เพื่อสร้างเครื่องมือ ML อัตโนมัติ แต่งานที่ Wolfram สนุกเกินไป จากนั้นประมาณปี 2562-2563 โมเดลภาษาขนาดใหญ่ (LLM) รุ่นแรกเริ่มปรากฏขึ้น เช่น GPT-2 และ GPT-3 ฉันตกใจมากที่พวกเขาสามารถเข้าใจและสร้างข้อความได้ดีเพียงใด ในขณะเดียวกัน ฉันเห็นว่าการสร้างแบบจำลอง NLP นั้นเจ็บปวดเพียงใด: คุณต้องจัดการกับทีมบันทึกย่อ ต้องมีผู้เชี่ยวชาญทำการทดลองมากมาย ฯลฯ ฉันคิดว่าควรมีวิธีใช้ LLM เหล่านี้ผ่าน เครื่องมือในการปรับปรุงประสบการณ์ในการสร้างแบบจำลอง NLP อย่างมาก ผู้ร่วมก่อตั้งของฉัน ซามูเอล (ซึ่งเป็นลูกพี่ลูกน้องของฉัน) มีวิสัยทัศน์เดียวกัน และเราจึงตัดสินใจสร้างเครื่องมือนี้
เป้าหมายของ NuMind คือการกระจายการใช้เครื่อง การเรียนรู้ – และปัญญาประดิษฐ์โดยทั่วไป – โดยการสร้างเครื่องมือที่เรียบง่ายแต่ทรงพลัง ปัจจุบันมีเครื่องมือใดบ้าง
แน่นอน เครื่องมือแรกของเราคือการสร้างโมเดล NLP แบบกำหนดเอง ตัวอย่างเช่น สมมติว่าคุณต้องการวิเคราะห์ความรู้สึกของผู้ใช้จากความคิดเห็นของพวกเขา โดยทั่วไปแล้ว การใช้โมเดลสำเร็จรูปนั้นไม่ค่อยดีนัก เนื่องจากโมเดลนี้ได้รับการฝึกอบรมเกี่ยวกับข้อมูลประเภทต่างๆ และสำหรับงานที่แตกต่างกันเล็กน้อย (งานวิเคราะห์ความรู้สึกแตกต่างกันอย่างน่าประหลาดใจ!) คุณต้องการฝึกโมเดลที่กำหนดเองซึ่งทำงานได้ดีกับข้อมูลของคุณแทน เครื่องมือของเราช่วยให้ทำอย่างนั้นได้ง่ายและมีประสิทธิภาพมาก โดยพื้นฐานแล้ว คุณจะโหลดข้อมูล ทำคำอธิบายประกอบจำนวนเล็กน้อย และรับโมเดลที่คุณปรับใช้ผ่าน API ได้ สิ่งนี้เกิดขึ้นได้จากการใช้ LLM แต่ยังรวมถึงกระบวนทัศน์การเรียนรู้ใหม่ที่เราเรียกว่าการพัฒนา AI แบบโต้ตอบ
โมเดลแบบกำหนดเองใดบ้างที่คุณเห็นว่าพัฒนาขึ้นจากรอบแรกของ ลูกค้า NuMind?
มีเครื่องมือวิเคราะห์ความรู้สึกอยู่สองสามตัว ตัวอย่างเช่น ลูกค้ารายหนึ่งกำลังติดตามความรู้สึกของการแชทเป็นกลุ่มที่ผู้คนช่วยกันต่อสู้กับการเสพติด จำเป็นต้องมีการวิเคราะห์นี้เพื่อเข้าแทรกแซงในกรณีที่หายากซึ่งความเชื่อมั่นกำลังลดลง ลูกค้ารายอื่นใช้เราเพื่อค้นหาตำแหน่งงานที่ดีที่สุดสำหรับเรซูเม่ที่กำหนด – และอย่างไรก็ตาม ฉันเชื่อว่ามีศักยภาพมากมายใน AI การจับคู่ประเภทนี้ นอกจากนี้เรายังมีลูกค้าที่กำลังดึงข้อมูลจากเอกสารทางการแพทย์และกฎหมาย
บริษัทต่างๆ สามารถดูข้อมูลโดยใช้เครื่องมือ NuMind ประหยัดเวลาได้มากเพียงใด
เป็นแอปพลิเคชัน แน่นอนว่าต้องขึ้นอยู่กับ แต่เมื่อเทียบกับโซลูชันแบบดั้งเดิม (การติดฉลากข้อมูลและการฝึกอบรมโมเดลแยกต่างหาก) เราพบว่าความเร็วเพิ่มขึ้นถึง 10 เท่าเพื่อให้ได้โมเดลและนำไปผลิตจริง ฉันคาดว่าตัวเลขนี้จะดีขึ้นเมื่อเราพัฒนาผลิตภัณฑ์ต่อไป ในที่สุด ฉันเชื่อว่าโครงการที่ต้องใช้เวลาหลายเดือนจะเสร็จสิ้นภายในไม่กี่วัน และมีประสิทธิภาพดีขึ้น
คุณช่วยอธิบายวิธีการทำงานของการพัฒนา AI แบบโต้ตอบของ NuMind ได้ไหม
แนวคิดของการพัฒนา AI แบบโต้ตอบมาจากวิธีที่มนุษย์สอนซึ่งกันและกัน ตัวอย่างเช่น สมมติว่าคุณจ้างเด็กฝึกงานเพื่อแยกประเภทอีเมลของคุณ คุณต้องอธิบายงานและวัตถุประสงค์ก่อน จากนั้นคุณอาจยกตัวอย่างดีๆ สักสองสามกรณี อาจเป็นกรณีหักมุม จากนั้นผู้ฝึกงานของคุณจะเริ่มติดป้ายกำกับอีเมล และการสนทนาก็จะเริ่มขึ้น ผู้ฝึกงานของคุณจะกลับมาพร้อมคำถาม เช่น “ฉันควรติดป้ายกำกับนี้อย่างไร” หรือ “ฉันคิดว่าเราควรสร้างป้ายกำกับใหม่สำหรับสิ่งนี้” หรือแม้กระทั่งถามคุณว่า “ทำไม” เราควรติดป้ายกำกับด้วยวิธีใดวิธีหนึ่ง ในทำนองเดียวกัน คุณอาจถามคำถามกับผู้ฝึกงานของคุณเพื่อระบุและแก้ไขช่องว่างความรู้ของพวกเขา วิธีการสอนนี้เป็นธรรมชาติและมีประสิทธิภาพอย่างมากในแง่ของการแลกเปลี่ยนข้อมูล เรากำลังพยายามเลียนแบบเวิร์กโฟลว์นี้เพื่อให้มนุษย์สามารถสอนเครื่องจักรได้อย่างมีประสิทธิภาพ
ในทางเทคนิค เวิร์กโฟลว์นี้เป็นการสื่อสารแบบสองทิศทางที่มีเวลาแฝงต่ำ แบนด์วิธสูง หลายรูปแบบ และแบบสองทิศทางระหว่างมนุษย์กับเครื่องจักร และเราตัดสินใจเรียกมันว่า Interactive AI Development เพื่อเน้นย้ำถึงแง่มุมแบบสองทิศทางและความหน่วงต่ำ ฉันเห็นว่านี่เป็นกระบวนทัศน์ที่สามในการสอนเครื่องจักร รองจากการเขียนโปรแกรมแบบคลาสสิกและการเรียนรู้ของเครื่องแบบคลาสสิก (ซึ่งคุณเพียงแค่ให้ตัวอย่างงานมากมายเพื่อให้คอมพิวเตอร์เข้าใจว่าต้องทำอะไร)
สิ่งนี้ กระบวนทัศน์ใหม่ถูกปลดล็อกโดย LLM แน่นอน คุณต้องมีบางอย่างที่ฉลาดอยู่แล้วในเครื่องเพื่อที่จะโต้ตอบกับมันได้อย่างมีประสิทธิภาพ ฉันเชื่อว่ากระบวนทัศน์นี้จะกลายเป็นสิ่งที่พบเห็นได้ทั่วไปในอนาคตอันใกล้ และเราสามารถมองเห็นได้แล้วด้วย LLM แบบแชท และแน่นอนว่าด้วยเครื่องมือของเรา
เรากำลังนำกระบวนทัศน์นี้มาใช้เพื่อสอนงาน NLP แต่สิ่งนี้สามารถ – และจะ – นำไปใช้ได้อีกมากมาย รวมถึงการพัฒนาซอฟต์แวร์
มีอะไรอีกไหมที่คุณต้องการแบ่งปันเกี่ยวกับ NuMind?
อาจเป็นเครื่องมือที่ทั้งผู้เชี่ยวชาญและไม่เชี่ยวชาญสามารถใช้ในแมชชีนเลิร์นนิง เป็นเครื่องมือหลายภาษา ที่คุณเป็นเจ้าของโมเดล และข้อมูลสามารถอยู่ในเครื่องของคุณได้!
มิฉะนั้นเราจะอยู่ในช่วงเบต้าส่วนตัว ดังนั้นหากคุณมีความต้องการ NLP เรายินดีที่จะพูดคุยและค้นหาว่าเราจะช่วยคุณได้อย่างไร
ขอขอบคุณสำหรับบทสัมภาษณ์ที่ยอดเยี่ยม ผู้อ่านที่ต้องการเรียนรู้เพิ่มเติมควรไปที่ NuMind