Jorge Torres เป็นผู้ร่วมก่อตั้งและซีอีโอของ MindsDB ซึ่งเป็นแพลตฟอร์มที่ช่วยให้ทุกคนใช้พลังของแมชชีนเลิร์นนิงเพื่อถามคำถามเชิงคาดเดาของ ข้อมูลของพวกเขาและได้รับคำตอบที่ถูกต้องจากมัน นอกจากนี้ MindsDB ยังสำเร็จการศึกษาจากชุดผลิตภัณฑ์ฤดูหนาวปี 2020 ล่าสุดของ YCombinator และเพิ่งได้รับการยอมรับให้เป็นหนึ่งในบริษัท AI ที่มีแนวโน้มมากที่สุดในอเมริกาโดย Forbes
อะไรดึงดูดให้คุณสนใจการเรียนรู้ของเครื่องในตอนแรก
เป็นเรื่องราวที่น่าสนใจ ในปี 2008 ฉันอาศัยและทำงานใน Berkeley สำหรับสตาร์ทอัพชื่อ Couchsurfing และฉันเห็นคลาสนี้ (cs188-Introduction to AI) แม้ว่าตอนนั้นฉันจะไม่มีส่วนเกี่ยวข้องกับมหาวิทยาลัย แต่ฉันก็ถามศาสตราจารย์ John DeNero ถ้าฉันนั่งในชั้นเรียนได้และเขาอนุญาต ศาสตราจารย์คนนี้ยอดเยี่ยมและทำให้ทุกคนตกหลุมรักหัวข้อนี้จริงๆ มันเป็นสิ่งที่ดีที่สุดที่เกิดขึ้นกับฉัน ฉันรู้สึกทึ่งที่คอมพิวเตอร์สามารถเรียนรู้ที่จะแก้ปัญหาได้ ฉันรู้ว่าสิ่งนี้กำลังดำเนินไปอย่างรวดเร็วและตัดสินใจเลือกอาชีพนี้
เทคโนโลยีมีเหตุการณ์กำหนดชั่วอายุไม่กี่เหตุการณ์ที่เกิดขึ้นเพียงไม่กี่ครั้งในช่วงชีวิตหนึ่ง ฉันโชคดีพอที่จะเป็นสักขีพยานในการกำเนิดของอินเทอร์เน็ต แต่ยังเด็กเกินไปที่จะเป็นอย่างอื่นนอกจากเป็นผู้สังเกตการณ์เฉยๆ ฉันเชื่อว่าแมชชีนเลิร์นนิงเป็นเหตุการณ์แห่งยุคต่อไป และฉันต้องการเป็นส่วนหนึ่งของมันในแนวทางที่มีความหมายเพื่อขับเคลื่อนเทคโนโลยีและวิธีที่เราใช้มัน
MindsDB เริ่มต้นที่ UC Berkeley ในปี 2018 คุณช่วยแชร์ข้อมูลเชิงลึกจากยุคแรก ๆ เหล่านี้หน่อยได้ไหม
UC Berkeley เป็นหนึ่งในสถาบันการวิจัยที่ยอดเยี่ยมของโลกและมีประวัติการสร้างและสนับสนุนซอฟต์แวร์โอเพ่นซอร์ส และเรา คิดว่าไม่มีที่ที่ดีกว่าในการเริ่มต้น MindsDB ค่านิยมของเราสอดคล้องกัน พวกเขาให้เราตรวจสอบครั้งแรกผ่าน UC Berkeley Skydeck Accelerator และที่เหลือพวกเขาบอกว่าเป็นประวัติศาสตร์
ช่วงแรก ๆ ไม่ต่างจากสตาร์ทอัพจำนวนมากในภูมิภาคอ่าว – คนสามคนทำงานหลายชั่วโมง ในสิ่งที่พวกเขาเชื่อ แต่มีโอกาสเพียงเล็กน้อยเท่านั้นที่จะประสบความสำเร็จ ข้อแตกต่างเพียงอย่างเดียวคือแทนที่จะทำงานในโรงรถที่เต็มไปด้วยฝุ่นใน Palo Alto เราอยู่ในความสะดวกสบายในพื้นที่ทำงานร่วมกันของ Skydeck Penthouse (ไม่มีค่าเช่า)
ฉันเชื่อว่าข้อมูลมีพลังมหาศาล ยิ่งบริษัทมีมากเท่าไหร่ พวกเขาก็ยิ่งสามารถขับเคลื่อนธุรกิจไปข้างหน้าได้มากเท่านั้น แต่ก็ต่อเมื่อพวกเขาสามารถรับข้อมูลเชิงลึกที่มีความหมายจากมันได้
ในฤดูใบไม้ร่วงปี 2017 Adam Carrigan (COO) เพื่อนสนิทของฉันและฉันได้ข้อสรุปว่ามีธุรกิจจำนวนมากเกินไปที่ต้องเผชิญกับข้อจำกัดเมื่อถึงเวลานั้น เพื่อดึงข้อมูลที่มีความหมายจากข้อมูลของพวกเขา พวกเขาตระหนักว่าหนึ่งในข้อจำกัดที่ใหญ่ที่สุดคือจำนวนธุรกิจเหล่านี้ที่ใช้พลังของปัญญาประดิษฐ์ต่ำกว่าความเป็นจริง เราเชื่อว่าแมชชีนเลิร์นนิงสามารถทำให้ทุกคนเข้าถึงข้อมูลและความฉลาดได้ นั่นเป็นเหตุผลที่เราออกแบบแพลตฟอร์มที่ช่วยให้ทุกคนสามารถใช้พลังของแมชชีนเลิร์นนิงเพื่อถามคำถามเชิงคาดเดาเกี่ยวกับข้อมูลของตนและรับคำตอบที่ถูกต้องจากข้อมูลนั้น
เราเรียกแพลตฟอร์มนี้ว่า MindsDB และมุ่งเน้นที่การดำเนินการต่อไปเพื่อสร้าง เป็นเรื่องง่ายอย่างไม่น่าเชื่อสำหรับนักพัฒนาในการสร้างแอปพลิเคชันคลื่นลูกใหม่ที่มี AI เป็นศูนย์กลางอย่างรวดเร็ว ซึ่งจะเปลี่ยนวิถีชีวิตและการทำงานของเรา และสำหรับธุรกิจในการดึงข้อมูลจากข้อมูลของพวกเขา
เหตุใด MindsDB จึงมุ่งเน้นไปที่ แก้ปัญหาการเน้นข้อมูลเป็นศูนย์กลางแทนที่จะใช้แมชชีนเลิร์นนิงเป็นศูนย์กลางหรือไม่
หากคุณดูงานวิจัยส่วนใหญ่เกี่ยวกับ AI เปอร์เซ็นต์ส่วนใหญ่มาจากสถาบันการศึกษา ในอดีต ML เป็นศูนย์กลางของโมเดลเพราะนี่คือที่ที่สถาบันวิจัยสามารถเพิ่มคุณค่าที่รับรู้ได้ การวิจัยเพิ่มเติมช่วยปรับปรุงโมเดลหรือสร้างโมเดลใหม่ซึ่งให้ผลลัพธ์ที่ดีกว่า ในทางกลับกัน เนื่องจากข้อมูลเป็นศูนย์กลาง การเพิ่มคุณภาพที่ดีขึ้น/ข้อมูลที่เกี่ยวข้องมากขึ้นให้กับแนวทางที่มีอยู่จึงไม่สามารถเผยแพร่ได้ง่าย (KPI หลักสำหรับนักวิจัย)
อย่างไรก็ตาม ปัญหาส่วนใหญ่ของแมชชีนเลิร์นนิงที่ใช้ ปัจจุบันได้รับประโยชน์จากข้อมูลที่ได้รับการปรับปรุงมากกว่าจากแบบจำลองที่ได้รับการปรับปรุง สิ่งนี้ยังสอดคล้องกับพันธกิจของเราในการทำให้แมชชีนเลิร์นนิงเป็นประชาธิปไตย คนส่วนใหญ่ที่อยู่นอกพื้นที่ Ml ไม่รู้อะไรมากนักเกี่ยวกับ ML แต่แน่นอนว่าพวกเขารู้มากเกี่ยวกับข้อมูลของพวกเขา
เรา เห็นว่ามีบริษัทอยู่ 2 ประเภท ทางหนึ่งคือบริษัทที่มีข้อมูลในฐานข้อมูล อีกทางหนึ่ง คือบริษัทที่ยังไม่มีฐานข้อมูล เราตระหนักว่าหากบริษัทอยู่ในกลุ่มของฐานข้อมูล ได้วางแนวทางที่ถูกต้องไว้แล้วเพื่อให้สามารถใช้แมชชีนเลิร์นนิงได้จริงๆ ในขณะที่บริษัทที่ยังไม่ค้นพบฐานข้อมูลยังมีหนทางอีกยาวไกล ดังนั้นเราจึงมุ่งเน้นไปที่การให้คุณค่าแก่ผู้ที่สามารถดึงฐานข้อมูลได้จริง
MindsDB เข้าใกล้การสร้างแบบจำลองและการปรับใช้ใน SQL ธรรมดาอย่างไร
เราสร้างการแสดงแบบจำลองเป็นตารางที่สามารถสืบค้นได้ ดังนั้นเราจึงลบแนวคิดของ’การปรับใช้’ออกจากภาพ เมื่อคุณพิมพ์บนฐานข้อมูล CREATE VIEW มุมมองนั้นจะใช้งานได้จริงเมื่อคำสั่งเสร็จสิ้นการประมวลผล เช่นเดียวกับเมื่อคุณสร้าง CREATE MODEL ใน Mindsdb
ผู้คนชื่นชอบ MindsDB เนื่องจากความเรียบง่ายที่คุณได้ มาถึงวงจรชีวิตของ ML-Ops เหตุใดการทำให้แมชชีนเลิร์นนิงใช้งานได้ง่ายขึ้นจึงมีความสำคัญ
ผู้คนชื่นชอบเพราะมันช่วยลดขั้นตอน ETL ที่ไม่จำเป็น ดังนั้นจึงต้องบำรุงรักษาน้อยลง เป้าหมายของเราคือการให้ผู้ใช้ดึงคุณค่าของแมชชีนเลิร์นนิง โดยไม่คิดถึงการบำรุงรักษาโครงสร้างพื้นฐาน ML หากพวกเขามีโครงสร้างพื้นฐานข้อมูลอยู่แล้ว
ข้อดีและความเสี่ยงบางประการของการเป็น การเริ่มต้นแบบโอเพนซอร์สเทียบกับการเริ่มต้นแบบเดิมๆ ใช่หรือไม่
โครงการแบบโอเพนซอร์สสามารถเริ่มต้นด้วยเพียงไอเดีย และผู้คนจะช่วยคุณสร้างมันขึ้นมาระหว่างทางโดยใช้แหล่งปิด แนวทางที่คุณต้องเริ่มต้นด้วยสมมติฐานเดียวกัน แต่คุณควรคิดถูกเพราะไม่มีใครช่วยคุณปรับปรุงผลิตภัณฑ์ของคุณ (อย่างน้อยก็ไม่ใช่ปริมาณเดียวกับในโอเพ่นซอร์ส) ให้คิดว่าโอเพ่นซอร์สเป็นวิธีการที่ผู้ใช้ผลิตภัณฑ์ทำงานร่วมกันอย่างเหมาะสม.
เมื่อเร็วๆ นี้ MindsDB ระดมทุน Series A มูลค่า 16.5 ล้านเหรียญสหรัฐจาก Benchmark เหตุใด Benchmark จึงเหมาะกับนักลงทุนที่สมบูรณ์แบบ และวิสัยทัศน์ของพวกเขาตรงกับคุณอย่างไร
Benchmark มี บันทึกที่ไร้ที่ติในอุตสาหกรรมของเรา Chetan ได้ช่วยให้บริษัทต่างๆ เช่น mongodb, elastic, airbyte กลายเป็นผู้นำระดับโลกในขอบเขตของตน เราเชื่อว่าไม่มีสิ่งใดที่เหมาะกับ MindsDB มากไปกว่า Chetan และ Benchmark Capital
ขอขอบคุณสำหรับบทสัมภาษณ์ดีๆ ผู้อ่านที่ต้องการเรียนรู้เพิ่มเติมควรไปที่ MindsDB