Jorge Torres, è il co-fondatore e CEO di MindsDB, una piattaforma che aiuta chiunque a utilizzare la potenza del machine learning per porre domande predittive di i propri dati e riceverne risposte accurate. MindsDB si è anche laureato al recente batch Winter 2020 di YCombinator ed è stato recentemente riconosciuto come una delle aziende di intelligenza artificiale più promettenti d’America da Forbes.
Cosa ti ha attratto inizialmente del machine learning?
È una storia interessante. Nel 2008 vivevo e lavoravo a Berkeley per una startup chiamata Couchsurfing e ho visto questo corso (cs188-Introduction to AI). Sebbene all’epoca non fossi affiliato all’università, chiesi al prof. John DeNero se potessi partecipare a un corso e lui me lo ha permesso. Questo professore è stato brillante e ha davvero fatto innamorare tutti dell’argomento. È stata la cosa migliore che mi sia capitata. Ero stupito che i computer potessero imparare a risolvere un problema, mi sono reso conto che si stava muovendo velocemente e ho deciso di farne la mia carriera.
Ci sono alcuni eventi generazionali determinanti nella tecnologia che si verificano solo poche volte nella vita di una persona. Ho avuto la fortuna di assistere alla nascita di Internet, ma ero troppo giovane per essere tutt’altro che un osservatore passivo. Credo che il Machine Learning sia l’evento generazionale di prossima generazione e volevo farne parte in modo significativo per portare avanti la tecnologia e il modo in cui la utilizziamo.
MindsDB ha iniziato alla UC Berkeley nel 2018, potresti condividere alcune informazioni di questi primi giorni?
UC Berkeley è uno dei più grandi istituti di ricerca del mondo e ha una storia di creazione e supporto di software open source, e noi pensato che non ci fosse posto migliore per avviare MindsDB. I nostri valori erano allineati, ci hanno offerto il nostro primo controllo tramite l’acceleratore UC Berkeley Skydeck e il resto, dicono, è Storia.
I primi tempi non erano diversi da molte startup nella regione della Baia: tre persone che lavoravano per lunghe ore su qualcosa in cui credevano tutti, ma avevano solo poche possibilità di successo. L’unica differenza è che invece di lavorare in un garage polveroso a Palo Alto, ci trovavamo in un relativo comfort nello spazio di co-working Skydeck Penthouse (affitto gratuito).
Credo che i dati abbiano un enorme potere. Più un’azienda ha, più è in grado di far progredire le proprie attività. Ma solo se sono in grado di ricavarne informazioni significative.
Nell’autunno del 2017, io e il mio migliore amico Adam Carrigan (COO) siamo giunti alla conclusione che troppe aziende hanno dovuto affrontare dei limiti quando si trattava per estrarre informazioni significative dai loro dati. Si sono resi conto che uno dei maggiori limiti era il numero di queste aziende che utilizzavano gravemente il potere dell’intelligenza artificiale. Credevamo che l’apprendimento automatico potesse rendere i dati e l’intelligenza che può fornire accessibili a tutti. Ecco perché abbiamo progettato una piattaforma che consenta a chiunque di utilizzare la potenza dell’apprendimento automatico per porre domande predittive sui propri dati e ricevere risposte accurate.
Chiamiamo questa piattaforma MindsDB e ci concentriamo sul continuare a creare è incredibilmente facile per gli sviluppatori creare rapidamente la prossima ondata di applicazioni incentrate sull’intelligenza artificiale che trasformeranno il modo in cui viviamo e lavoriamo e per le aziende estrarre informazioni dai propri dati.
Perché MindsDB si è concentrato su risolvere il problema di essere incentrati sui dati invece che sull’apprendimento automatico?
Se si guarda alla stragrande maggioranza della ricerca sull’intelligenza artificiale, una grande percentuale proviene da istituzioni accademiche. Il machine learning è stato storicamente incentrato sul modello perché è qui che gli istituti di ricerca possono aggiungere valore percepito; più ricerca migliora i modelli o ne crea di nuovi producendo così risultati migliori. Essendo incentrato sui dati, d’altra parte, l’aggiunta di dati di qualità migliore/più pertinenti a un approccio esistente non è facilmente pubblicabile (il KPI chiave per i ricercatori).
Tuttavia, la stragrande maggioranza dei problemi di machine learning applicati oggi traggono molto più vantaggio da dati migliorati che da modelli migliorati. Questo è anche in linea con la nostra missione di democratizzare l’apprendimento automatico, la stragrande maggioranza delle persone al di fuori dello spazio Ml non sa molto di ML, ma sicuramente sa molto sui propri dati.
Noi visto che c’erano due tipi di aziende, da un lato aziende con dati nel database, dall’altro aziende con che non avevano ancora capito i database, ci siamo resi conto che se un’azienda era nel gruppo di database, la loro maturità dei dati li aveva già messi sulla strada giusta per poter applicare davvero l’apprendimento automatico, mentre le aziende che non avevano ancora scoperto i database avevano ancora molta strada da fare, quindi ci siamo concentrati sul fornire valore a coloro che potevano effettivamente estrarlo.
In che modo MindsDB si avvicina alla modellazione e all’implementazione in SQL semplice?
Creiamo rappresentazioni di modelli come tabelle che possono essere interrogate, quindi rimuoviamo efficacemente il concetto di’distribuzione’fuori dal quadro. Quando digiti su un database CREATE VIEW quella vista è attiva proprio quando il comando ha terminato l’elaborazione, la stessa cosa quando fai CREATE MODEL in minddb.
Le persone adorano MindsDB a causa della semplificazione che hai portato al ciclo di vita ML-Ops, perché semplificare l’implementazione del machine learning è così importante?
Le persone lo adorano perché astrae le pipeline ETL non necessarie, quindi meno cose da mantenere. Il nostro obiettivo è fare in modo che gli utenti estraggano il valore del machine learning, non pensando di mantenere l’infrastruttura ML se già gestiscono l’infrastruttura dati.
Quali sono alcuni dei vantaggi e dei rischi di essere un start-up open source rispetto a una start-up tradizionale?
Un progetto Open Source può iniziare solo con un’idea e le persone ti aiuteranno a costruirlo lungo il percorso, sulla fonte vicina approccio devi iniziare con gli stessi presupposti ma è meglio che tu abbia ragione perché nessuno ti aiuterà a migliorare il tuo prodotto (almeno non nello stesso volume dell’open source), pensa all’open source come a un approccio collaborativo adatto all’utente del prodotto.
MindsDB recentemente ha raccolto un investimento di $ 16,5 milioni di serie A da Benchmark, perché Benchmark è l’investitore perfetto e in che modo la loro visione corrisponde alla tua?
Benchmark ha un record impeccabile nel nostro settore, Chetan ha aiutato aziende come mongodb, elastic, airbyte a diventare i leader mondiali nei loro regni. Crediamo che non ci sia una soluzione migliore per MindsDB di Chetan e Benchmark capital.
Grazie per l’ottima intervista, i lettori che desiderano saperne di più dovrebbero visitare MindsDB.