Jorge Torres est co-fondateur et PDG de MindsDB, une plate-forme qui aide quiconque à utiliser la puissance de l’apprentissage automatique pour poser des questions prédictives à leurs données et d’en recevoir des réponses précises. MindsDB est également diplômé du récent lot d’hiver 2020 de YCombinator et a récemment été reconnu comme l’une des sociétés d’IA les plus prometteuses d’Amérique par Forbes.
Qu’est-ce qui vous a initialement attiré vers l’apprentissage automatique ?
C’est une histoire intéressante. En 2008, je vivais et travaillais à Berkeley pour une startup appelée Couchsurfing et j’ai vu ce cours (cs188-Introduction à l’IA). Bien que je n’étais pas affilié à l’université à l’époque, j’ai demandé au prof. John DeNero si je pouvais assister à un cours et il m’a permis de le faire. Ce professeur était brillant et il a vraiment fait tomber tout le monde amoureux du sujet. C’est la meilleure chose qui me soit arrivée. J’ai été étonné que les ordinateurs puissent apprendre à résoudre un problème, j’ai réalisé que cela évoluait rapidement et j’ai décidé d’en faire ma carrière.

Il y a quelques événements générationnels déterminants dans la technologie qui ne se produisent que quelques fois dans une vie. J’ai eu la chance d’être témoin de la naissance d’Internet, mais j’étais bien trop jeune pour être autre chose qu’un observateur passif. Je crois que l’apprentissage automatique est cet événement générationnel de la prochaine génération, et je voulais en faire partie de manière significative pour faire progresser la technologie et la façon dont nous l’utilisons.
MindsDB a commencé à UC Berkeley en 2018, pourriez-vous partager un aperçu de ces premiers jours ?
UC Berkeley est l’une des grandes institutions de recherche au monde et a une histoire de création et de soutien de logiciels open source, et nous pensé qu’il n’y avait pas de meilleur endroit pour démarrer MindsDB. Nos valeurs étaient alignées, ils nous ont offert notre premier chèque via l’accélérateur UC Berkeley Skydeck et le reste, selon eux, appartient à l’histoire.
Les premiers jours n’étaient pas sans rappeler de nombreuses startups dans la région de la baie-Trois personnes travaillant de longues heures sur quelque chose en quoi ils croyaient tous, mais n’avait qu’une petite chance de succès. La seule différence est que plutôt que de travailler dans un garage poussiéreux à Palo Alto, nous étions dans le confort relatif de l’espace de coworking Skydeck Penthouse (location gratuite).
Je crois que les données ont un pouvoir énorme. Plus une entreprise a, plus elle est en mesure de propulser ses activités vers l’avant. Mais seulement s’ils sont en mesure d’en tirer des informations significatives.
À l’automne 2017, mon meilleur ami Adam Carrigan (COO) et moi sommes arrivés à la conclusion que trop d’entreprises étaient confrontées à des limitations lorsqu’il s’agissait pour extraire des informations significatives de leurs données. Ils ont réalisé que l’une des plus grandes limites était le nombre de ces entreprises qui sous-utilisaient gravement la puissance de l’intelligence artificielle. Nous pensions que l’apprentissage automatique pouvait rendre les données et l’intelligence qu’elles peuvent fournir accessibles à tous. C’est pourquoi nous avons conçu une plate-forme qui permettrait à quiconque d’utiliser la puissance de l’apprentissage automatique pour poser des questions prédictives sur ses données et en recevoir des réponses précises.
Nous appelons cette plate-forme MindsDB et nous nous efforçons de continuer à faire il est incroyablement facile pour les développeurs de créer rapidement la prochaine vague d’applications centrées sur l’IA qui transformeront notre façon de vivre et de travailler et pour les entreprises d’extraire des informations de leurs données.
Pourquoi MindsDB s’est-il concentré sur résoudre le problème d’être centré sur les données plutôt que sur l’apprentissage automatique ?
Si vous regardez la grande majorité de la recherche en IA, un grand pourcentage provient d’institutions universitaires. Le ML a toujours été centré sur le modèle, car c’est là que les institutions de recherche peuvent ajouter de la valeur perçue ; plus de recherche améliore les modèles ou en crée de nouveaux, produisant ainsi de meilleurs résultats. Étant centré sur les données, d’autre part, l’ajout de données de meilleure qualité/plus pertinentes à une approche existante n’est pas facilement publiable (le KPI clé pour les chercheurs).
Cependant, la grande majorité des problèmes d’apprentissage automatique appliqué bénéficient aujourd’hui beaucoup plus de données améliorées que de modèles améliorés. Cela correspond également à notre mission de démocratisation de l’apprentissage automatique, la grande majorité des personnes en dehors de l’espace ML ne connaissent pas grand-chose au ML, mais elles en savent certainement beaucoup sur leurs données.
Nous vu qu’il y avait deux types d’entreprises, d’une part les entreprises avec des données dans la base de données, d’autre part, les entreprises qui n’avaient pas encore compris les bases de données, nous nous sommes rendu compte que si une entreprise était sur le groupe de bases de données, leur maturité des données les avait déjà mis sur la bonne voie pour pouvoir vraiment appliquer l’apprentissage automatique, alors que les entreprises qui n’avaient pas encore découvert les bases de données avaient encore un long chemin à parcourir, nous nous sommes donc concentrés sur la création de valeur pour ceux qui pouvaient réellement l’extraire.
Comment MindsDB aborde-t-il la modélisation et le déploiement en SQL ?
Nous créons des représentations de modèles sous forme de tables pouvant être interrogées, de sorte que nous supprimons efficacement le concept de’déploiement’hors de l’image. Lorsque vous tapez sur une base de données CREATE VIEW, cette vue est en direct lorsque la commande est terminée, même chose lorsque vous faites CREATE MODEL dans mindsdb.
Les gens aiment MindsDB en raison de la simplification que vous avez apporté au cycle de vie ML-Ops, pourquoi est-il si important de simplifier le déploiement de l’apprentissage automatique ?
Les gens l’adorent parce qu’il supprime les pipelines ETL inutiles, donc moins de choses à maintenir. Notre objectif est d’amener les utilisateurs à extraire la valeur de l’apprentissage automatique, en ne pensant pas à maintenir l’infrastructure ML s’ils maintiennent déjà l’infrastructure de données.
Quels sont certains des avantages et des risques d’être un start-up open-source versus start-up traditionnelle ?
Un projet Open Source peut démarrer avec juste une idée, et les gens vous aideront à le construire en cours de route, sur la source proche approche, vous devez commencer avec les mêmes hypothèses mais vous feriez mieux d’avoir raison car personne ne va vous aider à améliorer votre produit (du moins pas dans le même volume qu’en open source), pensez à l’open source comme une approche collaborative d’ajustement de l’utilisateur du produit.
MindsDB a récemment a levé un investissement de série A de 16,5 millions de dollars auprès de Benchmark, pourquoi Benchmark est-il l’investisseur idéal et comment sa vision correspond-elle à la vôtre ?
Benchmark a un dossier impeccable dans notre industrie, Chetan a aidé des entreprises comme mongodb, elastic, airbyte à devenir les leaders mondiaux dans leurs domaines. Nous pensons qu’il n’y a pas de meilleure solution pour MindsDB que Chetan et Benchmark Capital.
Merci pour cette excellente interview, les lecteurs qui souhaitent en savoir plus devraient visiter MindsDB.