Jorge Torres é cofundador e CEO da MindsDB, uma plataforma que ajuda qualquer pessoa a usar o poder do aprendizado de máquina para fazer perguntas preditivas de seus dados e receber respostas precisas deles. A MindsDB também se formou no recente lote de inverno de 2020 da YCombinator e foi recentemente reconhecida como uma das empresas de IA mais promissoras da América pela Forbes.
O que inicialmente atraiu você para o aprendizado de máquina?
É uma história interessante. Em 2008, eu estava morando e trabalhando em Berkeley para uma startup chamada Couchsurfing e vi esta aula (cs188-Introduction to AI). Embora eu não fosse afiliado à universidade na época, perguntei ao prof. John DeNero se eu pudesse assistir a uma aula e ele me permitiu. Este professor foi brilhante e realmente fez todos se apaixonarem pelo assunto. Foi a melhor coisa que me aconteceu. Fiquei surpreso que os computadores pudessem aprender a resolver um problema, percebi que isso estava acontecendo rápido e decidi fazer disso minha carreira.

Existem alguns eventos geradores que definem a tecnologia que acontecem apenas algumas vezes na vida de uma pessoa. Tive a sorte de testemunhar o nascimento da Internet, mas era jovem demais para ser qualquer coisa além de um observador passivo. Acredito que o aprendizado de máquina seja o evento da próxima geração e queria fazer parte dele de uma maneira significativa para impulsionar a tecnologia e a maneira como a usamos.
MindsDB começou na UC Berkeley em 2018, você poderia compartilhar algumas ideias desses primeiros dias?
A UC Berkeley é uma das maiores instituições de pesquisa do mundo e tem um histórico de criação e suporte a software de código aberto, e nós pensei que não havia lugar melhor para começar o MindsDB. Nossos valores estavam alinhados, eles nos ofereceram nosso primeiro cheque por meio do UC Berkeley Skydeck Accelerator e o resto eles dizem que é história.
Os primeiros dias não eram diferentes de muitas startups na região da baía-três pessoas trabalhando longas horas em algo em que todos acreditavam, mas tinham apenas uma pequena chance de sucesso. A única diferença é que, em vez de trabalhar em uma garagem empoeirada em Palo Alto, estávamos no relativo conforto do espaço de trabalho Skydeck Penthouse (livre de aluguel).
Acredito que os dados têm um poder enorme. Quanto mais uma empresa tem, mais ela é capaz de impulsionar seus negócios. Mas apenas se eles conseguirem obter insights significativos disso.
No outono de 2017, meu melhor amigo Adam Carrigan (COO) e eu chegamos à conclusão de que muitas empresas enfrentavam limitações quando se tratava para extrair informações significativas de seus dados. Eles perceberam que uma das maiores limitações era quantos desses negócios estavam subutilizando severamente o poder da inteligência artificial. Acreditávamos que o aprendizado de máquina poderia tornar os dados e a inteligência que ele pode fornecer acessíveis a todos. É por isso que projetamos uma plataforma que permitiria a qualquer pessoa usar o poder do aprendizado de máquina para fazer perguntas preditivas sobre seus dados e receber respostas precisas deles.
Chamamos essa plataforma de MindsDB e estamos focados em continuar a fazer é incrivelmente fácil para os desenvolvedores criar rapidamente a próxima onda de aplicativos centrados em IA que transformarão a maneira como vivemos e trabalhamos e para as empresas extrair informações de seus dados.
Por que o MindsDB se concentrou em resolvendo o problema de ser centrado em dados em vez de centrado em aprendizado de máquina?
Se você olhar para a grande maioria das pesquisas em IA, uma grande porcentagem vem de instituições acadêmicas. O ML tem sido historicamente centrado no modelo porque é onde as instituições de pesquisa podem agregar valor percebido; mais pesquisas melhoram os modelos ou criam novos, produzindo assim melhores resultados. Por outro lado, por ser centrado em dados, adicionar dados de melhor qualidade/mais relevantes a uma abordagem existente não é facilmente publicável (o principal KPI para pesquisadores).
No entanto, a grande maioria dos problemas de aprendizado de máquina aplicados hoje se beneficiam muito mais de dados aprimorados do que de modelos aprimorados. Isso também se alinha bem com nossa missão de democratizar o aprendizado de máquina. A grande maioria das pessoas fora do espaço de ML não sabe muito sobre ML, mas com certeza sabe muito sobre seus dados.
Nós vimos que existiam dois tipos de empresas, de um lado empresas com dados no banco de dados, do outro, empresas com que ainda não tinham descoberto bancos de dados, percebemos que se uma empresa estava no grupo de bancos de dados, a maturidade de seus dados já os havia colocado no caminho certo para poder realmente aplicar o aprendizado de máquina, enquanto as empresas que ainda não haviam descoberto os bancos de dados ainda tinham um longo caminho a percorrer, então focamos em fornecer valor para aqueles que realmente poderiam extraí-lo.
Como o MindsDB aborda a modelagem e implantação em SQL simples?
Criamos representações de modelos como tabelas que podem ser consultadas, removendo com eficiência o conceito de’implantação’fora de cena. Quando você digita em um banco de dados CREATE VIEW, essa visualização é ativada quando o processamento do comando é concluído, a mesma coisa quando você faz CREATE MODEL no mindsdb.
As pessoas adoram o MindsDB devido à simplificação que você criou trazido para o ciclo de vida de ML-Ops, por que simplificar a implantação do aprendizado de máquina é tão importante?
As pessoas adoram porque abstrai pipelines de ETL desnecessários, portanto, menos coisas para manter. Nosso foco é fazer com que os usuários extraiam o valor do aprendizado de máquina, não pensando em manter a infraestrutura de ML se eles já mantêm a infraestrutura de dados.
Quais são algumas das vantagens e riscos de ser um start-up de código aberto versus uma start-up tradicional?
Um projeto de código aberto pode começar com apenas uma ideia, e as pessoas irão ajudá-lo a construí-lo ao longo do caminho, no código fechado abordagem, você tem que começar com as mesmas suposições, mas é melhor estar certo, porque ninguém vai ajudá-lo a melhorar seu produto (pelo menos não no mesmo volume que no código aberto), pense no código aberto como uma abordagem colaborativa para o usuário do produto.
MindsDB recentemente levantou um investimento de US$ 16,5 milhões da Série A da Benchmark, por que a Benchmark é o investidor perfeito e como a visão deles combina com a sua?
A Benchmark tem uma histórico impecável em nossa indústria, Chetan ajudou empresas como mongodb, elastic, airbyte a se tornarem líderes mundiais em seus domínios. Acreditamos que não há melhor ajuste para o MindsDB do que o capital Chetan e Benchmark.
Obrigado pela ótima entrevista, os leitores que desejam saber mais devem visitar MindsDB.