Etienne Bernard é cofundador e CEO da NuMind, uma empresa de software fundada em junho de 2022 especializada no desenvolvimento de ferramentas de aprendizado de máquina. Etienne é especialista em IA e aprendizado de máquina. Depois de um PhD (ENS) e pós-doutorado (MIT) em física estatística, Etienne ingressou na Wolfram Research, onde se tornou o chefe de aprendizado de máquina por 7 anos. Durante esse período, Etienne liderou o desenvolvimento de ferramentas de aprendizado automático, uma estrutura de aprendizado profundo amigável e vários aplicativos de aprendizado de máquina.
O que inicialmente atraiu você para o aprendizado de máquina?
A primeira vez que ouvi o termo “aprendizado de máquina” foi em 2009, acredito, graças ao prêmio Netflix. Achei a ideia de que as máquinas podem aprender fascinante e poderosa. Já estava claro para mim que isso levaria a muitas aplicações importantes – incluindo a empolgante possibilidade de criar IAs. Decidi imediatamente mergulhar nele e nunca mais voltei.
Depois de obter um PhD (ENS) e pós-doutorado (MIT) em física estatística, você ingressou na Wolfram Research, onde se tornou o chefe de aprendizado de máquina por 7 anos. Quais foram alguns dos projetos mais interessantes em que você trabalhou?
Meu tipo de projeto favorito na Wolfram foi o desenvolvimento de funções automáticas de aprendizado de máquina para a Wolfram Language (também conhecida como Mathematica). O primeiro foi o Classify, onde você apenas fornece os dados e ele retorna um classificador. Para mim, o aprendizado de máquina sempre foi automático. Você não ajusta os hiperparâmetros de seu aluno humano e também não deveria ajustar para sua máquina! Foi bastante desafiador, do ponto de vista científico e da engenharia de software, criar funções automáticas de aprendizado de máquina verdadeiramente robustas e eficientes.
Criar uma estrutura de rede neural de alto nível também foi um projeto muito interessante. Muitas decisões de design difíceis sobre como representar redes neurais simbolicamente, como visualizá-las e como manipulá-las (ou seja, ser capaz de cortar algumas peças, colar outras, substituir camadas, etc.) Acho que fizemos um trabalho decente ao a propósito, e se fosse de código aberto, tenho certeza que seria muito usado 😉
Durante esse período, você também escreveu um livro seminal intitulado “Introduction to Machine Learning”, quais foram alguns dos desafios por trás de escrever um livro tão abrangente?
Ah, foram muitos! Demorou dois anos no total para escrever. Eu poderia ter decidido apenas escrever um livro “como fazer”, o que teria sido mais fácil, mas parte da minha jornada na Wolfram tem sido sobre aprendizado de aprendizado de máquina, e senti a necessidade de transmitir isso. Portanto, a principal dificuldade era descobrir exatamente sobre o que falar e em que ordem, para torná-lo interessante e fácil de entender. Depois, havia os detalhes pedagógicos: devo usar uma fórmula matemática para esse conceito? Ou algum código? Ou apenas uma visualização? Eu queria tornar este livro o mais acessível possível e isso me deu muitas dores de cabeça. No geral estou feliz com o resultado. Espero que seja útil para muitos!
Você poderia compartilhar a história da gênese por trás do NuMind?
Ok. Eu queria criar uma startup por um tempo, originalmente em 2012 para criar uma ferramenta de auto ML, mas o trabalho na Wolfram era muito divertido. Então, por volta de 2019-2020, começaram a aparecer os primeiros modelos de linguagem grande (LLMs), como o GPT-2 e depois o GPT-3. Foi um choque para mim o quão bem eles podiam entender e gerar texto. Ao mesmo tempo, pude ver como era doloroso criar modelos de NLP: você precisava lidar com uma equipe de anotação, ter especialistas executando muitos experimentos etc. Achei que deveria haver uma maneira de usar esses LLMs por meio de um ferramenta para melhorar drasticamente a experiência de criação de modelos de PNL. Meu co-fundador, Samuel (que por acaso é meu primo), compartilhava da mesma visão, então decidimos criar esta ferramenta.
O objetivo do NuMind é disseminar o uso de máquinas aprendizado – e inteligência artificial em geral – criando ferramentas simples, mas poderosas. Quais são algumas das ferramentas atualmente disponíveis?
De fato. Nossa primeira ferramenta é para criar modelos personalizados de PNL. Por exemplo, digamos que você queira analisar o sentimento de seus usuários a partir de seus comentários. Usar um modelo pronto para uso geralmente não é bom, porque ele foi treinado em um tipo diferente de dados e para uma tarefa ligeiramente diferente (as tarefas de análise de sentimento são surpreendentemente diferentes umas das outras!). Em vez disso, você deseja treinar um modelo personalizado que funcione bem em seus dados. Nossa ferramenta permite fazer exatamente isso, de forma extremamente simples e eficiente. Basicamente, você carrega seus dados, executa uma pequena quantidade de anotações e obtém um modelo que pode ser implantado por meio de uma API. Isso é possível graças ao uso de LLMs, mas também a esse novo paradigma de aprendizado que chamamos de Interactive AI Development.
Quais são alguns dos modelos personalizados que você está vendo desenvolvidos desde a primeira rodada de Clientes da NuMind?
Existem alguns analisadores de sentimentos. Por exemplo, um cliente está monitorando o sentimento de bate-papos em grupo onde as pessoas estão ajudando umas às outras a lutar contra seus vícios. Essa análise é necessária para intervir no caso raro em que o sentimento está em declínio. Outro cliente nos usa para descobrir quais vagas de emprego são as melhores para um determinado currículo – e, a propósito, acredito que há muito potencial nesses tipos de IAs de matchmaking. Também temos clientes que estão extraindo informações de documentos médicos e jurídicos.
Quanta economia de tempo as empresas podem obter ao usar as ferramentas NuMind?
É um aplicativo dependente é claro, mas em comparação com as soluções tradicionais (rotular dados e treinar um modelo separadamente), vemos uma melhoria de até 10x na velocidade para obter um modelo e colocá-lo em produção. Espero que esse número melhore à medida que continuamos desenvolvendo o produto. Eventualmente, acredito que projetos que levariam meses serão concluídos em dias e com melhor desempenho.
Você poderia explicar como funciona o desenvolvimento interativo de IA da NuMind?
A ideia do desenvolvimento interativo de IA vem de como os humanos ensinam uns aos outros. Por exemplo, digamos que você contrate um estagiário para classificar seus e-mails. Você primeiro descreveria a tarefa e seu propósito. Então você pode dar alguns bons exemplos, talvez alguns casos extremos. Em seguida, seu estagiário começaria a rotular e-mails e uma conversa começaria. Seu estagiário voltaria com perguntas como”Como devo rotular este?”ou “acho que deveríamos criar um novo rótulo para este”, ou mesmo perguntar “por que” devemos rotular de uma determinada maneira. Da mesma forma, você pode fazer perguntas ao seu estagiário para identificar e corrigir suas lacunas de conhecimento. Essa forma de ensinar é muito natural e extremamente eficiente em termos de troca de informações. Estamos tentando imitar esse fluxo de trabalho para que os humanos ensinem as máquinas com eficiência.
Em termos técnicos, esse fluxo de trabalho é uma comunicação de baixa latência, alta largura de banda, multimodal e bidirecional entre o humano e a máquina , e decidimos chamá-lo de Interactive AI Development para enfatizar os aspectos de bidirecionalidade e baixa latência. Eu vejo isso como um terceiro paradigma para ensinar máquinas, depois da programação clássica e do aprendizado de máquina clássico (onde você apenas dá vários exemplos da tarefa para o computador descobrir o que fazer).
Isso novo paradigma é desbloqueado por LLMs. De fato, você precisa ter algo que já seja inteligente na máquina para interagir com ela de maneira eficiente. Acredito que esse paradigma se tornará comum em um futuro próximo, e já podemos vislumbrá-lo com LLMs baseados em bate-papo e com nossa ferramenta, é claro.
Estamos aplicando esse paradigma para ensinar tarefas de PNL , mas isso pode – e será – usado para muito mais, incluindo o desenvolvimento de software.
Existe mais alguma coisa que você gostaria de compartilhar sobre o NuMind?
Talvez seja uma ferramenta que pode ser usada por especialistas e não especialistas em aprendizado de máquina, que seja multilíngue, que você possua seus modelos e que os dados possam permanecer em sua máquina!
Caso contrário, estamos em uma fase beta privada, portanto, se você tiver alguma necessidade de PNL, ficaremos felizes em conversar e descobrir se/como podemos ajudá-lo!
Obrigado pela ótima entrevista, os leitores que desejam saber mais devem visitar NuMind.