Etienne Bernard es cofundador y director ejecutivo de NuMind, una empresa de software fundada en junio de 2022 que se especializa en el desarrollo de herramientas de aprendizaje automático. Etienne es un experto en inteligencia artificial y aprendizaje automático. Después de un doctorado (ENS) y un posdoctorado (MIT) en física estadística, Etienne se unió a Wolfram Research, donde se convirtió en el jefe de aprendizaje automático durante 7 años. Durante este tiempo, Etienne lideró el desarrollo de herramientas de aprendizaje automático, un marco de aprendizaje profundo fácil de usar y varias aplicaciones de aprendizaje automático.
¿Qué le atrajo inicialmente del aprendizaje automático?
La primera vez que escuché el término “aprendizaje automático” fue en 2009 creo, gracias al premio de Netflix. Encontré la idea de que las máquinas pueden aprender fascinante y poderosa. Ya tenía claro que esto conduciría a muchas aplicaciones importantes, incluida la emocionante posibilidad de crear IA. Inmediatamente decidí sumergirme en él y nunca volví.
Después de obtener un doctorado (ENS) y un posdoctorado (MIT) en física estadística, se unió a Wolfram Research, donde se convirtió en el jefe de aprendizaje automático durante 7 años. ¿Cuáles fueron algunos de los proyectos más interesantes en los que trabajó?
Mi tipo de proyecto favorito en Wolfram fue el desarrollo de funciones automáticas de aprendizaje automático para Wolfram Language (también conocido como Mathematica). El primero fue Classify, donde solo le das los datos y devuelve un clasificador. Para mí, el aprendizaje automático siempre se ha tratado de ser automático. ¡No ajustas los hiperparámetros de tu estudiante humano, y tampoco deberías hacerlo para tu máquina! Fue bastante desafiante desde una perspectiva científica y de ingeniería de software crear funciones de aprendizaje automático verdaderamente robustas y eficientes.
La creación de un marco de red neuronal de alto nivel también fue un proyecto muy interesante. Muchas decisiones de diseño difíciles sobre cómo representar simbólicamente las redes neuronales, cómo visualizarlas y cómo manipularlas (es decir, poder cortar algunas piezas, pegar otras, reemplazar capas, etc.) Creo que hicimos un trabajo decente al Por cierto, y si fuera de código abierto, estoy bastante seguro de que se usaría mucho 😉
Durante este período de tiempo también escribiste un libro seminal titulado”Introducción al aprendizaje automático”, ¿Cuáles fueron algunos de los desafíos detrás de escribir un libro tan completo?
¡Oh, hubo muchos! Me llevó dos años en total escribirlo. Podría haber decidido simplemente escribir un libro de”instrucciones”, lo que hubiera sido más fácil, pero parte de mi viaje en Wolfram ha consistido en aprender sobre aprendizaje automático y sentí la necesidad de transmitirlo. Entonces, la principal dificultad fue averiguar de qué hablar exactamente y en qué orden, para hacerlo interesante y fácil de entender. Luego estaban los detalles pedagógicos: ¿debería usar una fórmula matemática para este concepto? ¿O algún código? ¿O simplemente una visualización? Quería hacer este libro lo más accesible posible y esto me dio muchos dolores de cabeza. En general estoy contento con el resultado. ¡Espero que sea útil para muchos!
¿Podrías compartir la historia de génesis detrás de NuMind?
Está bien. Quería crear una startup por un tiempo, originalmente en 2012 para crear una herramienta de aprendizaje automático automático, pero el trabajo en Wolfram era demasiado divertido. Luego, alrededor de 2019-2020, comenzaron a aparecer los primeros modelos de lenguaje grande (LLM), como GPT-2 y luego GPT-3. Fue un shock para mí lo bien que podían entender y generar texto. Al mismo tiempo, pude ver lo doloroso que era crear modelos de PNL: necesitabas tratar con un equipo de anotaciones, tener expertos realizando muchos experimentos, etc. Pensé que debería haber una manera de usar estos LLM a través de un herramienta para mejorar drásticamente la experiencia de crear modelos NLP. Mi cofundador, Samuel (que resulta ser mi primo), compartía la misma visión, por lo que decidimos crear esta herramienta.
El objetivo de NuMind es difundir el uso de la máquina aprendizaje, y la inteligencia artificial en general, mediante la creación de herramientas simples pero poderosas. ¿Cuáles son algunas de las herramientas que están disponibles actualmente?
De hecho. Nuestra primera herramienta es para crear modelos personalizados de PNL. Por ejemplo, supongamos que desea analizar el sentimiento de sus usuarios a partir de sus comentarios. El uso de un modelo listo para usar generalmente no es bueno, porque ha sido entrenado en un tipo diferente de datos y para una tarea ligeramente diferente (¡las tareas de análisis de sentimiento son sorprendentemente diferentes entre sí!). En su lugar, desea entrenar un modelo personalizado que funcione bien en sus datos. Nuestra herramienta permite hacer precisamente eso, de una manera extremadamente simple y eficiente. Básicamente, carga sus datos, realiza una pequeña cantidad de anotaciones y obtiene un modelo que puede implementar a través de una API. Esto es posible gracias al uso de LLM, pero también a este nuevo paradigma de aprendizaje que llamamos Desarrollo interactivo de IA.
¿Cuáles son algunos de los modelos personalizados que está viendo desarrollados desde la primera ronda de ¿Clientes de NuMind?
Ha habido algunos analizadores de sentimientos. Por ejemplo, un cliente está monitoreando el sentimiento de los chats grupales donde las personas se ayudan mutuamente a combatir sus adicciones. Este análisis es necesario para intervenir en el raro caso de que el sentimiento esté decayendo. Otro cliente nos usa para encontrar qué ofertas de trabajo son mejores para un currículum determinado y, por cierto, creo que hay mucho potencial en este tipo de IA de emparejamiento. También tenemos clientes que extraen información de documentos médicos y legales.
¿Cuánto tiempo pueden ahorrar las empresas al usar las herramientas de NuMind?
Es una aplicación dependiente, por supuesto, pero en comparación con las soluciones tradicionales (etiquetado de datos y entrenamiento de un modelo por separado), vemos una mejora de hasta 10 veces en la velocidad para obtener un modelo y ponerlo en producción. Espero que este número mejore a medida que continuamos desarrollando el producto. Con el tiempo, creo que los proyectos que hubieran llevado meses se completarán en días y con un mejor rendimiento.
¿Podría explicar cómo funciona el desarrollo interactivo de IA de NuMind?
La idea del Desarrollo de IA Interactiva proviene de cómo los humanos se enseñan unos a otros. Por ejemplo, supongamos que contrata a un interno para clasificar sus correos electrónicos. Primero describiría la tarea y su propósito. Entonces usted podría dar algunos buenos ejemplos, tal vez algunos casos de esquina. Luego, su pasante comenzaría a etiquetar los correos electrónicos y comenzaría una conversación. Su pasante regresaría con preguntas como”¿Cómo debo etiquetar este?”o “Creo que deberíamos crear una nueva etiqueta para este”, o incluso preguntarte “por qué” deberíamos etiquetar de cierta manera. Del mismo modo, puede hacer preguntas a su pasante para identificar y corregir sus lagunas de conocimiento. Esta forma de enseñanza es muy natural y extremadamente eficiente en términos de intercambio de información. Estamos tratando de imitar este flujo de trabajo para que los humanos enseñen a las máquinas de manera eficiente.
En términos técnicos, este flujo de trabajo es una comunicación bidireccional, multimodal y de baja latencia entre el humano y la máquina. , y decidimos llamarlo Desarrollo interactivo de IA para enfatizar los aspectos bidireccionales y de baja latencia. Veo esto como un tercer paradigma para enseñar a las máquinas, después de la programación clásica y el aprendizaje automático clásico (donde solo das un montón de ejemplos de la tarea para que la computadora descubra qué hacer).
Esto Los LLM desbloquean un nuevo paradigma. De hecho, debe tener algo que ya sea inteligente en la máquina para interactuar de manera eficiente con ella. Creo que este paradigma se volverá común en un futuro cercano, y ya podemos ver destellos de él con los LLM basados en chat y, por supuesto, con nuestra herramienta.
Estamos aplicando este paradigma para enseñar tareas de PNL , pero esto se puede usar, y se usará, para mucho más, incluido el desarrollo de software.
¿Hay algo más que le gustaría compartir sobre NuMind?
Quizás que es una herramienta que puede ser utilizada tanto por expertos como por no expertos en aprendizaje automático, que es multilingüe, que usted posee sus modelos y que los datos pueden permanecer en su máquina.
De lo contrario, estamos en una fase beta privada, por lo que si tiene alguna necesidad de PNL, ¡estaremos encantados de hablar y ver si/cómo podemos ayudarlo!
Gracias por la excelente entrevista, los lectores que deseen obtener más información deben visitar NuMind.