Etienne Bernard 是 NuMind 的聯合創始人兼首席執行官,這家軟件公司成立於 2022 年 6 月,專門開發機器學習工具。 Etienne 是人工智能和機器學習方面的專家。在獲得統計物理學博士學位 (ENS) 和博士後 (MIT) 之後,Etienne 加入了 Wolfram Research,在那裡他擔任了 7 年的機器學習負責人。在此期間,Etienne 領導了自動學習工具、用戶友好的深度學習框架和各種機器學習應用程序的開發。
最初是什麼吸引您進入機器學習?
我相信我第一次聽到“機器學習”這個詞是在 2009 年,這要歸功於 Netflix 獎。我發現機器可以學習的想法既迷人又強大。我已經很清楚,這將帶來大量重要的應用——包括創造 AI 的令人興奮的可能性。我立即決定投入其中,再也沒有回來。
在獲得統計物理學博士學位 (ENS) 和博士後 (MIT) 後,您加入了 Wolfram Research,在那裡您擔任了 7 年的機器學習負責人。您參與過哪些更有趣的項目?
我在 Wolfram 最喜歡的項目是為 Wolfram 語言(又名 Mathematica)開發自動機器學習函數。第一個是 Classify,你只需給它數據,它就會返回一個分類器。對我來說,機器學習一直是自動化的。你不會調整你的人類學生的超參數,你也不應該為你的機器調整!從科學和軟件工程的角度來看,創建真正強大且高效的自動機器學習函數是非常具有挑戰性的。
創建高級神經網絡框架也是一個非常有趣的項目。關於如何象徵性地表示神經網絡、如何可視化它們以及如何操縱它們(即能夠切割一些部分、將其他部分粘合在一起、替換層等)的許多困難的設計決策我認為我們做得不錯方式,如果它是開源的,我很確定它會被大量使用寫這樣一本全面的書背後有哪些挑戰?
哦,有很多!一共寫了兩年。我本可以決定只寫一本“如何做”的書,這樣會更容易,但我在 Wolfram 的部分旅程是關於學習機器學習的,我覺得有必要傳播它。因此,主要的困難在於弄清楚究竟要談什麼,以什麼順序,才能讓它變得有趣和容易理解。然後是教學細節:我應該為這個概念使用數學公式嗎?或者一些代碼?或者只是一個可視化?我想讓這本書盡可能易於閱讀,這讓我很頭疼。總的來說,我對結果很滿意。我希望它對很多人有用!
您能分享 NuMind 背後的起源故事嗎?
好的。有一段時間我想創建一家初創公司,最初是在 2012 年創建一個汽車 ML 工具,但在 Wolfram 的工作太有趣了。然後在 2019-2020 年左右,第一批大型語言模型 (LLM) 開始出現,例如 GPT-2,然後是 GPT-3。他們理解和生成文本的能力之強令我震驚。同時,我可以看到創建 NLP 模型是多麼痛苦:你需要與註釋團隊打交道,需要專家進行大量實驗等。我認為應該有一種方法可以通過顯著改善創建 NLP 模型的體驗的工具。我的聯合創始人 Samuel(恰好是我的堂兄)有著相同的願景,因此我們決定創建這個工具。
NuMind 的目標是傳播機器的使用通過創建簡單而強大的工具來學習——以及一般的人工智能。目前可用的工具有哪些?
的確如此。我們的第一個工具是用於創建自定義 NLP 模型。例如,假設您想從用戶的反饋中分析他們的情緒。使用現成的模型通常不是很好,因為它是針對不同類型的數據和稍微不同的任務進行訓練的(情感分析任務彼此之間驚人地不同!)。相反,您想要訓練一個適用於您的數據的自定義模型。我們的工具允許以極其簡單和高效的方式做到這一點。基本上,您加載數據,執行少量註釋,然後獲得可以通過 API 部署的模型。這要歸功於 LLM 的使用,以及我們稱之為交互式 AI 開發的這種新學習範式。
您看到的一些定制模型是從第一輪開發而來的NuMind 客戶?
有一些情緒分析器。例如,一位客戶正在監控群聊中人們互相幫助對抗毒癮的情緒。需要進行此分析,以便在情緒下降的罕見情況下進行干預。另一位客戶使用我們來尋找最適合給定簡歷的職位空缺——順便說一句,我相信這類匹配 AI 有很大的潛力。我們也有一些客戶正在從醫療和法律文件中提取信息。
公司可以通過使用 NuMind 工具節省多少時間?
它是應用程序當然,與傳統解決方案(分別標記數據和訓練模型)相比,我們看到獲得模型並將其投入生產的速度提高了 10 倍。我希望隨著我們繼續開發產品,這個數字會有所改善。最終,我相信原本需要幾個月才能完成的項目將在幾天內完成,而且性能會更好。
您能解釋一下 NuMind 的交互式 AI 開發是如何工作的嗎?
交互式 AI 開發的想法來自於人類如何互相教導。例如,假設您僱用了一名實習生來對您的電子郵件進行分類。您將首先描述任務及其目的。然後你可能會給出一些很好的例子,也許是一些極端情況。然後你的實習生會開始標記電子郵件,然後開始對話。你的實習生會帶著諸如“我應該如何給這個貼上標籤?”之類的問題回來。或“我認為我們應該為此創建一個新標籤”,甚至問您“為什麼”我們應該以某種方式標記。同樣,您可能會向您的實習生提問,以確定並糾正他們的知識差距。這種教學方式非常自然,在信息交流方面也極其有效。我們正在嘗試模仿這個工作流程,以便人類有效地教機器。
從技術上講,這個工作流程是人機之間的低延遲、高帶寬、多模態和雙向通信,我們決定將其稱為交互式 AI 開發,以強調雙向性和低延遲方面。我認為這是繼經典編程和經典機器學習之後的第三種教授機器的範式(你只需給出一堆任務示例,讓計算機弄清楚該做什麼)。
這LLM 解鎖了新範式。事實上,您需要在機器中擁有某種已經具有某種智能的東西,以便有效地與之交互。我相信這種範式在不久的將來會變得普遍,我們已經可以在基於聊天的 LLM 中看到它的踪影,當然還有我們的工具。
我們正在應用這種範式來教授 NLP 任務,但這可以而且將會用於更多用途,包括開發軟件。
關於 NuMind,您還有什麼想分享的嗎?
也許它是一種機器學習專家和非專家都可以使用的工具,它是多語言的,您擁有自己的模型,並且數據可以保留在您的機器上!
否則我們正處於私人測試階段,所以如果您有任何 NLP 需求,我們很樂意與您交談並了解我們是否/如何幫助您!
感謝您接受精彩的採訪,希望了解更多信息的讀者可以訪問 NuMind。