Ein Forscherteam in Princeton hat herausgefunden, dass Beschreibungen von Werkzeugen in menschlicher Sprache das Erlernen eines simulierten Roboterarms beschleunigen können, der verschiedene Werkzeuge heben und verwenden kann.
Die neue Forschung unterstützt die Idee, dass KI Das Training kann autonome Roboter anpassungsfähiger in neuen Situationen machen, was wiederum ihre Effektivität und Sicherheit verbessert.
Durch das Hinzufügen von Beschreibungen der Form und Funktion eines Werkzeugs zum Trainingsprozess des Roboters wurde die Fähigkeit des Roboters, neue Werkzeuge zu manipulieren, verbessert verbessert.
ATLA-Methode für das Training
Die neue Methode heißt Accelerated Learning of Tool Manipulation with Language oder ATLA.
Anirudha Majumdar ist Assistenzprofessorin für Maschinenbau und Luft-und Raumfahrttechnik in Princeton und Leiterin des Intelligent Robot Motion Lab.
„Zusätzliche Informationen in Form von Sprache können einem Roboter helfen Man lernt nicht schneller, die Tools zu verwenden“, sagte Majumdar.
Das Team hat das Sprachmodell GPT-3 abgefragt, um Toolbeschreibungen zu erhalten. Nachdem sie verschiedene Eingabeaufforderungen ausprobiert hatten, entschieden sie sich für „Beschreibe die [Funktion] von [Werkzeug] in einer detaillierten und wissenschaftlichen Antwort“, wobei die Funktion die Form oder der Zweck des Werkzeugs ist.
Karthik Narasimhan ist Assistenzprofessor für Informatik und Mitautor der Studie. Narasimhan ist auch ein führendes Fakultätsmitglied in der Princeton-Gruppe für die Verarbeitung natürlicher Sprache (NLP) und hat als Gastforscher bei OpenAI zum ursprünglichen GPT-Sprachmodell beigetragen.
„Weil diese Sprachmodelle im Internet trainiert wurden , kann man sich dies in gewisser Weise als eine andere Möglichkeit vorstellen, diese Informationen effizienter und umfassender abzurufen, als Crowdsourcing zu verwenden oder bestimmte Websites für Toolbeschreibungen zu durchsuchen“, sagte Narasimhan.
Simuliert Roboter-Lernexperimente
Das Team wählte einen Trainingssatz von 27 Werkzeugen für seine simulierten Roboter-Lernexperimente aus, wobei die Werkzeuge von einer Axt bis zu einem Wischer reichten. Dem Roboterarm wurden vier verschiedene Aufgaben übertragen: das Werkzeug schieben, das Werkzeug anheben, damit einen Zylinder über einen Tisch streichen oder einen Stift in ein Loch hämmern.
Das Team entwickelte dann eine Reihe von Richtlinien durch maschinelle Lernansätze mit und ohne Sprachinformationen. Die Leistungen der Richtlinien wurden in einem separaten Test von neun Tools mit gepaarten Beschreibungen verglichen.
Der Ansatz, der als Meta-Lernen bezeichnet wird, verbessert die Fähigkeit des Roboters, mit jeder aufeinanderfolgenden Aufgabe zu lernen.
Laut Narasimhan lernt der Roboter nicht nur, jedes Werkzeug zu benutzen, sondern „versucht auch zu lernen, die Beschreibungen jedes dieser hundert verschiedenen Werkzeuge zu verstehen, so dass er, wenn er das 101. Werkzeug sieht, schneller lernt, das neue zu benutzen tool.“
Bei den meisten Experimenten bot die Sprachinformation erhebliche Vorteile für die Fähigkeit des Roboters, neue Tools zu verwenden.
Allen Z. Ren ist ein Ph.D. Student in Majumdars Gruppe und Hauptautor der Forschungsarbeit.
„Mit dem Sprachtraining lernt es, am langen Ende des Brecheisens zu greifen und die gekrümmte Oberfläche zu nutzen, um die Bewegung der Flasche besser einzuschränken, “, sagte Ren. „Ohne die Sprache hat es die Brechstange nahe der gekrümmten Oberfläche gepackt und war schwerer zu kontrollieren.“
„Das allgemeine Ziel ist es, Robotersysteme – insbesondere solche, die mit maschinellem Lernen trainiert werden – zu verallgemeinern in neue Umgebungen“, fügte Majumdar hinzu.