Google fügt seinen Hilfsrobotern KI-Sprachkenntnisse hinzu, um Menschen besser zu verstehen

Google fügt seinen Hilfsrobotern KI-Sprachkenntnisse hinzu, um Menschen besser zu verstehen

Die Muttergesellschaft von Google, Alphabet, führt zwei ihrer ehrgeizigsten Forschungsprojekte zusammen – Robotik und KI-Sprachverständnis – in dem Versuch, einen „Hilfsroboter“ zu entwickeln, der natürliche Sprachbefehle verstehen kann.

Seit 2019 entwickelt Alphabet Roboter, die einfache Aufgaben wie Getränke holen und Oberflächen reinigen können. Dieses Everyday Robots-Projekt steckt noch in den Kinderschuhen – die Roboter sind langsam und zögernd – aber die Bots haben jetzt ein Upgrade erhalten: verbessertes Sprachverständnis dank Googles großes Sprachmodell (LLM) PaLM.

Die meisten Roboter reagieren nur auf kurze und einfache Anweisungen wie „Bring mir eine Flasche Wasser“. Aber LLMs wie GPT-3 und Googles MuM sind in der Lage, die Absicht hinter schrägeren Befehlen besser zu analysieren. In Googles Beispiel könnten Sie einem der Everyday Robots-Prototypen sagen: „Ich habe mein Getränk verschüttet, können Sie helfen?“ Der Roboter filtert diese Anweisung durch eine interne Liste möglicher Aktionen und interpretiert sie als „Hol mir den Schwamm aus der Küche“.

Ja, es ist eine Art niedrige Messlatte für einen „intelligenten“ Roboter, aber es ist definitiv immer noch eine Verbesserung! Was wirklich schlau wäre, wäre, wenn dieser Roboter gesehen Du verschüttest ein Getränk, gehört du schreist „gah oh mein gott mein dummes getränk“ und dann aushelfen.

Google hat das resultierende System PaLM-SayCan getauft, der Name beschreibt, wie das Modell die Sprachverständnisfähigkeiten von LLMs („Say“) mit der „Affordance Grounding“ seiner Roboter kombiniert (das ist „Can“ – das Filtern von Anweisungen durch mögliche Aktionen).

Google sagt, dass die Bots durch die Integration von PaLM-SayCan in seine Roboter in der Lage waren, in 84 Prozent der Fälle korrekte Antworten auf 101 Benutzeranweisungen zu planen und sie in 74 Prozent der Fälle erfolgreich auszuführen. Das ist eine solide Trefferquote, aber diese Zahlen sind mit Vorsicht zu genießen. Wir haben nicht die vollständige Liste der 101-Befehle, daher ist nicht klar, wie eingeschränkt diese Anweisungen waren. Haben sie wirklich die volle Breite und Komplexität der Sprache erfasst, die wir von einem echten Haushaltshelfer-Roboter erwarten würden? Es ist unwahrscheinlich.

Denn das ist die große Herausforderung für Google und andere, die an Heimrobotern arbeiten: Das wirkliche Leben ist kompromisslos chaotisch. Es gibt einfach zu viele komplexe Befehle, die wir einem stellen möchten real Heimroboter, von „Räum das Müsli auf, das ich gerade unter der Couch verschüttet habe“ bis „Brate die Zwiebeln für eine Nudelsoße an“ (beide Befehle, die eine große Menge an implizitem Wissen enthalten, vom Aufräumen des Müslis bis zum Platz der Zwiebeln der Kühlschrank sind und wie man sie zubereitet usw.).

Aus diesem Grund hat der einzige Heimroboter in diesem Jahrhundert, der auch nur einen gewissen Erfolg erzielt hat – der Roboter-Staubsauger – nur einen Zweck im Leben: Schmutz zu saugen.

Da die KI Verbesserungen bei Fähigkeiten wie Sehvermögen und Navigation liefert, sehen wir jetzt, dass neue Arten von Bots auf den Markt kommen, aber diese sind immer noch absichtlich in ihren Möglichkeiten eingeschränkt. Schauen Sie sich zum Beispiel den Retriever-Bot von Labrador Systems an. Es ist im Grunde ein Regal auf Rädern, das Gegenstände von einem Teil des Hauses in einen anderen transportiert. In diesem einfachen Konzept steckt sicherlich viel Potenzial – der Retriever-Roboter könnte für Menschen mit eingeschränkter Mobilität unglaublich nützlich sein –, aber wir sind noch weit entfernt von den Alleskönner-Roboterbutlern unserer Träume.

Quellenlink