Neuer MIT-Roboter ahnt, was Menschen fehlt
Innovation blendet irrelevante Reize dank eines raffiniert entwickelten KI-Toolkits einfach aus
![]() |
Versuchsanordnung: Hier findet sich der "Relevance"-Roboter mühelos zurecht (Foto: mit.edu) |
Cambridge (pte004/28.04.2025/06:10)
Forscher des Massachusetts Institute of Technology (MIT) haben einem neuen Haushaltsroboter beigebracht, aus Gesprächen, Gesten und Blicken von Menschen deren Bedürfnisse zu erahnen und sie zu befriedigen. Wie der aufmerksame Gastgeber würde er beim Frühstück zum Beispiel die Butter reichen, weil er den suchenden Bick des Gastes richtig interpretieren kann.
Hirn filtert Überflüssiges
Vorbild für die Neuentwicklung ist der Mensch. Dank einer Region im Gehirn, die als retikuläres Aktivierungssystem (RAS) bekannt ist, lassen sich Ablenkungen ausblenden und der Fokus auf das Wesentliche richten. Das RAS ist ein Bündel von Neuronen im Hirnstamm, das unbewusst unnötige Reize ausfiltert, sodass eine Person die relevanten Reize nicht übersieht. Das RAS hilft, eine Reizüberflutung zu verhindern, sodass Menschen beispielsweise gezielt zur Kaffeekanne greifen.
"Das Erstaunliche ist, dass diese Neuronengruppen alles herausfiltern, was nicht wichtig ist, sodass sich das Gehirn auf das konzentrieren kann, was gerade relevant ist. Das ist im Grunde genommen unser Ansatz. Unser Roboter muss einem Menschen keine Fragen mehr stellen, um herauszufinden, was er braucht. Er nimmt einfach aktiv Informationen aus der Umgebung auf, um schnell herauszufinden, wie er helfen kann", sagt MIT-Forscher Kamal Youcef-Toumi.
Roboter hört Wort "Kaffee"
Das Verfahren nennen die Forscher "Relevance", weil es dem Roboter ermöglicht, relevante von irrelevanten Infos zu unterscheiden. Relevance besteht aus vier Hauptphasen. Die erste ist die Wahrnehmungsphase, in der der Roboter audiovisuelle Signale, beispielsweise von einem Mikrofon und einer Kamera, aufnimmt, die kontinuierlich in ein KI-Toolkit eingespeist werden. Dieses Toolkit kann ein großes Sprachmodell umfassen, das Audio-Gespräche verarbeitet, um Schlüsselwörter und Phrasen zu identifizieren, sowie verschiedene Algorithmen, die Objekte, Menschen, physische Aktionen und Aufgaben Ziele erkennen und klassifizieren. Das KI-Toolkit läuft kontinuierlich im Hintergrund, ähnlich wie die unbewusste RAS-Filterung.
Die zweite Stufe ist eine "Trigger-Check"-Phase, bei der das System regelmäßig überprüft, ob etwas Wichtiges passiert, beispielsweise ob ein Mensch in der Nähe des Roboters auftaucht. Damit wird die dritte Phase aktiviert. Diese dient dazu, die Merkmale in der Umgebung zu ermitteln, die für die Unterstützung des Menschen am wahrscheinlichsten relevant sind, etwa umherschweifende Blicke.
Obstschale ausgeblendet
Um die Relevanz festzustellen, haben die Forscher einen Algorithmus entwickelt, der Echtzeitvorhersagen des KI-Toolkits berücksichtigt. Beispielsweise könnte das Sprachmodell des Toolkits das Schlüsselwort "Kaffee" erkennen. Die Relevanzmethode hilft dann, Objekte zu bestimmen, die etwas mit Kaffee zu tun haben, also Kaffeekanne, Tasse, Zucker und Milchkännchen. Obstschale und Brotkorb werden gleich ausgeblendet, ebenso Butterdose und Honigtopf.
Ein Blick des Menschen in die leere Tasse gibt dem Roboter dann letzte Sicherheit. Er schnappt sich die Kaffeekanne und gießt ein. Insgesamt kann der Roboter die Absicht eines Menschen mit einer Genauigkeit von 90 Prozent vorhersagen und relevante Objekte mit einer Genauigkeit von 96 Prozent identifizieren. Derart programmiert, könnte er in der intelligenten Fertigung und in Lagerumgebungen eingesetzt werden und mit Menschen intuitiv zusammenarbeiten und ihnen assistieren.
(Ende)Aussender: | pressetext.redaktion |
Ansprechpartner: | Wolfgang Kempkens |
Tel.: | +43-1-81140-300 |
E-Mail: | kempkens@pressetext.com |
Website: | www.pressetext.com |