pte20110518016 Forschung/Entwicklung, Technologie/Digitalisierung

Musikvideo lässt Computer besser sehen

Forscher nutzen Kunstprojekt für effizientere Posenschätzung


Video-Posen: Lernmaterial für maschinelles sehen (Foto: nyu.edu)
Video-Posen: Lernmaterial für maschinelles sehen (Foto: nyu.edu)

New York/Graz (pte016/18.05.2011/11:45) Informatiker an der New York University (NYU) http://www.nyu.edu haben auf ein Musikvideo gesetzt, um Computern besseres Sehen beizubringen - insbesondere das Erkennen von Menschen unabhängig von ihrer Umgebung. Denn dank einem Crowdsourcing-Kunstprojekt der niederländischen Band C-Mon & Kypski http://www.c-monandkypski.nl stehen viele Einzelbilder verschiedener Personen in sehr ähnlicher Haltung zur Verfügung. Mithilfe eben dieser Datenbasis hat das Team einen Algorithmus lernen lassen, effizient Personen mittels sogenannter Posenschätzung zu erkennen.

Breites Anwendungspotential

Mit Microsofts Kinect hat maschinelles Sehen bereits Einzug in Wohnzimmer gehalten und der Sensor erkennt eben auch die Körperhaltung von Usern. "Kinect funktioniert deshalb so gut, weil ein 3D-Sensor verwendet wird", meint Horst Bischof, Professor am Institut für Maschinelles Sehen und Darstellen der TU Graz http://www.icg.tu-graz.ac.at , gegenüber pressetext. Um ein noch breiteres Anwendungsspektrum beispielsweise für Gestensteuerung oder die Medizin zu erschließen, ist aber eine Posenschätzung mit nur einer Kamera interessant, die unabhängig von Faktoren wie dem Hintergrund, der Kleidung oder der Beleuchtung funktioniert.

Deshalb erachtet Bischof den NYU-Ansatz als interessant, der sich ein Crowdsourcing-Videoprojekt von C-Mon & Kypski zunutze macht. Bei "One Frame of Fame" http://oneframeoffame.com bekommen User ein Einzelbild aus dem Video zum Song "More or Less" gezeigt und sollen die jeweilige Pose vor ihrer Webcam nachstellen. Die entstehende Aufnahme ersetzt dann ein Frame im stündlich aktualisierten Online-Video. Dieses enthält somit eine Vielzahl an Bildern verschiedener Personen in ähnlichen Körperhaltungen.

Lernvideo

Die New Yorker Wissenschaftler haben das Kunstprojekt nun zweckentfremdet. "Es hat sich als die ideale Datenquelle für die Entwicklung eines Algorithmus erwiesen, der Ähnlichkeiten anhand der Pose bestimmt", sagt der NYU-Informatiker Graham Tailor. Denn die Video-Einzelbilder sind vor sehr unterschiedlicher Kulisse entstanden, zeigen Personen beiderlei Geschlechts mit völlig verschiedener Kleidung und sind teils furchtbar belichtet.

Damit bietet das Video eine unglaublich gute Vergleichsdatenbank für das maschinelle Lernen des NYU-Algorithmus. Daher ist es den Forschern gelungen, dass ihr System Menschen in ähnlichen Körperhaltungen auch trotz völlig unterschiedlicher Umgebung effizient erkennen kann.

(Ende)
Aussender: pressetext.redaktion
Ansprechpartner: Thomas Pichler
Tel.: +43-1-81140-303
E-Mail: pichler@pressetext.com
Website: pressetext.com
|