Forschung

Roboter lernen in Graz räumliches Sehen

26.04.2016

An der TU Graz wurde ein neues Christian-Doppler-Labor eröffnet. Die Kooperation mit einer Tochter des US-Chipkonzerns Qualcomm ist auf sieben Jahre angelegt.

Dieser Artikel ist älter als ein Jahr!

Räumliches Sehen stellt für die meisten Menschen eine Selbstverständlichkeit dar. Maschinen und Roboter mit einem gleichwertigen Sehvermögen auszustatten, ist jedoch eine komplizierte und aufwändige Angelegenheit. Ein neues Christian-Doppler Labor („Semantische 3D Computer Vision“) an der TU Graz sucht gemeinsam mit einem US-Chipkonzern nach Lösungen. Am Dienstag wurde das Labor eröffnet.

Ein Buch aus einem Regal zu greifen, ist einfach. Intuitiv wissen wir, wir weit der Arm ausgestreckt werden muss, um das Druckwerk zu fassen. Was für Menschen jedoch alltägliche Routine ist, kann Computer bereits an ihre Grenzen bringen: Maschinen können zwar Dank Kameratechnik und computergesteuerter Bilderkennungsmethoden zweidimensional „sehen“. Die richtige Interpretation des auf zweidimensionaler Ebene Gesehenen lässt allerdings zu wünschen übrig, wie Institutsleiter Vincent Lepetit vom Institut für Maschinelles Sehen und Darstellen der TU Graz schilderte.

Autonomes Fahren und Navigation

„2D-Bilder geben lediglich Informationen darüber, wo sich ein Objekt ungefähr befindet. Es ist eine flache Information ohne Angaben zur Tiefe von Objekten oder zu deren Position in Relation zu anderen Objekten“, erklärte Lepetit. Ein Roboter wisse daher nicht genau, wohin er greifen soll. In den kommenden sieben Jahren wird das Team an der TU Graz gemeinsam mit Qualcomm Technologies Inc. - einer Hundertprozenttocher des US-Chipkonzerns Qualcomm - an einer Bildbeschreibung in 3D arbeiten. Das Ziel sei, dass sich Roboter sich selbstständig in einer unkontrollierten Umgebung zurechtfinden. Laut dem Unternehmen mit Sitz in San Diego sollen die Ergebnisse der Kooperation vor allem zum Autonomen Fahren und der Navigation für Roboteranwendungen eingesetzt werden.

Damit die Maschine sehen und erfassen könnte wie wir, müsste sie räumliche Informationen aus digitalen Bildern ziehen können. Verzerrungen, Unschärfe, Bewegungen oder die Ähnlichkeit zu anderen Objekten machen es der Maschine jedoch schwer, richtig zu sehen und zu interpretieren. Algorithmen für Computer Vision und Bildverarbeitung seien zudem sehr rechenintensiv. „Erfreulicherweise ist die Rechnerleistung in den letzten Jahren aber rasant gestiegen, und das eröffnet uns neue Möglichkeiten in der Computer Vision“, so Lepetit.

Die Grazer Gruppe will auf maschinellem Lernen basierende Ansätze als grundlegende Bausteine für Anwendungen der 3D-Computer-Vision entwickeln. Um die Position der Roboter auch bei Geschwindigkeit zu messen, seien möglichst vielfältige Datenquellen sinnvoll. Zur Verwendung kommen sollen Tiefe- und Infrarotkameras aber auch Lichtfeldkameras, welche den Einfall von Licht von verschiedenen Seiten erfassen. Auch dynamische Bildsensoren, die Aufnahmen mit hoher Geschwindigkeit liefern, werden hinzugezogen.

Autonomes Fahren und Navigation

Kommentare