Computer auf dem Weg vom Sehen zum Erkennen

16. September 2014, 08:12
  • technologien
  • eth
  • konferenz
image

Die in Fachkreisen höchst renommierte European Conference on Computer Vision gastierte in Zürich. Das kommt als Werbeeffekt auch der ETH als Organisatorin zugute.

Die in Fachkreisen höchst renommierte European Conference on Computer Vision gastierte in Zürich. Das kommt als Werbeeffekt auch der ETH als Organisatorin zugute.
Eine Woche lang war Zürich das Mekka der Computer-Vision-Community: Im Kongresshaus und an der ETH ging vom 6. bis 12. September erstmals in der Schweiz die seit 1990 im Zwei-Jahres-Turnus stattfindende European Conference on Computer Vision (ECCV) über die Bühne. "Zusammen mit der International Conference on Computer Vision (ICCV) und der US-amerikanischen Computer Vision and Pattern Recognition Conference (CVPR) ist dies die wichtigste wissenschaftliche Konferenz auf unserem Gebiet", hält Professor Marc Pollefeys (Foto) fest. Pollefeys leitet am ETH-Departement für Informatik das Institute for Visual Computing und war zusammen mit seinem Kollegen Luc van Gool massgeblich für die Organisation der Konferenz verantwortlich.
ETH stark bei Computer Vision
Die ETH, so Pollefeys, ist bei der Verarbeitung visueller Informationen durch Informatikmittel besonders stark. Neben seinem eigenen Institut gebe es auch im Departement für Informationstechnologie und Elektrotechnik (Computer Vision Laboratory) und im Departement für Bau, Umwelt und Geomatik (Institut für Photogrammetrie und Geodäsie) Forschungsgruppen, die sich damit befassen, mit Hilfe von Algorithmen statische oder bewegte Bilder zu verstehen und so Informationen zu der in den Bildern festgehaltenen Geometrie, Bewegung und Semantik zu gewinnen.
"Jede der drei Gruppen ist allein für sich schon stark, zusammen machen sie die ETH zu einer der ersten Adressen für Computer Vision weltweit." Das sehe man auch an den zahlreichen Papers von ETH-Absolventen, die jeweils von den sehr wählerischen Gremien von Konferenzen wie eben der ECCV und der ICCV akzeptiert würden.
Dazu komme noch das ebenfalls sehr renommierte Computer Graphics Laboratory von Professor Markus Gross und diverse weitere Stärken der ETH wie etwa im Bereich Robotics. Diese sehr breite Abstützung war für Pollefeys ein wichtiger Grund, seiner Forschung an der ETH und nicht anderswo nachzugehen. Manche anderen Universitäten hätten vielleicht eine einzelne Disziplin auf besonders exzellentem Niveau, seien daneben aber weniger gut aufgestellt.
Von Forschung bis Praxis
Eine ECCV ist keine Konferenz, an der "wichtige" Persönlichkeiten zur Belustigung des Publikums Hollywood-reife Präsentationen abhalten. Vielmehr geht um den Wissens- und Erfahrungsaustausch unter Wissenschaftlern –insgesamt rund 1300 Doktoranden, Postdoc-Absolventen, Professoren und auch etliche Studenten waren vor Ort. Der Austausch geht, selbstverständlich neben viel Socializing und Networking sowie meist sehr spezifischen Workshops und Tutorials, vor allem auf zwei Arten vor sich: In den "Oral Sessions" können die Präsentatoren eine Viertelstunde referieren und ihre Forschung dem Publikum vorstellen. An den "Poster Sessions" zeigen Dutzende von Teilnehmern ihre Methoden und Ergebnisse jeweils einen halben Tag lang den Kollegen, die im Saal herumwandeln – zur Illustration ihrer Erläuterungen haben sie auf einem Anschlagbrett eine genau bemessene Fläche für ihr Poster zur Verfügung.
Neben diesem forschungsorientierten und eher theoretischen Schwerpunkt wurden an der ECCV auch etliche Forschungsergebnisse demonstriert – jeden Vormittag unterschiedliche–, deren Umsetzung in Produkte schon näher liegen dürfte als das, was in den Poster Sessions zu sehen war. Eine Gruppe der Universität Bristol zeigte zum Beispiel eine Anwendung für Google Glass oder Android-Smartphones: Man blickt mit der Kamera auf ein Objekt wie etwa eine Steckdose oder einen Akkuschrauber, dieses wird erkannt, und es wird ein Lernvideo eingeblendet, das die Bedienung des Gegenstands erklärt. Das Verfahren hat das Potential, herkömmliche Handbücher weitgehend überflüssig zu machen.
Ebenfalls zu sehen war eine von der Gruppe von Professor Pollefeys entwickelte App, die aus dem Smartphone einen 3D-Scanner macht und erstmals an der letztjährigen ICCV in Sydney gezeigt wurde. Die Smartphone-Kamera wird dazu einfach rund um das Objekt bewegt, von dem ein 3D-Modell erstellt werden soll. Das Smartphone nimmt laufend Bilder auf, berechnet die Geometrie des Objekts und generiert das 3D-Modell mit inkrementell zunehmender Qualität. Bisher war für solche dreidimensionalen Scans zusätzliche Hardware nötig. Die Software soll nun unter dem Motto "agile reality capture" über ein Startup namens Aquilaviz zur Marktreife gebracht werden.
Industrie vermehrt involviert
Interessant war die Demonstration eines Fussgängererkennungssystems für Autos, die von Daimler und der Universität Amsterdam organisiert wurde. Das System erkennt, wenn ein Fussgänger die Strasse quert, warnt zunächst den Autofahrer und bremst den Wagen rechtzeitig ab, falls der Fahrer nicht reagiert. "Auch die israelische Firma Mobileye hat vergleichbare Systeme, die sogar bereits erhältlich sind", meint Pollefeys und vergleicht die Situation heute mit dem Stand vor zehn Jahren. Damals sei man in der Lage gewesen, einzelne Probleme in einem engen Kontext experimentell zu lösen. "Heute können die Techniken, die wir entwickeln, wirklich eingesetzt werden. Computer Vision fängt an, unser Leben positiv zu beeinflussen. Algorithmen, die die Welt sehen und verstehen, werden bald überall eingesetzt werden."
Als weiteres Beispiel für den praktischen Einsatz von Computer-Vision-Technologie nennt der Professor die HDS-Software Cyclone (High-Definition Surveying) für die Laser-Scanner von Leica Geosystems, die mit einem Stand an der kleinen Ausstellung der ECCV vertreten war. Solche Geräte werden unter anderem im Hoch- und Tiefbau, aber auch in der Forensik eingesetzt. Die Software berücksichtigt laut Pollefeys neu auf Basis eines KTI-Projekts seiner Gruppe neben der Geometrie, die in Form so genannter Punktwolken erfasst und dargestellt wird, auch Realbilder des Vermessungsobjekts und richtet die Bilder automatisch aus. So erhält man vom Objekt nicht nur geometrische Daten, sondern auch das Aussehen – bis hin zum 360-Grad-3D-Panorama.
Überhaupt zeige sich die Industrie generell immer mehr an solchen wissenschaftlichen Konferenzen interessiert, und zwar zwecks Talentsuche. In Zürich waren den auch unter anderem Google, Amazon und Microsoft vor Ort. (Urs Binder)
(Foto: Minh Tran)

Loading

Mehr zum Thema

image

Twint partnert mit Cembra-Tochtergesellschaft Swissbilling

Die Schweizer Bezahl-App Twint will künftig mit Swissbilling zusammenarbeiten. Details der Partnerschaft waren indes nicht zu erfahren.

publiziert am 23.9.2022
image

Verstärkung für ETH kommt aus Kopenhagen

Die Hochschule beruft einen neuen Professor im Departement Mathematik, der auf Statistik und Machine Learning spezialisiert ist. Ein anderer KI-Spezialist verlässt die Uni.

publiziert am 23.9.2022
image

RZ-Ausfälle kosten schnell mal mehr als 1 Million Dollar

Eine internationale Studie zeigt, dass die Betreiber auch im nachhaltigen Umgang mit Strom und Wasser noch Verbesserungs­potenzial aufweisen.

publiziert am 22.9.2022
image

Der "letzte Überlebende" im Floppy-Disk-Business

Es gibt immer noch Abnehmer für die alten Datenträger. Aber die Vorräte des wahrscheinlich letzten Floppy-Händlers gehen langsam zur Neige.

publiziert am 21.9.2022 3