Less can be more - Optical Reservoir Computing
- 1CZS-Nachwuchsgruppe Interpretierbare Modelle für effiziente analoge Zeitserienvorhersage, Technische Universität Ilmenau
- 2Fachgebiet Theoretische Physik 2, Technische Universität Ilmenau
- 3Fachgebiet Technische Optik, Technische Universität Ilmenau
Die automatisierte Erkennung menschlicher Handlungen gewinnt aufgrund von Anwendungen in Bereichen wie Überwachung und autonomen Fahren zunehmend an Bedeutung. Moderne neuronale Netze erreichen bereits nahezu perfekte Ergebnisse, greifen dafür aber weiterhin auf aufwendige Vorverarbeitungen und Trainingsmethoden zurück. Im Gegensatz dazu legen Reservoir-Computing-Systeme den Fokus auf Effizienz und streben ähnliche Leistung bei reduziertem Rechenaufwand an, indem ausschließlich die Ausgabeschicht trainiert wird. Folglich werden Trainingszeit und Hardwareanforderungen drastisch reduziert und reale Systeme zur Datentransformation eingesetzt. In diesem Beitrag präsentieren wir Ergebnisse zur Erkennung menschlicher Gesten unter Verwendung eines hybriden optoelektronischen Systems basierend auf [1]. Ein derartiges System stellt eine Verarbeitung mit Lichtgeschwindigkeit und nahezu unbegrenzte Skalierbarkeit aufgrund der inhärenten Parallelität in Aussicht. Im Gegensatz zu gängigen Arbeiten verzichten wir auf jegliche digitale Vorverarbeitung und encodieren rohe Videodaten direkt in die optische Domäne. Die Kombination von Informationen der Realbildebene und der Fourierebene ermöglicht die Klassifizierung vollständiger Videos anstatt einzelner Bilder. Im Hinblick auf die Klassifizierungsgenauigkeit wird unser System evaluiert und zeigt vor dem Hintergrund der effektiven Hardwarenutzung einen möglichen partiellen Ersatz digitaler Vorprozessierung im Vergleich zu anderen neuronalen Netzen auf.