Masterarbeit
Generische beschleunigte Plattform für Bildverarbeitung
Completion
2024/12
Research Area
Intelligent Information Management
Advisers
Description (German)
Die Interaktion zwischen Mensch und Maschine erfordert eine effiziente
Schnittstelle, um eine zügige
und zuverlässige Erfassung
sowie Verarbeitung von Daten zu gewährleisten. Verschiedene Arten von
Sensoren können verwendet werden, um Eingabedaten zu erhalten. Eine
Kategorie dieser, sind 3D-
oder Bildkameras. Sie bieten einen großen
Aufnahmebereich und ermöglichen zugleich eine schnelle
Datenerfassung
mit einer hohen Informationsdichte. Die Vorteile dieser Technologie gehen jedoch mit
einigen Problemen einher. Aufgrund der großen Datenmengen setzen die
Verarbeitung und
Übertragung leistungsstarke sowie schnell
Hardwaresysteme voraus. Obwohl Konzepte wie Cloud
Computing genügend
Rechenleistung bieten, erhöht sich jedoch die Latenzzeit aufgrund von
Übertragungsverzögerungen. Eine Alternative ist die
dezentralisierte Berechnung auf Edge-Geräten.
Die jüngsten
Fortschritte in der Mensch-Maschine-Interaktion haben zu einem Anstieg der visuellen
Verarbeitungsmethoden geführt. Es etablieren sich neue Anwendungsszenarien
wie Sicherheits-
systeme für die Mensch-Roboter-Kollaboration, sowie
die Erkennung von Personen mit Mobilitäts-
einschränkungen um
ihnen in verschiedenen Situationen zu helfen. Die Algorithmen zur
Objekterkennung können verwendet werden, um funktionale Informationen aus
den Rohbilddaten zu
gewinnen. Dieser Prozess wird in der Regel mit Hilfe von
neuronalen Netzen der künstlichen Intelligenz
(KI) realisiert. Die
zugrunde liegenden KI-Frameworks können von der Hardwarebeschleunigung
durch
Grafikkarten profitieren, die das Anlernen und die Datenverarbeitung
beschleunigen.
In dieser Masterarbeit soll ein Framework geschaffen werden, das
einheitliche Schnittstellen sowie
Befehle für die Konfiguration und
Generierung eines solchen Systems vereinfacht und verwendet. Es
dient als
grundlegende Komponente für die Erstellung von Laufzeitumgebungen
für
bildverarbeitungsbasierte Anwendungen im Rahmen des vom Fraunhofer
IWU durchgeführten
Projekts "Human in Sphere", dass eine Umgebung zur
Erstellung von benutzerdefinierten Bild-
verarbeitungsanwendungen spezifiziert.
Das Framework muss sich drei Hauptproblemen stellen:
Portabilität der
Software auf verschiedene Hardwareplattformen, ohne dass es zu einem nicht
funktionierenden Zustand aufgrund von Inkompatibilitätsproblemen kommt.
Außerdem sollten die
Größe und die verwendeten
Teilprozesse variabel einstellbar sein, was eine skalierbare
Programmstruktur
erfordert. Nicht zuletzt sind die Performance und Effizienz ein wichtiger Aspekt des
Gesamtsystems, um nahezu echtzeitfähige Ergebnisse zu erhalten, ohne dass
die fertige Anwendung
hängen bleibt oder zusammenbricht.
Um
die vorgestellten Probleme in einem Schritt zu lösen, ist das Hauptziel die
Erstellung eines
Frameworks, das alle benötigten Softwareteile und
Gerätetreiber konfiguriert, generiert und
miteinander verbindet, um
eine grundlegende Anwendung zu erstellen. Die vollständige Lösung
wäre
ein System mit Treibern für die Kameraschnittstelle und
die Grafikkartenbeschleunigung zusammen
mit allen Abhängigkeiten, die
für die KI-Unterstützung benötigt werden, basierend auf
Techniken des
aktuellen Stands der Technik. Die zuvor eingeführten
Anforderungen werden durch Zeit- und
Leistungsmessungen während der
Ausführung verifiziert, um das Gesamtsystem zu bewerten. Es wird
auch
eine Beispielanwendung erstellt, um das tatsächliche Verhalten des Systems zu
zeigen.