Forschung

Immer mehr Daten werden beim autonomen Fahren, durch Internet of Things, mobile Anwendungen, Social Media und in Produktionsprozessen generiert. Diese stellen einen wichtigen Produktions- und Wettbewerbsfaktor dar. Immer mehr Unternehmen realisieren das Potenzial der verfügbaren Datenmengen und beginnen, sich als “Data-driven Company” neu zu definieren. Durch neue Technologien wie z.B. In-Memory-Datenbanken oder zur Speicherung großen Datenmengen können Daten zunehmend umfassender für Machine Learning genutzt werden.

Das Institute for Machine Learning and Analytics beschäftigt sich mit verschiedenen Aspekten von Machine Learning und der intelligenten Analyse von (großen) Datenmengen.

Autonome Systeme

Als autonomes System bezeichnet man ein System, das selbständig Entscheidungen treffen kann. Dazu muss es seine Umgebung wahrnehmen, aufgrund der Wahrnehmungen eine Vorstellung von seiner Umgebung entwickeln und basierend auf dieser selbständig handeln. Hierfür werden Entscheidungen getroffen, welche durch geplante Aktionen umgesetzt werden, die wiederum auf die Umwelt rückwirken. Dabei interagieren autonome Systeme häufig auch mit anderen autonomen Systemen.

Beispiele sind autonome Fahrzeuge oder autonom agierende Roboter, die nicht starr vorprogrammiert sind, sondern auf Änderungen in der Umgebung reagieren müssen. An der Hochschule Offenburg laufen diesbezüglich die Projekte Audi Autonomous Driving Cup und Shell Eco Marathon Autonomous Challenge im Bereich autonomes Fahren sowie Magma und Sweaty im Bereich autonomer Roboter.

Big Data

Big Data

Im Bereich Big Data untersuchen wir, wie sehr große strukturierte und semi-strukturierte Datenmengen effizient gespeichert und insbesondere analysiert werden können. Für Projekte und Proof-of-Concepts steht ein Cluster mit Hadoop und Spark zur Verfügung, wobei die Datenanalysen mit Hilfe von GPUs (on Hadoop) und R und Spark durchgeführt werden. Die verschiedenen Komponenten von Hadoop und Spark haben dabei ihre eigenen Einsatzgebiete, lassen sich oftmals aber auch mit den anderen Tools oder auch mit externen Systemen verbinden, um so auch komplexere Aufgaben bewältigen zu können. Beispielsweise lässt sich das Anwendungsfeld einer solchen Plattform durch die Einbindung von Tools zum Maschinellen Lernen erweitern.

Im Rahmen eines Projekts mit einem Industrieunternehmen wurde bspw. eine „Big Data Plattform“ zur Speicherung und Auswertung von Produktionsdaten konzeptioniert und realisiert. Durch den Einsatz der Hadoop Technologien wurden aktuell eingesetzte relationale Datenbanktechnologien ergänzt und schnellere (ad-hoc) Analysen sowie Machine Learning auf den Daten ermöglicht.

Business Analytics

Business Analytics

Die Anwendung von maschinellen Lernverfahren und statistischen Analysen auf betriebswirtschaftliche Fragestellungen ist der Gegenstand von Business Analytics. Anwendungen gibt es in sämtlichen Bereichen eines Unternehmens: Von der Zielgruppenanalyse und Kampagnenoptimierung im Marketing über Absatzprognosen im Verkauf bis hin zur Analyse von Fertigungsprozessen auf der Basis von Sensordaten. Auch traditionelle Themen der Datenanalyse und Speicherung wie Business Intelligence und Data Warehouse sowie deren Erweiterung durch maschinelle Lernverfahren sind Gegenstand unserer Forschungsinteressen. In Zukunft werden Methoden der Verarbeitung natürlicher Sprache und anderer unstrukturierterer Daten zunehmende Bedeutung auch bei betriebswirtschaftlichen Prozessen erlangen.

Learning Analytics

Learning Analytics

Unter Learning Analytics versteht man das Messen, Sammeln, Analysieren und Auswerten von Daten über Lernende und Lernprozesse, um mit Hilfe der gesammelten Daten Lern- und Lehrunterstützung anzubieten. Dabei kommen vielfältige Methoden und Vorgehensweisen des Maschinellen Lernens zum Einsatz. Die zugrunde liegenden Daten werden typischerweise in elektronischen Lernumgebungen und in digitalen Prüfungsverwaltungssystemen erzeugt. Grundlage sind z.B. Prüfungsergebnisse, Lerndokumente, Online-Diskussionen, Tests und Übungen. Bei sämtlichen Aktivitäten rund um Learning Analytics sind Persönlichkeit und Daten der Lernenden zu schützen. 

Machine Learning

Mit Hilfe von Machine Learning sind Computer in der Lage, auf Basis von Daten selbstständig zu lernen, wie komplexe Aufgaben gelöst werden können, ohne dass diese explizit programmiert werden müssen. Machine Learning Algorithmen nutzen bereitgestellte Trainings- und Testdaten, um nach Mustern zu suchen und ein Modell zu lernen, um damit zukünftig automatisch Entscheidungen zu treffen. Ziel ist es, dass der Computer ohne menschliche Hilfe automatisch lernt und Aktionen anpasst.

Es gibt eine Reihe von unterschiedlichen Machine Learning Methoden, die sich in überwachte und unüberwachte Verfahren sowie Reinforcement Learning unterscheiden. Wir beschäftigung uns mit allen Arten des maschinellen Lernens und insbesondere auch mit Deep Learning.

Weitere Informationen zu Machine Learning

Multimedia-Datenbanken

Multimedia-Datenbanken

Im Gegensatz zu herkömmlichen, strukturierten Datenbanken speichern Multimedia-Datenbanken unstrukturierte Daten, vor allem Bild, Ton und Video, aber auch Freitext. Ein Betrachter kann den Inhalt eines Bildes oder eines Videos erfassen, für einen Computer bleibt der Sinn aber verborgen. Infolgedessen ist die Suche nach multimedialen Inhalten in einer Datenbank nur dann sinnvoll möglich, wenn semantische Metadaten vorhanden sind, die multimediale Inhalte beschreiben. Heute können diese Metadaten mit Hilfe von Deep Learning erstellt werden, z.B. sind dies Objekte in Bildern und Videos oder Gesichter / Personen und deren Emotionen. Damit wäre etwa die Suche nach Bildern, Sounds und Videos mit einem Tiger möglich.

Parallel Computing

Parallel Computing

Paralleles Rechnen ist Voraussetzung für die praktikable Durchführung vielen Machine-Learning-Techniken. So wird durch Parallelisierung beispielsweise das Training tiefer Neuronale Netze von zum Teil wochenlanger Rechenzeit auf wenige Tage oder Stunden reduziert, was die praktische Anwendung von Deep Learning erst möglich macht. Auch viele andere Verfahren des maschinellen Lernens sind sehr rechenintensiv und erfordern parallele bzw. verteilte Berechnungen.

Wir beschäftigen uns insbesondere mit der massiven Parallelisierung durch Grafikprozessoren (GPUs) und darauf optimierten Algorithmen, z.B. im Bereich Data Clustering. Das IMLA verfügt über mehrere Server, die mit NVIDIA Tesla GPUs für hochparallele Datenverarbeitung ausgestattet sind.

Smart Mobile Devices

Smart Mobile Devices

Machine Learning Verfahren können auch im mobilen Kontext, insbesondere auf Smartphones, eingesetzt werden. Dies kann mit Hilfe unterschiedlicher Systemarchitekturen erfolgen: Zum einen können die Algorithmen vollständig auf Servern ausgeführt werden, so dass die zu analysierenden Daten vom Smartphone über geeignete Schnittstellen übertragen werden müssen. Dies erfordert jedoch eine dauerhafte Verbindung mit den Servern. Alternativ dazu kann beim Einsatz bspw. neuronaler Netze lediglich das rechenintensive Lernen auf den Servern erfolgen, das trainierte Netz wird anschließend auf das Smartphone übertragen und dort lokal genutzt werden (vgl. TensorFlow Lite). Ein weiterer Ansatz besteht darin, Machine Learning Anwendungen vollständig auf dem smartphone auszuführen, z.B. unter Verwendung von hardwarenah implementierten SDKs wie z.B. ARCore (Android) oder AR-Kit (iOS).