Forschung

Immer mehr Daten werden beim autonomen Fahren, durch Internet of Things, mobile Anwendungen, Social Media und in Produktionsprozessen generiert. Diese stellen einen wichtigen Produktions- und Wettbewerbsfaktor dar. Immer mehr Unternehmen realisieren das Potenzial der verfügbaren Datenmengen und beginnen, sich als “Data-driven Company” neu zu definieren. Durch neue Technologien wie z.B. In-Memory-Datenbanken oder zur Speicherung großen Datenmengen können Daten zunehmend umfassender für Machine Learning genutzt werden.

Das Institute for Machine Learning and Analytics beschäftigt sich mit verschiedenen Aspekten von Machine Learning und der intelligenten Analyse von (großen) Datenmengen.

Autonome Systeme

Autonome Systeme

Ein autonomes System ist ein System, welches Entscheidungen autonom treffen kann. Um dies zu erreichen, muss sie ihre Umgebung wahrnehmen, ein Modell der Umgebung entwickeln, das auf ihren Wahrnehmungen basiert, und mit diesem Modell autonom handeln. Es trifft Entscheidungen, die dann in geplante Maßnahmen umgesetzt werden. Diese wirken sich wiederum auf die Umwelt aus. Häufig interagiert ein autonomes System mit anderen autonomen Systemen.

Beispiele sind autonome Fahrzeuge oder autonom agierende Roboter, die nicht unflexibel programmiert sind, sondern auf Veränderungen in ihrer Umgebung reagieren müssen. Zu den Projekten mit autonomen Systemen an der Hochschule Offenburg gehören der Audi Autonomous Driving Cup und Shell Eco Marathon Autonomous Challenge (autonomes Fahren) sowie Sweaty (Roboterfußball).

Big Data

Big Data

Im Bereich Big Data untersuchen wir, wie sehr große strukturierte und semi-strukturierte Datenmengen effizient gespeichert und insbesondere analysiert werden können. Für Projekte und Proof-of-Concepts steht ein Cluster mit Hadoop und Spark zur Verfügung, wobei die Datenanalysen mit Hilfe von GPUs (on Hadoop) und R und Spark durchgeführt werden. Die verschiedenen Komponenten von Hadoop und Spark haben dabei ihre eigenen Einsatzgebiete, lassen sich oftmals aber auch mit den anderen Tools oder auch mit externen Systemen verbinden, um so auch komplexere Aufgaben bewältigen zu können. Beispielsweise lässt sich das Anwendungsfeld einer solchen Plattform durch die Einbindung von Tools zum Maschinellen Lernen erweitern.

Im Rahmen eines Projekts mit einem Industrieunternehmen wurde bspw. eine „Big Data Plattform“ zur Speicherung und Auswertung von Produktionsdaten konzeptioniert und realisiert. Durch den Einsatz der Hadoop Technologien wurden aktuell eingesetzte relationale Datenbanktechnologien ergänzt und schnellere (ad-hoc) Analysen sowie Machine Learning auf den Daten ermöglicht.

Business Analytics

Business Analytics

Die Anwendung von maschinellen Lernverfahren und statistischen Analysen auf betriebswirtschaftliche Fragestellungen ist der Gegenstand von Business Analytics. Anwendungen gibt es in sämtlichen Bereichen eines Unternehmens: Von der Zielgruppenanalyse und Kampagnenoptimierung im Marketing über Absatzprognosen im Verkauf bis hin zur Analyse von Fertigungsprozessen auf der Basis von Sensordaten. Auch traditionelle Themen der Datenanalyse und Speicherung wie Business Intelligence und Data Warehouse sowie deren Erweiterung durch maschinelle Lernverfahren sind Gegenstand unserer Forschungsinteressen. In Zukunft werden Methoden der Verarbeitung natürlicher Sprache und anderer unstrukturierterer Daten zunehmende Bedeutung auch bei betriebswirtschaftlichen Prozessen erlangen.

Learning Analytics

Learning Analytics

Unter Learning Analytics versteht man das Messen, Sammeln, Analysieren und Auswerten von Daten über Lernende und Lernprozesse, um mit Hilfe der gesammelten Daten Lern- und Lehrunterstützung anzubieten. Dabei kommen vielfältige Methoden und Vorgehensweisen des Maschinellen Lernens zum Einsatz. Die zugrunde liegenden Daten werden typischerweise in elektronischen Lernumgebungen und in digitalen Prüfungsverwaltungssystemen erzeugt. Grundlage sind z.B. Prüfungsergebnisse, Lerndokumente, Online-Diskussionen, Tests und Übungen. Bei sämtlichen Aktivitäten rund um Learning Analytics sind Persönlichkeit und Daten der Lernenden zu schützen. 

Machine Learning

Mit Hilfe von Machine Learning sind Computer in der Lage, auf Basis von Daten selbstständig zu lernen, wie komplexe Aufgaben gelöst werden können, ohne dass diese explizit programmiert werden müssen. Machine Learning Algorithmen nutzen bereitgestellte Trainings- und Testdaten, um nach Mustern zu suchen und ein Modell zu lernen, um damit zukünftig automatisch Entscheidungen zu treffen. Ziel ist es, dass der Computer ohne menschliche Hilfe automatisch lernt und Aktionen anpasst.

Es gibt eine Reihe von unterschiedlichen Machine Learning Methoden, die sich in überwachte und unüberwachte Verfahren sowie Reinforcement Learning unterscheiden. Wir beschäftigung uns mit allen Arten des maschinellen Lernens und insbesondere auch mit Deep Learning.

Weitere Informationen zu Machine Learning

Multimedia-Datenbanken

Multimedia-Datenbanken

Im Gegensatz zu herkömmlichen, strukturierten Datenbanken speichern Multimedia-Datenbanken unstrukturierte Daten, vor allem Bild, Ton und Video, aber auch Freitext. Ein Betrachter kann den Inhalt eines Bildes oder eines Videos erfassen, für einen Computer bleibt der Sinn aber verborgen. Infolgedessen ist die Suche nach multimedialen Inhalten in einer Datenbank nur dann sinnvoll möglich, wenn semantische Metadaten vorhanden sind, die multimediale Inhalte beschreiben. Heute können diese Metadaten mit Hilfe von Deep Learning erstellt werden, z.B. sind dies Objekte in Bildern und Videos oder Gesichter / Personen und deren Emotionen. Damit wäre etwa die Suche nach Bildern, Sounds und Videos mit einem Tiger möglich.

Parallel Computing

Parallel Computing

Paralleles Rechnen ist Voraussetzung für die praktikable Durchführung vielen Machine-Learning-Techniken. So wird durch Parallelisierung beispielsweise das Training tiefer Neuronale Netze von zum Teil wochenlanger Rechenzeit auf wenige Tage oder Stunden reduziert, was die praktische Anwendung von Deep Learning erst möglich macht. Auch viele andere Verfahren des maschinellen Lernens sind sehr rechenintensiv und erfordern parallele bzw. verteilte Berechnungen.

Wir beschäftigen uns insbesondere mit der massiven Parallelisierung durch Grafikprozessoren (GPUs) und darauf optimierten Algorithmen, z.B. im Bereich Data Clustering. Das IMLA verfügt über mehrere Server, die mit NVIDIA Tesla GPUs für hochparallele Datenverarbeitung ausgestattet sind.

Smart Mobile Devices

Smart Mobile Devices

Machine Learning Verfahren können auch im mobilen Kontext, insbesondere auf Smartphones, eingesetzt werden. Dies kann mit Hilfe unterschiedlicher Systemarchitekturen erfolgen: Zum einen können die Algorithmen vollständig auf Servern ausgeführt werden, so dass die zu analysierenden Daten vom Smartphone über geeignete Schnittstellen übertragen werden müssen. Dies erfordert jedoch eine dauerhafte Verbindung mit den Servern. Alternativ dazu kann beim Einsatz bspw. neuronaler Netze lediglich das rechenintensive Lernen auf den Servern erfolgen, das trainierte Netz wird anschließend auf das Smartphone übertragen und dort lokal genutzt werden (vgl. TensorFlow Lite). Ein weiterer Ansatz besteht darin, Machine Learning Anwendungen vollständig auf dem smartphone auszuführen, z.B. unter Verwendung von hardwarenah implementierten SDKs wie z.B. ARCore (Android) oder AR-Kit (iOS).