Generierung und Monitoring der Datenqualität von Flottenaufzeichnungen durch Graph Based AI

Institut
Lehrstuhl für Fahrzeugtechnik
Typ
Bachelorarbeit / Semesterarbeit / Masterarbeit /
Inhalt
experimentell /  
Beschreibung

Beschreibung:

Die heutigen Datenbanken zur Speicherung von Mobilitätsdaten und deren Auswertung sind meist in relationalen Datenbanken, beispielsweise Postgresql oder DataWarehouses, wie ElasticSearch und Hadoop-Clustern. Während Erstere eine einfache Zugriffssprache und Zeilenbasierte-Analysen unterstützen, ermöglichen die Zweiteren das skalierbare Ablegen und Abrufen von Daten. Um zeitgemäß zu Analysieren und darauf entsprechende Modelle zu trainieren sind Abfragen und Repräsentationen nötig, die die Daten in gegenseitigen Kontext bringen und unstrukturierte Informationen verarbeiten. Gerade diese Verknüpfungen können genutzt werden um Fehlerverhalten in realen Datenaufzeichnungen zu finden. Für diese Explorativen Aufgaben können Graphendatenbanken und darauf implementierte Algorithmen, aus dem Bereich der angewandten Stochastik und dem Machine Learning zum Einsatz kommen.

In dieser wissenschaftlichen Arbeit soll die Daten von mehreren Fahrzeugflottenaufzeichnungen hinsichtlich der Datenqualität untersucht werden. Ein besonderes Augenmerk wird heirbei auf die Kombinationen aus Fahrzeugmodell, Softwarestand und Lokalität gelegt, da alle diese Eigenschaften mögliche Fehlerquellen während einer Datenaufzeichnung beinhalten. Hierzu werden geeignete Metriken aus den von vorhandenen Datenaufzeichnungen generiert. Diese werden nachfolgend zusammen mit den umgebenden Informationen, wie Softwarestände in eine Graphendatenbank überführt. Auf dieser werden nachfolgend Algorithmen ausgewählt, falls nötig trainiert und ausgewertet, welche Zusammenhänge und Aussagen generieren über das jeweilige Fahrzeug/Standort/Software-Kombinationen hinsichtlich möglicher Datenqualitätsdefizite. Diese resultierenden Aussagen sollen ansprechend aufbereitet werden, um beispielsweise den Verlauf über die fortschreitende Softwareentwicklung in der Toolchain am Lehrstuhl hinweg darzustellen.

Arbeitspakete:

  • Literatursuche zu Knowledge Graphs, Algorithmen und Flottendatenaufzeichnungen
  • Erarbeiten von entsprechenden Qualitätsmetriken über den Flottendaten
  • Erarbeitung einer geeigneten Datenstruktur und Überführung der Metriken in Kombination mit den zu Analysierenden Features in eine Graphendatenbank
  • Auswahl geeigneter Aggregationsalgorithmen und gegebenenfalls Training von diesen
  • Anwendung der Algorithmen auf den Datengraphen
  • Ableiten von Aussagen bzgl. der aktuellen Datenqualität und der historischen Entwicklung von dieser

Bei Interesse freue ich mich über eine aussagekräftige Bewerbung von dir. Bitte füge deinen Lebenslauf und einen aktuellen Notenauszug bei. In einem ersten gemeinsamen Gespräch können wir konkrete Inhalte und Schwerpunkte der Arbeit diskutieren.

Voraussetzungen
  • Programmierkenntnisse, präferiert Python
  • Datenbankkenntnisse hilfreich
  • Motivation an Datenanalyse
  • Spaß an Arbeiten im Kontext mit anderen Experten
  • Kreativität und Eigenintiative 
Tags
FTM Smarte Mobilität, FTM Netzler, FTM Studienarbeit, FTM Informatik
Möglicher Beginn
sofort
Kontakt
Fabian Netzler, M. Sc.
Tel.: +49 89 289 16598
netzlerftm.mw.tum.de