Data Mining Cup 2017 an der TU München

Gemeinsam mit den Kommilitonen an einem realitätsnahen Datensatz arbeiten, echte Fragestellungen beantworten und gemeinsam Lösungsansätze entwickeln – das ermöglicht der jährlich stattfindende Data Mining Cup an der TU München. Zur Krönung winken den drei besten Teams tolle Preise.

Unter der Leitung von Prof. Bichler findet alljährlich der Data Mining Cup in der Lehrveranstaltung Business Analytics statt. Wirtschaftsinformatiker haben hier einerseits die Möglichkeit Bonuspunkte für ihre Klausur zu erhalten, andererseits erhalten sie die Chance an einem von einem Praxispartner bereitgestellten Datensatz zu arbeiten und dieses Jahr dazu der Alexander Thamm GmbH ihre Fragen zu stellen.

Fragestellung beim Data Mining Cup 2017

Eine der beiden diesjährigen Fragestellungen drehte sich um die Klassifikation von Fahrzeugen in zwei Gruppen. Bei einer Gruppe war eine spezifische Motorkomponente ausgefallen und bei der anderen nicht. Die den Studenten übergebenen Daten konnten dank eines Kunden aus der Automobilindustrie bereitgestellt werden und wurden vor der Weitergabe hinreichend anonymisiert. Die Daten enthielten aggregierte Sensorwerte der betrachteten Fahrzeuge vor dem Ausfall der Komponente, bzw. zu einem zufälligen Zeitpunkt für Fahrzeuge ohne Ausfall. Ziel der Studenten war es, ein Klassifikationsmodell zu trainieren und so zu bearbeiten, dass die Metrik Accuracy einen möglichst hohen Wert erreicht. Die besten drei Teams erhielten eine Urkunde und wurden mit einem Preis ausgezeichnet.

Lösungsansätze für die diesjährige Fragestellung

Bei der Lösung der Aufgabe war es für die Studenten wichtig, sich an Methoden des überwachten Lernens zu bedienen (Supervised Learnings). Vor allem baumbasierte Ensemblemodelle erzielten eine hohe Güte. Die Gewinnerteams führten außerdem eine Vorbehandlung der Variablen durch (Preprocessing) und erstellten neue Prädiktoren (Feature Engineering). Viel wichtiger als das beste Modell zu finden war jedoch, dass den Studenten ein realitätsnaher Datensatz zur Verfügung stand an dem sie Best Practices erarbeiten konnten.

Auszeichnung der drei besten Teams

Das Siegerteam mit 85,2% Accuracy war Team „Data’R’tists, gefolgt von „sophisticated rhinoceros“ (85,0%) und „JUSTUS“ (84,7%). Das dreiköpfige Siegerteam erhielt jeweils eine Drohne, die Zweitplatzierten jeweils ein Raspberry Pi und die Drittplatzierten Amazon-Gutscheine.

Im Februar fand die Abschlussveranstaltung des Data Mining Cups 2017 der TU München statt. Nach der Abschlussvorlesung präsentierten der Senior Data Scientist Andreas Hübner und der Senior Statistician Arne Kaldhusdal der Alexander Thamm GmbH ihren Ansatz für die Lösung der Fragestellung. Außerdem standen sie den Studenten im Rahmen einer Q&A-Runde für Fragen zur Verfügung.

Wir wünschen den Studenten weiterhin viel Erfolg im Studium und viel Spaß mit den verdient gewonnenen Preisen!

Tags

top