Klassifizierung von Tourismusdaten

Anhand von Beschreibungstexten sollen Ausflugsziele und Sehenswürdigkeiten in unterschiedliche Klassen eingeteilt werden, um diese Touristen als passende Reiseziele vorzuschlagen.
/
Entwicklung eines ersten Klassifikationsalgorithmus innerhalb von 2 Wochen
Genauigkeit der Klassifikation (Accuracy) von bis zu 81 %
Identifikation der Top-20 Einflussfaktoren (Worte) je Klasse

Herausforderung

  • Ein Automobilclub steht vor der Herausforderung, Reiseziele für Touristen anhand von Beschreibungen automatisiert zu klassifizieren.
  • Im ersten Schritt sollen 12.000 verschiedene Reiseziele in 12 unterschiedliche Klassen (beispielsweise Öffnungszeiten) eingeordnet werden.

Lösung

  • Fokussierung auf 800, durch den Fachbereich manuell gelabelte, Reiseziele.
  • Aufbereitung der Beschreibungstexte, um diese in ein lesbares Format für ein Machine Learning Modell zu bringen (Tokenization, Lemmatizing, Punctuation, Word Dictionary, …) mittels geeigneter Python Pakete aus dem Bereich Natural Language Processing
  • Nutzen eines Algorithmus zur Klassifikation der Reiseziele und Evaluation der Ergebnisse
  • Vergleich der Ergebnisse aus dem Machine Learning Modell mit einer einfachen Heuristik („strategisches Raten“)

Ergebnis

  • Reisezielen in 12 verschiedene Klassen (Python Skript) wurde entwickelt.
  • Deskriptive Analysen zur Erzeugung von Transparenz der Reiseziele für Touristen und zur Analyse für den Fachbereich des Kunden (Jupyter Notebook)

Haben Sie Interesse an eigenen Use Cases?

Herausforderung

Ein Automobilunternehmen möchte verschiedene marktspezifische Daten visualisieren, um eine Wettbewerbsanalyse für den US-Markt zu ermöglichen.

Lösung

Es wird eine interaktive und flexible Anwendung, einschließlich verschiedener Karten mit zwei verschiedenen Ansichten implementiert.

Ergebnis

Relevante Märkte werden identifiziert, analysiert und visualisiert. Der Händler oder der jeweilige Vertrieb haben die Möglichkeit den direkten Wettbewerb mit dem eigenen Produkt zu vergleichen und die relevanten Daten zu visualisieren.