AT_Logo

Klassifikation von Reisezielen

Anhand von Beschreibungstexten sollen Ausflugsziele und Sehenswürdigkeiten in unterschiedliche Klassen eingeteilt werden, um diese Touristen als passende Reiseziele vorzuschlagen.
/
Entwicklung eines ersten Klassifikationsalgorithmus innerhalb von 2 Wochen
Genauigkeit der Klassifikation (Accuracy) von bis zu 81 %
Identifikation der Top-20 Einflussfaktoren (Worte) je Klasse

Herausforderung

  • Ein Automobilclub steht vor der Herausforderung, Reiseziele für Touristen anhand von Beschreibungen automatisiert zu klassifizieren.
  • Im ersten Schritt sollen 12.000 verschiedene Reiseziele in 12 unterschiedliche Klassen (beispielsweise Öffnungszeiten) eingeordnet werden.

Lösung

  • Fokussierung auf 800, durch den Fachbereich manuell gelabelte, Reiseziele.
  • Aufbereitung der Beschreibungstexte, um diese in ein lesbares Format für ein Machine Learning Modell zu bringen (Tokenization, Lematizing, Punctuation, Word Dictionary, …) mittels geeigneter Python Pakete aus dem Bereich Natural Language Processing
  • Nutzen eines Algorithmus zur Klassifikation der Reiseziele und Evaluation der Ergebnisse
  • Vergleich der Ergebnisse aus dem Machine Learning Modell mit einer einfachen Heuristik („strategisches Raten“)

Ergebnis

  • Reisezielen in 12 verschiedene Klassen (Python Skript) wurde entwickelt.
  • Deskriptive Analysen zur Erzeugung von Transparenz der Reiseziele für Touristen und zur Analyse für den Fachbereich des Kunden (Jupyter Notebook)

Haben Sie Interesse an eigenen Use Cases?