NLP Use Cases aus der Praxis

Nötige und hilfreiche Verarbeitungsschritte beim Umgang mit Text

Auswahl der passenden Methoden für NLP-Probleme

#ProcessYourLanguage

Die Schulung gibt eine Einführung in das Thema Natural Language Processing. Zunächst wird das Feld durch die Vorstellung verschiedener Use Cases motiviert. Es folgt eine Abgrenzung zu anderen Data Science/Machine Learning Projekten: Was unterscheidet textbasierte Daten von Zahlen oder Bildern? Was sind typische Ziele von NLP Projekten vs. anderen Data Science Projekten? Mit dem erworbenen grundlegenden Verständnis für das Feld widmet sich die Schulung der konkreten Umsetzung von NLP-Projekten. Behandelt werden verschiedene Cleaning- und Preprocessing-Methoden (Tokenization, Stopwords Removal, Stemming, Lemmatization), sowie Transformations-Methoden, um textbasierte Daten numerisch zu repräsentieren (Count Vectorization, TF-IDF Weighting). Der Fokus liegt dabei auf traditionelleren Repräsentationen (z.B. Bag of Words). Der praktische Teil besteht aus einer Mischung aus theoretischer Vorstellung der Methoden und praktischen Übungen zur Anwendung der Inhalte. Moderne Ansätze und Entwicklungen im Feld und deren Anwendbarkeit in der Praxis werden in einem abschließenden Block vorgestellt.

Die wichtigsten Inhalte der Natural Language Processing Schulung

  • Vorstellung der NLP Use Cases
  • Was unterscheidet NLP Probleme von anderen Problemen?
  • Einführung Bag of Words-Repräsentation
  • Data Pre-processing:
    • Tokenization (words, n-grams, characters)
    • Stopwords/Punctuation
    • Stemming 
    • Lemmatizing + Part of Speech Tagging
    • Upper/lower casing
    • Named Entitiy Recognition
  • Data Transformation
    • Count Vectorizer
      • Occurance matrix (binary)
      • Frequency matrix (word count)
    • Weighting Techniques (TF-IDF, PMI) 
  • Cleaning
    • Encoding
    • Excluding words/text parts in different language
  • Anwendung der erlernten Techniken an konkreten Beispielen
    • Vergleich der Performanz verschiedener Classifier (z.B. Naive Bayes, Support Vector Machine)
  • Ableitung komplexerer Repräsentationen vom Bag-of-Words Modell
    • Andere Zählmethoden  
    • Kontext-sensitive Ansätze
    • Verständnis für die Anwendbarkeit verschiedener Ansätze auf unterschiedliche Problemstellungen, Daten-Grundlagen und Projektziele

Alles auf einen Blick!

  • Advanced Schulung
  • Eintägige Schulung in München
  • Teilnehmerzahl auf 10 begrenzt
  • Gemeinsames Mittagessen und Verpflegung inklusive
  • Sprache: Deutsch

Haben Sie Fragen?

Hallo, ich bin Claudia Djukic-Müller.
Ich helfe Ihnen gerne weiter. Sie erreichen mich telefonisch unter +49 (0) 89 – 323 731 32

Zielgruppe & Voraussetzungen

Zielgruppe: Personen, die bereits erste Kenntnisse / Erfahrungen in Data Science und Machine Learning haben und Einblicke in das Fachgebiet Natural Language Processing erlangen wollen sowie Personen, die verstehen wollen, wie man mit textbasierten Daten arbeiten kann.

Voraussetzungen: allgemeines Verständnis für Data Science Use Cases und Methoden

 

Organisation

Die Natural Language Processing Schulung findet von 10:00 Uhr bis 18:00 Uhr in München statt. Es gibt ein gemeinsames Mittagessen mit allen Seminarteilnehmern und dem Dozenten im Leib&Seele, das sich direkt neben dem Data Science Hub befindet. Hier haben Sie in entspannter Atmosphäre Gelegenheit, im gemeinsamen Gespräch mit dem Dozenten Themen und offene Fragen zu vertiefen.

Die Teilnehmerzahl der Natural Language Processing Schulung ist auf 10 begrenzt, um Ihnen einen optimalen Lernerfolg zu ermöglichen.

Ort

Der eintägige Natural Language Processing Kurs findet in unserem Data Science Hub im Sapporobogen 6-8 in München statt. Mit den öffentlichen Verkehrsmitteln erreichen Sie uns innerhalb von 15 Minuten vom Hauptbahnhof. Gerne lassen wir Ihnen Hotelempfehlungen in der Nähe zukommen. 

Ihr Dozent

Nico Becker

Nico Becker

Nico Becker ist Data Scientist bei der Alexander Thamm GmbH. Er ist als Trainee gestartet und hat Einblicke in viele verschiedene Branchen und Problemstellungen erhalten. Sein Fachgebiet ist die der Entwicklung von Machine Learning Algorithmen sowie der benötigten Schritte zur Daten-Aufbereitung und -Transformation. Der Fokus lag dabei zuletzt vor allem auf der Klassifizierung von Text basierten Daten. Neben der Projektarbeit gehören die Moderation von Workshops und Schulungen zu seinen Tätigkeiten.

Starten Sie gut informiert in Ihre Schulung!

Sie haben Fragen zu den Inhalten, zur Organisation oder interessieren sich für ein Inhouse-Seminar zu unterschiedlichen Themen um Data & AI? Ich helfe Ihnen gerne weiter. Sie erreichen mich telefonisch unter +49 (0) 89 – 323 731 32

top