Textdatenanalyse mit NLP und maschinellem Lernen

Python

In der heutigen digitalen Welt sind enorme Mengen an Informationen in Textform verfügbar. Die Fähigkeit, diese Daten effektiv zu analysieren, ist für Fachleute in Bereichen wie IT-Forensik, Data Science und Data Analytics von entscheidender Bedeutung. Unser Kurs vermittelt Ihnen fundierte Kenntnisse in der digitalen Textdatenanalyse mit Schwerpunkten auf Natural Language Processing (NLP) und maschinellem Lernen (ML).

Sie erlernen die gesamte Verarbeitungs-Pipeline für umfangreiche Textmengen, beginnend mit der Datenakquise durch Web Crawling bis hin zur maschinenlesbaren Bereinigung und Vorverarbeitung oft unstrukturierter Textdaten. Anhand von Programmierbeispielen in Python werden Ihnen Standardmethoden des maschinellen Lernens wie Clustering und Klassifikation nähergebracht. Ein besonderer Fokus liegt auf der Interpretation der Ergebnisse und der Anwendung statistischer Methoden zur Bewertung der Güte dieser Verfahren.

Der Kurs kombiniert Live-Vorträge und Demonstrationen mit praktischen Programmierübungen in Jupyter-Notebooks. Unsere Expertinnen und Experten stehen Ihnen während des Seminars für Fragen zur Verfügung und bieten zudem einen zusätzlichen Tag Online-Support für die Nachbereitung an. Dieser praxisorientierte Ansatz stellt sicher, dass Sie die erlernten Methoden direkt auf Ihre spezifischen Projekte anwenden können.

Durch die Teilnahme an diesem Kurs erwerben Sie die Fähigkeit, relevante Informationen aus umfangreichen Textdaten zu extrahieren und zu interpretieren. Dies befähigt Sie, in Ihrem beruflichen Umfeld fundierte Entscheidungen zu treffen und komplexe Textanalysen effizient durchzuführen.

Nach dem Seminar können Sie:

Verstehen, welche Methoden des Natural Language Processing (NLP) und des maschinellen Lernens (ML) für Ihre Projekte verfügbar sind.
Implementieren dieser Methoden in Python, um große Textmengen effizient zu analysieren.
Bewerten der Ergebnisse durch Anwendung statistischer Methoden zur Gütebestimmung der eingesetzten Verfahren.

Auf Warteliste setzen

Veranstaltungstyp

Online-Seminar, Offenes Format, Inhouse-Format

Format

Online

Abschluss

Teilnahmebescheinigung

Zugangsvoraussetzung

Praktische Programmiererfahrungen in Python.

Termine, Anmeldefrist und Ort

Wir sind aktuell in der Termin-Planung. Sie können sich auf unsere Warteliste setzen lassen, und werden informiert, sobald ein Termin feststeht.

Dauer/ Ablauf

20 Stunden an 4 Tagen / Jeweils von 10:00 bis 15:30 Uhr

Sprache

Deutsch

Teilnahmegebühr

1.500,00 € (zzgl. MwSt.)

Forensiker*innen und Ermittler*innen
IT-Sicherheitsexpert*innen
Data Science & Data Analytics
Data Journalists
Social Media Manager
Marketing Experts
Financial Analysts

Crawling nach Textdaten im Internet
Korpuserstellung und -strukturierung
Datenbereinigung
Preprocessing
Grundlagen des ML in der Textdatenanalyse: Datenrepräsentation, Klassifikationsverfahren, Hyperparameter
Interpretierbarkeit von ML-Modellen
Evaluierung Ihrer Ergebnisse
Überblick über Anwendungen: Autorschaftsanalyse, Topic Modeling und Sentiment-Analyse
Tipps zu Literatur und externen Informationsquellen

Zu allen Kursteilen: Programmier-Beispiele in Python als Jupyter-Notebooks zur eigenen Bearbeitung, mit Betreuung durch unsere Expert*innen

Zur Broschüre [ PDF 0,27 MB ]

Jeong-Eun Choi, Lukas Graner, Karla Schäfer

Die Trainer*innen und Expert*innen im Bereich ML und NLP (wissenschaftliche Mitarbeitende aus dem Bereich "Media Security & IT-Forensics")

Referenzen:

Forschungsprojekte zum Thema Fakenews in Textform im Internet
Paper Award im „Digital Forensics Workshop (WSDF)” auf der ARES-Konferenz 2020 für eine Arbeit zu Autorschaftsanalyse
3. Platz im internationalen Textforensik-Wettbewerb „Profiling Fake News Spreaders on Twitter (2020 Edition)“ auf der „PAN at CLEF“-Konferenz mit einer Arbeit zum Erkennen von Desinformation

Auf Warteliste setzen

Textdatenanalyse mit NLP und maschinellem Lernen

Nach dem Seminar können Sie:

Jeong-Eun Choi, Lukas Graner, Karla Schäfer

Offenes Format

Auch Inhouse möglich

Diese Kurse könnten Sie auch interessieren:

Open Source Intelligence für Behörden

Einführung in die Datenträger-Forensik

Einführung in Darknet und Kryptowährung

Forensische Echtheitsprüfung für Digitalfotos und -videos

Kontakt

Dr. Sascha Zmudzinski

Adem Salgin