Thematische Exploration von Textdaten mit Topic Modeling (Aufbaukurs)

Welche Themen und Inhalte stecken in meinen Textdatein? Wie lassen sich diese herauskristallisieren? Die Erschließung von Themen bzw. Topics, vor allem in unstrukturierten Texten, stellt dabei eine Herausforderung dar. In unserer Weiterbildung erhalten Sie einen Überblick zu Techniken den „Topic Modelings“ zur Modellierung von Themen und bearbeiten hierzu eigene Programmierbeispiele.

Python

Topic Modeling

Latent Dirichlet Allocation

Maschinelles Lernen

Textforensik

Die Herausforderung: Das Erkennen von Thematiken und Trends aus Textsammlungen

Ein Großteil der weltweit verfügbaren Informationen liegt in Texten vor. In vielen Anwendungen muss man untersuchen, welche Themen („Topics“) in Texten besonders oft vertreten sind – und umgekehrt, welche Texte ein vorgegebenes Topic besonders stark thematisieren.

Die Lösung:

Methoden des sog. „Topic Modeling“ helfen Ihnen, Trends und Themen aus den zugehörigen Textdaten zu identifizieren. Dies können Sie z.B. einsetzen, wenn Sie Textdateien oder Chatverläufe untersuchen, wenn Sie Nachrichten, Unternehmensdaten, Social Media Kanäle oder Meinungsumfragen auswerten oder als „Data Journalist“ recherchierte Inhalte aufbereiten. Hierzu lernen Sie in der Weiterbildung die Methoden LDA, BERT, DBSCAN und UMAP in Theorie und Praxis kennen.

Der Kurs besteht einerseits aus Live-Vorträgen und Demos als Online-Seminar. Andererseits haben wir für Sie Python-Programmieraufgaben als Jupyter-Notebooks vorbereitet, die Sie unter Live-Betreuung unserer Expertin bearbeiten. Natürlich planen wir hierbei ausreichend Zeit für Diskussionen, Fragen und Pausen ein.

Nach Kursende steht Ihnen unsere Expertin noch einen weiteren Tag per Internetforum für Ihre Nachfragen zur Verfügung.

Ihre Vorteile auf einen Blick

Nach dem Seminar können Sie...

... nachvollziehen, wie man die LDA-Methode in Ihren eigenen Projekten in der Programmiersprache Python praktisch umsetzt.

Dieses Seminar bietet Ihnen...

Vermittlung innovativer Methoden des Topic Modeling und weiterer ML-Verfahren, die Sie hierbei unterstützen
Erkenntnisse aus dem aktuellen Forschungsstand zum Kursthema
Betreuung bei der Bearbeitung der Python-Programmierbeispiele durch unsere Expertin im Videochat und per Internetforum
Zeit zur Selbstreflexion und asynchrones Lernen passend zu ihrem Lerntempo, denn unsere Expertin steht Ihnen nach dem Seminar noch für Rückfragen per Forum zur Verfügung
Tipps für Literatur und externe Informationsquellen, mit denen Sie auch nach diesem Kurs am Puls der Zeit bleiben können
Austausch mit Expert*innen und Vernetzung mit anderen Anwendenden

Zur Anfrage

Veranstaltungstyp

Online-Seminar

Format

Online

Abschluss

Teilnahmebescheinigung

Zugangsvoraussetzung

Praktische Programmiererfahrungen in Python.

Termine, Anmeldefrist und Ort

Unser Angebot zum Topic Modeling wird derzeit inhaltlich und vom Zuschnitt für Sie aktualisiert. Neue Angebote sind im 3. Quartal wieder hier für Sie verfügbar."

Dauer/ Ablauf

9:00 - 16:00 Uhr Der Umfang des Seminares entspricht 6 Stunden.

Sprache

Deutsch

Teilnahmegebühr

500,00 Euro (USt. befreit gemäß §4 Nr. 22 Buchstabe a UStG)

Forensiker*innen und Ermittlende
IT-Sicherheitsexpert*innen
Data Science & Data Analytics
Data Journalists
Social Media Manager
Marketing Experts
Financial Analysts

Einführung Topic Modeling
Methoden des Topic Modeling:
Latent Dirichlet Allocation (LDA)
Bibliothek pyLDAvis
Bidirectional Encoder Representations from Transformers (BERT)
HDBSCAN
Uniform Manifold Approximation (UMAP)
Tipps zu Literatur und externen Informationsquellen
Programmier-Beispiele in Python als Jupyter-Notebooks zur eigenen Bearbeitung, mit Betreuung durch unsere Expertin

Verständnis für das Prinzip der LDA-Methode
Nachvollziehen der praktischen Umsetzung in „Python“.

Inna Vogel Jeong-Eun Choi, Karla Schäfer

Die Trainer*nnen sind Expert*nnen im Bereich ML und NLP (wissenschaftliche Mitarbeitende aus dem Bereich "Media Security & IT Forensics")

Referenzen unserer Referentin:

Forschungsprojekte zu den Themen Radikalisierung und Fakenews im Internet
3. Platz im internationalen Textforensik-Wettbewerb auf der „PAN at CLEF“-Konferenz 2020 mit einer Arbeit zum Erkennen von Desinformation

Zur Anfrage

Thematische Exploration von Textdaten mit Topic Modeling (Aufbaukurs)

Die Herausforderung: Das Erkennen von Thematiken und Trends aus Textsammlungen

Die Lösung:

Ihre Vorteile auf einen Blick

Nach dem Seminar können Sie...

Dieses Seminar bietet Ihnen...

Inna Vogel Jeong-Eun Choi, Karla Schäfer

Dieser Kurs ist eine Vertiefung zu unserem Einführungskurs …

Contact Press / Media

Dr. Sascha Zmudzinski

Contact Press / Media

Adem Salgin