Thematische Exploration von Textdaten mit Topic Modeling (Aufbaukurs)

Welche Themen und Inhalte stecken in meinen Textdaten?

Welche Themen und Inhalte stecken in meinen Textdatein? Wie lassen sich diese herauskristallisieren? Die Erschließung von Themen bzw. Topics, vor allem in unstrukturierten Texten, stellt dabei eine Herausforderung dar. In unserer Weiterbildung erhalten Sie einen Überblick zu Techniken den „Topic Modelings“ zur Modellierung von Themen und bearbeiten hierzu eigene Programmierbeispiele.

Python, Topic Modelling, Textforensik, Latente Dirichlet Alloction, Maschinelles Lernen, Weiterbildung

Die Herausforderung: Das Erkennen von Thematiken und Trends aus Textsammlungen

Ein Großteil der weltweit verfügbaren Informationen liegt in Texten vor. In vielen Anwendungen muss man untersuchen, welche Themen („Topics“) in Texten besonders oft vertreten sind – und umgekehrt, welche Texte ein vorgegebenes Topic besonders stark thematisieren.

 

Die Lösung:  

Methoden des sog. „Topic Modeling“ helfen Ihnen, Trends und Themen aus den zugehörigen Textdaten zu identifizieren. Dies können Sie z.B. einsetzen, wenn Sie Textdateien oder Chatverläufe untersuchen, wenn Sie Nachrichten, Unternehmensdaten, Social Media Kanäle oder Meinungsumfragen auswerten oder als „Data Journalist“ recherchierte Inhalte aufbereiten. Hierzu lernen Sie in der Weiterbildung die Methoden LDA, BERT, DBSCAN und UMAP in Theorie und Praxis kennen.

Der Kurs besteht einerseits aus Live-Vorträgen und Demos als Online-Seminar. Andererseits haben wir für Sie Python-Programmieraufgaben als Jupyter-Notebooks vorbereitet, die Sie unter Live-Betreuung unserer Expertin bearbeiten. Natürlich planen wir hierbei ausreichend Zeit für Diskussionen, Fragen und Pausen ein.

Nach Kursende steht Ihnen unsere Expertin noch einen weiteren Tag per Internetforum für Ihre Nachfragen zur Verfügung.


Ihre Vorteile auf einen Blick

Nach dem Seminar können Sie...

... nachvollziehen, wie man die LDA-Methode in Ihren eigenen Projekten in der Programmiersprache Python praktisch umsetzt.

 

Dieses Seminar bietet Ihnen...

  • Vermittlung innovativer Methoden des Topic Modeling und weiterer ML-Verfahren, die Sie hierbei unterstützen
  • Erkenntnisse aus dem aktuellen Forschungsstand zum Kursthema
  • Betreuung bei der Bearbeitung der Python-Programmierbeispiele durch unsere Expertin im Videochat und per Internetforum
  • Zeit zur Selbstreflexion und asynchrones Lernen passend zu ihrem Lerntempo, denn unsere Expertin steht Ihnen nach dem Seminar noch für Rückfragen per Forum zur Verfügung
  • Tipps für Literatur und externe Informationsquellen, mit denen Sie auch nach diesem Kurs am Puls der Zeit bleiben können
  • Austausch mit Expert*innen und Vernetzung mit anderen Anwendenden
ÜBERBLICK
Veranstaltungstyp
Online-Seminar
Format
Online
Abschluss
Teilnahmebescheinigung
Zugangsvoraussetzung
Praktische Programmiererfahrungen in Python.
Termine, Anmeldefrist und Ort
  • Unser Angebot zum Topic Modeling wird derzeit inhaltlich und vom Zuschnitt für Sie aktualisiert. Neue Angebote sind im 3. Quartal wieder hier für Sie verfügbar."
Dauer/ Ablauf
9:00 - 16:00 Uhr Der Umfang des Seminares entspricht 6 Stunden.
Sprache
Deutsch
Teilnahmegebühr
500,00 Euro (USt. befreit gemäß §4 Nr. 22 Buchstabe a UStG)
ZIELGRUPPE
  • Forensiker*innen und Ermittlende
  • IT-Sicherheitsexpert*innen
  • Data Science & Data Analytics
  • Data Journalists
  • Social Media Manager
  • Marketing Experts
  • Financial Analysts
INHALTE
  • Einführung Topic Modeling
  • Methoden des Topic Modeling:
  • Latent Dirichlet Allocation (LDA)
  • Bibliothek pyLDAvis
  • Bidirectional Encoder Representations from Transformers (BERT)
  • HDBSCAN
  • Uniform Manifold Approximation (UMAP)
  • Tipps zu Literatur und externen Informationsquellen
  • Programmier-Beispiele in Python als Jupyter-Notebooks zur eigenen Bearbeitung, mit Betreuung durch unsere Expertin
LERNZIELE
  • Verständnis für das Prinzip der LDA-Methode
  • Nachvollziehen der praktischen  Umsetzung in „Python“.
TRAINER*INNEN

Inna Vogel Jeong-Eun Choi, Karla Schäfer

Die Trainer*nnen sind Expert*nnen im Bereich ML und NLP (wissenschaftliche Mitarbeitende aus dem Bereich "Media Security & IT Forensics")

Referenzen unserer Referentin:

  • Forschungsprojekte zu den Themen Radikalisierung und Fakenews im Internet
  • 3. Platz im internationalen Textforensik-Wettbewerb auf der „PAN at CLEF“-Konferenz 2020 mit einer Arbeit zum Erkennen von Desinformation