Thematische Exploration von Textdaten mit Topic Modeling (Aufbaukurs)

Welche Themen und Inhalte stecken in meinen Textdaten?

Wie lassen sich diese herauskristallisieren? Die Erschließung von Themen bzw. Topics, vor allem in unstrukturierten Texten, stellt dabei eine Herausforderung dar. In unserer Weiterbildung erhalten Sie einen Überblick zu Techniken den „Topic Modelings“ zur Modellierung von Themen und bearbeiten hierzu eigene Programmierbeispiele.

Python
Online-Seminar
Textforensik
Topic Modeling
Latente Dirichlet Allocation
Maschinelles Lernen
Python, Topic Modelling, Textforensik, Latente Dirichlet Alloction, Maschinelles Lernen, Weiterbildung

Die Herausforderung: Das Erkennen von Thematiken und Trends aus Textsammlungen

Ein Großteil der weltweit verfügbaren Informationen liegt in Texten vor. In vielen Anwendungen muss man untersuchen, welche Themen („Topics“) in Texten besonders oft vertreten sind – und umgekehrt, welche Texte ein vorgegebenes Topic besonders stark thematisieren.

 

Die Lösung:  

Methoden des sog. „Topic Modeling“ helfen Ihnen, Trends und Themen aus den zugehörigen Textdaten zu identifizieren. Dies können Sie einsetzen, z.B. wenn Sie Textdateien oder Chatverläufe untersuchen, wenn Sie Nachrichten, Unternehmensdaten, Social Media Kanäle oder Meinungsumfragen auswerten oder als „Data Journalist“ recherchierte Inhalte aufbereiten.

Hierzu lernen Sie in der Weiterbildung die Methoden LDA, BERT, DBSCAN und UMAP in Theorie und Praxis kennen.

Der Kurs besteht einerseits aus Live-Vorträgen und Demos als Online-Seminar.

Außerdem haben wir für Sie Python-Programmieraufgaben als Jupyter-Notebooks vorbereitet, die Sie unter Live-Betreuung unserer Expertin bearbeiten.

Natürlich planen wir hierbei ausreichend Zeit für Diskussionen, Ihre Fragen und Pausen ein.

Zur Nachbereitung nach Kursende steht Ihnen unsere Expertin noch einen weiteren Tag per Internetforum für Ihre Nachfragen zur Verfügung.


Ihre Vorteile auf einen Blick

Nach dem Seminar können Sie...

... nachvollziehen, wie man die LDA-Methode in Ihren eigenen Projekten in der Programmiersprache Python praktisch umsetzt.

 

Dieses Seminar bietet Ihnen...

  • Vermittlung innovativer Methoden des Topic Modeling und weiterer ML-Verfahren, die Sie hierbei unterstützen
  • Erkenntnisse aus dem aktuellen Forschungsstand zum Kursthema
  • Betreuung bei der Bearbeitung der Python-Programmierbeispiele durch unsere ExpertInnen im Videochat und per Internetforum
  • Zeit zur Selbstreflexion und asynchrones Lernen passend zu ihrem Lerntempo, denn unsere ExpertInnen stehen Ihnen nach dem Seminar noch für Rückfragen per Forum zur Verfügung
  • Tipps für Literatur und externe Informationsquellen, mit denen Sie auch nach diesem Kurs am Puls der Zeit bleiben können
  • Austausch mit Experten und Vernetzung mit anderen Anwendern
ÜBERBLICK
Veranstaltungstyp
Online-Seminar
Format
Online
Abschluss
Teilnahmebescheinigung
Zugangsvoraussetzung
Praktische Programmiererfahrungen in Python.
Termine, Anmeldefrist und Ort
  • 02.11.2021 ONLINE (Anmeldung bis 25.10.2021)
Dauer/ Ablauf
10:00 - 16:00 Uhr Der Umfang des Seminares entspricht 6 Stunden.
Sprache
Deutsch
Teilnahmegebühr
500,00 Euro
ZIELGRUPPE
  • Forensiker/innen und Ermittler/innen
  • IT-Sicherheitsexperten
  • Data Science & Data Analytics
  • Data Journalists
  • Social Media Manager
  • Marketing Experts
  • Financial Analysts
INHALTE
  • Einführung Topic Modeling
  • Methoden des Topic Modeling:
  • Latent Dirichlet Allocation (LDA)
  • Bidirectional Encoder Representations from Transformers (BERT)
  • HDBSCAN
  • Uniform Manifold Approximation (UMAP)
  • Tipps zu Literatur und externen Informationsquellen
  • Programmier-Beispiele in Python als Jupyter-Notebooks zur eigenen Bearbeitung, mit Betreuung durch unsere Expertin
LERNZIELE
  • Verständnis für das Prinzip der LDA-Methode
  • Nachvollziehen der praktischen  Umsetzung in „Python“.
REFERENTEN

Die Trainerin ist Expertin im Bereich Natural Language Processing (NLP), wissenschaftliche Mitarbeiterin aus dem Bereich "Media Security & IT Forensics"

Referenzen unserer Referentin:

  • Forschungsprojekte zu den Themen Radikalisierung und Fakenews im Internet
  • 3. Platz im internationalen Textforensik-Wettbewerb auf der „PAN at CLEF“-Konferenz 2020 mit einer Arbeit zum Erkennen von Desinformation