Einführung in forensische Textanalyse mit NLP und maschinellem Lernen

Textdaten auf relevante Inhalte "zwischen den Zeilen" untersuchen

Ein Großteil der weltweit verfügbaren Informationen liegt in Texten vor. Für viele Anwendungen ist das »Schürfen« nach relevanten Informationen im Text wichtig, z.B. um nach Themen, Stimmungen oder Schreibstilen zu klassifizieren oder Autoren zu identifizieren. In diesem Seminar werden Ihnen hierzu Methoden der digitalen Textforensik vermittelt, mit dem Schwerpunkt auf Computerlinguistik (NLP) und maschinellem Lernen (ML).

Computerlinguistik (NLP)
Online-Seminar
Textforensik
Maschinelles Lernen
© istock

Die Herausforderung: Das "Schürfen" nach relevanten Informationen in digitalen Testsammlungen

Ein Großteil der weltweit verfügbaren Informationen liegt in Texten vor. Relevant sind hierbei sind die Textinhalte an sich, etwa die enthaltenen Themen oder „Stimmungen“ im Text. Aber auch Schreibstile können aufschlussreich für eine Untersuchung sein. Für die Analyse hierzu müssen Verfahren des maschinellen Lernens (ML) geeignet eingesetzt und angepasst werden. Zusätzliche Schwierigkeiten sind hierbei die Unstrukturiertheit von Texten oder das Fehlen von Metadaten.

 

Die Lösung: Natural Language Processing (NLP) und maschinelles Lernen (ML), um relevante Informationen aus Texten ableiten zu können!

Ihnen werden Methoden der digitalen Textanalyse vermittelt, mit den Schwerpunkten auf NLP und ML.

Zunächst lernen Sie die Grundlagen des NLP kennen, mit denen Sie Textdaten im Internet crawlen und sie dann maschinenlesbar "bereinigen" und strukturieren.

Im Anschluss lernen Sie, wie bekannte Standardmethoden des ML (z.B. Clustering, Classification) im Kontext von Textanalyse funktionieren. Ebenso lernen Sie die Grundlagen der Techniken kennen, mit denen Sie anschließend Autorenstile erkennen oder im Text präsente Themen („topics“) und Stimmungen („sentiment“) herauslesen. Außerdem lernen Sie, wie Sie die Entstehung der ML-Ergebnisse interpretieren und die Güte der Verfahren evaluieren können.

Dieser Kurs besteht aus Live-Vorträgen im Webinar. Dieser werden angereichert durch eine Reihe von interaktiven Live-Demos in der Programmiersprache "Python".

Natürlich planen wir hierbei ausreichend Zeit für Diskussionen, Ihre Fragen und Pausen ein. Denn unsere Online-Veranstaltung soll für Sie lehrreich, produktiv und gleichzeitig angenehm sein.

 

Ihre Vorteile auf einen Blick

Nach dem Seminar können Sie...

  • verstehen, wie Sie grundlegende Problemstellungen hinsichtlich der Verarbeitung von Textdaten lösen
  • nachvollziehen, wie man diese Methoden praktisch in Python umsetzt
     

Dieses Seminar bietet Ihnen...

  • Vermittlung gängiger Methoden und Werkzeuge der forensischen Textuntersuchung
  • Erkenntnisse aus dem aktuellen Forschungsstand in NLP und ML
  • Austausch mit Experten und Vernetzung mit anderen Anwendern der Computerlinguistik und der Text-Forensik
ÜBERBLICK
Veranstaltungstyp
Seminar, Webinar
Format
Online
Abschluss
Teilnahmebescheinigung
Zugangsvoraussetzung
Grundkenntnisse in Python-Programmierung, alternativ: gute Kenntnisse in einer anderen Hochsprache.
Termine, Anmeldefrist und Ort
  • 01.02.2021 - 03.02.2021 Online (Anmeldung bis 22.01.2021)
Dauer/ Ablauf
Tag 1 - 3: Websession 10:00- 15:00 Uhr Der Umfang des Seminares entspricht einer 1,5 Tages Schulung
Sprache
Deutsch
Teilnahmegebühr
650,00 €
ZIELGRUPPE
  • Forensiker
  • Ermittler
  • Data Scientists
INHALTE
  • Crawling nach Textdaten im Internet
  • Korpuserstellung und -strukturierung
  • Datenbereinigung
  • Preprocessing
  • Grundlagen des ML
  • Interpretierbarkeit von ML-Modellen
  • Evaluierung Ihrer Ergebnisse
  • Überblick über Autorschaftsanalyse, Topic Modeling und Sentiment-Analyse
  • Tipps zu Literatur und Software
LERNZIELE

Das Verstehen des maschinellen Lernens im Kontext der automatischen Analyse von Textdaten.

Nachvollziehen der praktischen  Umsetzung mithilfe der Programmiersprache „Python“.

REFERENTEN

Die Trainer sind ExpertInnen im Bereich ML und NLP (wissenschaftliche Mitarbeiter aus dem Bereich "Media Security & IT Forensics")

Referenzen:

  • Gutachtertätigkeiten zur Autorschaftsverifikation
  • Technologieberatung und Schulungen in ML und NLP für verschiedene Auftraggeber (NN)
  • Forschungsprojekte zu den Themen Radikalisierung, Fakenews, Versicherungsbetrug und Cybergrooming in Textform im Internet
  • Best Paper Award im „Digital Forensics Workshop (WSDF)” auf der ARES-Konferenz 2020 für eine Arbeit zu Autorschaftsanalyse
  • 3. Platz im internationalen Textforensik-Wettbewerb „Shared Tasks: Profiling Fake News Spreaders on Twitter (2020 edition)“ auf der „PAN at CLEF“-Konferenz mit einer Arbeit zum Erkennen von Desinformation