Avatar vom Dozent:in

Data Mining (praktisch) edit

Modulverantwortlich Prof. Dr. Dietlind Zühlke
Dozent:innen Prof. Dr. Dietlind Zühlke
Kürzel DMP
Sprache deutsch
Kreditpunkte 5
Voraussetzungen nach Prüfungsordnung keine
Empfohlene Voraussetzungen Mathematische Grundkenntnisse (insbes. Rechnen mit Matrizen), Algorithmen und Programmierung sind Voraussetzung für eine erfolgreiche Teilnahme.
Prüfungsformen Mündlicher Beitrag(Einzelleistung) und Praktikumsbericht(Einzelleistung)
Level Spezialisierung
Häufigkeit des Angebots jedes Sommersemester
Verwendung des Moduls in weiteren Studiengängen IT-Management, Informatik, Wirtschaftsinformatik
Präsenzzeit in Stunden 60
Selbststudium in Stunden 90
Letzte Aktualisierung 13. September 2024

Inhalt:

Kann man mit Twitter Daten den Ausgang der Bundestagswahl vorhersagen? Wie deckt man in sozialen Netzwerken oder anhand von Verbindungsdaten Gruppen von Individuen auf, die zusammen gehören? Wie erzeugt man Profile von Internetnutzern, um deren Verhalten vorherzusagen oder Werbemaßnahmen zielgerecht zu platzieren? Wie betreibt man Meinungsforschung im Internet, also z.B. ob ein bestimmter Text einem Produkt positiv oder negativ gegenübersteht? Mit solchen Fragen, die von großem ökonomischen und politischen Interesse sind und gegenwärtig stark beforscht werden, wird sich das WPF Data Mining beschäftigen. Ausgangspunkt für die behandelten Verfahren ist die Lineare Algebra. Der Kurs gliedert sich in drei Teile:

Im ersten Teil (Vorlesung) werden zunächst Regressionsmodelle, dann einfache neuronale Netze (Perceptron) und Verfahren des Deep Learnings behandelt.

Im zweiten Teil (Vorlesung) kommen weitere überwachte und nicht überwachte Lernverfahren hinzu, insbesondere

Die Teilnehmerinnen und Teilnehmer sollen im dritten Teil des Kurses eine praxisrelevante Data Mining Aufgabe selbstständig bearbeiten, z.B. im Rahmen eines Data Mining Wettbewerbs (Data Mining Cup) oder durch die Analyse aktueller Daten eines Industriepartners.

Als Tools zur praktischen Umsetzung werden wir Python und R nutzen. Zu Beginn wird es einen Python-Einführungskurs geben.

Literatur

arrow_upward