Mathematische Grundlagen des Data Cleanings

Zusammenfassung

Als zentraler Bestandteil von Data Science Prozessen wirkt sich Data Cleaning direkt auf deren Ergebnisse und Erkenntnisse aus. Beim Data Cleaning wird ein Datensatz u. a. auf Dopplungen, Ausreißer und fehlende Daten untersucht. In einem Design-Based-Research-Projekt werden mit realen Daten die mathematischen Grundlagen und Methoden der Ausreißeridentifikation in Form von digitalem Material didaktisch aufbereitet. Aufbauend auf dem Vorwissen der Lernenden werden gängige statistische und abstandsbasierte Methoden der Ausreißeridentifikation, wie der Dixon-Test, betrachtet und elementarisiert.

Typ
Publikation
In: Beiträge zum Mathematikunterricht 2024, WTM-Verlag
Sarah Schönbrodt
Sarah Schönbrodt
Assistenzprofessorin @ Universität Salzburg

Forschung im Bereich Mathematikdidaktik und KI-Bildung