Bei der Datenanalyse werden statistische Methoden systematisch angewendet, um Zusammenhänge in mitunter sehr großen Datensätzen erkennen und daraus neues Wissen gewinnen zu können. Die in der Regel durchzuführenden Prozessschritte erfordern den Einsatz computergestützter Methoden. Ein relevanter Prozessschritt ist die Datenaufbereitung (Data Preparation), um deren Qualität für die anschließende Analyse zu erhöhen. In diesem Training werden anhand eines Beispiel-Datensatzes verschiedene Aspekte der Datenaufbereitung, sowohl theoretisch betrachtet als auch gemeinsam in einem Jupyter-Notebook praktisch erarbeitet. Betrachtet wird die Restrukturierung und Indexierung der Daten, der Umgang mit fehlenden Werten und Ausreißern sowie ein abschließender Vergleich der Analyse-Ergebnisse basierend auf verschiedenen Varianten der Vorverarbeitung.