Kapitel 12 Visualisierung
12.1 Allgemeines
Jede Darstellung sollte selbsterklärend sein – daher ist auf aussagekräftige Titel, Achsenbeschriftungen und Legenden zu achten! Generell sollte auf Lesbarkeit optimiert werden und die Kernaussage bzw. das Ziel der Darstellung klar erkennbar sein (und eventuell im Titel direkt benannt werden). [Achtung, das passiert auf Grund von Platzlimitationen in diesem Skriptum nicht immer!]
12.2 Histogramm
Ein Histogramm gibt die Häufigkeitsverteilung einer Variablen wieder. Dafür werden die Daten in Klassen (bins) eingeteilt–die Festsetzung der bins verändert die Darstellung teilweise enorm.
12.3 Boxplot
Ein Boxplot ist eine kompakte Darstellung der Quartile einer Variable durch eine Box und Whisker (daher wird diese Darstellung auch Box-and-Whisker-Plot genannt). Es gibt verschiedene Varianten, die folgende verwendet folgende Definitionen:
- Die Striche gehen von \(Q1 - 1.5*IQR\) bis \(Q3 + 1.5*IQR\).
- Die Punkte sind “Ausreißer” (außerhalb der von den Strichen erfassten Daten)s
- Die Boxen definieren Q1 bzw. Q3
- Der Median (Q2) ist der (horizontale) Balken innerhalb der Box
12.4 Scatterplot
Der Scatterplot stellt eine Punktwolke basierend auf 2 kontinuierlichen Variablen dar.
Die Regressionsgerade kann zusätzlich eingezeichnet werden.
## `geom_smooth()` using formula 'y ~ x'
Der Konfidenzintervall kann zusätzlich eingezeichnet werden.
## `geom_smooth()` using formula 'y ~ x'
12.5 Bar-Chart
Es sollten keine Verzerrungen der Proportionen entstehen: