Kapitel 12 Visualisierung

12.1 Allgemeines

Jede Darstellung sollte selbsterklärend sein – daher ist auf aussagekräftige Titel, Achsenbeschriftungen und Legenden zu achten! Generell sollte auf Lesbarkeit optimiert werden und die Kernaussage bzw. das Ziel der Darstellung klar erkennbar sein (und eventuell im Titel direkt benannt werden). [Achtung, das passiert auf Grund von Platzlimitationen in diesem Skriptum nicht immer!]

12.2 Histogramm

Ein Histogramm gibt die Häufigkeitsverteilung einer Variablen wieder. Dafür werden die Daten in Klassen (bins) eingeteilt–die Festsetzung der bins verändert die Darstellung teilweise enorm.

12.3 Boxplot

Ein Boxplot ist eine kompakte Darstellung der Quartile einer Variable durch eine Box und Whisker (daher wird diese Darstellung auch Box-and-Whisker-Plot genannt). Es gibt verschiedene Varianten, die folgende verwendet folgende Definitionen:

  • Die Striche gehen von \(Q1 - 1.5*IQR\) bis \(Q3 + 1.5*IQR\).
  • Die Punkte sind “Ausreißer” (außerhalb der von den Strichen erfassten Daten)s
  • Die Boxen definieren Q1 bzw. Q3
  • Der Median (Q2) ist der (horizontale) Balken innerhalb der Box

12.4 Scatterplot

Der Scatterplot stellt eine Punktwolke basierend auf 2 kontinuierlichen Variablen dar.

Die Regressionsgerade kann zusätzlich eingezeichnet werden.

## `geom_smooth()` using formula 'y ~ x'

Der Konfidenzintervall kann zusätzlich eingezeichnet werden.

## `geom_smooth()` using formula 'y ~ x'

12.5 Bar-Chart

Es sollten keine Verzerrungen der Proportionen entstehen: