Ehrliche Skalierungen in ggplot

Methodenlehre
AdventskalendR
Autor:in

Gerrit Hirschfeld

Veröffentlichungsdatum

5. Dezember 2024

Eine Frage der Skalierung

Die Wahl der Skala hat einen großen Einfluss darauf, wie stark Unterschiede zu Tage treten. Gerade, wenn man Zusammenfassungsstatistiken darstellt, haben viele Programme die Angewohnheit (aka default settings) die X und Y-Skalen so zu wählen, dass möglichst alle Daten dargestellt werden. Wenn man nur die Zusammenfassungssatatistiken darstellt, führt das dazu, dass nur ein Ausschnitt der Y-Skala gezeigt wird. Im folgenden Beispiel sieht man, dass die tatsächlichen Preise zwischen 0 und ca. 18000 schwanken. In der Abbildung der Mittelwerte ist nur der Wertebereich zwischen 3000 und 5500 dargestellt.

Leere Punkte

Eine einfache Lösung besteht darin einfach unsichtbare einzelne Punkte einzu zeichnen. Dadurch wird die Skala an den tatsächlichen Werten ausgerichtet. Das geht ganz fix mit dem Parameter alpha =0.