Ehrliche Skalierungen in ggplot
Eine Frage der Skalierung
Die Wahl der Skala hat einen großen Einfluss darauf, wie stark Unterschiede zu Tage treten. Gerade, wenn man Zusammenfassungsstatistiken darstellt, haben viele Programme die Angewohnheit (aka default settings) die X und Y-Skalen so zu wählen, dass möglichst alle Daten dargestellt werden. Wenn man nur die Zusammenfassungssatatistiken darstellt, führt das dazu, dass nur ein Ausschnitt der Y-Skala gezeigt wird. Im folgenden Beispiel sieht man, dass die tatsächlichen Preise zwischen 0 und ca. 18000 schwanken. In der Abbildung der Mittelwerte ist nur der Wertebereich zwischen 3000 und 5500 dargestellt.
Leere Punkte
Eine einfache Lösung besteht darin einfach unsichtbare einzelne Punkte einzu zeichnen. Dadurch wird die Skala an den tatsächlichen Werten ausgerichtet. Das geht ganz fix mit dem Parameter alpha =0.