Inhaltsverzeichnis
Wann ist es ein Ausreißer?
In der Statistik spricht man von einem Ausreißer, wenn ein Messwert oder Befund nicht in eine erwartete Messreihe passt oder allgemein nicht den Erwartungen entspricht. Die „Erwartung“ wird meistens als Streuungsbereich um den Erwartungswert herum definiert, in dem die meisten aller Messwerte zu liegen kommen, z.
Was ist ein Ausreißer boxplot?
In Boxplots werden Ausreißer oft dadurch gekennzeichnet, dass sie als Punkte getrennt von der restlichen Grafik dargestellt werden. Hier ist ein Beispiel eines Boxplots der obigen Verteilung, der Ausreißer nicht kennzeichnet. Hier ist ein Beispiel eines Boxplots der selben Verteilung, der Ausreißer kennzeichnet.
Was sind robuste Methoden für Ausreißer?
In Datensituationen, in denen das Vorliegen von Ausreißern nicht ausgeschlossen werden kann, sind robuste Methoden somit den klassischen Methoden vorzuziehen. Betrachten wir nun als weiteres Beispiel die Regressionsanalyse. Nehmen wir an, es liegen zwei Variablen X und Y vor, wobei Y die abhängige und X die unabhängige Variable ist.
Wie wird die lineare Regression geschätzt?
Die lineare Regression wird mit der Kleinst-Quadrate-Methode (least squares) geschätzt. Dabei versucht der Lösungsalgorithmus, die quadratischen Residuen zu minimieren, also die quadrierten Differenzen zwischen tatsächlichen Werten und geschätzten Werten auf der Kriteriumsvariable.
Wie kann ich den Grad des Ausreißers bestimmen?
In der letzten Spalte, nicht standardisierte Residuen, können wir den Grade des Ausreißers bestimmen. Je größer bzw. kleiner dieser Wert ist, desto stärker ist der Ausreißer. In unserem Beispiel wäre Fall 40 der stärkste Ausreißer. Die Zahl bezieht sich dabei auf die Zahl auf der linken Seite in der Datenansicht bei SPSS.
Wie erkläre ich die Robustheit von statistischen Tests?
Im folgenden erkläre ich den robusten Schätzer und die Robustheit von statistischen Tests. Ein statistisches Maß ist robust, wenn es nicht sehr von Ausreißern beeinflusst wird. Beispielsweise ist als Lagemaß der Median robust gegen Ausreißer. Der Median ist die mittlere Beobachtung der Daten, oder auch das 50 \%-Quantil.