Mann-Whitney U Test
Dieser Online-Rechner führt den Mann-Whitney-U Test (auch Wilcoxon-Mann-Whitney-Test, Wilcoxon Rangsummen-Test oder Mann-Whitney-Wilcoxon (MWW) genannt) durch.
Wie es bereits im Zwei Proben T-Test erwähnt wird, kann man den t-test anwenden, wenn die folgenden Annahmen erfüllt sind:
- Zwei Proben sind unabhängig und zufällig aus der Quellpopulation(en) gezogen worden
- Die Messskala für beide Proben haben die Eigenschaften von gleichen Intervallskalen.
- Es kann sicher angenommen werden, dass die Quellpopulation(en) eine normale Verteilung hat.
Jedoch kann es gelegentlich passieren, dass die Daten die zweite oder/und dritte Anforderung nicht erfüllt. Zum Beispiel kann nichts darauf hinweisen, dass eine normale Verteilung gegeben ist, oder dass es eine gleiche Intervallskala gibt – was bedeutet, das nicht davon ausgegangen werden kann, dass der Abstand zwischen aufeinanderfolgenden Werten konstant ist. Aber man möchte trotzdem feststellen, ob die Differenz zwischen den zwei Proben signifikant ist. In solchen Fällen kann man den Mann–Whitney U Test verwenden, eine nichtparametrische Alternative zum T-Test
In der Statistik ist der Mann-Whitney U Test (auch als der Mann-Whitney-Wilcoxon (MWW), Wilcoxon Rangsummentest, oder Wilcoxon-Mann-Whitney (WMW) Test bekannt) ein nichtparametrischer Test für eine Null-Hypothese, die genauso wahrscheinlich ist, dass ein zufällig ausgewählter Wert eine Probe kleiner oder größer ist als ein zufällig ausgewählter Wert einer zweiten Probe1. Oder . Jedoch ist er auch ein Ersatz für ein unabhängiger Gruppen T-Tests mit der Null-Hypothese, dass die zwei Population Mediane gleich sind.
Übrigens sind der Mann-Whitney U Test und der Wilcoxon Rangsummentest zwei Tests. Beide wurden unabhängig voneinander entwickelt und verwenden verschiede Maßstäbe, aber sind statistisch gesehen äquivalent.
Die Annahmen für den Mann-Whitney Test sind:
- zwei Proben werden zufällig und unabhängig gezogen;
- die abhängigen Variablen sind intrinsisch stetig – das heißt, dass sie in der Lage sind, wenn auch nicht in der Praxis bis auf die n-te Dezimalstelle durchgeführte Messungen zu erzeigen
- Die Maßstäbe der beiden Proben haben die Eigenschaften mindestens einer ordinalen Messskala, so dass man sinnvoll von “größer als”, “kleiner als” und “gleich” reden kann.2
Wie man sehen kann, muss man für einen nichtparametrischen Test nicht von einer normalen Verteilungspopulation ausgehen (oder benötigen). Solche Tests werden als verteilungsfreie Tests bezeichnet.
Ein Wort der Warnung
Man weiß seit einiger Zeit, dass der Wilcoxon-Mann-Whitney Test nachteilig durch Varianzheterogenität beeinflusst ist, wenn die Proben nicht gleich sind. Jedoch können selbst bei gleichgroßen Probengrößen sehr kleine Differenz zwischen den Populationen Varianzen dazu führen, dass der Wilcoxon-Mann-Whitney Test mit großen Proben zu liberal ist, das heißt, die tatsächliche Typ-I Fehlerquote für die Wilcoxon-Mann-Whitney Test mit großen proben steigt mit der Probengröße an.3.
Daher muss man sich daran erinnern, dass dieser Test nur wahr ist, wenn die beiden Populationsverteilungen gleich sind (inklusive der Varianzheterogenität), außer bei einer Verschiebung der Lage.
Das Verfahren
Das Verfahren ersetzt die Rohwerte mit deren entsprechenden Rangs. Mit diesen kann man einige Ergebnisse mit einfacher Mathematik erhalten. Zum Beispiel ist die Gesamtsumme von Rängen bereits von deren Größe bekannt, und es ist . Daher ist der Durchschnittsrang .
Die generelle Idee ist, wenn die Null-Hypothese wahr ist und die Proben nicht signifikant anders sind, die Ränge zwischen A und B sind, und der Durchschnittsrang für jede Probe sollte sich dem Gesamtdurchschnitt der Ränge annähern, und die Rangsumme sollte sich and respektiv annähern.
Die Berechnung
Um den Test durchzuführen, muss man zuerst den Maßstab, bekannt als U, für jede Probe zu berechnen.
Man fängt damit an, alle Werte von beiden Proben in einer einzigen Reihe zu kombinieren, diese dann nach Werten sortieren und schließlich jedem Wert einen Rang zuzuordnen (bei einem Gleichstand, erhält jeder Wert einen Durchschnittsrang).Ränge gehen von 1 bis N, wobei N die Summe der Größen and ist. Danach berechnet man die Summe der Ränge für die Werte jeder Probe and .
Nun kann man U wie folgt berechnen:
Für kleine Probengrößen kann man tabellarische Werte verwenden. Dafür nimmt man das Minimum von zwei Us, und vergleicht die dann mit dem kritischen Wert zu den dazugehörigen Probengröße und wählt dann den signifikanten Level aus. Statistik-Fachbücher listen normalerweise kritische Werte für Probengrößen bis 20 in Tabellen auf.
Für große Probengrößen kann man den Z-Test verwenden. Es wurde oben beschrieben, das U ungefähr normal verteilt wird, wenn beide Probengrößen gleich oder größer als 5 sind (einige Quellen sagen 4).
,
wobei
ist.
Bei einem Gleichstand wird die Formal für Standardabweichung
wobei hier g die Anzahl von Gruppen mit gleichen Werten und tj Anzahl von gleichen Rängen in der Gruppe j ist.
Der untenstehende Rechner verwendet den Z-Test. Natürlich gibt es Limitationen bei den Probengrößen (beide Probengrößen sollten gleich der größer als 5 sein), aber dies ist wahrscheinlich keine Limitation für Fälle in der Praxis.
Kommentare