Mann-Whitney U Test

Dieser Online-Rechner führt den Mann-Whitney-U Test (auch Wilcoxon-Mann-Whitney-Test, Wilcoxon Rangsummen-Test oder Mann-Whitney-Wilcoxon (MWW) genannt) durch.

Diese Webseite exisiert dank der Arbeit von den folgenden Menschen:

Timur

Timur

Stefan Roesner

Erstellt: 2021-09-11 14:07:11, Letzte Aktualisierung: 2022-01-27 09:37:56
Creative Commons Attribution/Share-Alike License 3.0 (Unported)

Der Inhalt ist unter der Creative Commons Namensnennung / Weitergabe unter gleichen Bedingungen 3.0 (nicht portiert) lizenziert. Dies bedeutet, dass Sie diesen Inhalt unter den gleichen Lizenzbedingungen frei weitergeben oder ändern dürfen, jedoch mit Zuordnung zum Entwickler indem Sie einen Hyperlink auf Ihrer Webseite zu dieser Arbeit https://de.planetcalc.com/7858/ platzieren. Des Weiteren ändern Sie bitte keine Verweise auf das Originalwerk (falls vorhanden) das in diesem Inhlat vorhanden ist.

Wie es bereits im Zwei Proben T-Test erwähnt wird, kann man den t-test anwenden, wenn die folgenden Annahmen erfüllt sind:

  • Zwei Proben sind unabhängig und zufällig aus der Quellpopulation(en) gezogen worden
  • Die Messskala für beide Proben haben die Eigenschaften von gleichen Intervallskalen.
  • Es kann sicher angenommen werden, dass die Quellpopulation(en) eine normale Verteilung hat.

Jedoch kann es gelegentlich passieren, dass die Daten die zweite oder/und dritte Anforderung nicht erfüllt. Zum Beispiel kann nichts darauf hinweisen, dass eine normale Verteilung gegeben ist, oder dass es eine gleiche Intervallskala gibt – was bedeutet, das nicht davon ausgegangen werden kann, dass der Abstand zwischen aufeinanderfolgenden Werten konstant ist. Aber man möchte trotzdem feststellen, ob die Differenz zwischen den zwei Proben signifikant ist. In solchen Fällen kann man den Mann–Whitney U Test verwenden, eine nichtparametrische Alternative zum T-Test

In der Statistik ist der Mann-Whitney U Test (auch als der Mann-Whitney-Wilcoxon (MWW), Wilcoxon Rangsummentest, oder Wilcoxon-Mann-Whitney (WMW) Test bekannt) ein nichtparametrischer Test für eine Null-Hypothese, die genauso wahrscheinlich ist, dass ein zufällig ausgewählter Wert eine Probe kleiner oder größer ist als ein zufällig ausgewählter Wert einer zweiten Probe1. Oder p(X<Y)=0.5. Jedoch ist er auch ein Ersatz für ein unabhängiger Gruppen T-Tests mit der Null-Hypothese, dass die zwei Population Mediane gleich sind.

Übrigens sind der Mann-Whitney U Test und der Wilcoxon Rangsummentest zwei Tests. Beide wurden unabhängig voneinander entwickelt und verwenden verschiede Maßstäbe, aber sind statistisch gesehen äquivalent.

Die Annahmen für den Mann-Whitney Test sind:

  • zwei Proben werden zufällig und unabhängig gezogen;
  • die abhängigen Variablen sind intrinsisch stetig – das heißt, dass sie in der Lage sind, wenn auch nicht in der Praxis bis auf die n-te Dezimalstelle durchgeführte Messungen zu erzeigen
  • Die Maßstäbe der beiden Proben haben die Eigenschaften mindestens einer ordinalen Messskala, so dass man sinnvoll von “größer als”, “kleiner als” und “gleich” reden kann.2

Wie man sehen kann, muss man für einen nichtparametrischen Test nicht von einer normalen Verteilungspopulation ausgehen (oder benötigen). Solche Tests werden als verteilungsfreie Tests bezeichnet.

Ein Wort der Warnung

Man weiß seit einiger Zeit, dass der Wilcoxon-Mann-Whitney Test nachteilig durch Varianzheterogenität beeinflusst ist, wenn die Proben nicht gleich sind. Jedoch können selbst bei gleichgroßen Probengrößen sehr kleine Differenz zwischen den Populationen Varianzen dazu führen, dass der Wilcoxon-Mann-Whitney Test mit großen Proben zu liberal ist, das heißt, die tatsächliche Typ-I Fehlerquote für die Wilcoxon-Mann-Whitney Test mit großen proben steigt mit der Probengröße an.3.
Daher muss man sich daran erinnern, dass dieser Test nur wahr ist, wenn die beiden Populationsverteilungen gleich sind (inklusive der Varianzheterogenität), außer bei einer Verschiebung der Lage.

Das Verfahren

Das Verfahren ersetzt die Rohwerte mit deren entsprechenden Rangs. Mit diesen kann man einige Ergebnisse mit einfacher Mathematik erhalten. Zum Beispiel ist die Gesamtsumme von Rängen bereits von deren Größe bekannt, und es ist \frac{N*(N+1)}{2}. Daher ist der Durchschnittsrang \frac{N*(N+1)}{2}*\frac{1}{N}=\frac{N+1}{2}.

Die generelle Idee ist, wenn die Null-Hypothese wahr ist und die Proben nicht signifikant anders sind, die Ränge zwischen A und B sind, und der Durchschnittsrang für jede Probe sollte sich dem Gesamtdurchschnitt der Ränge annähern, und die Rangsumme sollte sich \frac{n_A*(N+1)}{2} and \frac{n_B*(N+1)}{2} respektiv annähern.

Die Berechnung

Um den Test durchzuführen, muss man zuerst den Maßstab, bekannt als U, für jede Probe zu berechnen.
Man fängt damit an, alle Werte von beiden Proben in einer einzigen Reihe zu kombinieren, diese dann nach Werten sortieren und schließlich jedem Wert einen Rang zuzuordnen (bei einem Gleichstand, erhält jeder Wert einen Durchschnittsrang).Ränge gehen von 1 bis N, wobei N die Summe der Größen n_A and n_B ist. Danach berechnet man die Summe der Ränge für die Werte jeder Probe R_A and R_B.

Nun kann man U wie folgt berechnen:
U_A=n_A*n_B+\frac{n_A*(n_A+1)}{2}-R_A\\U_B=n_A*n_B+\frac{n_B*(n_B+1)}{2}-R_B

Für kleine Probengrößen kann man tabellarische Werte verwenden. Dafür nimmt man das Minimum von zwei Us, und vergleicht die dann mit dem kritischen Wert zu den dazugehörigen Probengröße und wählt dann den signifikanten Level aus. Statistik-Fachbücher listen normalerweise kritische Werte für Probengrößen bis 20 in Tabellen auf.

Für große Probengrößen kann man den Z-Test verwenden. Es wurde oben beschrieben, das U ungefähr normal verteilt wird, wenn beide Probengrößen gleich oder größer als 5 sind (einige Quellen sagen n_A*n_B>204).

z=\frac{U-\mu_U}{\sigma_U},
wobei
\mu_U=\frac{n_A*n_B}{2}\\ \sigma_U=\sqrt{\frac{n_A*n_B*(N+1)}{12}} ist.

Bei einem Gleichstand wird die Formal für Standardabweichung
\sigma_U=\sqrt{\frac{n_A*n_B}{N*(N-1)}*[\frac{N^3-N}{12}-\sum_{j=1}^g\frac{t_{j}^3-t_j}{12}]}
wobei hier g die Anzahl von Gruppen mit gleichen Werten und tj Anzahl von gleichen Rängen in der Gruppe j ist.

Der untenstehende Rechner verwendet den Z-Test. Natürlich gibt es Limitationen bei den Probengrößen (beide Probengrößen sollten gleich der größer als 5 sein), aber dies ist wahrscheinlich keine Limitation für Fälle in der Praxis.

PLANETCALC, Mann-Whitney U Test

Mann-Whitney U Test

Zahlen nach dem Dezimalpunkt: 2
Die Datei ist sehr groß; Beim Laden und Erstellen kann es zu einer Verlangsamung des Browsers kommen.
U für Probe A
 
U für Probe B
 
U-Mittelwert
 
U-Standardabweichung
 
Z-Ergebnis (absoluter Wert)
 
Konfidenzniveu für ungerichtete Hypothese
 
Konfidenzniveu für gerichtete Hypothese
 

URL zum Clipboard kopiert
PLANETCALC, Mann-Whitney U Test

Kommentare