Download - Mann Witney Wisconsox
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 1/13
223
DISTRIBUCIÓN EXACTA DE LA ESTADÍSTICA DE PRUEBA TIPOMANN-WHITNEY-WILCOXON BAJO VIOLACIONES A LOS SUPUESTOS
ESTÁNDAR, PARA DISTRIBUCIONES UNIFORMES CONTINUAS
EXACT DISTRIBUTION OF THE MANN-WHITNEY-WILCOXON TYPE TESTSTATISTIC UNDER VIOLATIONS TO THE STANDARD ASSUMPTIONS, FOR CONTINUOUS
UNIFORM DISTRIBUTIONS
Bulmaro Juárez-Hernández1, David A. Sotres-Ramos2 y Andrzej Matuszewski3
1Universidad Autónoma Chapingo. Km 36.5, Chapingo, Estado de México. 2Especialidad de Postgradoen Estadística. ISEI. Colegio de Postgraduados. 56230, Montecillo, Estado de México. 3Institute of Computer Science. Polish Academy of Sciences. Ordona 21, 01 237 Warsaw, Poland.
RESUMEN
La prueba de Mann-Whitney-Wilcoxon (MWW) se utiliza fre-
cuentemente para comparar dos poblaciones independientes. Sin
embargo, es común que al aplicar esta prueba se pierdan de vis-
ta los supuestos estándar de este procedimiento. En particular,
con frecuencia sucede que el supuesto de igualdad de varianzas
no se satisface. En este trabajo se obtiene, para la clase de distri-
buciones uniformes continuas y en el caso de muestras pequeñas,
la distribución exacta de la estadística de prueba de MWW, y el
nivel de significancia real de la prueba, sin suponer igualdad de
varianzas.
Palabras clave: Heterogeneidad de varianzas, nivel de significancia,
pruebas de hipótesis.
INTRODUCCIÓN Y FORMULACIÓN
DEL PROBLEMA
En la práctica, es frecuente que los investigadoresrequieran una prueba estadística para detectar unadiferencia en localización entre dos poblaciones;
la situación típica es que las distribuciones de tales po-blaciones bajo la hipótesis nula tienen formas descono-cidas pero iguales, y el investigador tiene muestrasaleatorias (m.a.) independientes de ambas poblaciones.En este marco, es común que el investigador use la prue-ba propuesta de manera independiente por Wilcoxon(1945), y Mann y Whitney (1947). Su popularidad sedebe, entre otras causas, a que el valor de su estadística
de prueba y sus valores críticos pueden obtenerse fácil-mente. Por otro lado, esta prueba tiene propiedades de-seables como el que su estadística de prueba sea de dis-tribución libre y asintóticamente Normal (Randles yWolfe, 1979); además, como es un estimador para elparámetro P(X<Y), frecuentemente se usa para obtenerun intervalo de confianza de distribución libre para ese
Recibido: Abril, 1999. Aprobado: Octubre, 2000.Publicado como ENSAYO en Agrociencia 35: 223-235. 2001.
ABSTRACT
The Mann-Whitney-Wilcoxon (MWW) test is frequently used for
comparing two independent populations. However, a common
problem in applying this test is that the researcher does not verify
the standard assumptions for the MWW procedure. In particular,
the assumption of equal variances is usually not fulfilled. In this
paper, for the class of uniform continuous distributions with
unequal variances and small sample sizes, the exact distribution
of the MWW test statistics and the real significance level of the
test are obtained.
Key words: Hetereogeneity of variances, significance level, tests of
hypothesis.
INTRODUCTION AND FORMULATION
OF THE PROBLEM
In practice, researchers often require a statistical testto detect a difference in location between twopopulations. The typical situation is that the
distributions of such populations under the null hypothesishave unknown, but equal forms and the researcher hasindependent random samples from each population. Inthis framework, it is common that the researcher uses thetest proposed independently by Wilcoxon (1945) andMann and Whitney (1947). It is popular among otherreasons, because the value of its test statistic and its criticalvalues can be easily obtained. Moreover, the test hasdesirable properties such as the fact that its test statistic
is distribution free and asymptotically Normal (Randlesand Wolfe, 1979). Also, since it is an estimator for theparameter P(X<Y), it is often used to obtain a distribution-free confidence interval for that parameter (Hamdy, 1995).In the Normal case, Pitman’s asymptotic relativeefficiency of the MWW statistics compared to Student’st test for two independent samples has a lower bound of 0.864 (Hodges and Lehman, 1956). The test is consistentfor any alternative such that P(X<Y)>1/2 (Lehman, 1951).
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 2/13
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001224
parámetro (Hamdy, 1995). En el caso Normal, la eficien-cia relativa asintótica de Pitman de la estadística de MWWrespecto a la estadística t de Student para dos muestrasindependientes, está acotada inferiormente por 0.864(Hodges y Lehman, 1956). Además la prueba es consis-tente para cualquier alternativa para la que P(X<Y)>1/2(Lehman, 1951).
El objetivo del trabajo se centra en el análisis del com-portamiento de la prueba bajo violaciones a los supues-tos estándar en la hipótesis nula, por lo que a continua-ción se presenta el esquema usual de la misma:
i. X X X m1 2, ,...,k p y Y Y Y n1 2, ,...,k p son dos m.a. in-dependientes con distribuciones continuas F X y GY , res-pectivamente.
ii. Las hipótesis a contrastar son:
′ =H0 :G x F xY X a f a f vs ′ = −Ha :G x F xY X a f a f∆ ;
∆ ∆ ∆≠ > <0 0 0, , (1)
iii. La estadística de prueba está dada por:
W R j j
n
==
∑1
(2)
donde R j es el rango de Y j dentro de la muestra combina-da de las X i y Y j.
iv. En el caso de que la alternativa sea
′ = −Ha :G x F xY X a f a f∆ con ∆>0, la prueba de MWWrechaza ′H0 en favor de ′Ha si,
W w N
≥ α (3)
donde w N α es el percentil de nivel α N de la distribución
exacta de la estadística de prueba W bajo ′H0 dada en(1) (Randles y Wolfe, 1979).
Bajo los cuatro supuestos anteriores la prueba deMWW tiene un nivel de significancia exactamente iguala α N , independientemente de la forma de la distribución
F X ( x); a α N se le llama nivel de significancia nominal.Sin embargo, en muchas aplicaciones prácticas es co-mún que las poblaciones a comparar no tengan la mismavarianza; por lo cual el presente trabajo tiene el propósi-to de estudiar el comportamiento de la prueba de MWWcuando las poblaciones a comparar son uniformes, con-tinuas y tienen varianzas diferentes.
Específicamente, en este trabajo se analiza una pruebade MWW modificada con los siguientes supuestos:
The objective of this work centers on the analysis of the test behavior under violations to the standardassumption in the null hypothesis. The usual scheme ispresented below:
i. X X X m1 2, ,...,k p and Y Y Y n1 2, ,...,k p are twooindependent random samples with continuousdistributions F X and GY respectively.
ii. The hypotheses to be contrasted are:
′ =H0 :G x F xY X a f a f vs ′ = −Ha :G x F xY X a f a f∆ ;
∆ ∆ ∆≠ > <0 0 0, , (1)
iii. The test statistic is given by:
W R j j
n
==
∑1
(2)
where R j is the rank of Y j in the combined sample of the X s and Y s.
iv. When the alternative is ′ = −Ha :G x F xY X a f a f∆
with ∆>0, the MWW test rejects ′H0 in favor of ′Ha , if
W w N
≥ α (3)
where w N α is the level α N percentile of the exact
distribution of the test statistic W under ′H0 given in (1)(Randles and Wolfe, 1979).
Under the previous four assumptions, the MWW testhas a significance level exactly equal to α N , regardless of the form of the distribution F X ( x); α N is called nominalsignificance level. However, in many practicalapplications it is common that the populations to becompared do not have the same variances. The presentresearch studies the behavior of the MWW test when thepopulations to be compared are uniform continuous andhave different variances.
Specifically, in this research modified MWW test withthe following assumptions is analyzed:
1) X X X m1 2, , ,...,l q and Y Y Y n1 2,, ,...,l q are twooindependent random samples with uniform distributions,U( ν0, ν1) and U(θ0, θ1), respectively.
2) The hypotheses to be contrasted are:
H0 1 2: / P X Y < =a f vs Ha : / P X Y < ≠a f 1 2 or
Ha : / P X Y < >a f 1 2 or Ha : / P X Y < <a f 1 2
(4)
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 3/13
JUÁREZ-HERNÁNDEZ et al.: LA PRUEBA DE MANN-WHITNEY-WILCOXON 225
1) X X X m1 2, , ,...,l q y Y Y Y n1 2,, ,...,l q son dos m.a. in-dependientes con distribuciones uniformes U( ν0, ν1) yU(θ0, θ1), respectivamente.
2) Las hipótesis a contrastar son:
H0 1 2: / P X Y < =a f vs Ha : / P X Y < ≠a f 1 2 ó
Ha : / P X Y < >a f 1 2 ó Ha : / P X Y < <a f 1 2(4)
3) La misma estadística que en iii.4) En el caso de que la alternativa sea
Ha : / P X Y < >a f 1 2 la prueba de MWW modifica-da rechaza H0 en favor de Ha si W p≥ α , donde p α seobtiene de la distribución exacta de la estadística deMWW bajo H0 dada en (4). Dicha distribución se ob-tiene para m=n=4 y m=n=5 en la siguiente sección deeste trabajo.
Bajo los supuestos 1, 2, 3 y 4 la prueba de MWW
modificada tiene nivel de significancia exactamente iguala α; a este valor se le denominará nivel de significanciaexacto de la prueba de MWW modificada.
Es importante notar que las hipótesis′ =H0 :G x F xY X a f a f y H0 1 2: / P X Y < =a f no son
equivalentes, pues no es difícil probar que ′ ⇒H H0 0 ,mientras que H H0 0 /⇒ ′ , como es claro si X es una varia-ble aleatoria (v.a.) U(−1,1) y Y es una v.a. U(−2,2).
También se analiza el nivel de significancia real de laprueba de MWW estándar dada en (3), uti lizando la dis-tribución exacta de la estadística de MWW para contras-tar las hipótesis en (4), cuando las distribuciones unifor-mes por comparar tienen varianzas diferentes.
Obtención de la distribución exacta de laestadística tipo MWW
Para obtener de una manera eficiente la distribu-ción exacta de W bajo H0 dada en (4), en el marco de laprueba de MWW modificada con los supuestos 1, 2, 3 y4; en primer lugar se demuestra una propiedad deinvarianza de la distribución de W bajo H0, la cual esen-cialmente afirma que la distribución de W bajo H0 nodepende del parámetro de localización (siendo el mis-mo para ambas poblaciones de donde se obtienen las
muestras), ni depende de los parámetros de dispersiónde las distribuciones de donde se toman las muestras,pero sí depende del cociente de las desviaciones estándarde dichas distribuciones. En seguida se prueba la sime-tría de la distribución de W bajo H 0, y finalmente, secalcula explícitamente la distribución de W bajo H0 paralos tamaños de muestra m=n=4 y m=n=5, y para dife-rentes valores del cociente (q= σY / σ X ) de las desviacio-nes estándar de las poblaciones de donde se toman lasmuestras.
3) The same statistic as in iii.
4) When the alternative is Ha : / P X Y < >a f 1 2 , themodified MWW test rejects H0 in favor of Ha if W p≥ α ,where p α is obtained from the exact distribution of theMWW statistic under H0 given in (4). That distribution isobtained for m=n=4 and m=n=5 in the following section
of this paper.Under assumptions 1, 2, 3, and 4, the modified MWWtest has a significance level exactly equal to α, whichhere will be called exact level of significance of themodified MWW test.
It is important to note that the hypotheses′ =H0 :G x F xY X a f a f and H0 1 2: / P X Y < =a f are not
equivalent since it is not difficult to prove that ′ ⇒H H0 0 ,while H H0 0 /⇒ ′ . This is clear if X is a random variable(r.v), U(−1,1), and Y is a r.v. U(−2,2).
Also, the real significance level of the standard MWWtest given in (3) is analyzed using the exact distributionof the MWW statistic to contrast the hypotheses in (4)
when the uniform distributions to be compared havedifferent variances.
Derivation of the exact distribution of theMWW type test statistics
The exact distribution of W under H0 given in (4) canbe obtained efficiently within the framework of themodified MWW test with assumptions 1, 2, 3, and 4. First,an invariance property of the W distribution under H0 isdemonstrated; which essentially confirms that thedistribution of W under H0 does not depend on the locationparameter (which is the same for the two samplepopulations), nor does it depend on the dispersionparameters of the distributions from which the sampleswere taken. It does depend, however, on the ratio of thestandard deviations of said distributions. The symmetry of the W distribution under H0 is then demonstrated and,finally, the distribution of W under H0 is explicitlycalculated for the sample sizes m=n=4 and m=n=5, for thedifferent values of the standard deviation ratio (q= σY / σ X )of the sampled populations.
An invariance property of the MWW type statistic
The property of invariance proved in this section refersto the distribution of the W statistic, MWW type underH0:P( X <Y )=1/2. Thus, if we define R=P( X <Y ), therelationship between R and the population parameters of the random variables X~U( ν0, ν1) and Y ~U(θ0, θ1) isobtained. That is,
R P X Y E P X Y Y E dxY Y
Y = < = < =
−
F H G
I K J
L
NM
O
QPz a f b g
1
1 00 ν ν ν
,
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 4/13
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001226
Una propiedad de invarianzade la estadística tipo MWW
La propiedad de invarianza que se prueba en esta sec-ción se refiere a la distribución de la estadística W tipoMWW bajo H0:P( X <Y )=1/2. Así que, si se define R=P( X <Y ), se obtendrá la relación entre R y los paráme-tros poblacionales de las v.a. X ~U( ν0, ν1) y Y ~U(θ0, θ1).Esto es:
R P X Y E P X Y Y E dxY Y
Y = < = < =
−
F H G
I K J
L
NM
O
QPz a f b g
1
1 00 ν ν ν
,
de donde
R=−
F H G
I K J
+ −F H G
I K J
1 2
21 0
0 1 0
ν ν
θ θ ν(5)
Ahora, si R=1/2, de (5) se tiene que:
1
1 0 ν ν−
F H G
I K J
θ θ ν0 1 02
2
+ −F H G
I K J
=1/2, esto es,
θ θ0 1 2+a f / = + ν ν0 1 2a f / .De modo que R=1/2 se cumple siempre y cuando las
v.a. X y Y tengan como soportes intervalos concéntricos,es decir, intervalos con el mismo punto medio. Por loque si X ~U( µ−θ, µ+θ) y Y ~U( µ−qθ, µ+qθ), entonces,H0: R=1/2 es verdadera para todo µ∈R y θ y q∈R+.
Al considerar el resultado anterior, si X 1,..., X m y
Y 1,..., Y n son m.a. independientes de las distribucionesU( µ−θ, µ+θ) y U( µ−qθ, µ+qθ) respectivamente, en-
tonces la distribución de la estadística W R j j
n
==
∑1
bajo
H0: R=1/2, es independiente del valor de los paráme-
tros µ y θ, y sólo depende del parámetro q, que es la
razón de la desviación estándar de la v.a. X respectode la desviación estándar de la v.a. Y .
Para demostrar esta afirmación, se usará la equiva-
lencia de la estadística W y la estadística de Mann-
Whitney dada por: U= −== ∑∑ ψ Y X j i j
m
i
n
c h11 , donde ψ(t)=1si t>0 y 0 si t≤0. Tal equivalencia entre ambas esta-
dísticas está dada por la expresión:
W U n n= + +1 2a f / (6)
Esto es, supóngase que a,b∈R+ con a≠b, µ, τ∈R,q∈R+ y además que:
hence
R=−
F H G
I K J
+ −F H G
I K J
1 2
21 0
0 1 0
ν ν
θ θ ν(5)
Now, if R=1/2, from (5) we have:1
1 0 ν ν−
F H G
I K J
θ θ ν0 1 02
2
+ −F H G
I K J
=1/2, that is
θ θ0 1 2+a f / = + ν ν0 1 2a f / .Then R=1/2 is satisfied as long as the random
variables X and Y have support on concentric intervals,that is, intervals with the same middle point. Thus, if X ~U( µ−θ, µ+θ) and Y ~U( µ−qθ, µ+qθ), then H0: R=1/2is true for all µ∈R and θ and q∈R+.
Considering the above result, if X 1,…, X mand Y 1,…,Y nare independent random samples of U( µ−θ, µ+θ) and
U( µ−qθ, µ+qθ) respectively, then the distribution of the
statistic W R j j
n
==
∑1
under H0: R=1/2 is independent of
the value of the parameters µ and θ, and depend only on
parameter q, the ratio of the standard deviation of therandom variable X with respect to the standard deviationof the random variable Y .
To demonstrate this affirmation, the equivalence of
the W statistic and the Mann-Whitney statistic given by
U= −==
∑∑ ψ Y X j i j
m
i
n
c h11
, will be used, where ψ(t)=1 if t>0
and 0 if t≤0. The equivalence between the two statisticsis given by the expression
W U n n= + +1 2a f / (6)
That is, assume that a,b∈R+ with a≠b, µ, τ∈R, q∈R+
and besides:
(I) the random samples X 1,…, X m and Y 1,…, Y n,independent of each other, are obtained from the
distributions U( µ−a, µ+a) and U( µ−qa, µ+qa)
respectively, with: W R j j
n
11
==∑ and
U111
= −==
∑∑ ψ Y X j i j
m
i
n
c h, where R j is the range of Y j in the
combined sample of the X s and Y s, and
(II) the random samples ′ X 1 ,..., ′ X m and ′Y 1 ,..., ′Y nindependent of each other, are obtained from the
distributions U( τ−b, τ+b) and U( τ−qb, τ+qb),
respectively with: W R j j
n
21
= ′=
∑ and
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 5/13
JUÁREZ-HERNÁNDEZ et al.: LA PRUEBA DE MANN-WHITNEY-WILCOXON 227
(I) Las m.a. X 1,..., X m y Y 1,..., Y n independientes en-
tre sí, son obtenidas de las distribuciones U( µ−a, µ+a)
y U( µ−qa, µ+qa) respectivamente, con: W R j j
n
11
==
∑ y
U111
= −==
∑∑ ψ Y X j i j
m
i
n
c h, donde R j es el rango de Y j en la
muestra combinada de las X y las Y , y(II) Las m.a. ′ X 1 ,..., ′ X m y ′Y 1 ,..., ′Y n independientes
entre sí, son obtenidas de las distribuciones U( τ−b, τ+b)
y U( τ−qb, τ+qb) respectivamente con: W R j j
n
21
= ′=
∑ y
U211
= ′− ′==
∑∑ ψ Y X j i j
m
i
n
c h, donde ′ R j es el rango de ′Y j en
la muestra combinada de las ′ X y las ′Y .
Si se utiliza el símbolo =d , para denotar que dosv.a. o vectores aleatorios tienen la misma distribución,
como en ′ = + − X b a X id
i τ µ / a fa f y′= + −Y b a Y i
d
j
τ µ / ,a fc h entonces
U211
11 11
= + − − + −
= − = −
==
== ==
∑∑
∑∑ ∑∑
ψ τ µ τ µ
ψ ψ
j
m
i
n
j i
j
m
i
n
j i j
m
i
n
j i
b a Y b a X
b a Y b a X Y X
/ /
/ /
a fc h a fa fb g
a f a f c h
es decir, U2= d U1, y por (6), se tiene que: W 1= d W 2, inde-pendientemente de los valores arbitrarios a, b, µ y τ.Probándose así la
Proposición 1.1 Si X 1,…, X m y Y 1,…,Y n son m.a. in-dependientes de poblaciones con distribución U( µ−θ, µ+θ)
y U( µ−qθ, µ+qθ) respectivamente, con µ∈R y θy q∈R+;
la distribución de la estadística W R j j
n
==
∑1
bajo H0: R=1/2,
es independiente del valor de los parámetros µ y θ, y de-
pende sólo del parámetro q.
Simetría de la estadística tipo MWW
En esta sección se prueba la simetría, bajo H0: R=1/2,
de la estadística W R j j
n
==
∑1
, con m.a. de tamaños m=n
de las distribuciones U( µ−q, µ+θ) y U( µ−qθ, µ+qθ).
Se ha probado que la distribución bajo H0: R=1/2 dela estadística W tipo MWW, es independiente de los va-lores de µ y θ, y que sólo depende del valor de q; estopermite analizar el comportamiento de esta estadística,sin pérdida de generalidad, tomando m.a. independien-tes X 1,..., X n y Y 1,..., Y n de las distribuciones U(−1,1) y
U211
= ′− ′==
∑∑ ψ Y X j i j
m
i
n
c h, where ′ R j is the rank of ′Y j in
the combined sample of the ′ X s and ′Y s.
If the symbol =d is used to denote that two randomsamples or random vectors have the same distribu tion,
as in, ′ = + − X b a X id
i τ µ / a fa f and
′= + −Y b a Y i d j τ µ / ,a fc h then
U211
11 11
= + − − + −
= − = −
==
== ==
∑∑
∑∑ ∑∑
ψ τ µ τ µ
ψ ψ
j
m
i
n
j i
j
m
i
n
j i j
m
i
n
j i
b a Y b a X
b a Y b a X Y X
/ /
/ /
a fc h a fa fb g
a f a f c h
that is, U2=d U1, and because of (6), W 1=d W 2, regardlessof the arbitrary values a, b, µ and τ. Thus proving
Proposition 1.1 If X 1,…, X m and Y 1,…, Y n areindependent random samples of populations withU( µ−θ, µ+θ) and U( µ−qθ, µ+qθ) distributions,
respectively, with µ∈R and θ and q∈R+, the distribution
of the statistic W R j j
n
==
∑1
under H0: R=1/2, is independent
of the value of the parameters µ and θ, and depend only
on the q parameter.
Symmetry of the MWW type statistic
In this section, symmetry of the statistic W R j j
n
==∑1
is
demonstrated under H0: R=1/2, with random samples of
sizes m=n of the distributions U( µ−q, µ+θ) and U( µ−qθ, µ+qθ). It has been proven that the distribution underH0: R=1/2 of the MWW type statistics is independent of the values of µ and θ, and that it depends solely on thevalue of q. This allows to analyze the behavior of thisstatistic, without loss of generality, taking independentrandom samples X 1,…, X m and Y 1,…,Y n of the distributionsU(−1,1) and U(−q, q) respectively. Thus, given thesymmetry around zero of both distributions, we have( X 1,…, X n) = d (− X 1,…, − X n) and (Y 1,…, Y n) = d (−Y 1,…, −Y n).
Now, if Qi represents the rank of X i, and R j representsthe rank of Y j in the combined sample of X s and Y s, thevector of ranks of the combined sample of the − X sand −Y s is (2n+1−Q1,…, 2n+1−Qn, 2n+1− R1,…,2n+1− Rn), so that (Q1,…,Qn, R1,…, Rn) = d (2n+1−
Q1,…,2n+1−Qn, 2n+1− R1,…, 2n+1− Rn), and
R n R n n R jd
j
n
jd
j
n
j j
n
= + − = + −= = =
∑ ∑ ∑1 1 1
2 1 2 1c h a f , from which
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 6/13
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001228
U(−q, q) respectivamente. Así, dada la simetría alrede-dor de cero de ambas distribuciones, se tiene que( X 1,…, X n) = d (− X 1,…, − X n) y (Y 1,…, Y n) = d (−Y 1,…,−Y n).Ahora, si Qi representa el rango de X i y R j representa elrango de Y j en la muestra combinada de las X y las Y , elvector de rangos de la muestra combinada de las −
X y las −Y , es (2n+1−Q1,…, 2n+1−Q
n, 2n+1− R
1,…,
2n+1− Rn), por lo que (Q1,…,Qn, R1,…,Rn) = d (2n+1−Q1,…,2n+1−Qn, 2n+1− R1,…, 2n+1− Rn), y
R n R n n R jd
j
n
jd
j
n
j j
n
= + − = + −= = =
∑ ∑ ∑1 1 1
2 1 2 1c h a f , de donde,
Rn n n n
R j j
nd
j j
n
= =
∑ ∑−+
=+
−1 1
2 1
2
2 1
2
a f a f, o
W n n n n
W d − + = + −2 1
22 1
2a f a f .
Esto último implica que la estadística W es una variable
aleatoria simétrica con media E W n n
a fa f
=+2 1
2, con lo
que se ha probado la siguiente proposición:
Proposición 1.2 Si X 1,…, X n y Y 1,…,Y n son m.a.independientes de las distribuciones U( µ−θ, µ+θ) y
U( µ−qθ, µ+qθ), respectivamente, con µ∈R y q, θ∈R+;
entonces, la distribución de la estadística W R j j
n
==
∑1
,
bajo H 0: R=1/2, es simétrica.
Distribución exactade la estadística tipo MWW
Caso m=4 y n=4
Para determinar la distribución exacta de la estadísti-ca de prueba tipo MWW dada en (2), bajo H 0: R=1/2,cuando m=n=4, se supone, sin pérdida de generalidadpor la Proposición 1.1, que: X 1, X 2, X 3, X 4 y Y 1, Y 2, Y 3, Y 4son m.a. independientes de las distribuciones U(−1, 1) yU(−q, q), respectivamente. Dado que el cálculo de laprobabilidad asociada a cada valor de W se efectúa enforma directa sobre los eventos que generan dicho va-lor, es necesario hacer uso de la función de densidad deprobabilidades conjunta (f.d.p.c.) del vector aleatorioV = ( X 1, X 2, X 3, X 4, Y 1, Y 2, Y 3, Y 4), conformado por lamuestra conjunta. La función es:
Rn n n n
R j j
nd
j j
n
= =
∑ ∑−+
=+
−1 1
2 1
2
2 1
2
a f a f, or
W n n n n
W d −
+=
+−
2 1
2
2 1
2
a f a f.
The last expression implies that the W statistic is a symetric
random variable with mean E W n n
a fa f
=+2 1
2, with
which the following proposition has been proved:
Proposition 1.2 If X 1,…, X n and Y 1,…, Y n areindependent random samples of the distributionsU( µ−θ, µ+θ) and U( µ−qθ, µ+qθ), respectively, with
µ∈R and q, θ∈R+, then the distribution of the statistic
W R j j
n
==∑
1, under H0: R=1/2, is symmetric.
The exact distributionof the MWW test type statistic
Case of m=4 and n=4
To determine the exact distribution of the MWW typetest statistic given in (2), under H0: R=1/2, for m=n=4, itis assumed, without loss of generality, and givenProposition 1.1, that X 1, X 2, X 3, X 4 and Y 1, Y 2, Y 3, Y 4 areindependent random samples of the distributionsU(−1,1)
and U(−q, q), respectively. Since probabilities associatedto each W value are calculated directly on the events thatgenerate said value, it is necessary to make use of the joint probability density function of the random vectorV = ( X 1, X 2,X 3, X 4, Y 1,Y 2,Y 3,Y 4), made up of the combinedsample. The function is
f x x x x y y y yV 1 2 3 4 1 2 3 4, , , , , , ,a f
=L
NM
O
QPL
NMM
O
QPP
−−
=−
=∏ ∏4
41 1
1
4
1
4
q x yi
i q q j
ja f a f c hI I, , , q∈R+
(7)
In what follows, a classification is made of what willbe called configurations, which denote a class of equi-probable single events of the joint sample of X s and Y sassociated with each value of the statistic. Thisclassification will be instrumental in the calculation of theprobabilities necessary to determine the exact distributionof the W statistic. Note that when m=n=4, the possiblevalues of the W statistic are 10, 11,…, 25, 26.
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 7/13
JUÁREZ-HERNÁNDEZ et al.: LA PRUEBA DE MANN-WHITNEY-WILCOXON 229
f x x x x y y y yV 1 2 3 4 1 2 3 4, , , , , , ,a f
=L
NM
O
QPL
NMM
O
QPP
−−
=−
=∏ ∏4
41 1
1
4
1
4
q x yi
i q q j
ja f a f c hI I, , , q∈R+
(7)
En el desarrollo que se efectúa, se hace una clasifica-ción de lo que denominaremos configuraciones, las cua-les denotan una clase de eventos simples equiprobablesde la muestra conjunta de las X y las Y asociada a cadavalor de la estadística. Esta clasificación ayudará en elcálculo de las probabilidades necesarias para determinarla distribución exacta de la estadística W. Nótese que cuan-do m=n=4, los valores posibles de la estadística W son:10, 11,..., 25, 26.
La determinación de la distribución exacta de la esta-dística W se divide en los siguientes casos: (i) q= σY / σ X ≤1y (ii) q= σY / σ X >1.
Para el caso (i) cada uno de los siguientes esquemasrepresenta una configuración, la que denota una clasecompuesta de 576 eventos simples equiprobables, gene-rados al considerar todas las permutaciones de las X ylas Y de la muestra conjunta, conservando las literalessus posiciones relativas y permutando sus subíndices; esdecir, cada uno de estos eventos producen un mismo va-lor de W . Estas configuraciones ayudarán al cálculo de ladistribución de probabilidades exacta de W y se clasifi-can según el valor que toma dicha estadística. Aquí sólose presenta y se analiza el caso en el que la estadística W
toma el valor de 10. Esto es:
1ª (−1)(−q)Y 1Y 2Y 3Y 4 X 1 X 2 X 3 X 4(q)(1)1b (−1)(−q)Y 1Y 2Y 3Y 4 X 1 X 2 X 3(q) X 4(1)1c (−1)(−q)Y 1Y 2Y 3Y 4 X 1 X 2(q) X 3 X 4(1)1d (−1)(−q)Y 1Y 2Y 3Y 4 X 1(q) X 2 X 3 X 4(1)1e (−1)(−q)Y 1Y 2Y 3Y 4(q) X 1 X 2 X 3 X 4(1)
En donde, por ejemplo, la configuración en 1c repre-senta al evento{(−1)≤(−q) <Y i <Y j <Y k <Y l < X m < X n <(q) < X r < X s <1(i,j,k,l) y (m,n,r,s) son permutaciones de los números 1,2, 3 y 4}.
Así, la configuración en 1a es la base para el cálculode la probabilidad del evento:
E ai j k l m n r s
11 2 3 4 1 2 3 4
=∈ ∈, , , , , , , , , , , ,a f a f a f a fPer Per
U U {(−1)≤(−q) <Y i
<Y j <Y k <Y l < X m < X n < X r < X s <(q)≤1}
el cual tiene una probabilidad igual a 576 veces la proba-bilidad del evento
C1a={(−1)≤(−q) <Y 1 <Y 2 <Y 3 <Y 4 < X 1 < X 2 < X 3 < X 4<(q)≤1}
The determination of the exact distribution of the Wstatistic is separated into the following cases: (i) q= σY / σ X ≤1and (ii) q= σY / σ X >1.
For case (i), each of the following schemes representsa configuration. A configuration denotes a class made upof 576 equally probable single events generated whenconsidering all the permutations of the X s and Y s in the joint sample keeping the relative positions of the lettersand permutating their sub-indexes; that is, each of theseevents produces the same value of W. Theseconfigurations will help to calculate the exact probabilitydistribution of W, and are classified according to eachvalue that the statistic takes. Here we present and analyzeonly the case in which the W statistic takes the value of 10. That is:
1ª (−1)(−q)Y 1Y 2Y 3Y 4 X 1 X 2 X 3 X 4(q)(1)1b (−1)(−q)Y 1Y 2Y 3Y 4 X 1 X 2 X 3(q) X 4(1)1c (−1)(−q)Y 1Y 2Y 3Y 4 X 1 X 2(q) X 3 X 4(1)
1d (−1)(−q)Y 1Y 2Y 3Y 4 X 1(q) X 2 X 3 X 4(1)1e (−1)(−q)Y 1Y 2Y 3Y 4(q) X 1 X 2 X 3 X 4(1)
Where, for example, configuration in 1c representsthe event{(−1)≤(−q) <Y i <Y j <Y k <Y l < X m< X n <(q) < X r < X s <1(i,j,k,l)and (m,n,r,s) are permutations of the numbers 1, 2, 3,and 4}
Thus, the configuration in 1a is the basis to calculatethe probability of the event:
E a
i j k l m n r s
1
1 2 3 4 1 2 3 4
=∈ ∈, , , , , , , , , , , ,a f a f a f a fPer Per
U U {(−1)≤(−q) <Y i
<Y j <Y k <Y l < X m < X n < X r < X s <(q)≤1}
which has a probability equal to 576 times the probabilityof the event
C1a={(−1)≤(−q) <Y 1 <Y 2 <Y 3 <Y 4 < X 1 < X 2 < X 3 < X 4 <(q)≤1}
directly represented by the configuration given in 1a; thus:
P E a
i j k l p q r s
11 2 3 4 1 2 3 4
a fa f a f a f a f
=∈ ∈
∑ ∑, , , , , , , , , , , ,Per Per
P{(−1)≤(−q)
<Y i <Y j <Y k <Y l < X p < X q < X r < X s <(q)≤1}
=576P{(−1)≤(−q)<Y 1<Y 2<Y 3<Y 4< X 1< X 2< X 3< X 4 <(q)≤1}
= z z z z z z z z −576 1 2 3 4 1 2 3 4 4 13214321 f x x x x y y y y dx dyV x
q
x
q
x
q
y
q
y
q
y
q
y
q
q
q, , , , , , , , ...a f
where f x x x x y y y yV 1 2 3 4 1 2 3 4, , , , , , , ,a f is given in (7).
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 8/13
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001230
representado de forma directa por la configuración dadaen 1a, así:
P E a
i j k l p q r s
11 2 3 4 1 2 3 4
a fa f a f a f a f
=∈ ∈
∑ ∑, , , , , , , , , , , ,Per Per
P{(−1)≤(−q)
<Y i <Y j <Y k <Y l < X p < X q < X r < X s <(q)≤1}
=576P{(−1)≤(−q)<Y 1<Y 2<Y 3<Y 4< X 1< X 2< X 3< X 4 <(q)≤1}
= z z z z z z z z −576 1 2 3 4 1 2 3 4 4 13214321 f x x x x y y y y dx dyV x
q
x
q
x
q
y
q
y
q
y
q
y
q
q
q, , , , , , , , ...a f
donde f x x x x y y y yV 1 2 3 4 1 2 3 4, , , , , , , ,a f está dada en (7).
El cálculo de la integral anterior y los restantes nopresentados aquí, se efectúan con el sistema de cómputoMathematica 2.2 (Stephen, 1993).
Las demás probabilidades se calculan de forma aná-
loga para las diferentes configuraciones de cada valor dela estadística W .Así, tomando en cuenta las configuraciones para cada
valor de W y la f.d.p.c. del vector V dada en (7), sedesarrolló un programa en Mathematica 2.2 para obteneruna sucesión de distribuciones exactas de la estadísticaW , para diferentes valores del parámetro q= σY / σ X , con0<q≤1. Estos valores, junto con las respectivas f.d.p.exactas de la estadística W , generadas con m.a. indepen-dientes de tamaños m=n=4 para cada pareja de distribu-ciones determinadas por el valor de q, se presentan en laFigura 1.
Para el caso (ii), al igual que en el caso (i) se tienen
configuraciones, cada una de las cuales denota una clasecompuesta de 576 eventos simples equiprobables queproducen el mismo valor para la estadística W . Estas con-figuraciones se agrupan en función del valor de W quegeneran. Aquí sólo se presentan las configuraciones quegeneran el valor 10 para la estadística W , cuando X 1, X 2, X 3, X 4 y Y 1, Y 2, Y 3, Y 4 son m.a. independientes de las distri-buciones U(−1, 1) y U(−1/q, 1/q), respectivamente, con0<q≤1. Esto es:
1ª (−1/q)(−1)Y 1Y 2Y 3Y 4 X 1 X 2 X 3 X 4(1)(1/q)1b (−1/q)Y 1(−1)Y 2Y 3Y 4 X 1 X 2 X 3 X 4(1)(1/q)1c (−1/q)Y 1Y 2(−1)Y 3Y 4 X 1 X 2 X 3 X 4(1)(1/q)
1d (−1/q)Y 1Y 2Y 3(−1)Y 4 X 1 X 2 X 3 X 4(1)(1/q)1e (−1/q)Y 1Y 2Y 3Y 4(−1) X 1 X 2 X 3 X 4(1)(1/q)
El cálculo de las probabilidades necesarias para de-terminar la distribución exacta de la estadística W se hacede manera análoga al caso (i), dado que si W q representala estadística tipo MWW para el caso (i) y W 1/ q represen-ta la estadística tipo MWW para el caso (ii), entonces,W q= d W 1/ q, lo cual permite estudiar el comportamiento
Calculation of the above integral, and the rest notpresented here, are performed with the Mathematica 2.2computer system (Stephen, 1993).
All other probabilities are calculated analogously forthe different configurations of each value of the W statistic.
Thus, taking into account the configurations for eachvalue of W and the joint probability density function of the V vector given in (7), a program in Mathematica 2.2was developed to obtain a succession of exact distributionsof the W statistic, for different values of the parameterq= σY / σ X , with 0<q≤1. Figure 1 presents these values,together with their respective exact probability densityfunction of the W statistic, generated with independentrandom samples of sizes m=n=4 for each pair of distributions determined by the value of q.
For case (ii), as well as in case (i), there areconfigurations, each of which denotes a class composedof 576 equally probable single events that produce thesame value for the W statistic. These configurations are
grouped in function of the value of W that they generate.Here, only the configurations that generate the value of 10 for the W statistic are presented when X 1, X 2, X 3, X 4and Y 1, Y 2, Y 3, Y 4 are independent random samples of thedistributions U(−1, 1) and U(−1/q, 1/q), respectively,with 0<q≤1. That is,
1ª (−1/q)(−1)Y 1Y 2Y 3Y 4 X 1 X 2 X 3 X 4(1)(1/q)1b (−1/q)Y 1(−1)Y 2Y 3Y 4 X 1 X 2 X 3 X 4(1)(1/q)1c (−1/q)Y 1Y 2(−1)Y 3Y 4 X 1 X 2 X 3 X 4(1)(1/q)1d (−1/q)Y 1Y 2Y 3(−1)Y 4 X 1 X 2 X 3 X 4(1)(1/q)1e (−1/q)Y 1Y 2Y 3Y 4(−1) X 1 X 2 X 3 X 4(1)(1/q)
The calculus of the probabilities necessary fordetermining the exact distribution of the W statistic iscarried out in a similar manner to case (i), given that if W q represents the MWW type statistics for case ( i) andW 1/ q represents the MWW type statistic for case (ii), thenW q= d W 1/ q. This permits to study the behavior of the WMWW type statistic by calculating the succession of distributions in only one of the cases.
Case m=5 and n=5
To obtain the exact distribution of the MWW type teststatistics given in (2), when m=n=5, an analogous
procedure to that described for the case m=n=4 is followed.That is, without loss of generality, it is assumed that X 1, X 2, X 3, X 4, X 5 and Y 1,Y 2,Y 3,Y 4,Y 5 are independent randomsamples of the distributions U(−1,1) and U(−q, q),respectively. Here R j is the rank corresponding to Y j withinthe combined sample of the X s and Y s. In this case, the joint probability density function of the random vector of the combined sample V = ( X 1, X 2, X 3, X 4, X 5,Y 1,Y 2,Y 3,Y 4,Y 5),with the conditions given above, has the following form:
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 9/13
JUÁREZ-HERNÁNDEZ et al.: LA PRUEBA DE MANN-WHITNEY-WILCOXON 231
Figura 1. Función de densidad de probabilidad exacta de la estadística W tipo MWW para muestras de tamaño m=n=4 provenientes delas distribuciones X~U( µ−θ, µ+θ) y Y~U( µ−qθ, µ+qθ), con q≤1.
Figure 1. Density function of exact probability of the MWW type W statistic for m=n=4 sample sizes from the distributions X~U( µ−θ,µ+θ)and Y~U( µ−qθ, µ+qθ), with q≤1.
w0.0463
0.00970.01100.0111
0.18650.03040.0330
0.0318
0.28040.03180.03300.0304
0.18650.01110.01100.0097
0.0463
0
0.05
0
00
.
..
1
11
5
0
0.100.10
0. 10 0.10
0.10 0.10
0
0
0
0
0.
.
.
.2
3
2
25
0
0
0
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
0.0346
0.01480.01900.0198
0.14250.04930.0578
0.0543
0.21590.05430.05780.0493
0.14250.01980.01900.0148
0.0346
0
0.05
0.15
0.25
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
0.02640.0168
0.02450.02660.11310.0603
0.07560.07010.17340.0701
0.07560.06030.11310.0266
0.02450.01680.0264
0
0.02
0.04
0.060.08
0.12
0.14
0.16
0.18
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
0.02090.0170
0.02770.03210.09420.0661
0.08750.08130.14670.0813
0.08750.06610.09420.0321
0.02770.01700.0209
0
0.02
0.04
0.060.08
0.12
0.14
0.16
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
0.01740.01620.02910.0365
0.08270.06890.0947
0.08920.13040.08920.0947
0.06890.08270.03650.0291
0.01620.0174
0
0.02
0.04
0.06
0.08
0.12
0.14
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
0.01550.01520.02930.0398
0.07600.07030.0984
0.09490.12100.09490.0984
0.07030.07600.03980.0293
0.01520.0155
0
0.02
0.04
0.060.08
0.12
0.14
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
0.01450.0145
0.02890.04200.0725
0.07110.09980.09860.11600.0986
0.09980.07110.07250.0420
0.02890.01450.0145
0
0.02
0.04
0.06
0.08
0.12
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
0.01430.0143
0.02860.04290.0714
0.07140.10000.10000.11430.1000
0.10000.07140.07140.0429
0.02860.01430.0143
0
0.02
0.04
0.06
0.08
0.12
w 1 0
w 1 3
w 1 6
w 1 9
w 2 2
w 2 5
q= / =1/8 σ σY X
q= / =3/8 σ σY X
q= / =5/8 σ σY X
q= / =3/4 σ σY X
q= / =7/8 σ σY X
q= / =1.0 (caso estánda r) σ σY X
q= / =1/2 σ σY X
q= / =1/4 σ σY X
10
11121314
151617
1819
202122
232425
26
10111213
14151617
18192021
222324
2526
101112
131415
16
17181920
21222324
2526
101112
131415
161718
1920212223
242526
p(w) p(w)Gráfica de p(w) Gráfica de p(w)
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 10/13
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001232
de la estadística W tipo MWW calculando la sucesión dedistribuciones únicamente en uno de los casos.
Caso m=5 y n=5
Para obtener la distribución exacta de la estadísticatipo MWW dada en (2), cuando m=n=5, se sigue un pro-cedimiento análogo al descrito en el caso m=n=4; esdecir, se supone sin pérdida de generalidad que X 1, X 2, X 3, X 4, X 5 y Y 1,Y 2,Y 3,Y 4,Y 5 son m.a. independientesde las distribucionesU(−1,1) y U(−q, q), respectivamente.Aquí también R j como el rango correspondiente a Y j den-tro de la muestra combinada de las X y las Y . En estecaso, la f.d.p.c. del vector aleatorio de la muestra conjun-ta V = ( X 1, X 2, X 3, X 4, X 5,Y 1,Y 2,Y 3,Y 4,Y 5), con las condicio-nes antes dadas tiene la forma:
f x x x x x y y y y yV s s1 2 3 4 1 2 3 4, , , , , , , , ,a f
= LNM O
QPLNMM
OQPP
−−
=−
=∏ ∏4
51 1
1
5
1
5q x y
ii q q
j ja f a f c hI I, , , q∈R+
(8)
De manera que tomando en cuenta la f.d.p.c. del vectorV dada en (8), las configuraciones respectivas y una su-cesión de valores para q= σY / σ X , se desarrolló un progra-ma en Mathematica 2.2 para obtener la sucesión de dis-tribuciones exactas de la estadística W tipo MWW, co-rrespondientes a valores dados de q. Al igual que en elcaso anterior, para analizar el comportamiento de la esta-dística, es suficiente calcular las distribuciones de W paravalores de q tales que 0<q≤1 o bien para valores deq≥1, ya que, con las mismas consideraciones hechas parael caso m=n=4, W q= d W 1/ q.
Los resultados se presentan en la Figura 2, la que in-cluye una sucesión de valores de q= σY / σ X , junto con lasrespectivas distribuciones exactas de la estadística W bajoH0: R=1/2, generadas al tomar m.a. independientes detamaños m=n=5, dentro de la clase de distr ibuciones uni-formes continuas determinadas por el respectivo valorde q.
Niveles de significancia real para la prueba tipo
MWW para la familia uniforme continua cuandom=n=4 y m=n=5
Ahora se investiga el comportamiento del nivel de sig-nificancia real de la prueba estándar de MWW; es decir,la prueba definida en (2) y (3), para contrastar las hipó-tesis dadas en (4) en una situación donde las varianzas delas dos distribuciones uniformes por comparar son dife-rentes. En este contexto, a continuación se precisa la de-finición del nivel de significancia real ( αR):
f x x x x x y y y y yV s s1 2 3 4 1 2 3 4, , , , , , , , ,a f
=L
NM
O
QPL
NMM
O
QPP
−−
=−
=∏ ∏4
51 1
1
5
1
5
q x yi
i q q j
ja f a f c hI I, , , q∈R+
(8)
By considering the joint probability density functionof vector V given in (8), the respective configurationsand a succession of values for q= σY / σ X , a program wasdeveloped in Mathematica 2.2 to obtain the successionof exact distributions of the W MWW type statisticcorresponding to given values of q. As in the previouscase, to analyze the behavior of the statistic, it is enoughto calculate the distributions of W for q values, in therange (0, 1] or for values of q equal or greater than 1,since with the same considerations made when m=n=4,W q= d W 1/ q.
The results are presented in Figure 2, which contains
a succession of values for q= σY / σ X , together with therespective exact distributions of the W statistic under H0: R=1/2, generated by taking independent random samplesof sizes m=n=5, within the class of continuous uniformdistributions determined by the respective q value.
True significance levels for the MWW typetest for the continuous uniform family
when m=n=4 and m=n=5
Now the behavior of the true level of significance of the standard MWW test is studied; that is, the test definedin (2) and (3) to contrast the hypotheses given in (4), undera situation where the variances of the two uniformdistributions to be compared are different. In this context,a precise definition of the true level of significance ( αR)is given as follows:
α R = P{Reject H0 using standard MWWH0 is true},
that is, α α R P W w P X Y N
= ≥ < =a fm r1 2 / .
Note that α R is a function of α N , σ X and σY .
The values of the true level of significance of the
MWW type test obtained from the distributions given inFigures 1 and 2, correspond to the cases m=n=4 andm=n=5 which are presented in Table 1.
In the second column of Table 1,values of α R arepresented for the m=n=4 case, alternative hypothesis[Ha: R>1/2], and different values of q= σY / σ X for thedecision rule: “Reject H0 if W ≥24”, which produces avalue α N =0.0571.
In the third column of Table 1, values of α R arepresented for the m=n=4 case, alternative hypothesis
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 11/13
JUÁREZ-HERNÁNDEZ et al.: LA PRUEBA DE MANN-WHITNEY-WILCOXON 233
F i g u r a 2 . F u n c i ó n d e d e n s i d a d d e p r o b a
b i l i d a d e s e x a c t a d e l a e s t a d í s t i c a W t i p o M W
W p a r a m u e s t r a s d e t a m a ñ o m = n = 5 p r o v e n
i e n t e s d e l a s d i s t r i b u c i o n e s U ( µ − θ , µ + θ ) y U ( µ − q θ , µ + q θ ) , c o n 0 < q ≤ 1 .
F i g u r e 2 . D e n s i t y f u n c t i o n o f e x a c t p r o b
a b i l i t i e s o f t h e M W W t y p e W s
t a t i s t i c f o r m = n = 5 s a m p l e s i z e s f r o m t h e d i s t r i b u t i o n s U ( µ − θ , µ + θ ) a n d U ( µ − q θ , µ + q θ ) , w i t h
0 < q ≤ 1 .
0 . 0
2 0 5
0 . 0
0 4 5
0 . 0
0 5 2
0 . 0
0 5 3
0 . 0
0 6 0
0 . 1
0 3 5
0 . 0
1 9 6
0 . 0
2 1 0
0 . 0
2 1 1
0 . 0
2 2 5
0 . 2
0 7 7
0 . 0
3 2 2
0 . 0
3 1 6
0 . 0
3 1 6
0 . 0
3 2 2
0 . 2
0 7 7
0 . 0
2 2 5
0 . 0
2 1 1
0 . 0
2 1 0
0 . 0
1 9 6
0 . 1
0 3 5
0 . 0
0 6 0
0 . 0
0 5 3
0 . 0
0 5 2
0 . 0
0 4 5
0 . 0
2 0 5
0
0 . 0
5
0 0 . . 1 1
5 0
0 . 1
0
0 . 1
0
0 . 1
0
0 0 . . 2 2
5 0
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
0 . 0
1 3 6
0 . 0
0 6 1
0 . 0
0 8 2
0 . 0
0 8 6
0 . 0
1 0 7
0 . 0
7 0 3
0 . 0
2 9 6
0 . 0
3 3 6
0 . 0
3 4 6
0 . 0
3 8 7
0 . 1
4 3 2
0 . 0
5 3 0
0 . 0
5 1 5
0 . 0
5 1 5
0 . 0
5 3 0
0 . 1
4 3 2
0 . 0
3 8 7
0 . 0
3 4 6
0 . 0
3 3 6
0 . 0
2 9 6
0 . 0
7 0 3
0 . 0
1 0 7
0 . 0
0 8 6
0 . 0
0 8 2
0 . 0
0 6 1
0 . 0
1 3 6
0
0 . 0
5
0 . 1
5
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
0 . 0
0 9 2
0 . 0
0 6 2
0 . 0
0 9 5
0 . 0
1 0 7
0 . 0
1 4 2
0 . 0
5 0 4
0 . 0
3 4 0
0 . 0
4 0 5
0 . 0
4 3 2
0 . 0
4 9 6
0 . 1
0 5 8
0 . 0
6 5 3
0 . 0
6 3 5
0 . 0
6 3 5
0 . 0
6 5 3
0 . 1
0 5 8
0 . 0
4 9 6
0 . 0
4 3 2
0 . 0
4 0 5
0 . 0
3 4 0
0 . 0
5 0 4
0 . 0
1 4 2
0 . 0
1 0 7
0 . 0
0 9 5
0 . 0
0 6 2
0 . 0
0 9 2
0
0 . 0
2
0 . 0
4
0 . 0
6
0 . 0
8
0 . 1
2
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
0 . 0
0 6 6
0 . 0
0 5 6
0 . 0
0 9 6
0 . 0
1 1 8
0 . 0
1 6 5
0 . 0
3 9 2
0 . 0
3 5 5
0 . 0
4 3 5
0 . 0
4 8 5
0 . 0
5 6 5
0 . 0
8 5 9
0 . 0
7 1 8
0 . 0
7 0 7
0 . 0
7 0 7
0 . 0
7 1 8
0 . 0
8 5 9
0 . 0
5 6 5
0 . 0
4 8 5
0 . 0
4 3 5
0 . 0
3 5 5
0 . 0
3 9 2
0 . 0
1 6 5
0 . 0
1 1 8
0 . 0
0 9 6
0 . 0
0 5 6
0 . 0
0 6 6
0
0 . 0
2
0 . 0
4
0 . 0
6
0 . 0
8
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
0 . 0
0 5 1
0 . 0
0 4 9
0 . 0
0 9 2
0 . 0
1 2 2
0 . 0
1 8 0
0 . 0
3 3 1
0 . 0
3 5 8
0 . 0
4 4 4
0 . 0
5 2 0
0 . 0
6 0 5
0 . 0
7 6 5
0 . 0
7 4 6
0 . 0
7 4 9
0 . 0
7 4 9
0 . 0
7 4 6
0 . 0
7 6 5
0 . 0
6 0 5
0 . 0
5 2 0
0 . 0
4 4 4
0 . 0
3 5 8
0 . 0
3 3 1
0 . 0
1 8 0
0 . 0
1 2 2
0 . 0
0 9 2
0 . 0
0 4 9
0 . 0
0 5 1
0
0 . 0
2
0 . 0
4
0 . 0
6
0 . 0
8
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
0 . 0
0 4 4
0 . 0
0 4 4
0 . 0
0 8 6
0 . 0
1 2 3
0 . 0
1 9 0
0 . 0
2 9 9
0 . 0
3 5 8
0 . 0
4 4 2
0 . 0
5 4 1
0 . 0
6 2 5
0 . 0
7 2 7
0 . 0
7 5 4
0 . 0
7 7 4
0 . 0
7 7 4
0 . 0
7 5 4
0 . 0
7 2 7
0 . 0
6 2 5
0 . 0
5 4 1
0 . 0
4 4 2
0 . 0
3 5 8
0 . 0
2 9 9
0 . 0
1 9 0
0 . 0
1 2 3
0 . 0
0 8 6
0 . 0
0 4 4
0 . 0
0 4 4
0
0 . 0
2
0 . 0
4
0 . 0
6
0 . 0
8
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
0 . 0
0 4 1
0 . 0
0 4 1
0 . 0
0 8 1
0 . 0
1 2 1
0 . 0
1 9 6
0 . 0
2 8 3
0 . 0
3 5 7
0 . 0
4 3 8
0 . 0
5 5 2
0 . 0
6 3 3
0 . 0
7 1 6
0 . 0
7 5 5
0 . 0
7 8 9
0 . 0
7 8 9
0 . 0
7 5 5
0 . 0
7 1 6
0 . 0
6 3 3
0 . 0
5 5 2
0 . 0
4 3 8
0 . 0
3 5 7
0 . 0
2 8 3
0 . 0
1 9 6
0 . 0
1 2 1
0 . 0
0 8 1
0 . 0
0 4 1
0 . 0
0 4 1
0
0 . 0
2
0 . 0
4
0 . 0
6
0 . 0
8
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
0 . 0
0 4 0
0 . 0
0 4 0
0 . 0
0 7 9
0 . 0
1 1 9
0 . 0
1 9 8
0 . 0
2 7 8
0 . 0
3 5 7
0 . 0
4 3 7
0 . 0
5 5 6
0 . 0
6 3 5
0 . 0
7 1 4
0 . 0
7 5 4
0 . 0
7 9 4
0 . 0
7 9 4
0 . 0
7 5 4
0 . 0
7 1 4
0 . 0
6 3 5
0 . 0
5 5 6
0 . 0
4 3 7
0 . 0
3 5 7
0 . 0
2 7 8
0 . 0
1 9 8
0 . 0
1 1 9
0 . 0
0 7 9
0 . 0
0 4 0
0 . 0
0 4 0
0
0 . 0
2
0 . 0
4
0 . 0
6
0 . 0
8
w 1 5
w 2 1
w 2 7
w 3 3
w 3 9
1 5
1 6
1 7
1 8
1 9
2 0
2 1
2 2
2 3
2 4
2 5
2 6
2 7
2 8
2 9
3 0
3 1
3 2
3 3
3 4
3 5
3 6
3 7
3 8
3 9
4 0
1 5
1 6
1 7
1 8
1 9
2 0
2 1
2 2
2 3
2 4
2 5
2 6
2 7
2 8
2 9
3 0
3 1
3 2
3 3
3 4
3 5
3 6
3 7
3 8
3 9
4 0
q =
/
= 1 /
8
σ
σ Y
X
q =
/
= 5 / 8
σ
σ Y
X
q =
/
= 3 / 4
σ σ Y
X
q =
/
= 7 / 8
σ
σ Y
X
q =
/
= 1 . 0
( C a s o e s t á n d a r )
σ
σ Y
X
q =
/
= 1 / 4
σ σ Y
X
q =
/
= 3 / 8
σ
σ Y
X
q =
/
= 1 / 2
σ
σ Y
X
G r á f i c a d e p
( w )
p ( w )
w
p ( w )
p ( w )
p ( w )
G r á f i c a d e p ( w )
G r á f i c a d e p ( w )
G r á
f i c a d e p ( w )
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 12/13
AGROCIENCIA VOLUMEN 35, NÚMERO 2, MARZO-ABRIL 2001234
α R =P{Rechazar H0 usando MWW estándarH0 es cierta},
esto es, α α R P W w P X Y N
= ≥ < =a fm r1 2 / .
Nótese que α R es una función de α N , σ X y σY .
Los valores del nivel de significancia real de la prue-ba tipo MWW obtenidos de las distribuciones dadas enlas Figuras 1 y 2, corresponden a los casos m=n=4 ym=n=5 que se presentan en el Cuadro 1.
En la segunda columna del Cuadro 1 se presentan losvalores de α R para el caso m=n=4, hipótesis alternativa[Ha: R>1/2], y diferentes valores de q= σY / σ X para laregla de decisión: “Rechazar H0 si W ≥24”, que produceun valor α N =0.0571.
En la tercera columna del Cuadro 1 se presentan losvalores de α R para el caso m=n=4, hipótesis alternativa[Ha: R≠1/2], y diferentes valores de q= σY / σ X para laregla de decisión: “Rechazar H0 si W ≤11 ó W ≥25”, que
produce un valor α N =0.0571.En la cuarta columna del Cuadro 1 se presentan losvalores de α R para el caso m=n=5, hipótesis alternativa[Ha: R>1/2], y diferentes valores de q= σY / σ X para la reglade decisión: “Rechazar H0 si W ≥36”, que produce unvalor α N =0.0476.
En la quinta columna del Cuadro 1 se presentan losvalores de α R para el caso m=n=5, hipótesis alternativa[Ha: R≠1/2], y diferentes valores de q= σY / σ X para la re-gla de decisión: “Rechazar H0 si W ≤18 ó W ≥37”, queproduce un valor α N =0.0556.
[Ha: R>1/2], and different values of q= σY / σ X for thedecision rule: “Reject H0 if W≤11 or W≥25”, whichproduces a value aN=0.0571.
In the fourth column of Table 1, values of α R arepresented for the m=n=5 case, alternative hypothesis[Ha: R>1/2], and different values of q= σY / σ X for thedecision rule “Reject H
0if W≥36”, which produces a
value α N =0.0476.In the fifth column of Table 1, values of α R are
presented for the m=n=5 case, alternative hypothesis[Ha: R≠1/2], and different values of q= σY / σ X for thedecision rule: “Reject H0 if W≤18 or W≥37”, whichproduces a value α N =0.0556.
RESULTS AND DISCUSSION
It has been demonstrated that the MWW type statistics,under H0: R=1/2, in the family of continuous uniformdistributions, has a symmetric distribution which is
independent of the location parameter and depends solelyon the ratio of the standard deviations of the distributionsfrom which the random samples come. The exactdistribution of the statistic under H0: R=1/2, for the classof continuous uniform distributions, when the sizes of the samples are m=n∈{4,5} was obtained. A rapidtendency toward normality of the statistic in the standardcase and an erratic behavior in the cases in which thecoefficient of the standard deviations tends toward zeroor infinity can be observed. On the other hand, as can beseen in Table 1, for m=n=4 and hypothesis H a: R>1/2,
Cuadro 1. Valores reales de los niveles de significancia para valores diferentes de q= σY / σ
X en la prueba tipo MWW, cuando los tamaños de
las muestras son m=n=4 y m=n=5, y las hipótesis alternativas son de una y dos colas.Table 1. Real values of the levels of significance for different values of q= σ
Y / σ
X in the MWW type test when the sizes of the samples are
m=n=4 and m=n=5, and the alternative hypotheses are one and two tails.
(m=n=4) (m=n=5)
q= σY / σ X α R α R
[Ha: P( X <Y )>1/2] [Ha: P( X <Y )≠1/2] [Ha: P( X <Y )>1/2] [Ha: P( X <Y )≠1/2]
1/8 0.0669 0.1120 0.0415 0.07111/4 0.0684 0.0987 0.0472 0.07303/8 0.0676 0.0863 0.0497 0.07101/2 0.0655 0.0757 0.0501 0.06725/8 0.0627 0.0673 0.0495 0.06303/4 0.0600 0.0614 0.0486 0.0592
7/8 0.0580 0.0581 0.0479 0.05651.0† 0.0571 0.0571 0.0476 0.05568/7 0.0580 0.0581 0.0479 0.05654/3 0.0600 0.0614 0.0486 0.05928/5 0.0627 0.0673 0.0495 0.06302.0 0.0655 0.0757 0.0501 0.06728/3 0.0676 0.0863 0.0497 0.07104.0 0.0684 0.0987 0.0472 0.07308.0 0.0669 0.1120 0.0415 0.0711
† Niveles de significancia nominalesvNominal levels of significance.
8/3/2019 Mann Witney Wisconsox
http://slidepdf.com/reader/full/mann-witney-wisconsox 13/13
JUÁREZ-HERNÁNDEZ et al.: LA PRUEBA DE MANN-WHITNEY-WILCOXON 235
RESULTADOS Y DISCUSIÓN
Se demostró que la estadística tipo MWW, bajoH0: R=1/2, en la familia de distribuciones uniformes con-tinuas, tiene una distribución simétrica e independientedel parámetro de posición, que depende únicamente dela razón de las desviaciones estándar de las distribucio-nes de donde provienen las m.a. Se determinó la distri-bución exacta de la estadística bajo H0: R=1/2, para laclase de distribuciones uniformes continuas, y tamañosde muestra m=n∈{4,5}. Puede observarse una rápida ten-dencia a la normalidad de la estadística en el caso estándary un comportamiento errático cuando el cociente de lasdesviaciones estándar tiende a cero o a infinito. Por otrolado, como se puede verse en el Cuadro 1, para m=n=4 y
la hipótesis Ha: R>1/2, se tiene que
Máxq
R N α α− ≤0.0113, para 1/8≤q≤8; esto significa
que la prueba de MWW es robusta aun cuando el cocien-
te de las desviaciones estándar de las distribuciones dedonde se toman las muestras es 8. Si Ha: R≠1/2, la prue-ba es poco robusta cuando 0<q≤3/8 ó q≥8/3, pero es
robusta cuando 3/8<q<8/3, ya que en este último caso
Máxq
R N α α− ≤ 0.0292. Para el caso m=n=5, la prueba
es muy robusta cuando Ha: R>1/2 y 1/8≤q≤8, ya que
Máxq
R N α α− ≤ 0.0025. Si Ha: R≠1/2 y 1/8≤q≤8, la
prueba también es robusta ya que
Máxq
R N α α− ≤0.0174.
Se observa además que la estadística tipo MWW tien-
de al comportamiento estándar en forma continua cuan-do q→1.
CONCLUSIONES
La prueba de rangos tipo MWW para contrastar lashipótesis [H0: R=1/2] vs [Ha: R>1/2] ó [Ha: R≠1/2],cuando las distribuciones de donde provienen las mues-tras son uniformes continuas con varianzas diferentes,
tiene un buen comportamiento en su nivel de signifi-
cancia en ambos casos, ya que Máxq
R N α α− < 0.018
para 1/8≤
q≤
8; siendo esta prueba altamente robusta
respecto a su nivel de significancia, cuando [Ha: R>1/2].
Maxq
R N α α− ≤0.0113 , for 1/8≤q≤8; that is, the
MWW test is robust even when the coefficient of the
standard deviations of the distributions from which thesamples are taken is 8. If H a: R≠1/2, the test is not veryrobust when 0<q≤3/8 or q≥8/3, but it is robust when
3/8<q<8/3, since, in the latter case,Max
qR N
α α− ≤0.0292. For the m=n=5 case, the test
is highly robust when Ha: R>1/2 and 1/8≤q≤8,
sinceMaxq
R N α α− ≤0.0025. If Ha: R≠1/2 and 1/8≤q≤8,
the test is also robust, since Maxq
R N α α− ≤ 0.0174.
Furthermore, it is observed that the MWW type
statistic continuously tends toward a standard behaviorwhen q→1.
CONCLUSIONS
The rank test MWW type for contrasting hypotheses[H0: R=1/2] vs [Ha: R>1/2] or [Ha: R≠1/2], when thedistributions from which the samples arises are uniform
and continuous with different variances, performs well
in its significance level since Maxq
R N α α− ≤ 0.018 for
1/8≤q≤8, being highly robust in terms of its significance
level when [Ha: R>1/2].
—End of the English version—
LITERATURA CITADA
Hamdy, M. I. 1995. Distribution-free confidence intervals for Pr(X<Y)based on independent samples of X and Y. Comm. Statist.-Simula. 24: 1005-1017.
Hodges, J. L., Jr., and E. L. Lehmann. 1956. The efficiency of somenonparametric competitors of the t-test. Ann. Math. Stat. 27:324-335.
Lehmann, E. L. 1951. Consistency and unbiasedness of certainnonparametric tests. Ann. Math. Stat. 22: 165-179.
Mann, H. B., and D. R. Whitney 1947. On a test of whether one of two random variables is stochastically larger than the other. Ann.Math. Stat. 18: 50-60.
Randles, R. H., and D. A. Wolfe 1979. Introduction to the Theory of Nonparametric Statistics. John Wiley & Sons. New York . 450 p.
Stephen W. 1993. Mathematica . A System for Doing Mathematicsby Computer. 2nd. ed. Wolfram Research, Inc. Champaign, Ill.961 p.
Wilcoxon, F. 1945. Individual comparisons by ranking methods.Biometrics 1: 80-83.