„Mann–Whitney-próba” változatai közötti eltérés

[nem ellenőrzött változat][nem ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
a Vépi átnevezte a(z) Mann-Whitney próba lapot a következő névre: Mann–Whitney-próba: helyesírás
helyes elnevezés
2. sor:
== Bevezetés ==
 
A statisztikában a MannMann–Whitney-Whitney próba (más néven: MannMann–Whitney–Wilcoxon-Whitney-Wilcoxon vagy Wilcoxon-féle- rangösszeg teszt) a két mintás t-próba nem parametrikus megfelelője, amelyet nem normál eloszlás valamint ordinális változók esetén használunk. Tehát ezzel a teszttel is azt a nullhipotézist vizsgáljuk miszerint a két minta ugyanabból a populációból származik.
 
== Történeti áttekintés ==
A MannMann–Whitney-Whitney teszt statisztikai háttere először 1914-ben jelent meg egy cikkben, amely a német Gustav Deuchler nevéhez köthető.
Frank Wilcoxon 1945-ben már említést tesz a kétmintás próbáról egyenlő elemszámok mellett, valamint már publikál egy szignifikancia tesztet a null hipotézis alátámasztására egy alternatív hipotézissel szemben.
 
13. sor:
== A teszt használatának feltételei ==
A MannMann–Whitney-Whitney tesztet a t-teszt használati feltételeinek sérülése esetén használjuk, például, ha az adatok nem normál eloszlásúak vagy a két minta varianciája szignifikánsan különbözik és ezért nem végezhető el a t-teszt.
<br />
A teszt használatának feltételei:
30. sor:
A próba értéke általában a kisebb elemszámú csoport rangösszege (de lehet a nagyobb elemszámú csoporté is).
Kitekintés: Az egyik csoport rangszámai nagy valószínűséggel magasabb értéket mutatnak, mint a másik csoporté, ezt azonban akkor tudjuk pontosan meghatározni, ha ismerjük a csoportok nagyságait. Például: a 2-es nem nagy rang érték egy 5 elemből álló csoportba, de egy 50 elemből álló mintába lehet. Vegyünk például egy versenyt, ahol ha 5 versenyzőből másodikként érsz be nem annyira nagy eredmény mintha 50-ből lennél második.
A MannMann–Whitney-Whitney próbához tartozó táblázatból a csoport elemszámainak segítségével tudjuk meghatározni azt az intervallumot, amelybe, ha a vizsgált rangösszeg beleesik akkor nem szignifikáns a különbség, ha kívül esik, akkor elvetjük a nullhipotézist.
Normál eloszláshoz való közelítés
A táblázat azonban csak kis elemszámok esetén használható. Nagy elemszám esetén normál eloszláshoz való közelítést kell alkalmazni.
42. sor:
A z érték kiszámítása után standard normál eloszlás és 0,05-ös szignifikancia szint mellett a kritikus érték 1,96, ha ennél a │z│nagyobb, akkor a két minta közti különbség szignifikáns 5%-os szinten.
 
Mann-WhitneyMann–Whitney U statisztika
A Mann-WhitneyMann–Whitney U statisztikának az alapja a két csoport elemeinek a párba állítása. Tehát, az egyik csoport minden elemét (Ai) párba állítjuk a másik csoport minden elemével (Bi). Az így keletkezett párok száma n1n2.
Ezek után megvizsgáljuk, hogy hány olyan párosítás van, ahol az első szám nagyobb, mint a másik (Ai>Bi). Ezeknek a pároknak a száma tulajdonképpen a Mann- Whitney U statisztika.
Ha a két csoport nem különbözik, akkor körülbelül ugyan annyi olyan pár lesz, ahol Ai<Bi , mint amennyiben Ai>Bi . Ha az egyik típusú pár aránya nagyban eltér a másiktól valószínűleg különbség van a két populációban a számok eloszlásában.
62. sor:
"U" _"1" +"U" _"2" ="n" _"1" "n" _"2"
 
A kisebb elemszámú csoport U értékének meghatározása után, a MannMann–Whitney-Whitney próbához tartozó U érték táblázat segítségével az elemszámoknak megfelelő cellában találjuk azt az intervallumot, amelyen ha az adott U érték kívül esik, 0,05-os szinten a különbség szignifikáns.
 
Ezek alapján a normál eloszláshoz való közelítés képlete megfogalmazható más módon is:
98. sor:
nA= 7 nB=6 N=13 RA=62 RB=29
Mivel általában a kisebb elemszámú csoport rangösszegét használjuk, így RB értékét figyeljük.
A MannMann–Whitney-Whitney táblázatban a két elemszám segítségével kideríthető, hogy a kritikus intervallum a 34-64 közötti rész. Tehát azt látjuk, hogy RB értéke kívül esik a kritikus intervallumon, tehát szignifikánsan különbözik a két csoport 0,05-ös szignifikancia szint mellett.
Mann-WhitneyMann–Whitney U Statisztika
Az előbbi példát nézve
"U" _"A" ="62"-("7" ("7" +"1" ))/"2"
111. sor:
"U" _"A" +"U" _"B" ="42"
 
A kisebb UB értéket figyelembe véve a MannMann–Whitney-Whitney táblázatban a két elemszám segítségével láthatjuk, hogy a kritikus intervallum a 34-64 közötti rész. Tehát azt látjuk, hogy U értéke kívül esik a kritikus intervallumon, tehát szignifikánsan különbözik a két csoport 0,05-ös szignifikancia szint mellett.
Normál eloszláshoz való közelítés
Tegyük fel, hogy a nagy érdeklődésre való tekintettel a vizsgálatokat országos szinten megismételték. A résztvevők száma azonban így már meghaladta a 60-at is.
118. sor:
nB=32 RB=1222
N= 64
A MannMann–Whitney-Whitney érték táblázatban nincs 64 elem, így normál eloszláshoz való közelítést alkalmazunk.
"Z"=("R" _"k" -"n" _"k" ("n" _"k" +"n" _"n" +"1" )⁄"2" )/√(("n" _"k" "n" _"n" ("n" _"k" +"n" _"n" +"1" ))/"12" )
"Z"=("858" -"31" ("31" +"32" +"1" )⁄"2" )/√(("31*32" ("31" +"32" +"1" ))/"12" )
125. sor:
Ebben az esetben a z abszolút értéke kisebb, mint 1,96 , tehát nincs szignifikáns különbség a két csoport között.
 
A MannMann–Whitney- Whitney próba t teszttel való összehasonlítsa
 
Ordinális adatok
Ordinális adatok esetén a MannMann–Whitney-Whitney tesztet kell választani.
 
Robosztusság
A MannMann–Whitney-Whitney teszt sokkal robosztusabb, mivel a t-teszthez képest a MannMann–Whitney-Whitney próba kevésbé hajlamos hamis szignifikáns eredményt mutatni az outlierek miatt. Ez azért lehetséges, mivel ha a mintánk tartalmaz egy olyan adatpontot, ami messze van az átlagtól (két szórásnyira), akkor az ronthatja a t-próba eredményeit. Azonban, ha az adatokat ordinálissá teszem, sorba állítom őket, nem lesz egy igazán félreeső adatom se, mindenki egyenlő távolságra lesz a másiktól (kivéve az egyenlő értékeket).
 
Hatékonyság
144. sor:
 
Publikálás
A MannMann–Whitney-Whitney teszt esetében az alábbi eredményeket szükséges publikálni:
a minták valamely középértéke (átlag, medián – mióta a Mann-WhitneyMann–Whitney ordinális teszt, azóta a medián ajánlott)
U értéke
a minták nagysága
159. sor:
Kivitelezés
Sok programcsomag tartalmazza ma már a MannMann–Whitney-Whitney tesztet, amelynek segítségével gyorsan elvégezhetjük a szükséges tesztet.
 
MATLAB