A Welch-próba vagy más néven d-próba a statisztikai hipotézisvizsgálatok közül a paraméteres próbák közé tartozik. A próba azt vizsgálja, hogy két külön mintában egy-egy valószínűségi változó átlagai egymástól szignifikánsan különböznek-e.

A próba alkalmazásának feltételei szerkesztés

a vizsgált valószínűségi változók

A próba nullhipotézise szerkesztés

Nullhipotézis: a két mintában a két átlag statisztikai szempontból megegyezik.

Alternatív hipotézis: a két mintában a két átlag statisztikai szempontból nem egyezik meg.

A "statisztikai szempontból" kifejezés itt arra utal, hogy az eltérés a két átlag között olyan minimális, hogy pusztán csak a véletlen ingadozásnak tulajdonítható (ekkor a két átlag statisztikai szempontból azonosnak tekinthető), vagy jelentősen nagyobb, mint ami a véletlennel magyarázható (ekkor a két átlag statisztikai szempontból nem tekinthető azonosnak).

Valójában a fenti két hipotézis precíz matematikai megfogalmazása a következő.

  • H0: Az X és Y valószínűségi változók várható értékei megegyeznek, (E(X) = E(Y)).
  • H1: Az X és Y valószínűségi változók várható értékei nem egyeznek meg, (E(X) ≠ E(Y)).

A próbastatisztika szerkesztés

A Welch-próba próbastatisztikája

 

ahol

  •   az egyik valószínűségi változó átlaga a mintájában,
  •   a másik valószínűségi változó átlaga a mintájában,
  • sx az egyik valószínűségi változó becsült szórása,
  • sy a másik valószínűségi változó becsült szórása,
  • n az egyik minta elemszáma,
  • m a másik minta elemszáma.

A próba végrehajtásának lépései szerkesztés

  1. Az t próbastatisztika értékének kiszámítása.
  2. A p szignifikanciaszint megválasztása. (Ez a legtöbb vizsgálat esetén 0,05 vagy 0,01.)
  3. A p szignifikanciaszinttől függő tp érték kiválasztása a próbának megfelelő táblázatból. A táblázat jelen esetben a t-eloszlás táblázata, mely eloszlásra szoktak úgy is utalni, mint Student-eloszlás, illetve Student-féle t-eloszlás. A táblázat kétdimenziós, a p szignifikanciaszint és az f szabadsági fok ismeretében azonnal megkapjuk a táblázatbeli tp értéket. Az f szabadsági fok a Welch-próba esetén az  összefüggés alapján a jobb oldal reciprokaként adódik. (Mivel ezt láthatóan meglehetősen bonyolult számolni, a gyakorlatban helyette sokszor egy – a Megjegyzésekben bemutatott – egyszerűsítéssel élnek.)
  4. A nullhipotézisre vonatkozó döntés meghozása.
    • Ha |t| ≥ tp, akkor a nullhipotézist elvetjük, az alternatív hipotézist tartjuk meg, és az eredményt úgy interpretáljuk, hogy
      a két mintában a valószínűségi változók átlagai szignifikánsan eltérnek egymástól (p szignifikancai szint mellett).
    • Ha |t| < tp, akkor a nullhipotézist megtartjuk, amit úgy interpretálunk, hogy
      a Welch-próba nem mutat ki szignifikáns különbséget a két mintában a valószínűségi változók átlagai között (p szignifikanciaszint mellett).

Példa szerkesztés

A próba matematikai háttere szerkesztés

A próba matematikai hátterének legfontosabb gondolata, hogy bármely X és Y független, normális eloszlású valószínűségi változóra vett X1, X2, … Xn illetve Y1, Y2, … Xm minták esetén az

 

valamint az

 

jelölésekkel élve megmutatható, hogy a

 

valószínűségi változó t-eloszlást követ a fenti képlet alapján számítható f szabadsági fokkal.

Emiatt az f szabadsági fokú t-eloszlás ismeretében bármilyen 1 > p > 0 esetén meg lehet határozni azt az tp értéket, melyre teljesül hogy ha igaz a nullhipotézis, akkor a t próbastatisztika értéke 1-p valószínűséggel jó közelítéssel a (-tp, tp) intervallumba esik.

Megjegyzések szerkesztés

  • Az f szabadsági fokot az
 
képlet alapján számítani igen bonyolult. Megmutatható azonban, hogy – az fmin = min {n – 1; m – 1} és fmax = n + m - 2 jelölésekkel élve – teljesül, az fminffmax összefüggés, vagyis az f értéke két nagyon könnyen számítható korlát közé szorítható. Ennek felhasználásával az f fáradságos kiszámítása sokszor elkerülhető.
Mivel fix p mellett a t-eloszlás táblázatának értékei f növelésével nőnek biztos, hogy tmint ptmax, ahol tmin, t p és tmax rendre a p szignifikanciaszinthez és fmin, f és fmax szabadsági fokhoz tartozó t-eloszlás táblázatában található értékek. Így |t| ≥ tmax esetén biztos, hogy |t| ≥ tp is teljesül, vagyis a nullhipotézis elvetéséhez elegendő, hogy |t| ≥ tmax teljesüljön. Hasonlóan |t| < tmin esetén biztos, hogy |t| < tp is teljesül, s így a nullhipotézis megtartásához |t| < tmin is elegendő.
  • Egy másik lehetőség az f fáradságos kiszámításának megkerülésére annak a felhasználása, hogy ha m és n elég nagy (általában az m > 40, n > 40 feltételt szokták megadni), akkor a t-táblázat helyett lehet a standard normális eloszlás táblázatát használni ugyanúgy, mint például az egymintás u-próba (vagy egyébként bármely u-próba) esetén. Ezt azért lehet megtenni, mert ilyen magas n és m értékek mellett a t-eloszlás nagyon közel van a normális eloszláshoz (a t-eloszlás a szabadsági fok növelésével aszimptotikusan normális eloszlású).
  • A Welch-próba bizonyos tekintetben a kétmintás u-próba párja. A kétmintás u-próba ugyanezt a nullhipotézist vizsgálja, csak feltétele az szórások értékének előzetes ismerete is, s nem a minták adatai alapján becsli azokat. A próbastatisztika képlete is nagyon hasonló, csak benne az becsült sx és sy szórások helyett az eleve ismert σx és σy szórások szórások szerepelnek. A két próba matematikai háttere is nagyon hasonló.
  • Szintén szoros a kapcsolat a Welch-próba és a kétmintás t-próba között. Ez a két próba is ugyanazt a nullhipotézist teszteli, ugyanolyan adottságok mellett, csak a kétmintás t-próba feltételezi, hogy a két valószínűségi változó szórásai megegyeznek, míg a Welch-próbához nincs szükségünk ilyen feltételezésre. Ennek a két próbának a képlete viszont jelentősen különbözik egymástól.
  • A szakirodalom nem teljesen egységes annak tekintetében, hogy a nullhipotézis elvetéséről vagy megtartásáról szóló döntésben az |t| és tp közötti két egyenlőtlenség közül melyiknél engedi meg az egyenlőséget. Ennek gyakorlati jelentősége nem igazán van, az alkalmazások során nagyon ritkán adódik, hogy a kiszámított próbastatisztika pontosan egybeessen a táblázatbeli értékkel. Ha esetleg mégis így alakul, akkor az eredmény úgy interpretálható, hogy a nullhipotézis elvetése esetén a kockázat pontosan megegyezik a szignifikanciaszinttel, s innen a kutató (és a tudós társadalom) szája ízétől függ, hogy ebben inkább a nullhipotézis elvetésének, vagy inkább a nullhipotézis megtartásának zálogát látja.
  • Érdemes megfigyelni az óvatos fogalmazást a nullhipotézis megtartása esetén. Az általunk meghatározott p szignifikanciaszint az elsőfajú hiba elkövetésének valószínűségét adja meg. Ha el tudom vetni a nullhipotézist, ekkora kockázatot vállalok arra nézve, hogy esetleg hiba elvetni. Amennyiben viszont nem tudom elvetni a nullhipotézis, akkor elsőfajú hibát biztosan nem fogok elkövetni, ám elkövethetek másodfajú hibát, melynek kockázatáról semmit nem mond a próba. Ez indokolja, hogy ha a nullhipotézist megtartjuk, akkor nem azt mondjuk, hogy nincs szignifikáns különbség a minta átlaga és az előre megadott m érték között, hanem hogy a Welch-próba nem tudott szignifikáns különbséget kimutatni (ami ettől még lehet, hogy van).

Források szerkesztés

  • Fazekas I. (szerk.) (2000): Bevezetés a matematikai statisztikába. Kossuth Egyetemi Kiadó, Debrecen.
  • Lukács O. (2002): Matematikai statisztika. Műszaki Könyvkiadó, Budapest.
  • Michaletzky Gy. – Mogyoródi J. (1995): Matematikai statisztika, Nemzeti Tankönyvkiadó, Budapest.
  • Michelberger P. – Szeidl L. – Várlaki P. (2001): Alkalmazott folyamatstatisztika és idősor-analízis. Typotex Kiadó, Budapest.
  • Vargha A. (2000): Matematikai statisztika pszcihológiai, nyelvészeti és biológiai alkalmazásokkal. Pólya Kiadó, Budapest.