Ezzel a bejegyzéssel már régóta adós vagyok, hiszen jó ideje foglalkozom már a különféle hipotézis vizsgálatokkal, és a Minitab elemzések bemutatásakor rendszeresen megjelent ez a bizonyos „P-Value”, azaz „P-érték” ami alatt általában egy nulla és egy közötti szám áll. A különféle statisztikai szoftverek helpjében általában csak az van megadva, hogy a különféle tesztek esetében mikor fogadjuk és mikor utasítsuk el a nullhipotézist, de azt szinte sohasem, hogy tulajdonképpen mi is ez. Na, ezen az apró hiányosságon szeretnék segíteni ezzel az írással.
Ha rákeresel arra, hogy mit jelent a P-érték, akkor a legtöbb oldalon mindenféle elméleti bla-bla található, ami alapján talán tudod használni ezt a számot valamire, de hogy nem fogod megérteni a jelentését, az biztos. Már korábban is említettem, hogy a statisztikai szoftverek készítőinek nem áll érdekében további információk megosztása a témában, mert akkor bárki ki tudná számolni, vagyis kevesebben használnának ilyen szoftvereket. Azt már nem annyira értem, hogy vajon a matematika tanárok, akiknek igazán semmilyen érdeke sem fűződik ahhoz, hogy eltitkolják ezt a „stratégiai jelentőségű” információt, vajon miért nem osztják meg a nyilvánossággal a P-érték tényleges jelentését, hiszen annyira nem űrtechnika, hogy ne lehetne megérteni hétköznapi aggyal. Csak rendesen kell elmagyarázni…
A P-értékről eddig általában csak azt tudtuk, hogy ha nagyobb a teszthez megadott α megbízhatósági szintnél, akkor elfogadjuk a nullhipotézist, ha meg kisebb akkor utasítsuk el. Vagyis ez alapján hozzuk meg a döntésünket. Hosszas keresgélés után találtam egy meghatározást, amely egy lépéssel közelebb vitt a megértéshez:
„… P values are the probability of observing a sample statistic that is at least as extreme as your sample statistic when you assume that the null hypothesis is true. …”
vagyis
„… A P-érték annak a valószínűsége, hogy találunk egy olyan mintát, amely statisztikai szempontból legalább olyan extrém értéket vesz fel, mint a próba statisztika, ha feltételezzük, hogy a nullhipotézis igaz …”
Jaj, ez így egy többszörösen összetett mondat, amiben hirtelen túl sok az információ. Viszont az alapgondolat elindít egy gondolatmenetet, amely már vezethet valahová. Talán emlékszel még arra, amikor egy dobókocka dobások eredményeiből létrehozott sokaságból jó sok mintát vettem és ezeknek a mintáknak az átlagait vizsgáltam (A nagy dobókocka kísérlet). Az előbb említett cikk egyik nagy tanulsága az volt, hogy ha egy sokaságból mintákat veszek, akkor a minták átlagai nem feltétlenül egyeznek meg a sokaság átlagával, sőt sokszor akár extrém értékeket is felvehetnek, azaz egészen nagy különbség is lehet egy-egy mintaátlag és a sokaság átlaga között.
Amikor hipotézis vizsgálatot végzünk, akkor általában a sokaságból kivett minta tulajdonságait vizsgáljuk, ezért ez esetben is a minta átlaga alapján szeretnénk megtudni valamit a sokaság átlagáról. Igen ám, de ez esetben is igaz az a tény, hogy ha ismerjük a minta átlagát (amely csak egyetlen minta a nagyon nagy számú lehetséges minta közül), akkor csak azt tudjuk, hogy a sokaság átlaga egy megadott tartományban van (Az átlag standard hibája). Vagyis a hipotézis vizsgálat során csak azt tudjuk eldönteni, hogy a sokaság átlaga benne van-e a minta átlagának megbízhatósági tartományában vagy sem. És mivel nulla valószínűség nincs, ezért adjuk meg, hogy 95%-os vagy 99%-os biztonsággal van-e benne a sokaság átlaga a minta átlagának megbízhatósági intervallumában.
Akkor ennek ismeretében fordítsuk le a fenti mondatot. Tegyük fel, hogy éppen egy hipotézis vizsgálatot végzünk és éppen kiszámoltuk a próba statisztikát. Az egyszerűség kedvéért vegyünk egy egymintás Z-próbát, hogy a standard normál eloszlással kelljen dolgoznunk. Mondjuk, hogy a kétoldali próba statisztikára kijött, hogy Z értéke 1,96 lett. Ha Z értéke 1,96, akkor az azt jelenti, hogy ha a minták átlagainak átlaga 0, ahogy az a standard normál eloszlás esetében lenni szokott, akkor nagyon sok minta esetében a mintáknak csak 2,5%-a esetében lenne a minták átlaga nagyobb, mint 1,96 és egy másik 2,5%-a esetében lenne kisebb, mint -1,96. Vagyis – ha a nullhipotézis igaz - a potenciális mintáknak 5%-a esetében lenne 1,96 vagy annál nagyobb, illetve -1,96, vagy annál kisebb. Ebben az esetben a P-érték pontosan 0,05, azaz 5%. Az alábbi ábra ezt mutatja be, bár angol nyelven.
Emiatt van az, hogy ha a P-érték nagyobb, mint 0,05, akkor a nullhipotézist nem tudjuk elvetni, hiszen 5%-nál nagyobb esélye van annak, hogy a sokaság átlaga benne van az általunk használt minta megbízhatósági tartományában, illetve megfordítva a dolgot, nem tudjuk kizárni, hogy a mintát abból a sokaságból vettük ki, amelyiket a nullhipotézis jelöli.
És ha jobban belegondolsz, nem vagyunk biztosak abban, hogy a minta ebből a sokaságból származik, mert származhat akár végtelen sok másik sokaságból is. Ha egy minta átlaga 0, de a mintaátlag megbízhatósági tartománya -1 és +1 között van, akkor a mintát kivehettük mindazon sokaságok közül, amelyek átlaga -1 és +1 között van!
Az egyetlen biztos döntés az, ha KI TUDJUK ZÁRNI, hogy a sokaság átlaga benne van a minta megbízhatósági tartományában. Ezért van az, hogy a hipotézis vizsgálatok jelentős része arra utazik, hogy ELVESSE a nullhipotézist és nem arra, hogy elfogadja azt. Ezen most biztos agyalni kell egy kicsit, de ha megnézed a fentebb hivatkozott bejegyzést, ott ugyanez ábrákkal is be van mutatva, azzal együtt talán könnyebb megemészteni az utolsó két bekezdést.
Az itt következő folyamatábra azt mutatja be, hogy hogyan határozzuk meg a P-értéket normál eloszlású egyoldali vagy kétoldali hipotézis vizsgálat esetén. Egyoldali vizsgálat esetén – akár bal-, akár jobboldali vizsgálatról van szó, a baloldali vagy a jobboldali 5%-ot vesszük figyelembe, így a P-érték mindig az lesz, ha a kiszámított Z-értékhez kikeressük a standard normál eloszlás táblázatból a hozzá tartozó valószínűséget, majd ezt kivonjuk 1-ből.
Ezt amiatt tesszük meg, mert a standard normál eloszlás táblázat a 0-tól jobbra eső részét adja meg a haranggörbének, és a valószínűségek 50%-tól kezdődnek, majd +3 környéként érik el majdnem az 1-et. Azaz, ha Z-re mondjuk kapok +1,96-ot, akkor az azt adja meg, hogy hol helyezkedik el a mintaátlagok 95%-a. De nekünk ennek pont az ellentettje kell, ezért kell a valószínűség értékét kivonni 1-ből.
Kétoldali hipotézis vizsgálat esetén vigyázni kell, mert nem a 95%-os, hanem a 97,5%-os valószínűséghez kell kikeresnünk a hozzá tartozó valószínűséget a táblázatból, azt ki kell vonni 1-ből a már fent említett okok miatt, viszont meg kell szorozni 2-vel, hogy megkapjuk a keresett 5%-ot.
Persze más típusú eloszlások (t-eloszlás, khí-négyzet eloszlás) esetében hasonlóan működik a dolog, csak a keresett 95%-os vagy 99%-os valószínűséghez tartozó t vagy khí-négyzet határértékek lesznek mások. Szerintem így már tényleg nem bonyolult, csak egy kis képzelőerő szükséges a P-érték jelentésének megértéséhez. És aki még ezek után sem érti, esetleg hallgassa meg dalban elbeszélve...
(A dal a képre kattintva indul el)