Statisztika egyszerűen

Mágikus jelek nélkül...

Trump és a nők négy év után – Kétmintás Z-próba előfordulás gyakoriságára (Test for 2-Proportions)

2019. július 30. 09:00 - glantos70

Statisztikai elemzések

2016 őszén az amerikai elnökválasztások végéhez közeledve a média részletesen elemezte az akkor még elnökjelölt viszonyát a nőkhöz, amely akkoriban és később is igencsak megkérdőjelezhető volt. Most, hogy közeledünk az újabb elnökválasztáshoz és tudjuk, hogy Trump újrázni akar, érdekes lehet feltenni a kérdést, hogy vajon a női szavazók hogyan vélekednek az elnökről, vajon mennyire tartják megbízhatónak és becsületesnek.

Az amerikai sajtóban jónéhány cikket lehet olvasni azokról a közvéleménykutatásokról, amelyekben kikérik az amerikai választópolgárok véleményét az elnök teljesítményéről. Ebben a megvilágításban érdekes lehet az, hogy vajon van-e különbség a férfiak és a nők véleményében Trump, mint elnök megbízhatóságáról. Az alábbi diagramon egy aktuális közvéleménykutatás eredménye látszik arról, hogy Trump mennyire őszinte és megbízható. A grafikonon az látszik, hogy kevesebb nő (Female - 37%) tartja őszintének és megbízhatónak az elnököt, mint a férfi (Male - 45%). De vajon elég jelentős eltérés-e ez ahhoz, hogy tényleg kijelenthessük, a nők kisebb arányban bíznak meg az elnökben, mint a férfiak?

 

Forrás:The Texas Politics Project – June 2019 University of Texas / Texas Tribune Poll (https://www.texaspolitics.utexas.edu/set/donald-trump-honest-and-trustworthy-june-2019#party-id)

Ez ismét egy remek lehetőség arra, hogy kipróbáljak egy újabb fajta hipotézis vizsgálatot, a kétmintás Z-próbát az előfordulási gyakoriságok vizsgálatára. Az előző két cikkben ennek az egymintás változatát mutattam be (Legyőzik a majmok a brókereket? és Hogyan csináld Minitab-bal - Egymintás Z-próba előfordulás gyakoriságára). Ahogyan a t-próba esetében is lehetőségünk volt arra, hogy egy minta átlagát hasonlítsuk össze egy sokaság átlagával vagy két független minta átlagát hasonlítsuk össze egymással, így az előfordulási gyakoriságok vizsgálatakor is. A logika ugyanaz, mint a kétmintás t-próba esetében (Az alkoholfogyasztás hatása a bowling eredményekre – kétmintás t-próba), azaz a két minta átlagát kivonjuk egymásból és ezt a különbséget fogjuk elosztani a két minta szórásának összegével. Esetünkben a próba statisztika képlete a következőképpen fog kinézni.

Itt mindjárt felmerül egy apró kérdés. Miért van a számlálóban a zárójel után a ’-0’? Ebben az esetben ennek semmi értelme sincs, legalábbis nem kell vele tennünk semmit sem. Viszont jelzi, hogy ha akarnánk, nemcsak azt tudnánk vizsgálni, hogy a két minta átlagának különbsége 0, de azt is hogy a két minta átlagának a különbsége egy megadott érték. Ha például úgy tettük volna fel a kérdést, hogy van-e legalább 8% különbség a férfiak és a nők aránya között, akik szerint Trump őszinte és becsületes, akkor a képletünk a következő módon nézne ki:

A számlálóban a (pférfi - p) a két minta előfordulási gyakoriságának a különbsége. A nevezőben a gyökjel alatt ugyanúgy a két minta bernoulli-eloszlás szerinti szórásának összege található, mint a 1-Proportion teszt esetében (Legyőzik a majmok a brókereket?).

Szerencsére megtaláltam a 2019 júniusi felmérés adatait, amiből kiderült, hogy összesen 1 375 Texas államban regisztrált választópolgárt kérdeztek meg, amelyből végül 564 férfi és 636 női (összesen 1 200) választópolgár adatait összesítették a végén.

Forrás: https://texaspolitics.utexas.edu/sites/texaspolitics.utexas.edu/files/201906_poll_toplines_final.pdf

Most már minden adatom megvan ahhoz, hogy ki tudjam számolni a próba statisztika értékét:

Mivel ismételten Z-próbáról van szó, azaz a standard normál eloszlást tudom alkalmazni a próba statisztika értékelésére (mert abból ugye csak egy van), ezért nem kell különösebben számolgatnom, csak elő kell vennem a korábban már többször alkalmazott táblázatot, ahol a határértékek a leggyakrabban alkalmazott esetekre előre ki lettek számolva.

A p = 0,05 megbízhatósági szintet és a jobb oldali ellenhipotézist alkalmazva a döntési határérték 1,64, ami KISEBB, mint a fent kiszámított Z = 2,857, azaz a nullhipotézist elutasítom és az ellenhipotézist fogadom el, tehát a teszt alapján értékelhető eltérés van a férfiak és a nők véleménye között, a nők véleménye kisebb arányban pozitív az elnök őszinteségéről és becsületességéről, mint a férfiaké.

Vajon mekkora lenne az az eltérés a két minta átlaga között, amelynél még éppen elfogadnám, hogy nincs különbség a férfiak és a nők véleménye között? Jó szokásomhoz híven ismét kiszámolom azt a legnagyobb különbséget, amely még éppen elfogadhatóvá tenné a nullhipotézist.

Azaz a jelenlegi 8%-os eltéréssel szemben, ha az eltérés csak 4,6% lenne a férfiak és a nők véleménye között, akkor még éppen elfogadnánk, hogy nincs lényeges különbség a férfiak és a nők véleménye között.  

Szólj hozzá!

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr6814914648

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása