Az előző bejegyzésben (Trump és a nők négy év után – Kétmintás Z-próba előfordulás gyakoriságára) sikerült megvizsgálnunk, hogy Donald Trump-nak mennyire sikerült belopnia magát a nők szívébe (hááát, vannak kétségeim). Akkor most szokásomhoz híven nézzük meg, hogyan néz ki ez a teszt Minitab-ban.
Az eddigi tesztekhez hasonlóan a 2-proportions teszt szintén a Stat / Basic statisztics menüben található.
A menüpontra kattintva megjelenő ablakban ismét választani kell a jobb felső sarokban, hogy az adataink milyen formában állnak rendelkezésre. Mivel nekem most csak az összegzett adataim vannak meg, ezért a „Summarized data” pontot választottam ki, majd kitöltöttem a két mintára vonatkozó mezőket az előző bejegyzésben leírtaknak megfelelően.
Az 'Options' gombra kattintva beállítottam, hogy mekkora legyen a megkívánt megbízhatósági szint (95% vagy 99%). Ha van valamilyen előzetes becslésünk a két adatsor által megadott arányok közötti különbségre, akkor azt megadhatjuk a 'Hypothesized difference' mezőben. Ha ide például beírjuk a 0,08-at, akkor a teszt azt fogja megadni, hogy igaz-e, hogy a férfiak és a nők 'igen' válaszainak aránya között 8% különbség van. Az 'Alternative hypothesis' mezőben kiválaszthatjuk, hogy egyoldali vagy kétoldali tesztet akarunk kiszámíttatni a Minitab-bal, ez is hasonló a korábban ismertetett tesztekhez. A 'Test method' mezőben lehetőleg válasszuk mindig az 'Estimate the proportions separately' lehetőséget. A 'Use the pooled estimate of the proportions' lehetőséget csak akkor érdemes alkalmazni, ha azt feltételezzük, hogy a két adatsor által megadott arányok megegyeznek, azaz a két adatsor azonos sokaságból származik.
Az OK gomb megnyomására az előző bejegyzéshez nagyon hasonló eredmények születtek.
Az első táblázatban az ’X’ oszlopban vannak azon férfiak (1) és nők (2) darabszáma, akik igennel választoltak arra kérdésre, hogy Trump őszinte és megbízható. Az ’N’ oszlopban van az összes megkérdezett nő és férfi darabszáma, a ’Sample p’ oszlopban pedig a kettő hányadosa található úgy, ahogy azt az előző cikk elején a grafikonon láttuk. A ’Difference’ jelenti a különbséget a két minta ’Sample p’ értéke között. Az ’Estimate for the difference’ ezt a bizonyos különbséget számítja ki (0,450355 - 0,369497 = 0,0808578). A ’95% lower bound for difference’ az előző cikkben bemutatott metódussal kiszámította a megbízhatósági intervallum alsó határát. Ami még fontos Z értéke (Z = 2,85), amelyet szintén kiszámoltunk az előző szösszenetben. Vagyis az eredmények és ezáltal a következtetések is megegyeznek a kézzel kiszámolt eredményekkel.