Hogyan csináld Minitab-bal - Kétmintás t-próba

2019. június 28. 10:30 - glantos70

Statisztikai elemzések

Miután ilyen szerencsésen megismerkedtünk a kétmintás t-próbával (Az alkoholfogyasztás hatása a bowling eredményekre – kétmintás t-próba), tehát az eddigi gyakorlatnak megfelelően vezessük le táblázatkezelőben és Minitab-ban is az előző cikkben említett feladatot.

Noha ebben az esetben már egy kicsit több átalakításra van szükség az egymintás t-próbához képest, azért még ez sem annyira bonyolult, hogy ne lehetne követni. A következő feladatokat kell elvégeznünk az átalakítás során.

Eddig csak egy mintával dolgoztunk, de mostantól két mintánk van, tehát be kell szúrnunk egy oszlopot a második mintának.
A sokaság átlagát ki kell törölni, és a minta jellemzőit át kell alakítani úgy, hogy mindkét minta jellemzői kiszámításra kerüljenek
’t’ értékének képletét meg kell változtatni a kétmintás t-próba számítási módjának megfelelően
A Student t-eloszlás határértékeinek kiszámításához meg kell változtatni a T.INVERZ() függvényben a szabadsági fokok számát
A megbízhatósági intervallumok kiszámításakor szintén meg kell változtatni a képleteket a kétmintás t-próbának megfelelően

Akkor lássunk neki!

Először is eltüntettem a sokaság átlagát és a ’t’-érték kiszámításához alkalmazott képletet, hogy ne zavarjon. Ezután beszúrtam egy új oszlopot a második minta (Minta2) értékeinek, illetve a minta adatai helyett mindkét minta átlagát, szórását és mintaszámát ki kell számolni, ezért az ehhez szükséges mezőket is elhelyeztem a táblában. Az első mintához hasonlóan a második minta esetében is 30 értéket tudunk megadni, amely szükség esetén tetszőleges mértékben bővíthető, csak az átlag, a szórás és a mintaszám képleteit kell megváltoztatni.

Ezután átírtam ’t’ értékének képletét a kétmintás t-próbának megfelelően.

Ezután kijavítottam a szabadsági fokok számát a Student t-eloszlás határtértékeinek képleteiben.

Majd a megbízhatósági intervallum határértékeinek képletét is módosítottam a már korábban leírtak szerint.

Így most már a kétmintás t-próba táblázat is működik, a végeredmény a következő lett. Látható, hogy ha a baloldali tesztet hajtom végre, akkor 99,9%-os megbízhatósági szint esetében el tudom fogadni a nullhipotézist azaz, ha nagyon-nagyon óvatos vagyok, akkor nem mondhatom, hogy Samu teljesítményét rontja az alkohol. Ha kétoldali tesztet végzek, akkor viszont már 99%-os megbízhatósági szinten sem lehetek biztos a fenti állítás igazságában.

Az eredmények visszaellenőrzése érdekében elvégeztem a számítást a Minitab program segítségével is és a következő eredményeket kaptam.

Először is átmásoltam a minták adatait Minitab-ba.

Ezután előhívtam a kétmintás t-próba menüpontot.

Itt most be kellett állítani, hogy a minták adatai egy oszlopban vannak és egy másik oszlop adatai alapján lehet őket csoportosítani, vagy a két minta adatai két különböző oszlopban vannak. Mivel a második eset az igaz, ezért így állítottam be az adatbevitelt.

Ezután megadtam a két minta adatait tartalmazó oszlopokat.

Az ’Options’ gomb megnyomásával eljutottam ahhoz az ablakhoz, ahol a teszt típusát és megbízhatósági szintjét lehet beállítani, majd itt is beállítottam a kívánt feltételeket. A megbízhatósági szint 95%, a nullhipotézisünk alapján a két minta átlaga közötti különbség 0. A Minitab-ban van egy olyan opció is, hogy meg lehet adni egy minimális vagy maximális különbséget a két mintaátlag között, adott esetben ez hasznos lehet. Az alternatív hipotézis esetünkben az, hogy a két mintaátlag különbsége nagyobb, mint 0 hiszen kisebb nem lehet. Jelen esetben nem jelöltem be azt, hogy feltételezzük, hogy a két minta varianciája (szórásának négyzete) megegyezik, hiszen tudom, hogy a két variancia nem egyezik meg.

Ezután a ’Graphs’ gomb megnyomásával előhívtam egy másik ablakot, ahol kértem, hogy a két minta grafikus ábrázolására jelenítsen meg a Minitab egy boxplot diagramot.

Most először viszont az fordult elő, hogy a táblázatkezelő és a Minitab nem ugyanazt az eredményt hozta ki. A megbízhatósági intervallum alsó határa a táblázatkezelőben 20,7 volt, míg a Minitab 23,6-ot számolt. ’t’ értékére a táblázatkezelő -3,6-ot adott, míg a Minitab 4,48-at. Érdekes módon a szabadsági fokok száma a táblázatkezelőben 6 volt, míg a Minitab 4-et adott. De mit jelenthet ez a különbség. Szerencsére a google gyorsan talált egy weboldalt, ahol megtalálhatók a Minitab által alkalmazott képletek, amely azonnal megadta a különbségek okát:

Látható, hogy a Minitab ez esetben egy kicsit más képleteket használ, mint amelyeket én használtam, így az ő eredménye egy kicsivel szigorúbb lett annál, amit én számoltam ki.

Végül álljon itt a teszt végeredménye: