Statisztika egyszerűen

Mágikus jelek nélkül...

Milyen eloszlást követ a barackmag tömege?

2019. március 23. 10:00 - glantos70

Az eloszlásokról

Korábbi statisztikai tanulmányaim során mindig azt tanultam, hogy ha egy folyamatot csak véletlenszerű tényezők befolyásolnak, akkor az adott folyamat eredménye normál eloszlást követ. Ezen gondolkodva jutott eszembe az ötlet, hogy mi lenne, ha valamilyen természeti jelenségen próbálnám ki, hogy vajon tényleg mindenre működik-e a fenti elmélet. És ekkor eszembe jutott, hogy van a polcon egy kosárnyi szárított sárgabarack mag: mi lenne, ha megmérném ezeknek a tömegét és kielemezném, hogy a barackmagok tömegének eloszlása milyen.

Meg is fűztem a fiaimat, akik szorgalmasan le is mérték 100 db barackmag tömegét, én pedig bevittem ezeket egy táblázatba. Ezután a Minitab alkalmazásával leellenőriztem, hogy normál eloszlást követ-e az adatsor. Először egy egyszerű ponthisztogrammal ábrázoltam az adatokat:

A pontdiagramon egyértelműen látszik, hogy van egy olyan barackmag, amelynek a tömege jelentősen nagyobb, mint a többi barackmagé. A kieső értékekről szóló teszt egyértelműen jelzi, hogy a 86. sorban szereplő 2,58 gramm kieső érték, nem illeszkedik a többi 99 mag által megadott mintázatba:

Ettől függetlenül elvégeztem a vizsgálatot arra vonatkozóan, hogy az adatsor normál eloszlást követ-e. Azt kaptam, hogy ebben a formában nem!

A diagramon jól látható, hogy az egyetlen pont, amit kiesőnek találtunk, nagyon messze van az egyenestől (szerencsére a Minitab-nak van egy olyan funkciója, amely segítségével a diagram bármelyik pontjáról meg tudjuk mondani, hogy az adatsor melyik adata tartozik hozzá), a többiek sokkal közelebb vannak hozzá. Minél jobban ráfekszenek a pontok a kék egyenesre, annál inkább normál eloszlású az adatok szórása. A jobboldali keretben található „P-Value” érték 0,028, ami kisebb, mint a szokásosan figyelembe vett 0,05-ös érték (erről majd egy későbbi cikkben lesz még szó), tehát azt gyanítjuk, hogy az adatsor azért nem normál eloszlású, mert ez az egy kieső pont bezavar.

Azt nem tudom, hogy ez az egy barackmag miért lényegesen nehezebb, mint a többiek. A magokat a konyha polcán egy kosárban találtam, talán már évek óta gyűlnek benne a magok. Ezért nem tudom kizárni a vizsgálatból, hiszen releváns indoklás nélkül ezt nem tehetem meg. De annyit megtehetek, hogy kipróbálom, vajon a kieső barackmag tömeg nélkül a többi 99 mag tömege normál eloszlást követ-e:

Sajnos a ponthisztogram alapján nem igazán tudom eldönteni.

A hisztogram alapján azt mondanám, hogy nem teljesen szabályos, de hasonlít.

A normalitás vizsgálat viszont már egyértelműen kimutatta, hogy ha kivesszük az adatsorból az egy sokkal nehezebb barackmagot, akkor a többi barackmag tömege normál eloszlást követ, hiszen a pontok szépen rásimulnak a kék egyenesre és a "P-Value" értéke is nagyobb, mint a megkívánt 0,05.

Összegzés: A vizsgálat célja az volt, hogy eldöntsem, vajon a konyhában talált 100 darab sárgabarack magok tömege normál eloszlást követ-e. Sajnos a tapasztalatok alapján ezt egyértelműen nem jelenthetem ki, mert a barackmagok között volt egy darab mag, amelynek a tömege jelentősen nagyobb volt, mint a többi 99-é. Mivel ezt az eltérést semmilyen módon nem tudom megmagyarázni, a kieső értéket nem vehetem ki az adatsorból. Ennek ellenére azt ki lehet jelenteni, hogy ha ezt az egy magot kivenném, akkor a többi 99 barackmag tömege 95%-os valószínűséggel normál eloszlású lenne.

6 komment

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr2714677858

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

szomorú vasárnap terrorszervezet 2019.03.23. 12:41:51

Nem túl nagy a minta, és a barackok válogatása is lehetett biased. Egy extrém méretű barack inkább kerül a mintába, mint egy kis megszaradt szottyos.

glantos70 2019.03.23. 17:23:42

@szomorú vasárnap terrorszervezet: Nevedhez méltóan tömegpusztító a kommented. :-)

Kb. ennyi barackmagom volt itthon, ezért mértem le 100 darab magot. Nem lehetetlen úgy kiválogatni úgy a barackmagokat, hogy a számomra kedvező normál eloszlást kövesse a tömeg eloszlása, de a fenének van kedve ennyit vacakolni vele csak azért, hogy írhassak egy bejegyzést.

szomorú vasárnap terrorszervezet 2019.03.24. 02:21:11

@glantos70: Nem fikázni akartam :) A barackmagok barackokból vannak, azokat meg ízlés szerint válogatja az ember, a nem szívesen fogyasztott tulajdonságú barackok magjai így alul lehetnek reprezentálva, a kívánatos barackok magjai meg felül. Ez most nem torzitotta annyira az eloszlást, de nem lett volna váratlan.

glantos70 2019.03.24. 07:19:58

Ok, részemről nincs gáz. Az az igazság, hogy volt itthon pár szem vadgesztenye is, azokkal is megcsináltam ugyanezt. A vadgesztenyék tömege ugyanazt adta, az is normál eloszlású, csak ezt tényleg nem akartam közzétenni, mert annyira kevés volt a minta. Majd ősszel gyűjtenek nekem a gyerekek egy csomó vadgesztenyét, esetleg makkot és megismétlem a kísérletet! :-)

Attila Zsolt Sajo 2019.03.27. 07:32:46

Erről Karl Pearson's crab data jutott eszembe. (minta két/több populációból?)

glantos70 2019.03.27. 12:59:00

@Attila Zsolt Sajo: Jé, ezt nem ismertem, de tényleg hasonló a két téma. Köszi az ötletet, ennek utánanézek! :-)
süti beállítások módosítása