Statisztika egyszerűen

Mágikus jelek nélkül...

A valószínűségi eloszlásokról II.

2019. március 07. 10:30 - glantos70

Az eloszlásokról

A gyakorisági eloszlással kapcsolatban be kell vezetnünk a valószínűségi változó fogalmát (sajnos ezt nem tudjuk megúszni).

A valószínűségi változó megadja, hogy az eseménynek egy lehetséges végkimenetele milyen valószínűséggel fog bekövetkezni. A valószínűségi változót p-vel jelöljük az angol probability (=valószínűség) szó után. Ha az esemény egy adott végkimenetelét x-el jelöljük, akkor annak a valószínűsége, hogy az esemény eredménye x lesz, p(x)-el jelöljük. Ha például arra vagyunk kíváncsiak, hogy mekkora a valószínűsége annak, hogy egy dobókockával egyet dobunk, akkor azt úgy jelöljük, hogy p(x=1).  Egy valószínűségi változó nemcsak egy adott végkimenet valószínűségét, hanem végkimenetek egy adott csoportjának a valószínűségét is jelentheti. Annak a valószínűségét, hogy a dobókockánkkal kettőt vagy annál kisebb számot dobunk p(x≤2)-vel jelöljük. Ha pedig azt szeretnénk tudni, hogy mekkora a valószínűsége annak, hogy 1-nél nagyobb, de hatnál kisebb számot dobunk, úgy jelöljük, hogy p(1<x<6).

dk1.jpg

A dobókocka dobások esetében azt feltételezzük, hogy kellően sok dobás esetében mind a hat szám ugyanannyiszor fog kijönni, tehát a dobókocka dobás, mint esemény lehetséges végkimeneteleinek eloszlása egyenletes. Mivel a hat szám előfordulási gyakoriságainak összege 1, és mind a hat szám egyenlő arányban fordulhat elő, az egyes számok előfordulási gyakorisága 1/6 lesz. Ezt hívjuk egyenletes eloszlásnak. A dobókocka dobások hisztogramján mind a hat téglalap magassága egyforma lesz.

Mi történik akkor, ha nem arra vagyunk kíváncsiak, hogy egy adott szám hányszor fog kijönni, hanem arra, hogy mondjuk hányszor fogunk kapni négynél kisebb számot, azaz egyet, kettőt vagy hármat. Természetesen ekkor összeadjuk az egyes, a kettes és a hármas előfordulási gyakoriságát, így p(x < 4) = 1/6 + 1/6 + 1/6 = 3/6-ot, azaz 1/2-et kapunk, vagyis 50% a valószínűsége annak, hogy 4-nél kisebb számot dobunk majd. Ha a hisztogramunkon beszínezzük az egyeshez, a ketteshez és a hármashoz tartozó téglalapokat, akkor szemmel is jól látható lesz, hogy a téglalapok fele színes, a másik fele pedig fehér lesz.kocka20190204_2.jpg

Egy ilyen egyszerű esetben persze könnyű meghatározni az esemény eredménye várhatóan hányszor lesz majd benne a lehetséges végkimenetelek egy meghatározott csoportjában. Sajnos léteznek ennél sokkal bonyolultabb eloszlások is, ahol sokkal nehezebb meghatározni az eredmények meghatározott csoportjainak előfordulási valószínűségét, itt ezért egy kicsit más módszerhez kell folyamodnunk.

Mi lenne, ha átalakítanánk a hisztogramunkat? Most rajzoljuk meg úgy a hisztogramot, hogy az első, a legkisebb lehetséges végkimenetelhez rajzoljunk akkora téglalapot, amely arányos az adott végkimenetel előfordulásának számával. Ez eddig ugyanaz, mint az első hisztogram esetében. A második legkisebb lehetséges eredményhez rajzoljunk egy akkora téglalapot, amely arányos az első és a második végkimenetel előfordulásának számával. A harmadik legkisebb végkimenetel fölé rajzolt téglalap magassága pedig legyen arányos az első, a második és a harmadik lehetséges végkimenetel előfordulásának számával. Ha az összes lehetséges végkimenetel fölé ugyanígy megrajzoljuk a téglalapokat, akkor egy teljesen más alakú hisztogramot kapunk. Ezt pedig nevezzük el halmozott (kumulatív) eloszlás hisztogramnak. kocka20190204_3.jpg

Egy ilyen hisztogramról sokkal könnyebben le tudjuk olvasni azt, hogy milyen gyakran esik majd az esemény végeredménye a lehetséges végkimenetelek egy adott csoportjába. Ha például az halmozott eloszlás hisztogram alapján akarjuk megválaszolni az előző kérdést, hogy mennyi annak a valószínűsége, hogy négynél kisebb számot dobunk, azaz mennyi a p(x < 4) valószínűségi változó értéke, akkor egészen egyszerűen leolvassuk a hármas feletti oszlop magasságát (2468 db), és elosztjuk azt az összes kockadobások számával (5000 db). Az eredmény az előző számításhoz hasonlóan ~50% lesz.

kocka20190204_5.jpg

Hogyan számíthatjuk ki azt, hogy milyen gyakran fordulhat elő, hogy egy és négy közé esett a kockadobás eredménye, azaz kettőt vagy hármat dobunk, azaz mennyi p(1<x<4)?

kocka20190204_6.jpg

A hármas feletti téglalap magában foglalja azt, hogy hányszor dobtunk egyest, kettest és hármast (hiszen a 4-nél kisebb dobások valószínűségét keressük, azaz a 4 nem lehet benne az eredményekben). A hármas feletti oszlop magassága 2468, tehát ennyiszer fordult elő egyes, kettes vagy hármas az 5000 dobás között. A feltételeink között viszont szerepel az is, hogy a dobások között nem lehet egyes, tehát az egyesek darabszámát (805 db) ki kell vonnunk a hármasok darabszámából (2468 db). Így 1663 darabot kapunk eredményként. Ezt az 5000 darabbal elosztva 0,33-at kapunk, ami megegyezik 2/6-al, azaz 1/3-al.

Folytatása következik...

Szólj hozzá!

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr7914607102

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása