Statisztika egyszerűen

Mágikus jelek nélkül...

Esemény valószínűségének kiszámítása normál eloszlású sokaság esetén

2019. május 02. 10:45 - glantos70

Az eloszlásokról

Évek óta tanítom a normál eloszlást, illetve annak használatát az egyetemen. Amikor odaérek, hogy hogyan is használjuk ezt a gyakorlatban, általában mindig az „ősi” módszert tanítom, amikor a keresett x értékét standardizálom, azaz visszavezetem a standard normál eloszlásra (a módszert részletesen itt tárgyalom), majd a négyjegyű függvénytáblázatban található normál eloszlás táblázatból kikeresem az adott x’ értékhez tartozó valószínűséget. Ez egy teljesen jól használható módszer, de egyrészt oda kell figyelni, mert a normál eloszlás táblázatban csak a teljes eloszlásfüggvény fele van benne, tehát van, amikor még egy kicsit matekozni kell a kikeresett értékkel, hogy tényleg azt a valószínűséget kapjuk meg, amit keresünk. Ezt a módszert ebben a bejegyzésben nem szeretném ismertetni, de ha esetleg igény lenne rá, akkor egy másik bejegyzésben ezt is szívesen leírom.

Most viszont inkább azt feszegetném, hogyan számoljuk ki a keresett valószínűséget táblazatkezelő program segítségével. Szerencsére a gyakran használt táblázatkezelőkben vannak olyan beépített függvények, amelyek segítségével a keresett valószínűség egyből kiszámítható, nem szükséges standardizálni. Persze egy-két apróságra itt is oda kell figyelni, de igazából sokkal egyszerűbb ez a módszer, mint az „ősi” út. Még itt is lehetséges egy kis matekozás a végén, de talán egy kicsit egyszerűbb a dolog, mint az „ősi” módszerrel.

A jobb érthetőség kedvéért egy példán keresztül szeretném bemutatni, hogy hogyan számolunk táblázatkezelő segítségével. Mivel ezt ismerem jobban, a Microsoft Excel programot fogom használni a megoldáshoz. Biztos vagyok benne, hogy a LibreOffice-ban hasonlóan működik a módszer, maximum az alkalmazott függvény neve vagy más apróság lehet a különbség.

Akkor nézzük a példát:

Egy bizonyos vonatjáraton 560 ülőhely áll rendelkezésre. A vonat átlagos kihasználtsága 400 ülőhely, a szórás 100, az utas szám normális eloszlású. Indulás előtt szeretnénk a vonatra jegyet váltani. Mi a valószínűsége annak, hogy nem lesz szabad hely?

Akkor először is gyűjtsük össze, hogy mi micsoda a fenti feladatban:

A vonat átlagos kihasználtsága megfelel a sokaság átlagának, azaz µ = 400. Ha valaki hosszú idő alatt minden nap megszámolta, hogy hányan szálltak fel a vonatra, ezt gondosan feljegyezte, majd kiszámolta a kapott értékek szórását, akkor ez az érték σ = 100 lett. Ha feltételezzük, hogy az adatok normál eloszlásúak, akkor a vonat kihasználtsága µ ± 3σ, azaz 400 ± 3*100, tehát 100 és 700 utas között változik (a normál eloszlás tulajdonságait lásd itt). Jelenleg 560 utas van a vonaton. Ez több, mint a vonat átlagos kihasználtságaként megadott 400 utas, de kevesebb, mint a maximumnak becsült 700 utas. Ha grafikusan ábrázolom a feladatot, akkor az valahogy így néz ki:

Akkor most nézzük meg, hogy hogyan tudjuk kiszámítani ezt a valószínűséget excelben. Én jelenleg az Office 365 programcsomag excel programját használom. Tény, hogy sokan vannak, akik régebbi excelt használnak és sajnos pont ez a függvény is változott az újabb és újabb programokban. A legfrisebb függvény változat a NORM.ELOSZLÁS() függvény, de létezik még a NORM.ELOSZL() függvény is. A régebbi excel program verziók esetében érdemes utánanézni, hogy mi volt az éppen aktuális függvény neve.

A NORM.ELOSZLÁS() függvény nem csinál mást, minthogy kiszámítja egy adott átlagú és szórású normál eloszlás esetében kiszámítja az adott x értékhez tartozó eloszlásfüggvény vagy sűrűségfüggvény értékét. Tehát ugyanazzal az excel függvénnyel lehet kiszámítani mindkét fajta függvény értékét. Ebben az esetben a standardizálás (lásd itt) megspórolható, hiszen a függvény alkalmazásával megspórolhatjuk x átszámítását. A függvény használata a következő:

NORM.ELOSZLÁS(x, átlag, szórás, függvénytípus [igaz/hamis]), ahol

x – x értéke, amelyhez tartozó valószínűséget keressük, itt ez 560

átlag – az adathalmaz átlaga, itt ez 400

szórás – az adathalmaz szórása, itt ez 100

függvénytípus – ez egy logikai változó, azaz IGAZ vagy HAMIS értéket vehet fel. IGAZ esetén a NORM.ELOSZLÁS() az eloszlásfüggvény értékét számítja ki, HAMIS esetén pedig a sűrűségfüggvényét.

Rendben, de mit jelent a NORM.ELOSZLÁS() függvény által kiszámított érték?

Ha az eloszlásfüggvény x-hez tartozó értékét számoljuk ki, akkor a függvényt a következőképpen kell beírni a cellába:

NORM.ELOSZLÁS(560, 400, 100, IGAZ)

Ekkor ezt kapjuk:

Ha viszont a sűrűségfüggvény x-hez tartozó értékét számoljuk ki, akkor ezt kell beírni a cellába:

NORM.ELOSZLÁS(560, 400, 100, HAMIS)

Ekkor pedig ezt kapjuk:

Akkor a példának megfelelően próbáljuk meg kiszámítani a megadott példában keresett valószínűséget. Tehát akkor mekkora a valószínűsége annak, hogy nem lesz szabad ülőhely, azaz 560-nál többen fognak utazni a vonaton?

Természetesen az eloszlásfüggvényt kell alkalmaznunk, de ha visszagondolunk a fenti magyarázó ábrákra, akkor csak nem jó a dolog, hiszen most azt számoltuk ki, hogy mekkora a valószínűsége annak, hogy 560-nál KEVESEBBEN utaznak a vonaton. Hogyan kapjuk meg azt, hogy mekkora a valószínűsége annak, hogy 560-nál TÖBBEN utaznak a vonaton? Úgy, hogy kivonjuk az előbb kapott értéket 1-ből, hiszen a két eset együtt lefedi a teljes eseményteret. Így tehát ezt kapjuk:

Képletekkel ez így néz ki:

Természetesen más táblázatkezelő programok esetében más lehet a függvény neve, illetve különbözhetnek a függvény paraméterei vagy a használat módja, de a módszer logikája nagy valószínűséggel ugyanaz.

4 komment

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr914758483

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Rostás Antal 2019.10.08. 06:47:04

Szia, táblázatkezelőbe ez hogyan müködik? A grafikont hogyan tudom előhívni? Beirtam minden adatot és nem adja ki. köszönöm

glantos70 2019.10.08. 13:28:15

Elnézést kérek, ilyen diagramot nem tud az excel. A diagramot az R Studio programmal készítettem. Ezt oda kellett volna írnom.

glantos70 2019.10.08. 13:28:15

Elnézést kérek, ilyen diagramot nem tud az excel. A diagramot az R Studio programmal készítettem. Ezt oda kellett volna írnom.

Rostás Antal 2019.10.09. 09:29:03

@glantos70: Köszönöm a választ. Hogy tudom a programot letölrteni? Illetve ezen a programon belül hogy tud megcsinálni? anti.rostas@gmail.com eltudja küldeni a választ? köszönöm
süti beállítások módosítása