Statisztika egyszerűen

Mágikus jelek nélkül...

Ráadás diagram egymintás Z-próbához

2021. április 02. 08:00 - glantos70

Six Sigma in R

Úgy tűnik, nem tudok elszakadni a témától. Már az előző cikk (Senki többet harmadszor? – Újra az egymintás Z-próbáról, most R-kóddal) írása közben motoszkált a fejemben, hogy a próba egyszerűsége ellenére jó lenne valahogy vizuálisan is megjeleníteni az eredményt. Neki is ugrottam, hogy készítek egyet, de aztán a kód csak hízott és hízott, úgyhogy arra jutottam, hogy írok erről egy külön cikket. Mivel az R-kód hossza nincs arányban a fontosságával, ezért a diagram kirajzolását függvényként írtam meg, így a diagram kirajzolása 2-3 sor begépelésével megoldható. Másrészt a szkript részletes elemzéséből ismét sokat lehet tanulni.

A cél az, hogy láthatóvá tegyük az egymintás Z-próba eredményét. A fenti diagramon látható normál eloszlás görbe a sokaságból elméletileg kivehető nagyszámú minta átlagainak az eloszlását reprezentálja. A két függőleges szaggatott vonal határolja azt a tartományt, amelybe a mintaátlagok 95%-a esne. A tesztünk nullhipotézise az, hogy az általunk vizsgált mintát a megadott átlag és szórású sokaságól vettük ki. A vastag piros vonal az általunk kivett minta átlagát jelzi. Ha a vastag piros vonal beleesik a 95%-os tartományba, akkor a nullhipotézist el kell, hogy fogadjuk, azaz nem igazolható, hogy az általunk vizsgált mintát NEM a megadott átlagú és szórású sokaságból vettük ki. Ha a vastag piros vonal a 95%-os tartományon kívül esik, akkor viszont elvethetjük a nullhipotézist, azaz bizonyítékot találtunk arra, hogy a vizsgált mintát nem vehettük ki a sokaságból.

A teljes szkript egyben letölthető szövegfile-ként az alábbi linkről. A tömörített fájlban található egymintasztesztdiagram.R file-t R-ben vagy RStudio-ban megnyitva a szkript futtatható.

https://m.blog.hu/st/statisztikaegyszeruen/egymintasztesztdiagram.zip

A file tartalmazza a ’z.testgraph()’ függvényt, illetve azokat a kódsorokat is, amelyek segítségével teszteltem a függvény működését. Akkor nézzük részletesen, mit is csinál a program…

Először is töltsünk be három csomagot.

library(ggplot2) #A diagram kirajzolásához
library(ggpubr) #Csak a sokaság hisztogramjának kirajzolásához használtam
library(gridExtra) #A két diagram egymás mellé rajzolásához szükséges

A sorok végén a # jel után rövid megjegyzéseket helyeztem el a jobb átláthatóság kedvéért. Amint azt ott is írtam, a függvény használatához csak a ’ggplot2’ csomag szükséges, a másik kettőt csak a kipróbáláshoz használtam.

A következő blokkban az előző cikkhez hasonlóan létrehoztam egy nagyon hasonló sokaságot, mint az előző cikkben, így a részletes ismertetéstől eltekintek.

#Sokaság létrehozása
sok1 <- rnorm(200, mean = 10, sd = 2)
sok2 <- rnorm(200, mean = 25, sd = 5)
sok3 <- rnorm(200, mean = 30, sd = 1.5)
sok4 <- rnorm(200, mean = 40, sd = 3)
sok5 <- rnorm(200, mean = 50, sd = 2)

sokasag <- c(sok1, sok2, sok3, sok4, sok5)

#Sokaság hisztogramja
gghistogram(sokasag, bins = 32)

Ezután kiszámoltam a létrehozott sokaság átlagát és szórását és elmentettem egy-egy változóba.

Mellékes megjegyzés: R-ben van egy olyan konvenció, hogy a változónevek első betűje kisbetű, de az összetett neveknél a második, harmadik stb. részeket nagybetűvel jelöljük. Ez nemcsak poénból van így, az RStudio-nak van egy olyan tulajdonsága, hogy amikor elkezdesz begépelni egy nevet, akkor a szerkesztő feldobja azokat a változókat vagy függvényeket, amelyek a begépelt karakterekkel kezdődnek. Így akár egy hosszabb változónevet is simán be tudsz gépelni pár billentyűleütéssel.

Ezekre majd akkor lesz szükség, amikor a diagram rajzoló függvényt hívjuk majd meg, hiszen a mintaátlagok eloszlásának becsléséhez szükség lesz a sokaság átlagára és szórására.

#Sokaság átlagának és szórásának kiszámítása
sokasagAtlag <- mean(sokasag)
sokasagSzoras <- sd(sokasag)

Ha a ’mean()’ és az ’sd()’ függvények használata esetleg nem egyértelmű, akkor ezt részletesebben megtalálod a „Six Sigma in R” sorozat – Leíró statisztika R-ben című cikkben.

Ezután létrehoztam kétféle mintát, hogy megmutassam a különféle mintaátlagok hatását az eredményre. A ’minta1’ változó egy olyan 100-elemű mintát tartalmaz, amelyet ugyan nem a korábban létrehozott sokaságból vettem ki, de elméletileg kivehettem volna belőle. A ’minta2’ változóban egy olyan minta van, amelyet biztosan nem vehettem ki a létrehozott sokaságból.

#Kétféle minta létrehozása
minta1 <- rnorm(100, mean = 29, sd = 3)  #mintaátlag a megbízhatósági tartományban
minta2 <- rnorm(100, mean = 35, sd = 3)  #mintaátlag a megbízhatósági tartományon kívül

#mintaátlagok kiszámítása
minta1Atlag <- mean(minta1)
minta2Atlag <- mean(minta2)

Remek megfigyelés, hogy a mintáknak csak az átlagát számoltam ki, a szórását nem, hiszen a minták szórására nem lesz szükségünk, hiszen ismerjük a sokaság szórását. Ezzel megvan mindenünk, a

És most következzen a függvény leírása.

#grafikon rajzoló függvény
z.testgraph <- function(mintaAtlag, sokasagAtlag, sokasagSzoras, n)
{ ... }

A függvény megadása olyan, mintha egy változónak adnánk értéket. Ez olyannyira igaz, hogy a függvényt nem is tudjuk addig használni, amíg a kurzorral a sorra ráállva a CTRL-Enter billentyű kombináció lenyomásával le nem futtatjuk az értékadást és a függvény neve meg nem jelenik a változók között. Mondjuk ez a fajta függvénydefiníció logikusnak tűnik és nem kényelmetlen, csak egy kicsit meg kellett szokni. Természetesen a zárójelben megadott paramétereket kell majd átadni a függvénynek, amikor majd meghívjuk. A változóknak igyekeztem hosszabb „beszélő” nevet adni, hogy a kód könnyebben követhető legyen. Amint az látható, négy paramétert kell megadnunk. Az általunk kivett minta átlagát (mintaAtlag), a sokaság átlagát és szórását (sokasagAtlag, sokasagSzoras) és a minta elemszámát (n). A függvény törzsét kapcsos zárójelek közé kell tenni, ezért látható egy ’{’ a következő sorban.

 #A mintaátlagok eloszlás paramétereinek kiszámítása
  mintaEloszlasAtlag <- sokasagAtlag
  mintaEloszlasSzoras <- sokasagSzoras/sqrt(n)

A ’mintaEloszlasAtlag’ változó jelenti sokaságból elméletben kivett nagyszámú minta átlagát. Ezt a változót nem lett volna fontos létrehozni, de inkább létrehoztam, hogy jobban lehessen követni a kódot. A ’mintaEloszlasSzoras’ változó viszont a nagyszámú mintaátlag szórásának becsült értékét tartalmazza, amelyet ugye úgy kaptunk, hogy a sokaság szórását elosztottuk a minta elemszámának négyzetgyökével.

#A mintaátlagok 95%-os megbízhatósági határainak kiszámítása
  mintaEloszlas95Lower <- mintaEloszlasAtlag - 2 * mintaEloszlasSzoras
  mintaEloszlas95Upper <- mintaEloszlasAtlag + 2 * mintaEloszlasSzoras

A mintaeloszlás tulajdonságainak segítségével kiszámoltam azt a tartományt, amelybe várhatóan beleesne a sokaságból kivett minták 95%-a. A ’ mintaEloszlas95Lower’ értelemszerűen az alsó, a ’mintaEloszlas95Upper’ a felső határt jelenti (igen, itt írhattam volna alsót és felsőt is, de csak most vettem észre, hogy véletlenül angol maradt az elnevezés. Bocs).

#A diagram kirajzolásához szükséges legkisebb és legnagyobb x-értékek kiszámítása
  diagramLowerLimit <- mintaEloszlasAtlag - 4 * mintaEloszlasSzoras
  diagramUpperLimit <- mintaEloszlasAtlag + 4 * mintaEloszlasSzoras

Ez a két sor technikai jellegű, a két változóba a diagramterület alsó, illetve felső határát tároltam el.

  #A mintaátlag és a megbízhatósági határértékek értékének szöveggé alakítása a tizedesjegyek beállításával
  mintaAtlagSzoveg <- as.character(format(mintaAtlag, digits = 5))
  mintaEloszlas95LowerSzoveg <- as.character(format(mintaEloszlas95Lower, digits = 5))
  mintaEloszlas95UpperSzoveg <- as.character(format(mintaEloszlas95Upper, digits = 5))

Ez a rész szintén technikai jellegű. Azért, hogy a diagramon megjelenhessenek a mintaátlag és a 95% megbízhatósági tartomány határainak értékei, a kiszámított értékeket szöveggé kell alakítani. Ráadásul azt úgy, hogy a tizedespont után ne legyenek tizedesjegyek kilométerhosszan. A szöveggé alakítást az ’as.character()’ függvény segítségével lehet elvégezni. A tizedesjegyek hosszának beállításához viszont a ’format()’ függvényt tudjuk használni. A ’format()’ függvény ’digits = 5’ paramétere azt mondja, hogy a számnak csak 5 számjegye jelenjen meg összesen, azaz az egész és a tizedes jegyek száma összesen 5 lehet. Ez nem biztos, hogy minden esetben szerencsés, mert például a egymillió felett ez már problémás lehet. Most így átgondolva, a ’format()’ függvénynek van egy ’nsmall’ nevű paramétere is, ezzel a tizedespont mögötti számok mennyiségét lehet beállítani. Igény szerint ez kicserélhető a kódban, vagyis a ’digits =5’ helyett az ’nsmall = 2’ is alkalmazható.

Most jön a lényeg, a diagram kirajzolása.

Ez a legösszetetteb kódrészlet, de csak elsőre tűnik vadnak, igazából az egész olyan, mint a legó, az egyes diagram elemeket szépen egymás után pakoltam. Az egyes elemeket a ’+’ jellel kötjük össze, ebből tudja a fordító, hogy ezek a kódrészletek összetartoznak. Nézzük meg soronként, hogy mi mit jelent.

ggplot() + xlim(diagramLowerLimit, diagramUpperLimit) +                                                                        

A ’ggplot()1 függvény fogja össze a diagram egészét. Önmagában meghívva ez a függvény egy üres diagramterületet fog kirajzolni.

ggplot() + xlim(diagramLowerLimit, diagramUpperLimit) +                                                                   

Az ’xlim()’ függvénnyel be tudjuk állítani az x-tengely mérettartományát.

 …
geom_function(fun = dnorm, args = list(mean = mintaEloszlasAtlag, sd = mintaEloszlasSzoras)) +        

 A ’geom_function()’ függvénnyel bármilyen függvénygörbét ki tudunk rajzoltatni. Természetesen vannak előre definiált függvénytípusok, amelyeket a ’fun =’ paraméter beállításával lehet megadni. Ez esetben ez a normál eloszlás sűrűségfüggvénye, ezért lett a ’fun =’ paraméter értéke ’dnorm’, ahol a d betű a ’density’, azaz sűrűség fogalmat takarja.


geom_function(fun = dnorm, args = list(mean = mintaEloszlasAtlag, sd = mintaEloszlasSzoras)) +     …

Nem elég megadni a függvény típusát, az adott függvény konkrét paramétereit is meg kell adnunk. Ezt az ’args =’ paraméter segítségével tudjuk megadni. Azért ilyen kacifántos, mert ahányféle függvénytípus, annyiféle paramétersort kell megadni a függvény pontos definíciójához. Az ’args =’ után egy listát kell megadnunk, amelyben benne vannak az egyes paraméterek, ez esetben az átlag (’mean =’) és a szórás (’sd =’). Mivel a diagramon a mintaátlagok eloszlását akarom megjeleníteni, ezért a normál eloszlás átlagának a mintaátlagok átlagát, azaz a sokaság átlagát adom meg, szórásának pedig a mintaátlagok szórását (lásd fentebb).


    geom_vline(xintercept = mintaEloszlasAtlag, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaEloszlas95Lower, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaEloszlas95Upper, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaAtlag, color = "red", linetype = "solid", size = 2) +                  

A ’geom_vline()’ függvény egy függőleges vonalat rajzol a diagramra, amely a diagramterület aljától a tetejéig tart, ezért nem kell megadni az y-irányú koordinátákat, csak az x-tengely metszéspontját az ’xintercept =’ paraméter megadásával.


    geom_vline(xintercept = mintaEloszlasAtlag, color = "darkgreen", linetype = "dashed") +               
    geom_vline(xintercept = mintaEloszlas95Lower, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaEloszlas95Upper, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaAtlag, color = "red", linetype = "solid", size = 2) +                  

A ’color = „darkgreen”’ a vonal színét adja meg, a ’linetype = „dashes”’ pedig a vonal mintázatát, jelen esetben a ’dashed’ a szaggatott vonalat jelöli.


    geom_vline(xintercept = mintaEloszlasAtlag, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaEloszlas95Lower, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaEloszlas95Upper, color = "darkgreen", linetype = "dashed") +                
    geom_vline(xintercept = mintaAtlag, color = "red", linetype = "solid", size = 2) +                  

A ’size = 2’ a vonal vastagságát adja meg.


labs(title = "Egymintás Z-próba - 95% megbízhatósági szint") +                                                              

Ez a sor írja ki a diagram címét a bal felső sarokba.


    annotate(geom = "label", x = mintaAtlag, y = 0.25, label = "minta átlag") +                         
    annotate(geom = "label", x = mintaEloszlas95Lower, y = 0, label = "95% meg.tart. alsó határ") +     
    annotate(geom = "label", x = mintaEloszlas95Upper, y = 0, label = "95% meg.tart. felső határ") +    
    annotate(geom = "label", x = mintaAtlag, y = 0.23, label = mintaAtlagSzoveg) +                                  
    annotate(geom = "label", x = mintaEloszlas95Lower, y = 0.02, label = mintaEloszlas95LowerSzoveg) +
    annotate(geom = "label", x = mintaEloszlas95Upper, y = 0.02, label = mintaEloszlas95UpperSzoveg) 

}

Az ’annotate()’ függvény segítségével mindenféle megjegyzéseket és jelzéseket tehetünk a diagramra egy szabadon választott helyre. Ez lehet egyszerű szöveg, pont, egyenes vagy görbe vonal, esteleg téglalap is. A megjegyzés típusát a ’geom =’ paraméterrel lehet megadni, ez esetben a ’geom = „label”’ azt jelenti, hogy egy bekeretezett címkét kell megjeleníteni. Itt vigyázni kell az idézőjelek alkalmazására, mert különben hibára futunk. Az x és az y-irányú koordináták megadása értelemszerű, a 0:0 pont a két koordinátatengely metszéspontjában van. A címke szövegét a ’label =’ paraméter után kell megadni idézőjelek között. A címke szövegét nemcsak közvetlenül adhatjuk meg, hanem egy szöveges változóra történő hivatkozással is, mint például az utolsó két sorban, ahol a már előzőleg elkészített szöveges változót adtam meg a címke felirataként.

Összegzés:

Ez a diagram véleményem szerint nem létszükséglet, de előfordulhat, hogy szükség van rá valamilyen jelentésben vagy prezentációban. Akadnak még továbbfejlesztési lehetőségek, például paraméterként át lehetne adni a megkívánt megbízhatósági szintet, vagy be lehetne színezni a megbízhatósági tartományt. Ha valakinek van ilyen igénye, akkor nyugodtan fejlessze tovább a függvényt a saját szükségletei és szájíze szerint. Sajnos a kódsorok hossza miatt a tördelés egy kicsit szétcsúszott, emiatt elnézést kérek.

8 komment

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr9616398234

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

fordulo_bogyo 2021.04.06. 10:26:47

Nem kotozkodem, de nem ertek egyet:
"Ha a vastag piros vonal a 95%-os tartományon kívül esik, akkor viszont elvethetjük a nullhipotézist, azaz bizonyítékot találtunk arra, hogy a vizsgált mintát nem vehettük ki a sokaságból."
Nem bizonyitek, csak nagy a valoszinusege, hogy nem onnan vetted ki.
A 95% egy onkenyes ertek, a 94.9 es a 95.1% lenyegeben azonos, nem indokolt ilyen kemenyen megkulonboztetni oket szerintem.
En nem tudom kiszamolni, de kivancsi lennek, hogy ha az 1-90 kozotti szamok sokasagabol kihuzod az 1,2,3,4,5 szamokat, mint mintat, mit mond a probad?

glantos70 2021.04.06. 10:41:22

@fordulo_bogyo: Ebben az értelemben igazad van, a megbízhatósági határ meghatározása tényleg önkényes. A kérdésedre válaszolva, a minta (1, 2, 3, 4, 5) átlaga 2,5. A sokaság átlaga 45,5, a sokaság szórása 26,1247. Mivel a minta 5 elemből áll, ezért a z próbastatisztika értéke (2,5 - 45,5)/26,1247/gyök(5) = -3,6846. Ez valóban kisebb, mint a 95%-os határérték, amely -1,96, vagyis 95%-os valószínűséggel véletlenszerűen nem tudunk kivenni egy ilyen mintát a sokaságból. Ez a következtetés azt jelenti, hogy ha kiveszek 100 darab véletlenszerű mintát az 1-90 közötti egész számok közül, akkor az 1, 2, 3, 4, 5 minta 5-nél biztosan kevesebbszer lesz benne.

vmiki a troll 2021.04.07. 08:29:42

@glantos70: Koszi, ha nem zavar folytatnam, mert tovabbra is zavart erzek "az eroben".
"ha kiveszek 100 darab véletlenszerű mintát az 1-90 közötti egész számok közül, akkor az 1, 2, 3, 4, 5 minta 5-nél biztosan kevesebbszer lesz benne."
Biztosan? Vagy csak kicsi a valoszinusege?
Utanaszamoltam, az 1,2,3,4,5 minta atlaga nalam 3

Vegyunk egy masik mintat, mert kivancsi vagyok.
10,20,30,40,50 atlaguk 30, a szamolt Z ertek 1.32
1,15,45,60,80 z=-0.45

Nem veletlenul vettem egy 1-90 kozoti sokasagot, a lottora gondoltam.
Hetente vegeznek mindatvetelt.
Ugy tudom, hogy barmelyik minta elofordulasa azonos valoszinusegu, nincs egyetlen olyan minta (5 nyeroszam) sem amelyik 100 huzasbol 5-nel tobbszor lenne kihuzhato.

glantos70 2021.04.07. 08:42:34

@vmiki a troll: A hibáért elnézést kérek, az 1, 2, 3, 4, 5 átlaga valóban 3. A lottó esetében ez nem így működik, az valószínűségszámítás. A 10, 20, 30, 40, és 50 átlaga 30, de a Z-értéknek kapott 1,32 nem azt adja meg, hogy mekkora az esélye annak, hogy pont ezt az 5 számot húzzák ki, hanem azt, hogy egy olyan ötelemű számsorozatot, amelynek az átlaga 30. Ha belegondolsz, 90 szám közül állati sokféle módon ki lehet venni olyan mintát, amelynek az átlaga 30, emiatt ennek nagyobb lesz a valószínűsége.

A lottó, mint ötlet ettől függetlenül egészen jó, hiszen a kihúzott számok (elvileg) véletlenszerűek. Ki lehetne számítani a hetente kihúzott számok átlagát és ez alapján megadni, hogy melyik átlag milyen gyakran fordul elő. Akár még lottózni is lehetne ez alapján, hiszen ha legtöbbször a 45,5 jönne ki átlagként, csak meg kellene keresni azokat a számkombinációkat, amelyeknek az átlaga 45,5 és ezeket megjátszani... ja, nem. Sajnos ki fog derülni, hogy minél gyakrabban fordul elő egy átlag, annál többféle kombinációban fog előfordulni az adott átlag. Így megint csak túl sokféle kombinációt kellene megjátszani, amihez az isten pénze nem lenne elég.

De elméletben lehet, hogy megnézem...

fordulo_bogyo 2021.04.09. 13:16:22

@glantos70: Hm... eddig ugy ertettem, hogy azt mondja a proba, hogy abbol a sokasagbol 100 huzas esteten 5-nel kevesebbszer fordul elo EZ a KONKRET (kihuzott) minta, nem azt, hogy egy ilyen atlagu minta... (meg akkor is, ha ez az osszes ilyen atlagu mintakra igaz).
Lehet, hogy itt van az eb elhantolva, hogy a proba nem ezt a KONKRET mintat vizsgalja, hanem az ilyen atlagu mintak osszesseget?
Ha probalom ertelmezni a kepletet, akkor igy is olvashato, hiszen az osszes ugyanilyen atlagu mintara ugyanazt a valaszt adja, azaz nem erre a konkret mintarol, hanem az osszes ilyen mintakrol allit valamit.
A lotto termeszetesen valoszinusegszamitas, de szerintem az itt targyalt problema is valosznusegszamitas (is), egy sokasagbol veletlenul kivalasztunk x darab elemet, ez klasszikus valoszinusegszamitasi eset.

Visszaterek erre egy pillanatra:
"Ez a következtetés azt jelenti, hogy ha kiveszek 100 darab véletlenszerű mintát az 1-90 közötti egész számok közül, akkor az 1, 2, 3, 4, 5 minta 5-nél biztosan kevesebbszer lesz benne."
Biztosan? Vagy csak kicsi a valoszinusege?
Ugy gondolom, biztosat nem allithatunk, epp mert valoszinusegi problemarol van szo, csak valoszinusegeket mondhatunk.
Az, hogy valaminek 5%-nal kisebb a valosznusege, az nem jelenti azt, hogy 100 veletlen eset kozul BIZTOSAN nem fog 5-nel tobbszor elofordulni. Csak nem valoszinu.

glantos70 2021.04.09. 13:18:49

@fordulo_bogyo: Hát igen, tulajdonképpen mi a biztos az életben? A 100 véletlen eset azért nagyon necces példa ez esetben, mert ha belegondolsz, hogy amióta lottó létezik (mármint a hetvenes évek óta), még egyetlenegyszer sem húzták ki az 1-2-3-4-5 kombinációt. És itt nem 100 esetről beszélünk.

vmiki a troll 2021.04.12. 09:16:54

@glantos70: Mondjuk 1970-tol az 50 ev, evi 52 het az 12500 huzas... 5273912160
lehetseges kombinacioja van az 5 kihuzott szamnak, tehat az 1,2,3,4,5 mellett tovabbi 5273899659
kombinaciot sem huztak ki.
Utananeztem, 1957 ota van ez a lotto, azaz 13 evvel meg hosszabb, azaz 15750 huzas volt...
Nezz erre ra, itt egy tablazatban a kihuzott szamok gyakorisaga.
Elso pillantasra latszik, hogy az atlaghoz kozlei es az attol extrem tavoli szamok kihuzasi gyakorisaga nem ter el egymastol.
www.lottotipp.hu/Statistics/Frequency.aspx
Itt pedig az osszes eddig kihuzott szam egy tablazatban.
bet.szerencsejatek.hu/cmsfiles/otos.html
Ha mar eddig eljutottam kiszomoltam mind a 3344 kihuzott szamkombinaciora a probat. 133 olyan szamkombinacio volt, aminel a Z erteke -1.96 nal kisebb vagy +1.96-nal nagyobb volt.
Ez az osszes huzas 3.89%-a.
Ha gondolkozodom, akkor ebben a konkret peldaban 100 kihuzott szamkombinacio kozott atlagosan 3.89 olyan lesz, aminel a Z erteke a hatarerteken kivul van.
Nem BIZTOS, csak 5%-nal kisebb a valoszinusege, hogy egy ilyen szamsorozatot kihuznak.
A ket extrem a Z proba szerint: 2, 3, 6, 8, 30 z=-3.06 es a 61, 78, 80, 81, 86 z=+2.71
Jo jatek.

glantos70 2021.04.12. 09:17:39

@vmiki a troll: Az a lényeg, hogy az 1-2-3-4-5-öt ne tedd meg a lottón, ha nyerni akarsz.:-)
süti beállítások módosítása