Statisztika egyszerűen

Mágikus jelek nélkül...

Pont diagram - Egy egyszerű, de sokoldalú eszköz

2019. április 26. 09:45 - glantos70

Vizuális statisztika

Az adatok ábrázolásának egyik legegyszerűbb módja az adatgyűjtő lap, ahol a különféle kategóriákba tartozó egyedek előfordulási gyakoriságát egyszerű strigulák húzogatásával ábrázolhatjuk. A könnyebb olvashatóság érdekében ezeket a vonalakat ötösével csoportosíthatjuk, valahogy így:

.

Mivel egy ilyen adatgyűjtő lap használatához csak papírra és ceruzára van szükség, illetve a vonalak rajzolgatásával egyszerre dokumentáljuk az egyedek számát, illetve rajzolunk diagramot is, ennél egyszerűbb és gyorsabb adatfeldolgozás nem igazán létezik. Ennek a módszernek a számítógépes formája a pont hisztogram. Bár sokan ezt hívják pont diagramnak, de szerintem ez megtévesztő, mert a pont diagramnak nagyon sok formája és felhasználási módja van. Az alábbi pont hisztogram 50 darab dobókocka dobás eredményét ábrázolja.

Kevés számú adat ábrázolása esetén ennek az ábrázolási módnak nem sok hozzáadott értéke van a vonalak húzogatásához képest az adatgyűjtő lapon és kevés adat esetén az gyorsabb eredményt ad. Nagy mennyiségű adat esetén annyiban más a pont hisztogram alkalmazása, hogy a pontok száma nem megegyezik, hanem arányos az x-értékek előfordulási gyakoriságával. Hasonló esetekben a hisztogram alkalmazása elterjedtebb, erről majd később még szót fogunk ejteni.

Számomra a pont diagram az adatoknak ponthalmazként vagy pontfelhőként történő ábrázolása. Az adatok előzetes vizsgálatakor sok esetben előnyösebb az adatokat így ábrázolni, ahogyan azt a fejezet elején már bemutattam. A szokásostól eltérő mintázatok vagy kieső pontok így sokkal hamarabb feltűnnek, így ezeket már az elemzés elején ki lehet szűrni és keletkezésük okait is hatékonyabban lehet vizsgálni.

 A pont diagram alkalmas két változó viszonyának vizsgálatára is. Erre jó példa az áramfogyasztás és a villanyszámla kapcsolatának vizsgálata.

Ha a diagramhoz egy burkoló görbét is hozzáadunk, akkor még szemléletesebb lesz az ábra, mert így azt is láthatjuk, hogy az egyes villanyszámlák esetében az adott fogyasztásért fizetett villanyszámla mennyire tér el az „átlagos” vagy „várható” értéktől.

Ezt tovább kombinálhatjuk azzal, ha a leolvasás módja (diktált vagy becsült) szerint különböző színekkel ábrázoljuk a pontokat.

A pont diagram egészen komplex szintre is fejleszthető, ahol akár 4-5 különböző jellemző összefüggéseit is meg tudjuk mutatni így…

… vagy akár így is…

Természetesen ezeknél az összetett diagramoknál nagyon fontos az áttekinthetőség, illetve az, hogy az általunk megmutatni kívánt összefüggések vagy következtetések jól láthatóak legyenek. 

Szólj hozzá!

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr6114748155

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása