Statisztika egyszerűen

Mágikus jelek nélkül...

Szegény ember vízzel főz?

2019. március 29. 10:00 - glantos70

Eszközök

 

A statisztika alkalmazását jelentősen megkönnyítik a különböző szoftverek és alkalmazások, mert használatukkal a bonyolultnak tűnő számítások is játszi könnyedséggel végezhetők el. Beadjuk az adatokat a szoftvernek, amely kidobja az eredményt. Akkor mégis miért kell megérteni és megtanulni azt a rengeteg elméletet és képletet, amely ebben a könyvben szerepel? Miért nem elég csak beadni az adatokat, megnyomni a gombot és megkapni a végeredményt?

Sajnos ez azért nem ennyire egyszerű. Egyrészt a napjainkban rendelkezésre álló számítógépes eszközök nem a hétköznapi emberek számára íródtak, hanem olyan szakemberek részére, akik rengeteg tudással és tapasztalattal rendelkeznek a statisztika területén. Emiatt a szoftverek által adott eredmények nehezen értelmezhetőek a kevésbé tapasztalt szakemberek számára. Másrészt már az adatok összegyűjtésekor gondoskodni kell arról, hogy a feldolgozandó adatok tartalma és formátuma alkalmas legyen a tervezett elemzések elvégzésére, ehhez viszont elengedhetetlen az elvégzendő statisztikai tesztek és elemzések részletes ismerete.

A hétköznapi ember gyakran beleszalad abba a problémába, hogy nincs pénz vagy lehetőség a szükséges statisztikai elemző szoftverek beszerzésére, tehát eleve nem lehetséges a kulcsrakész eszközök használata. Ha minden kötél szakad, akkor még mindig rendelkezésre áll a papír, a ceruza és a számológép. Persze így időigényesebb és több szakértelmet igényel az adatok feldolgozása, de nem lehetetlen. Így egy hozzáértő szakember mindenféle drága eszköz nélkül is el tud végezni egy csomó különféle elemzést, ha elegendő idő áll a rendelkezésére. Természetesen ez a legolcsóbb megoldás, hiszen ehhez semmilyen beruházás nem szükséges.

Az előzőekhez képest komoly előrelépés, ha rendelkezésre áll egy számítógép a rajta futó Microsoft Excel programmal, illetve ennek valamilyen ingyenes alternatívájával. Ebben az esetben még mindig szükség van a statisztikai eszközök mélyebb ismeretére, de a ráfordított idő természetesen sokkal kevesebb, mint az előző esetben. A táblázatkezelő programok alkalmazása jelentősen lerövidíti a számításokhoz szükséges időt és energiát még akkor is, ha nem használunk semmilyen kész megoldást. A táblázatkezelő programokhoz ezen felül léteznek különféle bővítmények, amelyek segítségével a bennük tárolt adatok feldolgozhatók anélkül, hogy minden számítást magunknak kellene elvégeznünk, azonban sokszor ezek funkcionalitása is korlátozott. 

A táblázatkezelő programok esetében a ráfordítás nyilván magasabb, mintha mindent kézzel végeznénk el, mert a számítógép és a táblázatkezelő programok sajnos nincsenek ingyen.

Léteznek ingyenes statisztikai elemző programok, amelyek képesek az egyszerűbb statisztikai tesztek elvégzésére, de számíthatunk arra, hogy az ingyenes programok tudása korlátozott, vagy pedig a kezelése bonyolult. Ilyen például az R (https://www.r-project.org/)amely egy igen széleskörben alkalmazható statisztikai program, amelynek Linux és Windows környezetben futó változata is elérhető. A program képességeire nem lehet panasz, viszont a különböző tesztek parancssorból vagy előre megírt szkriptek, azaz parancsok sorozatát tartalmazó file-ok segítségével futtathatók. Akit ez nem zavar, az több-kevesebb utánajárással elsajátíthatja a program kezelését. Aki elszánja magát arra, hogy elsajátítsa az R kezelését, az szerencsére elég sok dokumentációt találhat az interneten, akár magyarul is. Az irodalomjegyzékben feltüntettem néhány hasznos magyar nyelvű forrást is, amely jól alkalmazható a tanuláshoz. Az R kezelésének megkönnyítésére létre lett hozva több grafikus felhasználói felület is, amelyeknek a segítségével az R-parancsok és szkriptek futtatása, illetve az eredmények megjelenítése egyszerűbbé vált, de ettől még maradt az alapvetően parancssoros kezelhetőség.

Aki szorgalmasan keresgél az interneten, elég sok ingyenes programot találhat, de én még egyetlen más olyan programot sem találtam, amit igazán jószívvel ajánlanék egy átlagos felhasználónak.

Külön említést érdemelnek az online statisztika elemző oldalak, amelyek alkalmazásához nem szükséges semmilyen programot telepíteni a számítógépre. Ezek között is lehet keresgélni, de a helyzet egy kicsit hasonló az ingyenes statisztikai programokéhoz, itt is nehéz igazán használható megoldást találni. Ezen kívül további nehézségeket jelent az ingyenes programok gyenge dokumentáltsága, a kezelési leírások, illetve az eredmények értelmezéséről szóló útmutatók, ez pedig ismét csak azt feltételezi, hogy a felhasználó rendelkezik a szükséges ismeretekkel.

Az ingyenes programok további hátránya, hogy nem lehet biztosan tudni, hogy a program által elvégzett számítások helyesek-e, az alkalmazott algoritmusok nincsenek független fél által ellenőrizve és jóváhagyva. Így nem lehetünk biztosak abban, hogy a szoftver megfelelően számol. Mivel a számítások részleteit ezek a szoftverek nem jelenítik meg, így leellenőrizni sem tudjuk a számítások helyességét. Ez sajnos megkérdőjelezi az ilyen programok, illetve weboldalak alkalmazhatóságát, ha igazán fontos elemzésekről van szó.

Amennyiben sokszor készítünk statisztikai elemzéseket és ezek eredményei hoznak annyit a konyhára, amely már kitermeli egy statisztikai program vagy programcsomag árát, akkor már eléggé széles a választék. Műszaki területen, illetve ott, ahol a széleskörben alkalmazzák a Six Sigma módszertant, ott a Minitab program a legelterjedtebb. Más tudomány területeken inkább más szoftverek terjedtek el, például az SPSS vagy az SAS. Mindegyik professzionális szoftverre igaz, hogy jól kezelhető grafikus felülettel rendelkeznek, az adatfeldolgozás, a statisztikai elemzések, illetve a grafikus elemző eszközök széles tárházát vonultatják fel. Előny, hogy ezek a szoftverek részletes kezelési útmutatókkal és tréning anyagokkal rendelkeznek az egyes eszközökről (Pl.: Minitab Help és StatGuide). Az átlagos felhasználó számára ennek ellenére problémás lehet a szoftverek alkalmazása, mert az elemzések és a riportok a szakemberek számára készültek, az átlag felhasználó számára nehezen értelmezhetők.

A fentiek alapján mindenki kiválaszthatja, hogy melyik megoldás a számára a legkedvezőbb áttekinthetőség, erőforrás igény és a ráfordítható anyagiak függvényében.

Nekem szerencsém van, mert jelenleg tudom használni a Minitab-ot, de felkészülve a nehezebb időkre elkezdtem tanulni az R programozását és kialakítani azt az eszköztárat, amellyel ugyanazt meg tudom majd csinálni, mint a Minitab-bal. A későbbiekben szeretném majd bemutatni itt a blogon is, hogy meddig jutok ezzel a projekttel.

Szakirodalom:

Vág András: Szabad hozzáférésű statisztikai elemző szoftverek a Világhálón, Statisztikai Szemle, 84. évfolyam, 4. szám

Abari Kálmán: Bevezetés az R-be – Oktatási segédlet

Szólj hozzá!

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr2114684742

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása