Statisztika egyszerűen

Mágikus jelek nélkül...

Burgonya dilemma– A Yates-féle kísérlettervezés 1. rész

2022. február 27. 18:23 - glantos70

Továbbra is futom a köreimet a kísérlettervezési módszerek körül. Ebben a cikkben egy olyan kísérlettervezési módszert mutatok be, ami elsőre lenyűgözött az egyszerűségével, majd pedig azzal, hogy mennyire nehéz volt rájönni, miért működik. Azt egyébként nem mondanám, hogy ez egy mainstream alkalmazás, életemben nem hallottam még róla – egészen mostanáig.

Sajnos ez a cikk is igen terjedelmesre sikerült, mert próbáltam annyira részletesen elmagyarázni a számítások lényegét, hogy ez már a terjedelem rovására ment. Ezért is bontottam két részre a cikket, hogy valamennyire még azért élvezhető legyen a kitartó olvasóknak.

Persze megkérdezheted, hogy miért lehet jó egy újabb kísérlettervezési módszert megtanulni a Latin négyzet (Káoszból rendet – Hogyan segít a véletlen rendet vágni a káoszban? és Nem muszáj kézzel számolni… - Latin négyzet kísérletterv R-ben), a faktoriális kísérletterv (Zanzásított ismeretszerzés - a kísérlettervezésről, ahogy én látom) és a Taguchi-kísérletterv (Kísérlettervezés kifejezetten mérnököknek – Taguchi-féle kísérlettervezés) mellé. Kifejezetten gyakorlati hasznát nem feltétlenül látom a módszer alkalmazásának, azt mondanám, hogy ennek a cikknek inkább statisztikatörténeti szempontból van jelentősége.

Frank Yates 1937-ben publikálta ezt a módszert a Rothampsted kísérleti állomáson Sir Ronald Fischerrel együtt végzett munkájáról. Azért az egy olyan korszak volt, mikor még nem léteztek számítógépek, csak bonyolultan kezelhető mechanikus számológépek, illetve a matematika és a statisztika sem állt még azon a szinten, mint napjainkban.

A módszer elsőre nem is tűnik bonyolultnak. A kísérletterv elkészítése hasonló a fentebb említett más módszerekhez. Kiválasztjuk a kimenetet potenciálisan befolyásoló tényezőket, majd meghatározzuk ezek alacsony és magas értékeit. Valahogy így:

Az első érdekes dolog itt következik. Yates módszere esetében az egyes alacsony-magas kombinációkat pontosan megadott sorrendben kell számba venni, ahogyan az a fenti táblázatban is látható. A módszer természetesen nemcsak 3 tényező esetén működik, 4 vagy több tényező esetén is alkalmazható, de a tényezők sorrendje ezekben az esetekben is kötött. Azért az egyszerűség kedvéért a 3-tényezős változatot fogom bemutatni. Szerencsére a példa is adott, mert Yates eredeti cikkében egy példán keresztül mutatja be a módszer alkalmazását.

A példa egy olyan kísérlet, amelyet 1934-ben végeztek el a korábban már említett Rothamsted experimental station egyik földterületén. A kísérlet során a nitrogén (n), a hamuzsír (h) és a szerves trágya (s) hatását vizsgálták a burgonya hozamának növekedésére. A kísérlet során természetesen nemcsak azt vizsgálták, hogy ezek az anyagok önmagukban milyen hatással vannak a növény fejlődésére, hanem azt is, hogy a fenti anyagok egyes kombinációinak milyen a hatása a terméshozamra.

A kísérlet során egy földterületet 32 egyforma méretű parcellákra osztották fel. Így a területet 4 blokkra tudták felosztani úgy, hogy mind a négy blokk 8 parcellát tartalmazott. Természetesen mind a 4 blokkban 8 parcella volt, amelyekbe a háromféle anyag különböző kombinációit alkalmazták véletlenszerű elrendezésben. Egy adott parcellára vagy adagoltak az adott típusú trágyából, vagy nem. Ha adagoltak, akkor minden parcellába ugyanannyit tettek az adott anyagból. A kísérlet teljessége érdekében voltak olyan parcellák is, amelyekben egyik trágyát sem alkalmazták, ezeket (-) jellel jelöltem meg. Az egyes parcellákban lévő betű kombinációk jelzik, hogy az adott területen milyen típusú trágyák kerültek kiszórásra, az alattuk lévő számok pedig azt jelzik, hogy az adott parcellában mekkora (hány tonna) volt a terméshozam.

Ha összegezzük, hogy mennyi burgonya termett az egyes blokkokban, akkor azt láthatjuk, hogy a blokkonkénti hozam nagyjából megegyezik, vagyis valószínűleg nincs nagy különbség az egyes blokkok között.

A következő lépésben nem blokkonként, hanem a kezelési mód szerint összegezzük az egyes parcellákra eső terméshozamokat. A hivatkozások között található cikkben, amelyből a példa származik, Yates professzor átváltotta az abszolút mennyiségeket hektáronkénti mennyiségekre (csak, hogy nehezebben lehessen követni a számítást?). A jobb követhetőség kedvéért én a teljes és a hektáronkénti hozamokat is feltüntettem.

Csak, hogy érthetőbb legyen az összegzés, az egyes kezelési módokhoz tartozó hozamokat úgy számoltam ki, hogy összesítettem azoknak a parcelláknak az eredményeit, amelyeknél az adott kezelési mód volt alkalmazva. Vagyis 101 + 106 + 87 + 131 = 425 tonna.

A tonna / hektár értékeket a cikkből vettem ki, ezek alapján úgy tűnik, hogy az egyes parcellák mérete kb. 150 hektár volt.

És akkor most jön a cifrább része a dolognak. Nézzük meg, hogy milyen adatokból tudhatjuk meg azt, hogy mondjuk a szerves trágyának milyen hatása van az egyes növényekre.

Ehhez össze kell számolnunk az összes olyan lehetőséget, ahol csak a szerves trágya hatása a különbség adott parcellák között!

Először is vannak azok az esetek, amikor nitrogént és hamuzsírt nem adunk hozzá a földterülethez. Ezek azok a parcellák, amelyekhez vagy nem adtunk hozzá semmit, vagy csak szerves trágyát adtunk a földhöz.

A két eset között csak az a különbség, hogy adtunk-e szerves trágyát a földterülethez vagy sem, vagyis a kétféle kezelési mód hozamának különbsége megadja a szerves trágya hatását. Ez esetben ez 8,59 – 2,84 = 5,75 tonna / hektár.

Ezzel viszont még nem ért véget a történet, mert

más olyan esetek is vannak, amikor kétféle kezelési mód között csak a szerves trágya alkalmazása, vagy annak hiánya a különbség!

Például vannak azok a területek, ahol hamuzsírt és szerves trágyát alkalmaztak, illetve azok, ahol pedig csak hamuzsírt. Ezeknél ugyanúgy a szerves trágya megléte vagy hiánya az egyetlen különbség, így a kétféle kezelési mód hatásának különbsége megadja a szerves trágya hatását önmagában.

Azaz, ha kivonjuk a hamuzsírral és szerves trágyával kezelt területek hozamából a hamuzsírral kezelt területek hozamát, akkor megkapjuk a keresett hatást, tehát 11,2 – 8,59 = 3,71 tonna / hektár.

Van még két ilyen eset:

Az egyik, amikor a nitrogénnel és szerves trágyával kezelt területek hozamát hasonlítjuk össze a csak nitrogénnel kezelt területekével.

Ezek szerint itt a szerves trágya 9,35 – 2,85 = 6,5 tonna / hektárral emelte meg a termésátlagot.

A negyedik eset pedig az, amikor azokat a parcellákat hasonlítjuk össze, ahol mindhárom összetevőt alkalmaztuk azokkal, ahol csak a nitrogént és a hamuzsírt használtuk.

Így ebben az esetben a szerves trágya hatása 12,1 – 8,06 = 4,04 tonna / hektárral emelte meg a hozamot.

Ha ezt a 4 esetet egy táblázatban összegezzük, akkor a következőt láthatjuk:

A négyféle eset azt mutatja, hogy a szerves trágya hatására átlagosan 5 tonna / hektárral nő a burgonya terméshozama.

A nitrogén és a hamuzsír hatását nem vezetem le ennyire részletesen, de az összefoglaló táblázatokat ideteszem, utána tudsz majd számolni, ha lesz kedved és türelmed.

Így a fő hatásokkal meg is lennénk, jól látható, hogy a legnagyobb hatása a szerves trágyának van, a hamuzsír szintén jelentősen növeli a hozamot, nitrogént önmagában viszont teljesen felesleges adagolni, csak kidobott pénz.

Interakciók

Az interakciók jelentéséről eddig még keveset írtam. Egy adott jellemzőre ható két bemeneti tényezőnek akkor van interakciója, ha a két jellemző együttes hatása lényegesen eltér az egyes jellemzők hatásától külön-külön. Erre lehet példa az alkohol és a gyógyszerek együttes hatása. Ha alkoholt iszom, akkor maximum jó kedvem lesz, rosszabb esetben másnapos leszek tőle. A gyógyszerek önmagukban megfelelően adagolva meggyógyítják a betegségeimet. De ha bizonyos gyógyszerek szedése esetén alkoholt iszom, akkor abba akár bele is halhatok.

Vagyis egy tényező hatása megváltozik, ha egy másik tényező is jelen van. A mi példánkban is van egy ilyen interakció, bár a példa talán nem annyira meggyőző.

A szerves trágya hatása a fenti adatok alapján sokkal jobb, ha nem adagolunk hamuzsírt is a talajhoz, mint ha adagolunk. A fenti táblázat első és harmadik sorában látható, hogy a terméshozamok 5,75, illetve 6,5 tonna / hektár, amikor csak szerves trágyát adtunk a talajhoz, míg a második és negyedik sor alapján csak 3,71, illetve 4,04 tonna / hektár, ha a talajhoz hamuzsírt is adagolunk.

De vajon van-e különbség aközött, ha nitrogént is adagolunk a másik két összetevőhöz, vagy ha nem? Amikor nem adagolunk nitrogént, akkor a hamuzsír nélküli és a hamuzsíros állapot különbsége 5,75 – 3,71 = 2,04 tonna / hektár. Amikor adagolunk nitrogént, akkor viszont ugyanez a különbség 6,5 – 4,04 = 2,46 tonna / hektár. A különbség nem tűnik túl nagynak, de azért különbség. Vagyis a hamuzsír hatása más, ha adagolunk nitrogént, vagy ha nem.

Mivel még jelentős mennyiségű számolás áll előttünk, ezért most itt befejezem ezt a cikket és majd a következő cikkben fogom folytatni a módszer ismertetését.

Hivatkozások:

Frank Yates: The design and analysis of factorial experiments, Imperial Bureau of Soil Science, Harpenden, England, 1937

Wikipedia – Yates analysis
https://en.wikipedia.org/wiki/Yates_analysis

Hans Riedwyl: Modifying and using Yates’ algorithm, Statistical Papers 39, 41 – 60 (1998)

Engineering Statistics Handbook: Yates Algorithm
https://www.itl.nist.gov/div898/handbook/eda/section3/eda35i.htm

 

2 komment

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr7417767572

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

gigabursch 2022.03.03. 08:38:04

Ez izgalmas!
Ezek a többváltozós - interakciós témák nagyon sok odafigyelést igényelnek.

glantos70 2022.03.03. 08:43:04

@gigabursch: Egyetértek! Hogy őszinte legyek, eléggé megizzasztott, mire tényleg megértettem, hogy hogyan szedegette össze a főkomponensek és az interakciók hatását Yates professzor. Szerintem nagyon ötletes az egész. A folytatásban pedig majd jön az egyszerűsített módszer ugyanezek összegyűjtésére, mit még mindig el lehet rontani, ha kézzel számolja az ember, de mondjuk egy képletezett excel táblázattal már egészen jól automatizálható a dolog. Az viszont még nagyobb kihívás volt, mire megértettem, hogy ez az egyszerűsített módszer hogyan működik! :-)
süti beállítások módosítása