Statisztika egyszerűen

Mágikus jelek nélkül...

A Sidney – Hobart Yacht verseny – Szigorúan monoton fejlődés

2019. november 15. 08:30 - glantos70

Statisztikai elemzések

A legendás Sidney - Hobart yachtverseny a világ egyik legnehezebb hajóversenye, a yacht versenyek Everest-jeként is emlegetik. A verseny során az ausztráliai Sidney-ből kell eljutni a Bass szorost keresztezve Tasmánia fővárosába, Hobart-ba. A verseny minden évben nagy esemény, amelyet Karácsony másnapján indul el, hogy azután az indulók 2-6 nap alatt eljussanak a 630 tengeri mérföldre lévő célig.

A Bass-szoros Ausztrália és Tasmánia között található körülbelül 300 kilométer hosszú tengerszoros, amely a Tasmán-tengert köti össze az Indiai-óceánnal. Ez a terület híres az erős szelekről és a szeszélyes hullámzásról. A verseny nagy része a Tasmán-tengeren zajlik, a verseny útvonalának közelében lévő sekély tengerszorosnak erős hatása van a verseny körülményeire. Noha a versenyt az Ausztrál nyárban rendezik, az erre a területre jellemző gyakran váltakozó viharos szelek miatt a verseny gyakran van hideg, a magas hullámok miatt az út egyenetlen és ezért nagy kihívást jelent a versenyzők számára. A bal oldali ábra mutatja meg a viharos időjárás kialakulásának fő okát, a jobb oldali pedig a hullámok magasságát, illetve a szél sebességét adja meg az 1998-as verseny során. A hullámok átlagosan 3-5 méter körüli, de voltak olyan hullámok is, amelyek elérték a 10-12 méteres magasságot is. A szél sebessége elérte a 64 csomós (~120 km/órás) sebességet is!

Az esemény eredetileg nem versenynek indult, Peter Luke és barátai egyszerű átkelést terveztek, de John Illingworth kapitány, a Királyi Haditengerészet tisztje azt javasolta, legyen inkább verseny. A legelső versenyen végül 9 hajó indult el és végül a kihívó, John Illingworth nyerte meg a versenyt ’Rani’ nevű hajójával. Azóta minden évben megrendezik az eseményt, amely egyfajta megmérettetést jelent a tengeri vitorlázók számára.

Ami a számomra is érdekessé tette ezt a versenyt az az, hogy a verseny Wikipédia oldalán közzétették az eddigi összes verseny győzteseit és azok időeredményeit. Természetesen ez egy remek alkalom arra, hogy elemezük egy kicsit ezt az adatsort. Már az első pillanatban szembetűnik, hogy mennyit javultak az időeredmények a verseny története során. Az első versenyzőknek még több, mint 6 napra volt szükségük az út megtételéhez, míg a legutóbbi versenyeken már alig több, mint egy nap is elég volt az átkeléshez.

Nézzük meg, hogyan néznek ki az adatok az idő függvényében:

Jaj de szép! Igazán szépen látszik, hogy az eltelt évtizedek során hogyan javultak az időeredmények. Természetesen az egyedi értékeknek van valamekkora szórása, de a trend ragyogóan látszik. Csak a kíváncsiság kedvéért kiszámoltam az évek és a győztes időeredmények közötti korreláció mértékét (Valaki átírta a korrelációs együttható képletét, hogy ne lehessen érteni? Ez most komoly…?).

Amint az látható, a korrelációs együttható értéke kb. -90% lett, ami ugye egy erős negatív korrelációt jelent. Noha erre semmilyen tudományos érv nem létezik, én a magam részéről neki sem kezdek a regresszió elemzésnek, ha a korrelációs együttható nincs 0,9 vagy -0,9 közelében. Ez nem általános szabály, ez csak az én saját külön bejáratú szabályom, vitatkozni lehet vele. Persze előfordul, hogy vannak kieső értékek, vagy olyan magyarázható mintázatok, amelyeket adott feltételek mellett ki lehet zárni. Végül is azért akarjuk meghatározni a regressziós egyenes egyenletét, mert jelen esetben szeretnénk megjósolni, hogy vajon körülbelül mennyi lesz a győztes időeredmény mondjuk 2030-ban, ez viszont nem ad megbízható eredményeket, ha a két változó korrelációja eleve nem elég erős.

A korábban megjelent bejegyzéseimben már összefoglaltam a regresszió elemzés elméleti hátterét:

Most pedig rakjuk össze mindezeket az ismereteket, és alkalmazzuk az eddig megtanultakat egy gyakorlati példán!

A teljes táblázat a következőképpen néz ki:

A bal felső sarokban lévő diagramot már bemutattam, most részletesen ismertetem majd a számítás menetét. Amint azt már korábban megtudtuk, egy egyenes egyenletét keressük, amelynek a formája y = ax + b. A feladat a és b értékének meghatározása.

Az ’a’ változó értékének meghatározásához a következő képletet alkalmazzuk:

Ehhez viszont ki kell számolnunk Sy, Sx és rxy értékeit. Mindhárom képlet jelentését részletesen ismertettem a fentebb említett bejegyzésekben, érdemes ezeket is átolvasni a jobb megértés kedvéért. Az évek és a győztes időeredmények szórása a következőképpen néz ki:

Ahogyan azt már fentebb láttuk, a korrelációs együttható pedig a következő képlettel számítható ki:

A szórások kiszámításához először is kiszámítottam az évekre és a győztes időeredményre vonatkozó adatsorok átlagát, …

… majd az adatsorok összes elemére kiszámítottam az Xi - X̅, valamint az Yi - Y̅ különbségeket, majd ezek négyzetét is. Természetesen ide csak a táblázat első elemeit másoltam be, de természetesen az adatsor mind a 74 elemét tartalmazza a táblázat. A jobb felső sarokban kiszámítottam az Sy és az Sx szórások képletében a számlálók értékeit.

Ezután már csak az a feladat maradt, hogy a fent kiszámított számlálók értékeit el kellett osztani n-1-gyel, azaz 73-al, majd e hányadosokból gyököt kellett vonni.

A korrelációs együttható kiszámítása hasonló módon történik, az 'rxySum' mező a fentebb bemutatott képletben a szumma jel utáni képlet eredménye:

Ezután ezt az összeget is csak el kellett osztani n-1-gyel és meg is kapjuk rxy értékét.

Innen 'a' értékének kiszámítása már gyerekjáték, hiszen csak be kell helyettesíteni a fent kiszámított értékeket a egyenletébe.

'b' értékét úgy kapjuk meg, hogy a regressziós egyenes képletébe beírjuk a, x̅ és y̅ értékeit, és kifejezzük az egyenletből 'b'-t.

Hurrá! Megkaptuk a keresett egyenes mindkét tényezőjének értékét, így nincs más dolgunk, minthogy rárajzoljuk az egyenest a korábban bemutatott scatter-diagramra. Ehhez készíthetünk egy külön táblázatot, ahol minden egyes évhez kiszámoljuk, hogy az adott évben mennyi a kapott regressziós egyenlet alapján kapott érték:

Ezt az adatsort hozzáadva a korábban bemutatott diagramhoz jól láthatjuk, hogy az egyenesre szépen illeszkednek az adatpontok, vagyis valószínűleg nem végeztünk rossz munkát.

A regressziós egyenes egyenlete tehát a következő:

Utolsóként annyi feldatunk maradt, hogy kiszámítsuk, mennyi lenne a győztes idő 2030-ban

Vagyis az egyenletünk azt jósolja, hogy 2030-ban a győztes idő 97 042 másodperc lesz, azaz 1617,36 perc. vagyis 26,96 óra, azaz 1 nap és ~3 óra lesz, körülbelül ennyi kell majd a győzelemhez. 2018-ban A "Wild Oats XI" nevű hajó 1 nap 19 óra 7 perc és 21 másodperces időeredménnyel nyert, vagyis a következő 12 évben körülbelül 16 órával javulnak majd az időeredmények, ha minden a terv szerint halad.

Összefoglalás:

Számomra fantasztikus az a kitartó és magasszintű mérnöki munka, amely ezt a töretlen fejlődést eredményezte. Ne felejtsük el, hogy mindez 75 év kitartó munkájának köszönhető, vagyis valószínűleg nem egy, hanem legalább 2-3 nemzedék részvételét feltételezi. Bár nem vagyok vitorlás rajongó és nem is tudok vitorlázni, részemről megemelem a kalapom mindazok előtt, akik részt vettek és részt vesznek ennek a csodálatos teljesítménynek az elérésében.

A további bejegyzésekben egyrészt bemutatom majd, hogy hogyan kell elvégezni ugyanezt az elemzést a Minitab programmal, illetve azzal fogunk foglalkozni, hogyan tudunk meggyőződni arról, hogy mennyire jó a regressziós egyenesünk.

Források:

https://en.wikipedia.org/wiki/Sydney_to_Hobart_Yacht_Race

https://www.abc.net.au/news/2018-12-26/sydney-to-hobart-1998-east-coast-low-changed-marine-forecasting/10286796

6 komment

A bejegyzés trackback címe:

https://statisztikaegyszeruen.blog.hu/api/trackback/id/tr3815226204

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

molnibalage · https://militavia.blog.hu/ 2019.11.15. 09:44:39

Az eredmények egy idő után ki fognak laposodni, hiszen a szélsebesség korlátos és a vitorlások emiatt egy adott sebességnél nem tudnak gyorsabban menni.

Mivel lehet kiszámolni azt, hogy akkor megadsz egy végértéket? Ráadásul akkor már nem lesz lineáris az összefüggés.

Erre milyen módszert lehetne használni?

Azért kérdem, mert energetikában egyesek mantjára az "exponenciális" árcsökkenés a naperőművek vagy csak simán a PV cellára, amikor ez ránézve sem igaz. Erre jópofa lenne egy számítást csinálni a meglevő adatsorokkal, hogy akkor mi azt, amit a görbék alapján lehet mondani.

glantos70 2019.11.17. 11:46:24

@molnibalage: Szia Balázs, teljesen igazad van, neked van ilyen adatsorod? Ugyanis abban az esetben, ha az egyenes meredeksége "kisimul", akkor nem lineáris, hanem exponenciális görbét kell keresnünk. Nyilván más lesz a görbe egyenlete, de lehetséges megkeresni az inflexiós pontot, ahol a görbe elfordul. Előre viszont ezt nehéz megjósolni, mert ez nagyon függ a vizsgált jelenség fizikai korlátaitól. Ne felejtsd el, hogy már megdöntötték a 100m síkfutás 10 másodperces és nemrég a maratonfutás kétórás "álomhatárát" is. Ki tudja megmondani, hogy hol a vége?

molnibalage · https://militavia.blog.hu/ 2019.11.17. 16:25:09

@glantos70: A maratoni futás álomhatárát nem verseny körülmények között döntötték meg.
Annak végső határa kb. ismert, pár % nem befolyásolja a görbét, ahhoz képest, ahol indult, amihez hozzásimul.

A hajózásnál én ezt egyszerűen úgy venném fel, hogy megnézem a valaha mért leggyorsabb vitorláshajót, amit több percig vagy óráig mértek. Az az ideális. Ezzel veszed a versenytávot a legrövidebb hosszon. Na, ez sanszosan soha nem lesz meg (mert a szél nem állandó, nem a legrövidebb út a leggyorsabb, stb.), de ehhez lehet simítani a görbét.

A 10 méteres síkfutás rekordja 1936 óta hogyan javult?

1936 Jesse Owens 10.2 Ez volt cirka 80 éve.

1976, ehhez legközelebbi elektronikus mérés 1983. Calvin Smith 9.93, de ezt 1,4 m/s hátszéllel, ami azért már közelít a max. 2 m/s engedélyezetthez. 40 év alatt kb. 2,5%-ot fejlődtek.

1996 Donovan Bailey 9.84. Hát, ez 3,5% 60 év alatt. További 20 év alatt alig 1%.

2009 Usain Bolt 9.59. 13 év alatt 2,5%, 80 év alatt is csak 6%.

Itt lényegében a bibi az, hogy Usain Bolt mérete, felépítése és minden más annyira egyedi, hogy ő gyakorlatilag a skálán kívül esik. Az egész futó történelemben, mióta ezt jegyzik nem volt hozzá hasonló alkatú sprinter. Egész egyszerűen X időnek ehhez el kell telni, hogy szülessen egy ilyen, és ne sérüljön le, ne történjen vele semmi ÉS érdekelje is a futás.

Usain teljesítménye egy trendvonaltól való elugrás. Más ezt a rekordot kb. a génszerkesztéshez kötötte volna. Neki mázlija volt, a természet összehozta ezt. Sok sok mrd emberből egy képes volt erre...

glantos70 2019.11.18. 08:17:52

@molnibalage: Szia Balázs, teljesen igazad van abban, amit leírtál. Ezzel együtt csak annyit kérdeznék vissza, hogy amióta a 100m-es síkfutásban megdöntötték a 10 mp-es álomhatárt, azóta mennyi az álomhatár?

molnibalage · https://militavia.blog.hu/ 2019.11.18. 08:27:04

@glantos70: Ezt egy boimechanikustól vagy nem tudom kitől kéne kérdezni. A baseballban a legmagasabb dobás elvi sebessége tudtommal megvan és 110-115 mph Afelett fennállna a csonttörés az erők miatt.

A futásnál is annak közelébe vagyunk, hogy az emberi izom többet nem bír fizikailag. Persze gémódosított ember lehet, hogy ezt áttöri, akinek terveznek olyan fehérjét, aki ezt ki tudja tolni, de a fehérje önmagában nem elég.

Én erre szoktam érzékenység vizsgálatot betenni. Beállítanám a véghatárt 9.4-re majd 9.3, majd 9.2-re és nézném, hogy a köv 40+40 évben mit hozna ki a modell.

Ezen felül rekordoknál komolyan benne van az, hogy ma rekortánon futnak, Jesse Owens meg salakon. Rekortánon lehet, hogy ő is tudta volna már a 10.0-át...

glantos70 2019.11.18. 14:52:44

@molnibalage: Szia Balázs, ettől szép az élet, hogy sosem tudhatjuk biztosan a jövőt, csak egy valamekkora valószínűséggel lesz igaz, amit ma jóslunk. :-)
süti beállítások módosítása