PrydeRide

PrydeRide
Fotograf: Torkel Stillefors

söndag 8 december 2013

Statistik som prediktor för kommande prestanda


Jag har senaste tiden ägnat mig en del åt statistik och simuleringar, s.k. Monte Carlo simulation, av olika fenomen.  Eftersom jag råkade hitta mina data över resultaten för C55 Eastfleet och SM för säsongerna 2010-2011, så stoppade jag in värdena för dessa resultat - normaliserat till procentuell placering i fältet, dvs att bli 2:a i ett fält på 10 båtar ger normaliserat resultat 0.20, att bli 2: i ett fält med 40 båtar ger normaliserat resultat 0.05 osv - för det team jag hade flest datapunkter på, JoZeBa.  Med andra ord, det jag matade in i formlerna var dels medelresultatet över dessa ca 20 kappseglingar, samt standardavvikelsen, och bad sedan mitt simuleringsprogram att ta fram hur en resultatfördelning, givet dessa ingångsparametrar skulle se ut. Jag har antagit att resultaten i segling är normalfördelade, vilket jag inte har nån annan fog att göra än att bl.a Central Limit Theorem talar för detta....

Ovanstående graf visar resultatet över 100.000 sådana körningar i simuleringsprogrammet.  På X-axeln ligger resultatet, dvs den förväntade relativa  placeringen i ett fält av godtycklig storlek, och på Y-axeln finns frekvensen, i den översta representerar frekvensen antal race med given placering, i den nedre relativ fördelning av resultaten. 

Hur ska man tolka dessa grafer...? Om vi tittar på den övre grafen först, så kan vi där avläsa att teamet i ca 68% av racen placera sig i intervallet 33% +- 17%, dvs inom 1 standardavvikelse från medelvärdet på 33%, dvs i intervallet 16-40%, vilket i ett fält med 20 båtar skulle innebära placeringsintervall  3-8.  

Från den kumulativa kurvan kan vi t.ex. avläsa att i ungefär 18% av racen, ca var 6:e race, skulle teamet placera sig inom 15% av fältet, vilket i ett 20-båtars fält motsvarar placeringarna 1- 3.  Från samma graf kan vi också avläsa att 'bottennappen', dvs resultat i den sämre halvan av fältet, bör förekomma ca 15% av racen, dvs ungefär 1 gång på 7 race. 

Detta stämmer mycket väl med min minnesbild över säsongerna 2010-2011, men det borde det ju göra, eftersom inparametrarna till modellen är hämtade från just den verkligheten.   Således, givet att inget radikalt förändras, t.ex teamets egen kompetens, eller motståndets kvalite', så ger denna typen av modeller en hygglig fingervisning om var någonstans man kan förvänta sig ett resultat i kommande helgs kappsegling. 

Nu har ju JoZeBa mer eller mindre lagt C55-karriären på hyllan, så relevansen av dessa resultat är mest av historiskt interesse. 

torsdag 5 december 2013

Segling: tur eller skicklighet ?

För ett tag sen - oops, två år sen! - skrev jag ett inlägg om seglingsportens komplexitet.

Eftersom jag i min andra, professionella värld ägnat mig en del åt simuleringar, s.k. Monte Carlo simuleringar på sistone, så testade jag en motsvarande simulering på segling. Dvs ett försök att förklara varför en världsstjärna som Ben Ainslie kan i nåt race hamna mitt i fältet, trots att han ändå så småningom vinner regattan.

Resultaten av den övningen finns på min andra blogg.