Het toetsen van veronderstellingen

Deel dit artikel

,

geen foto beschikbaar
Belangrijk uitgangspunt in de economische theorie is dat er geen “free lunch” bestaat

1. Iets voor niets?

Belangrijk uitgangspunt in de economische theorie is dat er geen “free lunch” bestaat. Het lijkt er soms wellicht wel op maar dan blijkt toch weer dat de hogere opbrengst het gevolg is van het grotere risico dat gelopen werd om de opbrengst te realiseren.

Wat staat ons als belegger dan te doen? Volgens deze opvatting hoeven we eigenlijk alleen nog maar te besluiten “hoeveel” risico we bereid zijn te accepteren en klaar is Kees.

Toch zijn dagelijks tienduizenden beleggers al of niet beroepsmatig in de weer met het nemen van “andere” besluiten dan de bepaling van hoeveel  risico men wenst te lopen. Eén van de redenen is dat vele beleggers toch menen een manier gevonden te hebben om een “gratis lunch” te verkrijgen, nou ja ….of een gratis “snack”.

Omdat de menselijk geest nogal bedrieglijk werkt waar het “eigen belang” betreft, kan die gedachte mogelijk ook gebaseerd zijn op “wishful thinking” en derhalve niet op objectieve maatstaven.

Als we ons niet willen laten bedriegen (door anderen of door onszelf), verdient het wellicht  aanbeveling de vermeende methode tot het verkrijgen van de gratis lunch op correctheid te controleren, of om in statistische termen te spreken:  de veronderstelling te toetsen op aanvaardbaarheid.

2. Steekproeftheorie. 

Gelukkig  is er een tak van wetenschap die ons bij dit controleren op correctheid  kan assisteren: de steekproeftheorie. Een theorie die weer onderdeel vormt van het ruimere terrein van de “Waarschijnlijkheidsrekening”.

Steekproeftheorie kan ons helpen om uit een door ons waargenomen klein deel van de werkelijkheid conclusies te trekken omtrent de héle werkelijkheid. Men noemt deze gang van zaken ook wel inductie, het algemene wordt afgeleid uit het bijzondere. Dit in tegenstelling tot deductie waarbij men juist uit het algemene het bijzondere afleidt.  

3. De bouwstenen van de steekproeftheorie.

Iedereen heeft te maken met “uitkomsten”waar geen zekerheid over bestaat. Om enkele voorbeelden te noemen: het aantal ogen dat u gooit in één worp met een dobbelsteen of de slotkoers van aandeel X morgen. Men noemt dergelijke getallen “kansvariabelen”.

Bij de dobbelsteen weten we dat de uitkomst 1, 2, 3, 4, 5, of 6 zal zijn (als de dobbelsteen niet op zijn kant blijft liggen). Voor het aandeel weten we dat de slotkoers morgen met zekerheid tussen 0 en oneindig  zal zijn (als er tenminste notering is voor het fonds). Toch is er een belangrijk verschil tussen beide voorbeelden. Bij de dobbelsteen weten we dat er 6 uitkomsten mogelijk zijn en dat iedere uitkomst dezelfde “kans” of waarschijnlijkheid heeft om gerealiseerd te worden. Voor de slotkoers morgen van het aandeel, hebben we deze kennis niet en toch zouden we daar wat meer over willen kunnen zeggen.

We kunnen alle mogelijke waarden, die een kansvariabele aan kan nemen, beschouwen als één verzameling. Deze verzameling met alle mogelijke uitkomsten noemt men wel de “populatie”. Om het begrip populatie wat aanschouwelijker te maken kunnen we ons bijvoorbeeld een bak voorstellen met daarin allerlei ballen al of niet van verschillende grootte.

Steekproeftheorie geeft ons de instrumenten om op basis van een beperkt aantal trekkingen (van ballen)  uit de bak, een karakterisering te geven van de samenstelling van alle ballen (de populatie) in de bak.

Die karakterisering bestaat uit wat de Engelsen noemen “sample statistics”. Eigenlijk een soort samenvatting van de getallen. Zoals we een boek kunnen samenvatten in enkele bladzijden, zo kunnen we ook een getallen reeks (zoals bijvoorbeeld de uitkomsten van “onzekere getallen”) samenvatten. Men gebruikt daar veelal het “gemiddelde” en de “spreiding” (of standaard deviatie) van die getallen voor. Om naar die “samenvattende” waarden te verwijzen, gebruikt men er vaak vaste symbolen voor. Zo gebruikt men als symbool voor het steekproefgemiddelde de letter m , als symbool voor de spreiding van de steekproef de letter s en als aanduiding voor de omvang van de steekproef (het aantal waarnemingen of trekkingen) de letter n.  Voor de karakterisering van de populatie gebruikt men als symbolen de Griekse letters voor m en s (m (spreek uit “mu”)voor gemiddelde en s (spreek uit “sigma”) voor standaard deviatie). 

4. De Centrale Limiet Stelling

Nu even terug naar de ballenbak. We kunnen daar bijvoorbeeld  “n1”  ballen uit halen en daar de gemiddelde grootte  “m1”   van bepalen evenals de spreiding in de grootte “s1” daarvan. Als we dit verschillende malen doen, dan krijgen we naar verwachting steeds een andere waarde voor  m ( m2, m3, etc) en een andere waarde voor s (s2, s3, etc). In onderstaande afbeelding wordt dit weergegeven (zij het dat daarin een ander symbool wordt toegepast voor m: x).

 
Het is niet reëel om te veronderstellen dat welke “puntschatting” m dan ook (m1, m2, etc) , precies overeenkomt met het populatie gemiddelde. Eerder mogen we verwachten dat de “werkelijke” gemiddelde grootte van alle ballen (het populatie gemiddelde)  in een interval ligt rondom het steekproefgemiddelde.

De belangrijkste peiler van de steekproeftheorie, de Centrale Limiet stelling, geeft hier zekerheid over. Deze stelt dat:

               Het steekproef gemiddelde m  is normaal verdeeld met een gemiddelde gelijk aan 

                het populatie gemiddelde  m  en een spreiding gelijk aan  s /Ö n” .

De spreiding of standaard deviatie van het steekproef gemiddelde  (s /Ö n) wordt ook wel “standaard fout” genoemd.

Nu weten we dat bij een Normale verdeling 95% van de verdeling binnen min en plus 1.96 standaard deviaties van het gemiddelde ligt.

Als we derhalve een ballenbak hebben waarvan de ballen gekenmerkt worden door gemiddelde  m  en  standaard deviatie  s en we trekken er een steekproef uit dan is er 95% kans dat :

     m - 1.96* s/Ö n  <  m  <   m + 1.96* s/Ö n

ofwel :

“het populatie gemiddelde bevindt zich in een interval van 1.96* s/Ö n  rondom het waargenomen steekproef gemiddelde m”.
Men noemt dit interval ook wel het  betrouwbaarheidsinterval (zie hieronder).
  

 

Als n (het aantal waarnemingen) groter wordt, dan wordt het betrouwbaarheidsinterval kleiner. Immers  s/Ö n wordt dan ook kleiner. Wenst men een betrouwbaarheidsinterval met een bepaalde (kleine) waarde dan kan men dit bereiken door het aantal waarnemingen te vergroten.

5. Is mijn veronderstelling waar?

Gewapend met  bovenstaande kennis gaan we kijken of we daarmee antwoord kunnen geven op de vraag of  “iets” al of niet waar (of liever gezegd “aannemelijk”) is. Dat “iets” moeten we dan eerst in een toetsbare vorm weer geven.

We veronderstellen als het ware een “m” waarde voor de populatie en gaan kijken of het steekproefgemiddelde in het betrouwbaarheidsinterval rondom die m waarde ligt. Daartoe berekenen we een testwaarde ook wel z-waarde genoemd. Deze testwaarde geeft het aantal standaarddeviaties aan dat het steekproef gemiddelde verwijderd is van het veronderstelde populatie gemiddelde. Is deze waarde hoog dan ligt het steekproef gemiddelde ver van het veronderstelde populatie gemiddelde. Is deze waarde laag dan  ligt het steekproef gemiddelde dicht bij het veronderstelde populatie gemiddelde.

Willen we bijvoorbeeld toetsen of een populatie gemiddelde m0 aannemelijk is (we noemen dit m0 omdat we veronderstellen dat deze gelijk is aan  m) dan luidt de testwaarde of z-waarde:

                                               (m-m0)/( s/Ö n)

 Deze testwaarde vergelijken we met het aantal standaarddeviaties dat we acceptabel vinden (het significantie niveau). We weten dat 95% van alle waarnemingen bij een normale verdeling binnen een interval van plus of min 1.96 standaard deviaties van het gemiddelde liggen. Is de testwaarde kleiner dan (in dit geval ) 1.96 dan nemen we aan dat H0 waar is. Anders verwerpen we H0. Zie onderstaande afbeelding:

   

6. In zeven stappen naar de waarheid

De hele toetsings procedure kunnen we als volgt samenvatten in 7 stappen:

1. Het formuleren van de veronderstellingen:

Er zijn steeds twee, elkaar uitsluitende, veronderstellingen. De eerste “veronderstelling” wordt meestal aangeduid met de term “nul hypothese” (H0). Dit is  de veronderstelling die men wil toetsen. Deze gaat er over het algemeen van uit dat er geen verandering is opgetreden in de waarde die wij willen toetsen (de veronderstelling is dat alles bij het oude is gebleven). De tweede veronderstelling beschrijft de toestand die geldt als de eerste veronderstelling wordt afgewezen en wordt de “alternatieve hypothese” genoemd (symbool: H1).

2. Het aangeven van de mate van “onzekerheid” die men bereid is te accepteren.

Dit wordt ook wel het “significantie” niveau genoemd. Niet ongebruikelijk is 5%. Wat betekent dit? Het betekent dat wij, als de “nul hypothese” werkelijk waar is, accepteren dat er een kans is van 5% dat we de veronderstelling toch als onwaar verwerpen.

3. Het bepalen van de “kritieke” waarden.

Op basis van het significantie niveau (bijv. 5%) wordt een kritieke waarde afgelezen uit een tabel van de Normale verdeling. Bij een éénzijdige test bedraagt deze 1.65 (5% van normaal verdeelde waarnemingen zijn groter dan het “gemiddelde” plus 1.65*de standaard deviatie).    

4. Het berekenen van de test waarde.

Dit wordt ook wel de z-waarde genoemd. Bij het toetsen van de veronderstelling dat twee gemiddelden gelijk zijn, wordt deze z-waarde bijvoorbeeld berekend als:

                                    (m1 – m2 )/ Ö (s12/n1 + s22/n2)

waarbij m1 en  m2  de beide gemiddelden voorstellen, s1 en  s2  de standaarddeviaties van die prijsveranderingen en n1 en n2 het aantal waarnemingen.        

5. Het vergelijken van de test waarde met de kritieke waarde.

Als de test waarde bijvoorbeeld 1.02 bedraagt, is deze derhalve kleiner dan 1.65, de kritieke waarde.

6. Het trekken van een conclusie.

Omdat de testwaarde kleiner is dan de kritieke waarde accepteren we in dit geval de nul hypothese.   

7.Vertaling van de conclusie naar begrijpelijke taal;

De steekproef ondersteunt de veronderstelling dat de oorspronkelijk gedachte H0 aannemelijk is.

7. Een voorbeeld.

Stel dat u een methode volgt  waarbij u maandelijks een portefeuille aanpassing uitvoert. U vermoed dat u daarmee een hoger gemiddeld maandelijks rendement behaalt dan wanneer u in de AEX zou beleggen. U heeft de data hiervoor over een periode van 12 jaar verzameld. U wilt nu uw vermoeden toetsen.

U kunt dit doen door bijvoorbeeld  het “overrendement” per maand te onderzoeken. U trekt daartoe maandelijks van uw portefeuille rendement het rendement af van de AEX van die maand. De ene maand zal dit overrendement positief zijn (de portefeuille leverde die maand meer op dan de AEX) , de andere maand wellicht negatief (de AEX presteerde die maand beter).

Het aantal waarnemingen bedraagt 144. U berekent vervolgens het gemiddelde maandelijkse overrendement (stel 0,8%) en de standaard deviatie daarvan (stel deze is 3%). Volgen we het stappen plan dan verloopt toetsing als volgt:

1. H0: gemiddeld overrendement =0 (er is geen verandering in rendement)

    H1: gemiddeld overrendement >0

2. Significantie niveau is 5% 

3. De kritieke waarde bedraagt 1.65

4. De z-waarde bedraagt :

                           z = (0,8- 0)/ (3/Ö144) = 3.2

5. De berekende waarde (3.2) is groter dan de kritieke waarde (1.65)

6. We verwerpen daarmee  H0 en accepteren H1

7. De gevolgde methode ondersteunt de gedachte dat de methode een beter maandelijks 

    rendement oplevert dan het rendement van de AEX.

Wellicht past u twee verschillende strategieën toe en wilt u weten of  één ervan “significant”beter is dan de andere. We berekenen dan voor beide strategieën de gemiddelde opbrengst per “trade” (m), de standaard deviatie van die “trade”resultaten (s) en noteren het aantal trades per strategie (n). Stel we berekenen voor strategie 1  de volgende waarden: m1= 3.2%, s1= 8% en n1=32. En voor strategie 2 : m2=4,2%, s2= 6% en n2=18. Volgen we het stappen plan dan verloopt toetsing als volgt:

1. H0:  m1 - m2   = 0 (de gemiddelde opbrengst per trade van beide strategieën is gelijk)

    H1:  m1 - m2 <> 0 (we toetsen op een verschil)

2. Significantie niveau is 5%

3. De kritieke waarden zijn  -1.96 en +1.96

4. De z-waarde bedraagt (zie formule in 6.4):

                          z = (3.2-4.2)/Ö(64/32 + 36/18) = -0.5

5. – 1.96 <  -0.5 < +1.96

6. We kunnen H0 niet afwijzen

7. Er is geen verschil in de “trade”opbrengsten van de beide strategieën.

 

8. Conclusie.

Beleggen is niet alleen handelen in financiële waarden het is handelen in onzekere waarden. Kwantificering van die onzekerheden kan een belangrijke bijdrage leveren tot betere besluitvorming bij beleggingsbeslissingen. Steekproeftheorie levert daarbij nuttige instrumenten om uw (onzekere) veronderstellingen een vastere basis te verlenen.

Mocht u zich hier nader over willen oriënteren dan is het boek van A. Buijs “Statistiek om mee te werken” een aanrader.

Literatuur:

Buijs, A. "Statistiek om mee te werken", Stenfert Kroese, ISBN 90 207 23553 

Buijs, A. "Statistiek om mee te werken; Opgaven", Stenfert Kroese, ISBN 90 207 23553 (zelfde)

'Meld je aan voor de nieuwsbrief' van HCC!beleggen

'Abonneer je nu op de nieuwsbrief en blijf op de hoogte van onze activiteiten!'

Aanmelden