Belangrijk uitgangspunt in de economische theorie is dat er geen “free lunch” bestaat
1. Iets voor niets?
Belangrijk uitgangspunt in de economische
theorie is dat er geen “free lunch” bestaat. Het lijkt er soms wellicht
wel op maar dan blijkt toch weer dat de hogere opbrengst het gevolg is
van het grotere risico dat gelopen werd om de opbrengst te realiseren.
Wat staat ons als belegger dan te doen?
Volgens deze opvatting hoeven we eigenlijk alleen nog maar te besluiten
“hoeveel” risico we bereid zijn te accepteren en klaar is Kees.
Toch zijn dagelijks tienduizenden beleggers
al of niet beroepsmatig in de weer met het nemen van “andere” besluiten
dan de bepaling van hoeveel risico men wenst te
lopen. Eén van de redenen is dat vele beleggers toch menen een manier
gevonden te hebben om een “gratis lunch” te verkrijgen, nou ja ….of een
gratis “snack”.
Omdat de menselijk geest nogal bedrieglijk
werkt waar het “eigen belang” betreft, kan die gedachte mogelijk ook
gebaseerd zijn op “wishful thinking” en derhalve niet op objectieve
maatstaven.
Als we ons niet willen laten bedriegen (door
anderen of door onszelf), verdient het wellicht aanbeveling
de vermeende methode tot het verkrijgen van de gratis lunch op
correctheid te controleren, of om in statistische termen te spreken:
de veronderstelling te toetsen op aanvaardbaarheid.
2. Steekproeftheorie.
Gelukkig is er een tak
van wetenschap die ons bij dit controleren op correctheid kan
assisteren: de steekproeftheorie. Een theorie die weer onderdeel vormt
van het ruimere terrein van de “Waarschijnlijkheidsrekening”.
Steekproeftheorie kan ons helpen om uit een
door ons waargenomen klein deel van de werkelijkheid conclusies te
trekken omtrent de héle werkelijkheid. Men noemt deze gang van zaken
ook wel inductie, het algemene wordt afgeleid uit het bijzondere. Dit
in tegenstelling tot deductie waarbij men juist uit het algemene het
bijzondere afleidt.
3. De bouwstenen van de
steekproeftheorie.
Iedereen heeft te maken met “uitkomsten”waar
geen zekerheid over bestaat. Om enkele voorbeelden te noemen: het
aantal ogen dat u gooit in één worp met een dobbelsteen of de slotkoers
van aandeel X morgen. Men noemt dergelijke getallen “kansvariabelen”.
Bij de dobbelsteen weten we dat de uitkomst
1, 2, 3, 4, 5, of 6 zal zijn (als de dobbelsteen niet op zijn kant
blijft liggen). Voor het aandeel weten we dat de slotkoers morgen met
zekerheid tussen 0 en oneindig zal zijn (als er
tenminste notering is voor het fonds). Toch is er een belangrijk
verschil tussen beide voorbeelden. Bij de dobbelsteen weten we dat er 6
uitkomsten mogelijk zijn en dat iedere uitkomst dezelfde “kans” of
waarschijnlijkheid heeft om gerealiseerd te worden. Voor de slotkoers
morgen van het aandeel, hebben we deze kennis niet en toch zouden we
daar wat meer over willen kunnen zeggen.
We kunnen alle mogelijke waarden, die een
kansvariabele aan kan nemen, beschouwen als één verzameling. Deze
verzameling met alle mogelijke uitkomsten noemt men wel de “populatie”.
Om het begrip populatie wat aanschouwelijker te maken kunnen we ons
bijvoorbeeld een bak voorstellen met daarin allerlei ballen al of niet
van verschillende grootte.
Steekproeftheorie geeft ons de instrumenten
om op basis van een beperkt aantal trekkingen (van ballen) uit
de bak, een karakterisering te geven van de samenstelling van alle
ballen (de populatie) in de bak.
Die karakterisering bestaat uit wat de
Engelsen noemen “sample statistics”.
Eigenlijk een soort samenvatting van de getallen. Zoals we een boek
kunnen samenvatten in enkele bladzijden, zo kunnen we ook een getallen
reeks (zoals bijvoorbeeld de uitkomsten van “onzekere getallen”)
samenvatten. Men gebruikt daar veelal het “gemiddelde” en de
“spreiding” (of standaard deviatie) van die getallen voor. Om naar die
“samenvattende” waarden te verwijzen, gebruikt men er vaak vaste
symbolen voor. Zo gebruikt men als symbool voor het
steekproefgemiddelde de letter m
, als symbool voor de spreiding van de steekproef de letter s
en als aanduiding voor de omvang van de steekproef (het aantal
waarnemingen of trekkingen) de letter n.
Voor de karakterisering van de populatie gebruikt men als
symbolen de Griekse letters voor m en s (m (spreek uit
“mu”)voor gemiddelde en s
(spreek uit “sigma”) voor standaard deviatie).
4. De Centrale Limiet Stelling
Nu even terug naar de ballenbak. We kunnen
daar bijvoorbeeld “n1” ballen
uit halen en daar de gemiddelde grootte “m1”
van bepalen evenals de spreiding in de grootte “s1” daarvan. Als
we dit verschillende malen doen, dan krijgen we naar verwachting steeds
een andere waarde voor m ( m2, m3, etc) en een
andere waarde voor s (s2, s3, etc). In onderstaande afbeelding wordt
dit weergegeven (zij het dat daarin een ander symbool wordt toegepast
voor m: x).
Het is niet reëel om te veronderstellen dat welke “puntschatting” m dan
ook (m1, m2, etc) , precies overeenkomt met het populatie gemiddelde.
Eerder mogen we verwachten dat de “werkelijke” gemiddelde grootte van
alle ballen (het populatie gemiddelde) in een
interval ligt rondom het steekproefgemiddelde.
De belangrijkste peiler van de
steekproeftheorie, de Centrale Limiet stelling, geeft hier zekerheid
over. Deze stelt dat:
Het steekproef gemiddelde m is normaal
verdeeld met een gemiddelde gelijk aan
het populatie gemiddelde “m” en
een spreiding gelijk aan “s /Ö n” .
De spreiding of standaard deviatie van het
steekproef gemiddelde (s
/Ö n) wordt ook wel “standaard fout” genoemd.
Nu weten we dat bij een Normale verdeling 95%
van de verdeling binnen min en plus 1.96 standaard deviaties van het
gemiddelde ligt.
Als we derhalve een ballenbak hebben waarvan
de ballen gekenmerkt worden door gemiddelde m
en standaard deviatie s
en we trekken er een steekproef uit dan is er 95% kans dat :
m - 1.96* s/Ö n
< m < m
+ 1.96* s/Ö n
ofwel :
“het populatie gemiddelde bevindt zich in een
interval van 1.96* s/Ö n
rondom het waargenomen steekproef gemiddelde m”.
Men noemt dit interval
ook wel het betrouwbaarheidsinterval (zie
hieronder).
Als n (het aantal waarnemingen) groter wordt,
dan wordt het betrouwbaarheidsinterval kleiner. Immers s/Ö
n wordt dan ook kleiner. Wenst men een betrouwbaarheidsinterval met een
bepaalde (kleine) waarde dan kan men dit bereiken door het aantal
waarnemingen te vergroten.
5. Is mijn veronderstelling
waar?
Gewapend met bovenstaande
kennis gaan we kijken of we daarmee antwoord kunnen geven op de vraag of
“iets” al of niet waar (of liever gezegd “aannemelijk”) is. Dat
“iets” moeten we dan eerst in een toetsbare vorm weer geven.
We veronderstellen als het ware een “m”
waarde voor de populatie en gaan kijken of het steekproefgemiddelde in
het betrouwbaarheidsinterval rondom die m waarde ligt.
Daartoe berekenen we een testwaarde ook wel z-waarde genoemd. Deze
testwaarde geeft het aantal standaarddeviaties aan dat het steekproef
gemiddelde verwijderd is van het veronderstelde populatie gemiddelde.
Is deze waarde hoog dan ligt het steekproef gemiddelde ver van het
veronderstelde populatie gemiddelde. Is deze waarde laag dan
ligt het steekproef gemiddelde dicht bij het veronderstelde
populatie gemiddelde.
Willen we bijvoorbeeld toetsen of een
populatie gemiddelde m0 aannemelijk is (we
noemen dit m0 omdat we veronderstellen dat deze gelijk is
aan m) dan luidt de testwaarde of
z-waarde:
(m-m0)/( s/Ö
n)
Deze testwaarde
vergelijken we met het aantal standaarddeviaties dat we acceptabel
vinden (het significantie niveau). We weten dat 95% van alle
waarnemingen bij een normale verdeling binnen een interval van plus of
min 1.96 standaard deviaties van het gemiddelde liggen. Is de
testwaarde kleiner dan (in dit geval ) 1.96 dan nemen we aan dat H0
waar is. Anders verwerpen we H0. Zie onderstaande afbeelding:
6. In zeven stappen naar
de waarheid
De hele toetsings procedure kunnen we als
volgt samenvatten in 7 stappen:
1. Het formuleren van de
veronderstellingen:
Er zijn steeds twee, elkaar uitsluitende,
veronderstellingen. De eerste “veronderstelling” wordt meestal
aangeduid met de term “nul hypothese” (H0). Dit is de
veronderstelling die men wil toetsen. Deze gaat er over het algemeen
van uit dat er geen verandering is opgetreden in de waarde die wij
willen toetsen (de veronderstelling is dat alles bij het oude is
gebleven). De tweede veronderstelling beschrijft de toestand die geldt
als de eerste veronderstelling wordt afgewezen en wordt de
“alternatieve hypothese” genoemd (symbool: H1).
2. Het aangeven van de
mate van “onzekerheid” die men bereid is te accepteren.
Dit wordt ook wel het “significantie” niveau
genoemd. Niet ongebruikelijk is 5%. Wat betekent dit? Het betekent dat
wij, als de “nul hypothese” werkelijk waar is, accepteren dat er een
kans is van 5% dat we de veronderstelling toch als onwaar verwerpen.
3. Het bepalen van de
“kritieke” waarden.
Op basis van het significantie niveau (bijv.
5%) wordt een kritieke waarde afgelezen uit een tabel van de Normale
verdeling. Bij een éénzijdige test bedraagt deze 1.65 (5% van normaal
verdeelde waarnemingen zijn groter dan het “gemiddelde” plus 1.65*de
standaard deviatie).
4. Het berekenen van de
test waarde.
Dit wordt ook wel de z-waarde genoemd. Bij
het toetsen van de veronderstelling dat twee gemiddelden gelijk zijn,
wordt deze z-waarde bijvoorbeeld berekend als:
(m1 – m2 )/ Ö
(s12/n1 + s22/n2)
waarbij m1 en m2
de beide gemiddelden voorstellen, s1 en
s2 de standaarddeviaties van die
prijsveranderingen en n1 en n2 het aantal
waarnemingen.
5. Het vergelijken van de
test waarde met de kritieke waarde.
Als de test waarde bijvoorbeeld 1.02
bedraagt, is deze derhalve kleiner dan 1.65, de kritieke waarde.
6. Het trekken van een
conclusie.
Omdat de testwaarde kleiner is dan de
kritieke waarde accepteren we in dit geval de nul hypothese.
7.Vertaling van de
conclusie naar begrijpelijke taal;
De steekproef ondersteunt de veronderstelling
dat de oorspronkelijk gedachte H0 aannemelijk is.
7. Een voorbeeld.
Stel dat u een methode volgt waarbij
u maandelijks een portefeuille aanpassing uitvoert. U vermoed dat u
daarmee een hoger gemiddeld maandelijks rendement behaalt dan wanneer u
in de AEX zou beleggen. U heeft de data hiervoor over een periode van
12 jaar verzameld. U wilt nu uw vermoeden toetsen.
U kunt dit doen door bijvoorbeeld
het “overrendement” per maand te onderzoeken. U trekt daartoe
maandelijks van uw portefeuille rendement het rendement af van de AEX
van die maand. De ene maand zal dit overrendement positief zijn (de
portefeuille leverde die maand meer op dan de AEX) , de andere maand
wellicht negatief (de AEX presteerde die maand beter).
Het aantal waarnemingen bedraagt 144. U
berekent vervolgens het gemiddelde maandelijkse overrendement (stel
0,8%) en de standaard deviatie daarvan (stel deze is 3%). Volgen we het
stappen plan dan verloopt toetsing als volgt:
1. H0: gemiddeld overrendement =0 (er is geen
verandering in rendement)
H1:
gemiddeld overrendement >0
2. Significantie niveau is 5%
3. De kritieke waarde bedraagt 1.65
4. De z-waarde bedraagt :
z = (0,8- 0)/ (3/Ö144) = 3.2
5. De berekende waarde (3.2) is groter dan de
kritieke waarde (1.65)
6. We verwerpen daarmee H0
en accepteren H1
7. De gevolgde methode ondersteunt de
gedachte dat de methode een beter maandelijks
rendement
oplevert dan het rendement van de AEX.
Wellicht past u twee verschillende
strategieën toe en wilt u weten of één ervan
“significant”beter is dan de andere. We berekenen dan voor beide
strategieën de gemiddelde opbrengst per “trade” (m), de standaard
deviatie van die “trade”resultaten (s) en noteren het aantal trades per
strategie (n). Stel we berekenen voor strategie 1 de
volgende waarden: m1= 3.2%, s1= 8% en n1=32. En voor strategie 2 :
m2=4,2%, s2= 6% en n2=18. Volgen we het stappen plan dan verloopt
toetsing als volgt:
1. H0: m1
- m2 = 0 (de gemiddelde
opbrengst per trade van beide strategieën is gelijk)
H1:
m1 - m2 <> 0 (we
toetsen op een verschil)
2. Significantie niveau is 5%
3. De kritieke waarden zijn -1.96
en +1.96
4. De z-waarde bedraagt (zie formule in 6.4):
z = (3.2-4.2)/Ö(64/32 + 36/18) = -0.5
5. – 1.96 < -0.5 <
+1.96
6. We kunnen H0 niet afwijzen
7. Er is geen verschil in de
“trade”opbrengsten van de beide strategieën.
8. Conclusie.
Beleggen is niet alleen handelen in
financiële waarden het is handelen in onzekere waarden. Kwantificering
van die onzekerheden kan een belangrijke bijdrage leveren tot betere
besluitvorming bij beleggingsbeslissingen. Steekproeftheorie levert
daarbij nuttige instrumenten om uw (onzekere) veronderstellingen een
vastere basis te verlenen.
Mocht u zich hier nader over willen
oriënteren dan is het boek van A. Buijs “Statistiek om mee te werken”
een aanrader.
Literatuur:
Buijs, A. "Statistiek om mee te werken",
Stenfert Kroese, ISBN 90 207 23553
Buijs, A. "Statistiek om mee te werken;
Opgaven", Stenfert Kroese, ISBN 90 207 23553 (zelfde)