Type I en type II fouten bij hypothesetoetsen

Een firma verkoopt dozen fruitsap met in de reclame de boodschap dat elke doos gemiddeld 10 gram suiker per 100 ml bevat.

Neem als uitgangspunt de hypothese dat het de bedoeling is van de verkoper om koopwaar met het juiste gehalte suiker te leveren. Het is aan te raden de geleverde partij te controleren, d.w.z. te toetsen aan de gestelde eisen. We formuleren de volgende hypothesen: H_0: \mu = 10 tegen H_1: \mu \neq 10

Het is mogelijk dat onze beslissingsregel de geleverde koopwaar afkeurt terwijl ze juist is. De fout die we dan begaan is type I-fout of een \alpha-fout. De verkoper loopt door deze beslissingsregel een risico \alpha dat een goede partij ten onrechte afgekeurd wordt. Vandaar dat een type -fout het risico van de verkoper is.

We houden onze beslissingsregel vast. De geleverde partij heeft echter een gemiddelde hoeveelheid suiker dat verschilt van 10 gram. Een steekproef uit deze slechte partij kan echter een waarde voor het steekproefgemiddelde geven dat toch in het aanvaardingsgebied ligt. Dit impliceert dat we de geleverde koopwaar aanvaarden terwijl ze verkeerd is. De fout die we dan begaan is een type II-fout of een \beta– fout. De koper loopt door deze beslissingsregel een risico \beta die slechte partij te aanvaarden. We spreken van het risico van de koper.

 

 

 

Giscorrectie

Bij  een  test die bestaat uit meerkeuze vragen kent men gewoonlijk aan elk goed antwoord 1 punt toe en aan elk fout of blanco antwoord 0 punten.

 

Noemen we X de stochast die het aantal punten weergeeft bij het gissen van één vraag met 4 antwoord alternatieven ( waarvan er slecht 1 juist is).

De kansverdeling van X is \begin{array}{1|cc} x&0&1 \\  \hline  P(X=x)&\frac{3}{4}&\frac{1}{4} \end{array}

Hieruit bekomen we de verwachtingswaarde E(x)= 0.\frac{3}{4}+1.\frac{1}{4}=0,25. Een student die blindelings gokt, heeft in dit evaluatiesysteem toch een positieve score. Om het gokken tegen te gaan zal men c punten aftrekken bij een fout antwoord. We bepalen de waarde van c zodat de student noch een positieve, noch een negatieve gemiddelde score zal hebben. Met andere woorden: E(x)=0.

De kansverdeling wordt nu: \begin{array}{1|cc} x&-c&1 \\  \hline  P(X=x)&\frac{3}{4}&\frac{1}{4} \end{array} en dus is E(x)=0 \Longleftrightarrow -c.\frac{3}{4}+1.\frac{1}{4}=0 \Longleftrightarrow c=\frac{1}{3}. We trekken dus \frac{1}{3} punt af bij een fout antwoord.

We veralgemenen: bij vragen met n keuzemogelijkheden geven we dan 1 punt voor een goed antwoord en voor een blanco 0 punten. Voor een fout antwoord trekken we \frac{1}{n-1} punten af

De regel van Simpson

Voor heel wat praktische problemen moet men een bepaalde integraal \int_a^b f(x)\ dx oplossen. De meest wiskundige manier is op zoek gaan naar een primitieve functie F(x) van f(x) en dan is \int_a^b f(x)\ dx=F(b)-F(a). Maar soms is het berekenen van een primitieve functie een zeer lastige of onmogelijke taak. Is het in die gevallen dan onmogelijk om de bepaalde integraal te berekenen?

 

Thomas Simpson heeft een regel neergeschreven om \int_a^b f(x)\ dx te benaderen:

  • Verdeel [a,b] in een even ,n , aantal stukken en stel  h=\frac{b-a}{n}.
  • Bereken de functie waarden f(a),f(a+h),f(a+2h),...,f(a+nh)=f(b).
  • Nu is \int_a^b f(x)\ dx \approx \frac{h}{3}\Big [ f(a)+f(b)+4\Big(f(a+h)+f(a+3h)+\cdots+f(a+(n-1)h\Big)+2\Big(f(a+2h)+f(a+4h)+\cdots+f(a+(n-2)h)\Big)\Big]

Simson bekwam zijn formule door de bepaalde integraal te interpreteren als een oppervlakte en het gebied onder de grafiek van y=f(x) over [a,b] te benaderen door de oppervlakte onder een parabool door de punten (a,f(a)),((m,f(m)) en (b,f(b)).

Voorbeeld: Bereken \int_1^5x\sqrt{x^2+4x}\ dx

Neem n=4, dan us h=1 en kunnen we de bepaalde integraal benaderen door \frac{1}{3}\Big( f(1)+4f(2)+2f(3)+4f(4)+f(5)\Big)\approx 60,498

 

 

N x N is aftelbaar oneindig

Om te bewijzen dat \mathbb{N} \times \mathbb{N} aftelbaar oneindig is, moeten we een bijectie opstellen tussen \mathbb{N} \times \mathbb{N} en \mathbb{N}. We kunnen dit doen via de diagonaalmethode van Cantor :

De volgende tekening spreekt voor zich:

Met volgende formule kan je het rangnummer bepalen van een bepaald punt (x,y):

    \[f(x,y)=\dfrac{1}{2}((x+y)^2+2(x+y)+(-1)^{x-y})\]

Het is wel moeilijker om met één natuurlijk getal z een koppel natuurlijke getallen te laten overeenkomen.

  • De diagonalen bevatten achtereenvolgens 1,2,3,… getallen, zodat de som S_n van de eerste n natuurlijke getallen zal verschijnen op elke diagonaal ( de omcirkelde rangnummers) .
  • Aangezien z gelegen is tussen twee opeenvolgende waarden van S_n, moet n gelijk zijn aan het aantal gehelen n_0 van de positieve wortel van de vierkantsvergelijking n^2+n-2z=0.
  • Als n_0 even is, dan behoort (x,y) tot een dalende diagonaal en is x=z-f(0,n_0)=S_{n_0} en y=n_0-x.
  • Als n_0 oneven is, dan behoort (x,y) tot een stijgende diagonaal en is y=z-f(n_0,0)=S_{n_0} en x=n_0-y.

Neem bijvoorbeeld het getal z met rangnummer 32. De vierkantsvergelijking n^2+n-64=0 heeft bij benadering als oplossingen -8,52 en 7,52. Dus is n_0=7. Het corresponderend punt in het vlak is (3,4).

Neem als tweede voorbeeld het getal z met rangnummer 38. De bijhorende vierkantsvergelijking n^2+n-76=0 heeft bij benadering als oplossingen -9,23 en 8,23 zodat n_0=8. Het corresponderend punt in het vlak is (2,6)

Afstand en skalair product

 

Om het begrip afstand te definiëren hebben we een metriek nodig. Dit kan je hier lezen. Een voorbeeld van een metriek in \mathbb{R}^2 is de Euclidische afstand, gedefinieerd door

    \[  d(x,y)=\sqrt{(x_2-x_1)^2+(y_2-y_1)^2}\]

Hiermee is een norm gedefinieerd via

    \[\Vert x\Vert =\sqrt{x_1^2+y_1^2}\]

en dan is

    \[d(x,y)=\Vert y-x\Vert\]

In \mathbb{R}^2 is er ook een skalair product

    \[x.y=x_1x_2+y_1y_2\]

Dit is een product met volgende eigenschappen:

  1. x.x \geq 0 en x.x=0 \Leftrightarrow x=0.
  2. x.y=y.x
  3. x.(ry+sz)=r x.y +s x.z

Het gegeven skalair product definieert dus de Euclidische metriek, via \Vert x\Vert = \sqrtçx.x} . Maar dat is niet altijd zo. Er zijn metrieken waarmee geen skalair product is geassocieerd. Een voorbeeld is de Manhattan metriek

    \[d(x,y)=|x_2-x_1|+|y_2-y_1|\]

 Er is geen skalair product dat hiermee correspondeert.

Normen die voldoen aan de parallellogram eigenschap kunnen een skalair product definiëren, andere niet:

    \[\Vert x+y \Vert +\Vert x-y \Vert=2(\Vert x \Vert+ \Vert y\Vert)\]