Gratis verzending vanaf 30 euro
Digitaal te lezen in de app
Als je een aantal willekeurige volwassen Nederlanders op een rijtje zet, zal het grootste deel van deze personen een lengte hebben tussen de 160 cm en 190 cm. Slechts een klein deel zal groter zijn dan 190 cm of kleiner dan 160 cm. De lengtes van deze mensen is op een bepaalde manier verdeeld. Een verdeling die vaak voorkomt in het dagelijks leven, is de normale verdeling. In dit artikel leggen we je daarom alles uit over de normale verdeling!
De normale verdeling is een verdeling van gegevens die verloopt volgens een frequentiepolygoon met de vorm van een kerstklok. Deze verdeling komt vaak voor en wordt daarom de normale verdeling genoemd. Het beschrijft hoe data zich verspreid in de wereld van statistiek.
De normale verdeling heeft vijf handige eigenschappen die vaak worden gebruikt:
In de afbeelding hieronder zie je een voorbeeld van hoe een normale verdeling eruit ziet:
De standaardafwijking geeft de spreiding van verschillende getallen in een waarneming weer. De standaardafwijking wordt gebruikt om de verdeling van een normale verdeling te geven. Niet alle gegevens zullen namelijk precies op het gemiddelde liggen. De gegevens wijken (bijna) altijd af en om die afwijking simpel te maken, noemen we het de standaardafwijking of de standaarddeviatie.
Vaak wordt de standaardafwijking gegeven in een opdracht, maar je kunt 'm ook zelf berekenen als je alle gegevens kent. Om de standaardafwijking te berekenen, wordt de volgende formule gebruikt:
Om deze formule toe te passen, dienen eerst alle afwijkingen te worden berekend. Daarna kan de standaardafwijking worden berekend.
In de formule wordt het sommatieteken ∑ gebruikt, maar eigenlijk worden alle deviaties los berekend, gekwadrateerd en opgeteld.
Voorbeeld:
Stel, je krijgt de volgende getallen: 1, 4, 5, 8, 9 en 9.
Allereerst is het gemiddelde benodigd. Deze is namelijk later ook nodig om de afwijkingen uit te rekenen. Het gemiddelde is:
dus
= 6.
Wanneer de formule wordt ingevuld, dien je rekening te houden met het sommatieteken ∑.
Dit geeft een standaardafwijking van d = 2,943...
Het afronden van dit getal geeft een standaardafwijking van ≈ 2,9
Er zijn twee parameters of vuistregels die bepalen hoe de normale verdeling eruit komt te zien:
De meeste waarden liggen rond het gemiddelde en daardoor op de hoogste piek. Hoe verder je van het gemiddelde afgaat, des te minder waarden er zullen zijn. De afstand tot het gemiddelde wordt aangegeven met standaardafwijkingen. Hoe hoog die standaardafwijking precies is, kan per situatie verschillen.
Per standaardafwijking van het gemiddelde ziet dat er als volgt uit:
Met '1 standaardafwijking van het gemiddelde' wordt hier de ruimte bedoeld tussen 'het gemiddelde + 1 standaardafwijking' en'het gemiddelde - 1 standaardafwijking'.
Let op: 3 standaardafwijkingen vanaf het gemiddelde bevat niet alle waarden. Dit heeft als reden dat er enkele uitschieters zijn die veel groter of kleiner zijn dan de rest van de waarden.
Voorbeeld:
Stel dat een klas het wiskundecijfer terugkrijgt. Alle scores zijn normaal verdeeld met een gemiddeld cijfer van 6,0 en een standaardafwijking van 1,5. De kans dat iemand een 4,5 heeft is dus even groot als de kans dat iemand een 7,5 heeft.
Een 10,5? Hoe is dat mogelijk? De cijfers hoeven natuurlijk niet echt op 10,5 te zitten, maar de grens van het 99,8%-gebied ligt in dit voorbeeld simpelweg op 10,5. In werkelijkheid houden de cijfers natuurlijk gewoon op bij maximaal 10.
Het betrouwbaarheidsinterval is een maatstaf om te zien hoe betrouwbaar een onderzoek is. In de wiskunde zijn er verschillende intervallen, waaronder het 95% betrouwbaarheidsinterval voor de populatieproportie.
Het 95% betrouwbaarheidsinterval wil zeggen dat er 95 onderzoeken een correcte uitkomst moeten hebben als er 100 onderzoeken worden uitgevoerd. Het geeft antwoord op de vraag: "Tussen welke twee waarden/grenzen ligt 95% van de gegevens?". Dit valt te berekenen met de volgende formules:
Het 95% betrouwbaarheidsinterval geeft 2 grenzen aan. Daarom wordt het 95% betrouwbaarheidsinterval 2 keer berekend.
Hierbij is:
De steekproefproportie wordt met de volgende formule berekend:
Let op: de steekproefproportie wordt gebruikt om het 95% betrouwbaarheidsinterval voor de populatieproportie te berekenen.
Een ander betrouwbaarheidsinterval is het 68% betrouwbaarheidsinterval, welke wordt berekend door middel van de volgende formules:
Voorbeeld:
Er is een onderzoek gedaan naar alle scholieren van een school met een bijbaantje. Uit een aselecte steekproef van 3260 leerlingen blijkt dat 1530 scholieren een bijbaantje hebben. Bereken het 95%-betrouwbaarheidsinterval voor de steekproefproportie scholieren met een bijbaantje. Geef je antwoord in 2 decimalen.
Er wordt hier gevraagd naar het 95%-betrouwbaarheidsinterval. Dat betekent dat er 2 antwoorden benodigd zijn: 1 voor elke grens. Allereerst nemen we de formule voor het 95%-betrouwbaarheidsinterval:
Om deze formule in te vullen, zal eerst de steekproefproportie moeten worden berekenend:
Invullen geeft:
Het 95%-betrouwbaarheidsinterval is [0,45 ; 0,49]. Met andere woorden: je kunt met 95% zekerheid zeggen dat het percentage scholieren dat een bijbaantje heeft, tussen de 45% en 49% ligt.
Let op! Er wordt gesproken over het 95%-betrouwbaarheidsinterval, daarom dient het antwoord ook als interval te worden genoteerd.
Om de normale verdeling te plotten op de grafische rekenmachine, is het belangrijk om te weten welke rekenmachine er wordt gebruikt:
Bij de TI-84 Plus CE-T kies je voor 2nd → VARS om bij het DISTR-menu te komen. Vervolgens kies je voor invNorm en kan de gegeven of berekende waarde worden ingevuld. Dit zal een normale verdeling plotten, maar kan ook een links-scheve of rechts-scheve verdeling maken.
Bij de CASIO FX-CG50 kies je voor het statistiek menu en druk op de toets F5 (DISTR) om naar het DISTR-menu te gaan. Druk daarna op toets F1 (NORM) om met de normale verdeling te rekenen.
Er ontstaan twee belangrijke opties:
Kies de juiste soort die het beste past en vul de gekregen of berekende waarden in op de grafische rekenmachine.
Wil je meer weten over de normale verdeling en de betrouwbaarheidsintervallen? Kijk dan onderstaande video van Math with Menno!