Statistiek; Standaard deviatie
De standaarddeviatie is een indicator voor de spreiding van de getallen rondom het gemiddelde
Het is belangrijk om te weten of de getallen dicht rondom het gemiddelde liggen, of dat ze een beetje evenwichtig verspreid zijn over de gehele range. De indicator daarvoor is de standaard deviatie (formule standaard deviatie). De standaard deviatie wordt ook wel de spreiding genoemd, en ook wel de standaardafwijking.
Als er helemaal geen variatie in de getallenreeks is dan is de standaard deviatie 0 (alle getallen komen dan overeen met het gemiddelde). Verder kan de standaard deviatie in theorie oplopen tot plus oneindig. In de praktijk is de grootte van de standaard deviatie afhankelijk van de range: is de range groot dan heeft men ook een grote standaard deviatie.
De standaard deviatie geeft ook een indicatie voor het normaal-verdeeld zijn van de variabele. Als vuistregel geldt dat er in het interval dat bepaald wordt door het gemiddelde plus één maal de standaard deviatie (de bovengrens) en het gemiddelde min één maal de standaard deviatie (de ondergrens), ongeveer 69% van alle waarden voor moet komen. Bij plus of min twee maal de standaard deviatie ligt ongeveer 95%, en bij plus of min drie maal de standaard deviatie ligt 99% (zie illustratie). Is dit niet het geval dan heeft men een andere verdeling.
Met behulp van de standaard deviatie kan men ook uitbijters (dat zijn gegevens die flink afwijken van de rest) aanwijzen. Men kan ze verwijderen door te stellen dat uitbijters niet boven 4 of 5 maal de standaard deviatie plus of min het gemiddelde mogen uitkomen. Als een uitbuiter wordt weggelaten, moet daarna natuurlijk wel opnieuw het gemiddelde en de spreiding worden berekend.
Waarschuwing: Er zijn programma’s die zeggen de standaard deviatie in een getallenreeks te berekenen maar feitelijk een schatting maken van de spreiding in de populatie!






