StandardavvikStandardavviket er et mål for spredningen av verdiene i et datasett eller av verdien av en stokastisk variabel. Den er definert som kvadratroten av variansen. En av grunnene til at standardavviket er en viktig parameter, er Tsjebysjevs ulikhet som sier at de fleste verdiene i et datasett av tilfeldige variabler vil ligge i nærheten av gjennomsnittet, hvor «i nærheten» er definert ved hjelp av standardavviket. Standardavviket ligger på det punktet hvor kurven i normalfordelingen endrer retning. Før man bruker standardavvik bør man bruke et histogram eller en frekvenstabell for å undersøke om datasettet er normalfordelt da mange statistiske metoder ikke kan stoles på dersom datasettet har skjevhet eller ekstremverdier[1]. Standardavviket ble introdusert av Francis Galton mot slutten av 1860-tallet. DefinisjonMed en gitt en populasjon x1, ..., xN av reelle tall, er gjennomsnittet gitt ved og standardavviket definert som
Standardavviket til en stokastisk variabel X er definert som
hvor E(X) er forventningsverdien til X. Hvis man har stikkprøver x1,...,xn fra en større populasjon, defineres det empiriske standardavviket som Relativt standardavvikVed å dividere standardavviket med gjennomsnittsverdien får en relativt standardavvik. Dette oppgis som regel i prosent. MåleenhetStandardavvik har som regel samme benevning som måleenheten til verdiene i datasettet. Et unntak er for verdier som har prosent som benevning. Siden en differanse mellom to prosentmålinger har enhet prosentpoeng, vil standardavviket til slike datasett ha enhet prosentpoeng. Det gjøres likevel ofte feil med dette, og prosent brukes som benevning også for standardavviket, noe som gjør det uklart om det er snakk om et vanlig standardavvik eller et relativt standardavvik. Referanser
|