- Værdierne i et boksplot: minimum, første kvartil (Q1), median, tredje kvartil (Q3), og maksimum.
- Boksen: Boksen strækker sig fra Q1 til Q3, og medianen markeres med en linje inde i boksen.
- Halerne: Linjer fra boksen til minimum og maksimum værdierne viser datasættets fulde rækkevidde. Eventuelle outliers markeres separat
For at vurdere et resultat af et boksplot, kan man fokusere på følgende aspekter:
- Median og kvartiler: Medianen, som er markeret med en linje inde i boksen, viser midtpunktet af dataene. Kvartilerne (Q1 og Q3) afgrænser boksen og repræsenterer de 25% og 75% percentiler. Dette giver et indblik i, hvor de fleste data ligger, og om der er en skævhed i fordelingen.
- Interkvartilområde (IQR): Dette er afstanden mellem Q1 og Q3 og repræsenterer spredningen af de midterste 50% af dataene. En større IQR indikerer større variation i dataene, mens en mindre IQR indikerer, at dataene er mere koncentrerede.
- Outliers og skævhed: Outliers er data, der ligger uden for “halerne” (whiskers) og kan indikere unormale eller ekstreme værdier. Skævhed kan observeres ved asymmetri i boksen og halerne. Hvis medianen ikke er centreret i boksen, eller hvis halerne er ulige lange, kan det indikere skævhed i dataen
- Forskellen på gennemsnit og medianværdi: Gennemsnittet viser den typiske værdi, hvis alle værdier vægtes lige meget. Det er fint, når der ikke er ekstreme værdier (outliers). Medianen er midtpunktet, når alle værdier er sorteret i rækkefølge. Den påvirkes ikke af ekstremt høje eller lave tal. Eksempel: Maks puls måles hos 7 personer der er 50 år til : 168, 169, 170, 170, 175, 178, 240. Gennemsnittet bliver 182 og median bliver 170. Her kan man se at den ekstremt høje makspuls på 240 ændrer gennemsnittet til 182 som er uhensigtsmæssigt, mens medianværdien er upåvirket, da det er den miderste person i datasættet der angiver medianværdien, så makspulsen bliver 170, hvilket er merer realistisk.


