Indholdsfortegnelse
Statistisk: Ugrupperede observationer
Hvad er ugrupperede observationer?
Ugrupperede observationer er et observationssæt, som ikke er kategoriseret og sat sammen. Alle observationerne står der hver for sig.
Når man arbejder med ugrupperede observationer skriver man dem ind i et skema med følgende faktorer: observation, hyppighed, kumuleret hyppighed, frekvens og kumuleret frekvens
Observation: Det observerede ”tal”.
Hyppighed: Så mange gange den pågældende observation forekommer.
Kumuleret hyppighed: Alle hyppighederne lagt sammen fra den mindste hyppighed til og med den hyppighed, som du er ved at udregne den kumulerede hyppighed for.
Frekvens: Hyppighed i procent. Beregnes på følgende måde:
Kumuleret frekvens: Alle frekvenserne lagt sammen fra den mindste frekvens til og med den frekvens, som du er ved at udregne den kumulerede frekvens for.
Deskriptorer (beskrivende størrelser)
De tre deskriptorer, som er lettest at bestemme, er størrelsen, mindsteværdien og størsteværdien.
- Størrelsen = antal observationer
- Mindsteværdien = den mindste observation
- Størsteværdien = den største observation
Til at beskrive fordelingen af observationer har vi tre deskriptorer: nedre kvartil, medianen og øvre kvartil.
- Nedre kvartil = defineres som medianen af observationssættets ”nederste halvdel”. Dette vil sige, at hvis der er 25 observationer, så er nedre kvartil de 12 nederste observationer. I et tilfælde hvor der er et lige antal nedre observationer, så er nedre kvartil gennemsnittet af de to observationer i midten. Hvis der er et ulige antal nedre observationer, så er nedre kvartil lig tallet i midten.
- Medianen = defineres som en talrækkes midterste tal. Hvis der er 25 observationer, så er medianen den observation, som står på den 13. plads i talrækken.
- Øvre kvartil = defineres som medianen af observationssættets ”øverste halvdel”. Dette vil sige, at hvis der er 25 observationer, så er øvre kvartil de 12 øverste observationer. I et tilfælde hvor der er et lige antal øvre observationer, så er øvre kvartil gennemsnittet af de to observationer i midten. Hvis der er et ulige antal øvre observationer, så er øvre kvartil lig tallet i midten.
Nedre kvartil, median og øvre kvartil kaldes også hhv. 1. kvartil, 2. kvartil og 3. kvartil.
Ordet ”kvartil” henviser til, at observationssættet opdeles i kvarte.
De tre kvartiler kan sammenfattes i kvartilsættet.
Kvartilsættet =(nedre kvartil; median; øvre kvartil)
Kvartilsættet fortæller, at 25% af observationerne er lig nedre kvartil eller mindre, at halvdelen af observationerne er lig medianen eller mindre og at 75% af observationerne er lig øvre kvartil eller mindre.
Stolpediagram
Et stolpediagram ser ud på følgende måde:
I et stolpediagram kan man aflæse frekvenserne.
Boxplot
Mindsteværdien, størsteværdien og kvartilerne kan vises i et boxplot.
Nederst i boxplottet tegnes en tallinje, hvorpå mindsteværdien, størsteværdien og de tre kvartiler kan aflæses.
Selve kassen i boxplottet afgrænses af nedre- og øvre kvartil. Kassen markerer altså de 50% midterste observationer (fra 25% til 75% af observationer). Inde i kassen er medianen markeret med en lodret streg.
Fra kassens sider tegnes to linjestykker ud til mindste- og størsteværdien.
Ud fra boxplottet kan man aflæse, om fordelingen er højreskæv, venstreskæv eller der er symmetrisk fordeling.
- Højreskæv = fordelingen er højreskæv, hvis observationerne til højre for medianen er fordelt over et bredt interval, mens observationerne til venstre for medianen er fordelt over et smalt interval.
- Venstreskæv = fordelingen er venstreskæv, hvis observationerne til venstre for medianen er fordelt over et bredt interval, mens observationerne til højre for medianen er fordelt over et smalt interval.
- Symmetrisk fordeling = fordelingen er symmetrisk, hvis observationerne er fordelt symmetrisk omkring medianen.
Middelværdi (gennemsnittet, middeltallet)
Middelværdien bestemmes som summen af alle observationerne divideret med antallet af observationer. Middelværdien betegnes med det græske bogstav μ (my).
Middelværdien er IKKE det samme som medianen.
Varians
Observationssættets varians er middelværdien af kvadraterne på forskellen mellem observationerne og deres middelværdi. Variansen betegnes Var og beregnes på følgende måde:
O=observation, M=middelværdi og F=frekvens
Spredning
Observationssættets spredning betegnes med symbolet σ (sigma) og er kvadratroden af variansen. Den beregnes på følgende måde:
σ
Spredningen er et mål for, hvor langt observationerne spreder sig fra middelværdien.
Skriv et svar