Komplett gjennomgang av pensum med forklaringer, formler, vanlige feil og eksamenstips.
MET 1190 Statistikk gir deg grunnleggende verktøy for å analysere data og trekke slutninger fra utvalg til populasjoner. Kurset dekker alt fra deskriptiv statistikk og sannsynlighetsregning til inferensstatistikk med konfidensintervall og hypotesetesting. Statistikk er et fundament for videre studier i økonometri, markedsanalyse og beslutningstagning. Denne studieguiden oppsummerer de viktigste konseptene, formlene og teknikkene du trenger til eksamen.
Deskriptiv statistikk handler om å beskrive og oppsummere datasett gjennom sentral-, sprednings- og fordelingsmål. Dette er grunnlaget for all videre statistisk analyse.
De tre viktigste sentralmålene er gjennomsnitt, median og modus. Gjennomsnittet (aritmetisk middel) beregnes som summen av alle observasjoner delt på antall observasjoner: x̄ = Σx_i / n. Gjennomsnittet er følsomt for ekstremverdier (uteliggere), noe som gjør medianen til et mer robust alternativ i skjeve fordelinger.
Medianen er den midterste verdien når observasjonene er sortert. Ved et partall observasjoner tar man gjennomsnittet av de to midterste. Modus er den verdien som forekommer oftest, og er spesielt nyttig for kategoriske data.
Varians måler gjennomsnittlig kvadratavvik fra gjennomsnittet. For et utvalg bruker vi s² = Σ(x_i - x̄)² / (n - 1), der vi deler på (Bessels korreksjon) for å få et forventningsrett estimat. Standardavviket er kvadratroten av variansen: s = √s², og har samme enhet som dataene.
Variasjonsbredde er differansen mellom største og minste observasjon. Interkvartilbredden (IQR) er differansen mellom tredje og første kvartil (Q3 - Q1) og fanger de midterste 50 % av dataene. IQR er robust mot uteliggere.
Skjevhet (skewness) beskriver asymmetri i fordelingen. Positiv skjevhet betyr en lang hale mot høyre (gjennomsnitt > median), negativ skjevhet betyr lang hale mot venstre. Kurtose beskriver hvor tunge halene er sammenlignet med normalfordelingen.
Viktige grafiske verktøy inkluderer histogram (viser frekvensfordelingen), boksplott (viser median, kvartiler og uteliggere), stolpediagram (for kategoriske data) og spredningsplott (for sammenhengen mellom to variabler). Et boksplott identifiserer uteliggere som observasjoner mer enn 1,5 × IQR utenfor kvartilene.
En frekvenstabell grupperer data i klasser og viser absolutt frekvens (antall), relativ frekvens (andel) og kumulativ frekvens. Relativ frekvens beregnes som . Kumulativ relativ frekvens viser andelen observasjoner som er lik eller mindre enn en gitt verdi, og er nyttig for å finne persentiler.
En butikk registrerer antall solgte enheter fem dager på rad: 12, 18, 15, 22 og 13. Beregn gjennomsnitt og standardavvik.
Løsning:
Aritmetisk gjennomsnitt
Utvalgsstandardavvik
Gjennomsnittlig salg er 16 enheter per dag, med et standardavvik på omtrent 4,06 enheter.
En frekvenstabell viser antall reklamasjoner per dag: 0 reklamasjoner (10 dager), 1 reklamasjon (15 dager), 2 reklamasjoner (5 dager). Beregn gjennomsnitt og varians.
Løsning:
Vektet gjennomsnitt
Gjennomsnittlig antall reklamasjoner per dag er 0,83, med en varians på 0,49.
Nøkkelformler
Vanlige feil
Eksamenstips