Komplett pensumoversikt for statistikk ved BI — med forklaringer, sentrale begreper, eksamenstips og vanlige fallgruver. Eksamensoptimalisert basert på tidligere eksamener.
MET 1190 Statistikk er et grunnleggende statistikkemne ved BI som dekker alt fra deskriptiv statistikk til regresjonsanalyse, med vekt på praktisk bruk av programvaren R. Eksamen består typisk av 4-5 oppgaver med ulik vekt, der Oppgave 1 alltid er flervalgsoppgaver om R-kode (10-15 %), og de resterende oppgavene krever fullstendige utregninger med begrunnelse.
Kurset bygger opp fra beskrivende statistikk (gjennomsnitt, varians, median) via sannsynlighetsregning og fordelinger (binomisk, normal) til statistisk inferens (konfidensintervall, hypotesetesting) og enkel linear regresjon. Sentralgrenseteoremet og estimatorteori knytter disse temaene sammen og gir det teoretiske grunnlaget for inferensmetodene.
Viktig: Eksamen gir vedlegg med alle formler og statistiske tabeller. Du trenger ikke pugge formlene, men du må forsta når du bruker hvilken formel og tolke resultatene korrekt. Korrekt matematisk notasjon og tydelige forklaringer er avgjørende for full uttelling.
Sentralmal (gjennomsnitt, median) og spredningsmal (varians, standardavvik) for å beskrive og oppsummere datasett. Grunnlaget for all videre statistisk analyse.
Deskriptiv statistikk handler om å oppsummere et datasett med noen få nøgletal. Vi skiller mellom sentralmål (hvor ligger dataene?) og spredningsmål (hvor spredt er de?). Disse målene er byggesteinene for alt annet i statistikken.
Gjennomsnitt (aritmetisk middel) er summen av alle verdier delt på antall observasjoner:
Gjennomsnittet er sensitivt for ekstremverdier (uteliggere). En enkelt veldig høy eller lav verdi kan trekke gjennomsnittet kraftig i sin retning.
Median er den midterste verdien når dataene er sortert i stigende rekkefølge:
Medianen er robust mot uteliggere og gir ofte et bedre bilde av "typisk verdi" i skjeve fordelinger.
Utvalgsvarians måler gjennomsnittlig kvadratisk avvik fra gjennomsnittet. Vi deler på (ikke ) for å få en forventningsrett estimator:
Utvalgets standardavvik er kvadratroten av variansen og har samme måleenhet som dataene:
Vi deler på i stedet for fordi vi bruker (som selv er estimert fra dataene) i stedet for den sanne populasjonsforventningen . Dette koster oss en "frihetsgrad". Hadde vi kjent , ville vi delt på . Denne korreksjonen (Bessels korreksjon) sikrer at , dvs. at utvalgsvariansen er en forventningsrett estimator for populasjonsvariansen.
Oppgave: Et utvalg av leveringstider (i timer) ga: og . Beregn gjennomsnitt og standardavvik.
Løsning:
Oppgave: Gitt den sorterte datasekvensen: (, partall). Finn medianen.
Løsning: Siden er partall, er medianen gjennomsnittet av observasjon nr. og :
I R: median(c(2, 5, 7, 9, 11, 14, 18, 22)) eller manuell formel (x[n/2] + x[(n/2)+1])/2.
Oppgave: En kundeservice målte ventetiden (i sekunder) for kunder. Oppsummeringsdata: , . Beregn gjennomsnitt og standardavvik.
Løsning:
Nøkkelformler
Vanlige feil
Eksamenstips
Laster...