En kort introduksjon til R

 

Form?let med denne lille innf?ringen er ? gi en liten introduksjon til R

 

Du kan kan kopiere kommandoene nedenfor fra web-leseren og lime dem inn i kommandovinduet til R.

Alt p? en linje som kommer etter ?# er en kommentar, og R hopper over dette

 

 

# R som kalkulator

 

# Du kan bruke R som en kalkulator. For eksempel:

3+2

3-2

3*2

3/2

3^2

sqrt(2)

exp(2)

log(2)

 

 

#Skalare variable

 

# Du kan definere skalare variable og regne med dem. For eksempel:

a <- 2?? # alternativt a=10

b <- 3?? # alternativt ?b=20

a+b

a*b

a^b

 

 

#Vektorer

 

# Du kan definere vektorer og regne med dem. For eksempel:

x <- c(1,2,3,4)?

y <-c(2,4,6,8)

x+y

y-x

y/x

y^x

 

# Merk at R regner elementvis

# (R kan ogs? utf?re vektor og matrise algebra)

 

# Du kan "trekke ut" ett eller flere elementer av en vektor:

x[2]

y[c(1,3)]

 

 

#Sekvenser

 

# R kan lage spesielle sekvenser (lagret som vektorer):

c <- 1:10

c

d <- seq(0,20,2)

d

f <- rep(1,10)

f

 

#Funksjoner av en vektor

 

# R har en rekke funksjoner som opererer p? vektorer. For eksempel:

sum(x)

prod(x)

length(x)

 

 

 

#Enkel beskrivende statistikk

 

# Lagrer dataene i tabell 1 p? side 1 i BS i en tabell:

rock.age<-c(249,254,243,268,253,269,287,241,273,306,303,280,260,256,278,344,304,283,310)

 

# Beregner gjennomsnitt, median og standardavvik:

mean(rock.age)

median(rock.age)

sd(rock.age)

 

# Kommandoen "summary" gir et sammmendrag:

summary(rock.age)

 

 

#Innlesing av data og datarammer

 

# Vi kan lese data fra en file (eventuelt p? web) inn i en dataramme. For eksempel:

sigarett<-read.table("http://www.uio.no/studier/emner/matnat/math/STK4900/v07/annet/sigaretter.dat", header=T)

 

#Se p? dataene og skriv ut et sammendrag av dem:

sigarett

 

 

# Du kan adressere variablene i en dataramme ved f.eks

sigarett$nicot????? #merk at det ikke holde ? skrive "nicot"

 

#Du kan tilknytte datarammen

attach(sigarett)

 

#N? er det nok ? skrive "nicot"

 

 

#Noen plot

 

# R kan lage en rekke nyttige plott.

hist(nicot)????????? ????????? # histogram

boxplot(nicot)???????????? # boksplott

qqnorm(nicot)???????????? # normalfordelingsplott

 

# Flere plott p? samme figur:

par(mfrow=c(1,2)) ???? # to plott ved siden av hverandre

plot(co, nicot)????????????? # spredingsplott

plot(tar, nicot)

par(mfrow=c(1,1))?? ?? # stiller tilbake igjen til ett plott

 

 

# Noen statistiske metoder

 

# t-test og konfidensintervall:

t.test(rock.age)

 

#Wilcoxon test and konfidensintervall:

wilcox.test(rock.age, conf.int=T)     

 

# Line?r regresjon:

fit<-lm(nicot~co+tar)

summary(fit)

 

# Merk at "summary" avhenger av hva slags objekt kommandoen brukes p?. Det er typisk for R.

 

 

# Hjelpefunksjoner

 

# R har et godt utbygget hjelpesystem som beskriver kommandoene. For eksempel:

help(lm)

 

# Hvis du ikke hadde kjent navnet kommandoen for line?r regresjon, kunne du ha gitt kommandoen:

help.search("linear regression")

 

 

# Utlogging og lagring av "workspace"

 

# Du avslutter R med kommandoen

q()

 

#Du blir spurt? "Save workspace image?". Hvis du svarer ja p? dette, tar R vare p? alle variable for neste R-sesjon

 

 

# Oppsett av R

 

# Hvis du bruker R til ? arbeide med flere prosjekter, er det lurt ? ha en mappe for hvert prosjekt.

# For STK4900, lager du en mappe som heter STK4900.

# I denne mappen lime du inn et "shortcut" av R-ikonet.

# Du h?yreklikker s? p? ikonet, og skriver "C:\Documents and Settings\brukernavn\My Documents\STK4900" i feltet "Start in"

# N? vil alle R-eregninger i STK4900 bli lagret i mappen STK 4900, og dermed holdt adskilt fra andre R-beregninger