Start-hjelp for datasettene til ukesoppgavene i R

Hvordan komme i gang med datasett fra boka i R eller RStudio?

F?r vi kan begynne med en gitt oppgave, m? vi en gang for alle laste ned datasettene som en zippet mappe:

  1. Laste ned zippet mappe herfra
  2. Herfra blir videre fremgangsm?te litt forskjellig for Mac og Windows
  • Mac: 
    • G? til mappen p? din maskin der ‘ips10e_csv_data_sets.zip’ ligger (dette kan v?re feks p? ‘~/Downloads/’), og herfra klikk p? mappa s? den blir pakket ut. Du f?r da en mappe som heter ‘ips10e_csv_data_sets’, i samme mappe der du hadde ‘ips10e_csv_data_sets.zip’.
    • Mappa ‘ips10e_csv_data_sets’ innenfor den ytre ‘ips10e_csv_data_sets’ inneholder en undermappe for hvert kapittel, for eksempel inneholder undermappa ‘ips10e_ch1_csv_data_sets’ datasettene til oppgavene i kapittel 1.
    • Dersom zip-fila ble lasta ned til ‘~/Downloads/’, ligger da datasettene til oppgavene i kapittel 1 i mappa ‘~/Downloads/ips10e_csv_data_sets/ips10e_csv_data_sets/ips10e_ch1_csv_data_sets’. Eksempelvis ligger da datasettet til oppgave 1.15 p? '~/Downloads/ips10e_csv_data_sets/ips10e_csv_data_sets/ips10e_ch1_csv_data_sets/ex01-015KPOT40.csv'
      • I RStudio kan n? datasettet til oppgave 1.15 n? leses inn med kommandoen data=read.csv("~/Downloads/ips10e_csv_data_sets/ips10e_csv_data_sets/ips10e_ch1_csv_data_sets/ex01-015KPOT40.csv")

        Variabelen `data` er n? en `data.frame` som inneholder flere kolonner med informasjon. Dersom du i oppgave 1.15 kun er interessert i variabelen `Potassium_mg` s? kan du hente ut denne til variabelen x med kommandoen

        x = data$Potassium_mg

  • Windows
    • G? til mappa p? din maskin der den komprimerte fila ‘ips10e_csv_data_sets.zip’ ligger. (Dette kan feks v?re p?  'C:\Users\brukernavn\Downloads', der 'brukernavn' byttes med ditt brukernavn.) H?yre-klikk p? 'csv.zip' og velg 'Pakk ut alle...' (eller et lignende valg for ? pakke ut). Hvis du ikke angir noe annet, blir det n? laget en ny mappe 'ips10e_csv_data_sets' p? det samme omr?det som fila 'ips10e_csv_data_sets.zip' ligger.
    • Mappa ‘ips10e_csv_data_sets’ innenfor den ytre ‘ips10e_csv_data_sets’ inneholder en undermappe for hvert kapittel, for eksempel inneholder undermappa ‘ips10e_ch1_csv_data_sets’ datasettene til oppgavene i kapittel 1.
    • Dersom den zip-fila ble lasta ned til ‘C:\Users\brukernavn\Downloads’, ligger da datasettene til oppgavene i kapittel 1 i mappa ‘C:\Users\brukernavn\Downloads\ips10e_csv_data_sets\ips10e_csv_data_sets\ips10e_ch1_csv_data_sets’. Eksempelvis ligger da datasettet til oppgave 1.15 p? 'C:\Users\brukernavn\Downloads’, ligger da datasettene til oppgavene i kapittel 1 i mappa ‘C:\Users\brukernavn\Downloads\ips10e_csv_data_sets\ips10e_csv_data_sets\ips10e_ch1_csv_data_sets\ex01-015KPOT40.csv'
      • Jeg kan n? lese inn datasettet i RStudio til oppgave 1.15 med kommandoen data=read.csv("C:\Users\brukernavn\Downloads\ips10e_csv_data_sets\ips10e_csv_data_sets\ips10e_ch1_csv_data_sets\ex01-015KPOT40.csv").

        Variabelen `data` er n? en `data.frame` som inneholder flere kolonner med informasjon. Dersom du i oppgave 1.15 kun er interessert i variabelen `Potassium_mg` s? kan du hente ut denne til variabelen x med kommandoen

        x = data$Potassium_mg

      • Du kan finne csv-fila til en oppgave i Filutforskeren og bruke 'Ctrl V' for ? kopiere filstien dens fra adresselinja i Filutforskeren til R-kommandoen i R-skriptet ditt.
  • Uavhengig av operativsystem: Om du ?nsker, flytt mappa 'ips10e_csv_data_sets' (gjerne den innerste dersom du ogs? fikk to mapper med samme navn innenfor hverandre) til en annen lokasjon der du ?nsker ? ha den lagra. Du kan feks legge den inni en STK1000-mappe p? skrivebordet, eller et annet sted p? datamaskinen der du finner den igjen (viktig!). Det kan v?re lurt ? ha datasettene og R-skriptene dine i en felles mappestruktur. Sp?r gjerne gruppel?rerne om hjelp n?r og hver gang du er usikker. ?velse gj?r mester!
Publisert 10. sep. 2024 20:33 - Sist endret 10. sep. 2024 20:33