M?lgruppe
Forskere og h?yeregradsstudenter som jobber mye med tekstlige data og som vil l?re litt om emnemodellering ("topic modelling"). Seminaret gir et innblikk i hvordan man bygger og evaluerer emnemodeller i R. Emnemodellering er en utforskende metode for ? finne hyppig forekommende ord eller fraser innenfor en gitt tekst eller et gitt tekstutsnitt som kan 'mappes' til "emner" eller semantiske kategorier.
Grunnleggende kunnskap i statistikk og R er en fordel men ikke et krav for deltakelse.
Hvis man ?nsker ? forberede seg til seminaret, kan man be om ? f? kode og datasett tilsendt p? forh?nd.
Tidspunkt
Torsdag 2. desember kl 13:15-15:00
Innhold
- Hva er emnemodellering?
- R
- Preprosessere data
- Viktige ord i emnene
- Emnesannsynlighet per "dokument"
- Aggregerte resultater
P?melding
Meld deg p? kurset her. Kurset er ?pent for alle tilknyttet UiO. Eksterne kan henvende seg p? epost for ? st? p? venteliste.
Viktig: Dersom det er ?nskelig ? selv skrive og kj?re kode i l?pet av kurset, m? deltakere ha med egen b?rbar PC eller Mac (Laptop) med b?de R (versjon 3.6.3 eller nyere) og RStudio ferdig installert. B?de R og RStudio er gratis, s? det er ikke n?dvendig ? skaffe lisens. R kan lastes ned fra https://cran.r-project.org og RStudio fra https://www.rstudio.com/products/rstudio/download/.
F?lgende R-pakker m? installeres: tm, quanteda, wordcloud, topicmodels, tidytext, tidyr, ggplot2, dplyr, stringr. Fremgangsm?te
Spr?k
Kurset holdes i utgangspunkt p? norsk
Kursholder:
Luigi Maglanoc PhD, Gruppe for datafangst og samlingsforvaltning, USIT.
Kontaktinformasjon:
Har du sp?rsm?l ang?ende kurset, kan du sende en epost til datafangst@usit.uio.no.