Jakten p? god automatisk teksting
UiOs tekstingsverkt?y Autotekst har kommet i ny versjon, med mye bedre teksting som krever mindre etterarbeid. – For to ?r siden utviklet vi tjenesten Autotekst for ? gj?re det enklere tekste video. Det er et krav at alle forelesningsvideoer p? uio.no skal v?re tekstet, og siden kravet tr?dte i kraft, har vi jobbet hardt for ? komme fram til en teknisk l?sning for god automatisk teksting, forteller leder for webutvikling p? UiO, Dagfinn Bergsager. – Teksting er sv?rt tidkrevende, s? det har v?rt viktig ? finne en l?sning som krever minst mulig manuell teksting. Og n? har vi det! Det fungerer sv?rt godt p? norsk tale, til og med n?r den som snakker har dialekt!
Se en kort video om Autotekst og hvordan du kan ta den i bruk.
Videoen er kun p? 1 minutt og 54 sekunder, s? dette har du tid til :)
Slik kan du bruke autotekst til ? tekste video fra forelesninger som ligger p? uio.no
- Last ned lydfila fra uio.no for videoen du skal transkribere
- Last lydfila opp i autotekst.uio.no og start transkribering
- Last opp .vtt-fila som autotekst lager sammen med videofila p? uio.no
- Velg ? redigere ediger video-fila og vel den opplastede .vtt-fila som undertekst
Se en kursvideo som gj?r de stegene som er beskrevet over.
Gi oss tilbakemeldinger p? hvordan autotekst fungerer!
Autotekst var tidlig ute, og n? er verkt?yet fornyet og forbedret
Autotekst, da den ble lansert, tok imot lyddata, sendte dem til Googles tjeneste Speech-to-Text og returnerte tekst. Problemet var at kvalitet p? transkribering av norsk tale var veldig lav, og krevde mye etterarbeid. – Vi beregnet kostnaden til ? renskrive teksting til alle forelesningsvideoer som publiseres p? uio.no til 20 millioner kroner i ?ret! I tillegg hadde vi personvernutfordringer med ? sende data ut av Norge hver gang vi skulle transkribere, fortsetter Bergsager.
Men n? har Autotekst kommet i ny versjon, med ny, og mye bedre teknologi som driver tekstingen. Tjenesten som er lansert n?, krever vesentlig mindre etterarbeid og i mange tilfeller kan teksting legges ut uten ? bli renskrevet i ettertid. Slik kan alle som m? tekste video eller transkribere lyd, spare mye tid og ressurser.
OpenAI reddet oss
P? slutten av h?sten 2022, like f?r ChatGPT ble ?rets snakkis, lanserte OpenAi tjenesten Whisper. Dette er programvare som er basert p? AI-modeller som kan kj?re p? lokale servere. Utfordringen er at tjenesten krever veldig mye datakraft. Heldigvis har IT-avdelingen p? UiO akkurat det – alts? mye datakraft – s? n? g?r verkt?yet Whisper p? v?r egen infrastruktur uten at noe data forlater campus og UiOs servere.
H?ndplukket spesialteam
F?r nytt?r ble det satt sammen et tverrfaglig team av utviklere og interaksjonsdesignere som skulle endre tjenesten autotekst.uio.no, som vi allerde hadde, til ? bruke Whisper til transkribering. I tillegg skulle de gj?re hele tjenesten mer brukervennlig og ? ta i bruk flere nye funksjoner, blant annet automatisk oversetting til engelsk.
I l?pet av uke 1 i 2023 ble hele prosjektet gjennomf?rt p? rekordtid og tjenesten ble skrevet om. IT-avdelingen lanserte en ferdigtestet fullversjon 1.februar 2023!
Vi har allerede f?tt mange tilbakemeldinger om hvor utrolig bra autotekst.uio.no n? klarer ? gj?re om norsk tale med forskjellige dialekter til tekst.
Neste steg: Integrasjon med mobilappen Nettskjema-diktafon
Allerede n? er det mulig ? transkribere lydopptak tatt med mobilappen nettskjema-diktafon, men da m? du f?rste laste ned opptaket og laste det opp i autotekst.uio.no. I l?pet av v?ren 2023 kommer alle lydopptak som lagres Nettskjema med diktafonappen, til ? bli transkribert automatisk ved bruk av de samme serverne.
Mer om Autotekst
- Les mer om tjenesten i UiOs IT-tjenestekatalog.
- Les artikkel om Autotekst p? Digi.no
- Bruk av tjenesten autotekst.uio.no er fritt tilgjengelig for alle UiO-brukere og kan bestilles av alle FEIDE-institusjoner.
- Om du skal transkribere sensitive data, kan du ogs? installere Whisper i ditt TSD-prosjekt.