Kunstig intelligens: Avsl?rer sykdom f?r symptomene kommer

Kroppens m?te ? bekjempe virus og bakterier p?, er nesten ufattelig komplisert. Er det mulig ? forst? mer med kunstig intelligens – og avsl?re sykdom f?r symptomene kommer?

N?r immunsystemet kombineres med kunstig intelligens, er det mulig ? forst? mer. Illustrasjon: Apollon. Underlagsbilder: Colourbox

Av Trine Nickelsen
Publisert 12. feb. 2024

– Jeg leter etter problemer som er s? vanskelige at det bare er avansert maskinl?ring som kan l?se dem, forteller professor Geir Kjetil Sandve p? Institutt for informatikk.

Selv er han en av Universitetet i Oslos fremste forskere p? kunstig intelligens. Han 澳门葡京手机版app下载er med forskere fra flere fagfelt, blant dem medisinere.

– Det var slik jeg snublet over immunsystemet. Dette systemet er s? sofistikert at det vil kreve ?revis med systematisk, metodisk forskning fra et helt felt av maskinl?rere ? n?ste opp i det, erkjenner Sandve.

?Det er nesten like mange potensielt forskjellige antistoffer som det er atomer i universet.?

Lange lenker

N?r et virus eller en bakterie invaderer kroppen v?r, blir m?lrettete tiltak satt i gang for ? ?delegge den ubudne gjesten. Det skjer framfor alt gjennom produksjon av noen spesielle proteiner, nemlig antistoffer.

Proteiner er, som vi vet, bygd opp av aminosyrer. Det finnes 20 forskjellige typer av dem. De kan kombineres p? enormt mange ulike m?ter og med ulike lengder. Aminosyrer binder seg nemlig sammen i lange lenker. Hvert protein har en unik rekkef?lge av aminosyrer, bestemt etter oppskrift fra genene. Immuncellene har et protein som likner antistoffer.

Et kort ord

– Jeg jobber med ? forst? reglene for hvordan en immuncelle gjenkjenner en trussel – et virus, en bakterie, eller i noen tilfeller – en misforst?tt trussel som f?rer til autoimmun sykdom, som leddgikt, diabetes type 1 og c?liaki, forteller Sandve.

M?ten antistoffene gjenkjenner virus og bakterier p?, er helt spesiell. Hver enkelt immuncelle vet n?yaktig hva den skal reagere p? blant en helt enorm mengde trusler.

– Men utrolig nok: all informasjonen som trengs for ? greie det, er i hovedsak lagret i en omtrent 15 bokstaver lang sekvens. Denne delen av immuncellens ‘antistoff’ kalles Complementarity-determining region 3, forkortet CDR3, opplyser han, og legger til at navnet ikke er tilfeldig: Det er nettopp denne delen av immuncellens antistoff som avgj?r hvilke farer som blir gjenkjent.

BARE ?N BLODPR?VE: Maskinl?ring finner m?nstre som immunforsvaret har lagd, og som avsl?rer sykdom. – M?let v?rt er at det om noen ?r er mulig ? sjekke for hundrevis av forskjellige sykdommer basert p? én enkelt blodpr?ve, sier Geir Kjetil Sandve. (Foto:Trine Nickelsen)
?

– Vi kan gi hver av de 20 forskjellige aminosyrene en bokstav. Det betyr at hver eneste immuncelle reagerer p? akkurat det den skal, ut fra en tekstlinje som er bare 15 bokstaver lang.

Men er dette noen stor utfordring for forskerne? Er det ikke da bare snakk om ? analysere 15 bokstaver, og ut fra de 15 bokstavene finne ut om immuncellen gjenkjenner et bestemt virus eller en bakterie – og dermed kan sette i gang sitt motangrep?

– Det h?res kanskje enkelt ut. Men vi m? huske at immunsystemet kan gjenkjenne milliarder ulike ting – og det alts? bare med et slikt 15 bokstaver lang ord.

Atomer i universet

For at s? korte ord skal kunne gjenkjenne s? mye ulikt, m? det v?re slik at selv sm? endringer i ordene f?rer til at noe helt annet blir gjenkjent.

– Var ordene derimot kjempelange, kunne de v?re ekstremt forskjellige. Da hadde det v?rt mye lettere for oss ? l?re ? skille dem fra hverandre. At de er s? korte, er akkurat det som gj?r det s? vanskelig ? bestemme hva en bestemt immuncelle kan gjenkjenne av inntrengere, erkjenner forskeren.?

Sandve ber oss se matematisk p? det. Som sagt, antistoffer er proteiner som best?r av aminosyrer?– byggeklosser det finnes 20 forskjellige utgaver av. Hvis vi tenker p? hvor mange ulike ord du kan skrive av noe som er 15 bokstaver langt, blir det 20 muligheter p? den f?rste plassen, 20 p? den neste, og s? videre fram til den femtende plassen.

– Multipliserer vi dette, f?r vi en anelse om hvor svimlende komplekst immunsystemet v?rt er: Det gir oss nesten like mange potensielt forskjellige antistoffer som det er atomer i universet.

Gj?r feil

Men immunsystemet kan ogs? gj?re feil. Uheldigvis gjenkjenner det ting i kroppen som det oppfatter som inntrengere, men som i virkeligheten er kroppens eget vev. Da oppst?r autoimmune sykdommer, som leddgikt, diabetes type 1 og multippel sklerose.

Selv har Sandve spesielt jobbet med c?liaki. Dette er en betennelsessykdom i tynntarmen. Sykdommen blir utl?st av gluten – som immunceller oppfatter som en trussel. Feilen gj?r at immunforsvaret i tarmen bli satt i gang.

M?let til Sandve og kollegene er ? forst? mer om sykdomsprosessen og utvikle mye m?ter ? stille diagnosen p? – begge deler basert p? analyse av m?nstre i de korte bokstavsekvensene som avgj?r hva immuncellene kjenner igjen av trusler. Men likevel er det ikke slik at bare én sekvens gjenkjenner gluten. Nei, det gj?r masse ulike sekvenser av de 15 bokstaver lange ordene.

Leter etter m?nstre

Rommet for variasjon er enormt. Det er ikke som med Visa-kortet ditt: Endrer du ett siffer, kan du ikke lenger betale med det. Kroppen derimot, er ikke avhengig av ? lage en helt fast bestemt sekvens – rekkef?lge p? bokstavene. Det er faktisk en helt enorm mengde ulike sekvenser som kan gjenkjenne gluten, eller influensavirus eller hva det skal v?re.

– Samtidig vet vi at fra naturens side fungerer immungjenkjenningen sv?rt presist og forutsigbart. Derfor burde det v?re mulig ? finne m?nstre for hvilke immunceller som gjenkjenner hva. I virkeligheten foreg?r dette ved at molekyler binder seg til hverandre. En intuitiv strategi er derfor ? studere molekylene p? atomniv?, sier Sandve.

Men det er enklere sagt enn gjort.

– Selv om formler fra kvantemekanikk i prinsippet gj?r det mulig ? beregne om ett molekyl vil feste seg til et annet, vil det i praksis kreve mange ?r med tungregning ? finne ut hva hvert enkelt antistoff gjenkjenner. ?

Proteinet i 3D

Antistoffer er som vi vet proteiner. Det er antistoffenes helt bestemte tredimensjonale form som gj?r dem i stand til ? binde seg til ulike virus og bakterier. Et protein dannes n?r alle stoffene i proteinet setter seg sammen og spontant folder seg til en komplisert origami-struktur. Hva slags funksjon proteinet vil ha, blir bestemt av hvordan denne strukturen blir seende ut.

? beregne den endelige formen til et protein er en enorm utfordring – hvordan det bretter, folder og kr?ller seg sammen – og interagerer med andre proteiner. Men maskinen AlphaFold, som Science k?ret til ?rets forskningsgjennombrudd i 2021, klarer det i l?pet av sekunder.

Men det gjelder likevel ikke alle proteiner.

– Egenskapene til antistoffene er s? spesielle, og m?ten de gjenkjenner virus p? s?pass subtil, at disse beregningene ikke fungerer, i alle fall ikke enn?, forteller forskeren.

"At dyp l?ring ?pner for ? utvikle skredders?m og utfolde sin kreativitet, tror jeg ikke s? mange tenker p?."

Isteden pr?ver Sandve og kollegene ? finne m?nstrene for hva immuncellene gjenkjenner basert p? maskinl?ring.

– Selv om vi ikke simulerer atomer direkte, husker vi nettopp p? at antistoffene egentlig er strukturer som fester seg til virus og bakterier i det tredimensjonale rommet.

Men, hvordan oppst?r m?nstrene forskerne leter etter i de 15 bokstaver lange sekvensene?

– M?ten antistoffer og virus kr?ller seg til romlige molekyler p?, og m?ten atomkreftene virker mellom disse molekylene, er det som gir m?nstrene for hva immuncellene gjenkjenner blant de ubudne gjestene, p?peker han.

F?r symptomene kommer

Immuncellene har ikke bare i oppgave ? bekjempe inntrengere under en infeksjon. Immunsystemet har ogs? et minne, som gj?r at vi slipper ? f? samme sykdom igjen.

– N?r immunsystemet bekjemper en sykdom, eller bare har m?tt et eller annet i kroppen v?r, legges det igjen noen celler som lever videre og holder p? denne informasjonen. Tar vi en blodpr?ve, f?r vi med oss en god del slike minneceller p? kj?pet. De kan fortelle om en sykdom som er akutt akkurat n?, men ogs? om sykdommer som lurer i bakgrunnen.

Kanskje har du en sykdom du ikke er klar over, en autoimmun sykdom? Da har trolig noen immunceller allerede begynt ? ?delegge litt vev i noen deler av kroppen din, men uten at du merker det.

– I stedet for ? sp?rre hva en bestemt immuncelle gjenkjenner, sp?r vi heller: Hvis vi tar ut en million slike celler, finner vi tegn p? en eller annen sykdom? Da kan vi sjekke for en lang, lang rekke sykdommer.

Sandve viser til at den fullstendige kartleggingen av menneskets samlete arvemasse kom for dr?yt 20 ?r siden. Da ble det mulig ? finne ut om den enkelte av oss har ?kt risiko for en sykdom ? bruke en DNA-test.

Men n? er det ikke lenger bare snakk om ? vurdere risiko – men sl? fast om du faktisk har en sykdom som p?g?r i kroppen.

– For seks-sju ?r siden fikk vi muligheten til ? ta en blodpr?ve og ut fra blodpr?ven sjekke hvilke immunceller du har og om du allerede har sykdommen og derfor sammsynligvis vil merke symptomene innen f? ?r. ??

Det er ingen sjans for en kliniker ? f? dette til p? laboratoriet. Sandve og kollegene har derfor utviklet maskinl?ringsverkt?yet de har gitt navnet immuneML, som ligger ute ?pent tilgjengelig. Ved ? analysere blodpr?ven ved hjelp av maskinl?ring finner forskerne m?nstrene som pasientens immunsystem har lagd.

– M?let v?rt er at det i framtiden skal v?re mulig ? sjekke for hundrevis av forskjellige sykdommer basert p? én enkelt blodpr?ve. En datamaskin ser etter m?nstre knyttet til mange ulike sykdommer samtidig, ogs? kreft. Det samme verkt?yet kan ogs? brukes for ? l?re slike m?nstre.

I forskningsgruppa hans, Sandve Lab, foreg?r mye av programmeringen.

Dyp l?ring er skredders?m

Sandve peker p? at det finnes mange ulike maskinl?ringsmetoder. Dyp l?ring og nevrale nettverk er det som er mest popul?rt n?. ChatGPT er basert p? slike nevrale nettverk. De kalles svarte bokser, i motsetning til andre tiln?rminger som regnes for ? v?re mer ?pne og transparente.

– For meg som utvikler forholder det seg faktisk motsatt. Det er den dype l?ringen som er transparent, og som gir meg muligheten til ? spekulere og bruke kreativiteten min.

Professsoren sammenlikner den dype l?ringen med en god, gammeldags mekanisk klokke med mange ulike tannhjul.

– De kan jeg flytte rundt p? for at klokken blir best mulig tilpasset behovene mine. Den vanlige, tradisjonelle maskinl?ringen derimot, er som en boks som er limt sammen, og som derfor vanskelig lar seg ?pne og mekke p?. ?

Sandve gir oss et eksempel:

– La oss ta det med ? bestemme om en pasient har en gitt sykdom ut fra en blodpr?ve: Med en del av maskinl?ringsmetodene jeg brukte for 20 ?r siden, ville jeg pr?vd fem ulike metoder, sett hvem av dem som virket best, og eventuelt fors?kt ? vri litt p? dem. Mulighetene til ? tilpasse metoden til problemet, var likevel begrenset.

Da fungerer den dype l?ringen p? en annen m?te.

– F?rst tar jeg det jeg vet om immunceller: Jeg vet at cellenes antistoff, som er proteiner, best?r av en om lag 15 bokstaver lang sekvens. Jeg vet at proteiner bretter seg opp i tredimensjonale strukturer. Jeg vet ogs? at aminosyrene, alle disse molekylene eller bokstavene som ligger n?r hverandre i éndimensjonale lenker, havner n?r hverandre ogs? n?r proteinene bretter seg i tredimensjonale strukturer.

– Derfor tror jeg at bokstaver som ligger n?r hverandre, virker sammen, at de gir en kombinasjonseffekt eller synergi. Da kan jeg legge inn en komponent i min dype l?rings-modell, nemlig det vi kaller et konvolusjonelt lag.

Sandve ber oss tenke p? dyp l?ring som et byggverk i Lego.

– Da er dette konvolusjonelle laget en legokloss som utnytter akkurat dette at bokstaver som havner n?r hverandre, samvirker for ? kunne oppdage en helt bestemt inntrenger blant milliarder andre. ?

Bygger med Lego

Immuncellene som Sandve og kollegene spesielt har v?rt p? jakt etter, er alts? de som gjenkjenner c?liaki. Han viser til at blant millioner av immunceller i en blodpr?ve, er det sv?rt f? som har noe ? si for c?liaki – immunsystemet har jo s? mange ulike trusler ? ta seg av.

– N?r jeg bruker dyp l?ring, kan jeg, i stedet for ? se p? et generelt gjennomsnittstrekk ved alle cellene, heller rette oppmerksomheten min inn mot et f?tall celler som virker mest aktuelle. Dessuten vil kollegene mine og jeg l?re oss hvilke f? celler vi b?r kikke p?, forteller forskeren.

– Da kan jeg bruke en annen type legokloss, som p? engelsk g?r under betegnelsen tansformers. Til slutt legger jeg til en tredje type legokloss, som vi kaller et fullt sammenkoblet lag. Det kan trekke ut signalene som forh?pentligvis har oppst?tt gjennom de f?rste to klossene – for ? predikere om en pasient har c?liaki eller ikke.

Dermed har Geir Kjetil Sandve lagd seg et unikt Lego-byggverk som gjennom en kombinasjon av tre n?ye utvalgte klosser, er skreddersydd til forst?elsen han har av problemet.

Skredders?m

– At dyp l?ring ?pner for ? utvikle skredders?m og utfolde sin kreativitet, tror jeg ikke s? mange tenker p?.

– N? h?per at stadig flere blir oppmerksom p? mulighetene dette gir for ? l?se komplekse problemstillinger innen medisin og andre fagomr?der – og at vi kan ha det moro mens vi gj?r det.?

Publisert 12. feb. 2024 07:00 - Sist endret 7. nov. 2025 15:11