Forst?r verden med moderne statistikk

Enkle, statistiske unders?kelser har reddet kvinner fra ? d? i barsel og babyer fra krybbed?d. N? kan moderne, statistiske metoder gj?re det mulig ? bedre kreftbehandlingen, avsl?re skattesvindlere og forst? krigens dynamikk.

STATISTIKK: - Statistikk er vitenskapen som gj?r det mulig ? ta beslutninger selv om datagrunnlaget best?r av usikkerheter, poengterer professor Nils Lid Hjort p? Matematisk institutt. Foto: Colourbox.

Av Yngve Vogt
Publisert 28. jan. 2019

Statistikere har tatt i bruk helt nye metoder for ? l?se viktige oppgaver for b?de deg og resten av samfunnet.

Statistikk kan brukes til mye, som alt fra fredsforskning og persontilpasset kreftbehandling til hvordan det er mulig ? avsl?re skattesnusk og hvordan rederiene kan spare millioner av kroner p? ? drifte de store tankb?tene p? verdenshavene.

– Felles for disse forskningsprosjektene er at vi m? l?se statistiske problemstillinger fra sv?rt store og til dels uoversiktlige datamengder. Det er nettopp det som er den store utfordringen for oss statistikere i dag. Statistikk er vitenskapen som gj?r det mulig ? ta beslutninger selv om datagrunnlaget best?r av usikkerheter. Vi bruker statistikk for ? finne kunnskap om hvordan verden virkelig er, poengterer Nils Lid Hjort, professor i statistikk p? Matematisk institutt ved Universitetet i Oslo.

Reddet kvinner i barsel

F?r i tiden var alt mye enklere. Da holdt det ? forholde seg til sm? datamengder.

Et livreddende eksempel med sv?rt enkel statistikk var da den ungarsk-?sterrikske legen Ignaz Semmelweis i 1847 reagerte p? de h?ye? d?delighetstallene blant f?dende kvinner p? et sykehus i Wien.

D?deligheten p? avdelingen til Semmelweis var mye h?yere enn p? de andre avdelingene ved sykehuset. P? avdelingen hans d?de én av ?tte kvinner. Legene obduserte ogs? lik. P? den andre avdelingen r?det jordm?drene. Der d?de én av femti kvinner.

D?dsraten sank dramatisk da Semmelweis, ved ? sammenligne tallene, slo fast at f?rre kvinner d?de i barsel hvis sykehuslegene vasket hendene grundig etter hver obduksjon.

– Den gangen kjente ingen til bakterier. Forklaringen p? de mange d?dsfallene kom f?rst flere ti?r senere. I dag er det opplagt at legene m? vaske hendene etter en obduksjon. Statistisk fantes det et m?nster, selv om legene der og da ikke hadde den medisinske forklaringen p? hvorfor dette var riktig, forteller Nils Lid Hjort.

Reduserte krybbed?d

KRYBBED?D: Takket v?re statistiske analyser kunne krybbed?dforskere p? begynnelsen av nittitallet sl? fast at det var lurt ? legge babyer p? ryggen. Foto: Colourbox

Over hundre ?r senere ble statistikk brukt i krybbed?dforskning. Mange babyer d?de uforklarlig og plutselig. Den australske barnelegen Susan Beal og den nederlandske legen Guus A. de Jonge fattet mistanke om at d?dsfallene kunne skyldes liggestillingen. Dette var p? 1970- og 80-tallet, da mageleie ble ansett som den optimale sovestillingen.

– Krybbed?depidemien kulminerte i Norge i 1989. Da d?de 142 barn i krybbed?d, forteller Torleiv Ole Rognum. Han er professor emeritus p? avdeling for rettsmedisinske fag ved Universitetet i Oslo og fikk sommeren 2018 en internasjonal pris for sitt omfattende arbeid mot krybbed?d.

Det store sp?rsm?let var om babyene skulle sove p? magen eller ryggen. Medisinerne satte i gang kontrollerte, statistiske studier for ? finne ut om det fantes en sammenheng mellom liggestilling og d?dsfall.

I 1990, f?r sammenhengen var endelig bevist, ble det p? et stort internasjonalt m?te om krybbed?d i Trondheim anbefalt at spedbarn skulle ligge p? ryggen. To ?r senere, i 1992, ble sammenhengen statistisk bevist.

– Virkningen var dramatisk. Krybbed?dtallene falt og har fortsatt ? falle. I dag er det rundt ti ?rlige tilfeller, poengterer Torleiv Ole Rognum.

Dataeksplosjon

Siden den gang har datamengdene eksplodert.

– Den voldsomme datafangsten har endret statistikkfaget, sier Nils Lid Hjort.

Noen tror kanskje at de enorme datamengdene gj?r det lettere for statistikere. Da tar de grundig feil.

– Vi leter etter n?len i h?ystakken. Jo st?rre h?ystakken er, desto vanskeligere er det ? finne n?len. Dessuten er det fare for ? finne ting som ligner p? n?ler, men som ikke er det likevel.

Mange samler inn data uten ? stille seg klare sp?rsm?l om hva de ?nsker ? finne svaret p?. Det er et stort problem.

– Med en ugjennomtenkt innsamling av data kan de klassiske, statistiske metodene bli ugyldige.

Statistikerne m? derfor utvikle og tilpasse metodene sine for ? kunne holde tritt med de enorme datamengdene som har kommet til de siste ?rene.

– Ethvert fag med komplekse problemstillinger vil trenge statistikk p? h?yt niv?. Selv om statistikkfaget er hundre ?r gammelt og mye fundamentalt er forst?tt, er det mer enn nok problemstillinger igjen. Det skyldes ikke bare at datafangsten er st?rre enn f?r, men ogs? at dataene er blitt langt mer komplekse, p?peker Nils Lid Hjort.

Postdoktor Céline Cunen p? Matematisk institutt har forsket p? hvordan statistikk kan brukes til ? si noe om hvorvidt verden er blitt fredeligere, noe du kan lese mer om i denne temautgaven. Hun poengterer at statistikere n? m? lete etter mye svakere signaler i datamaterialet enn tidligere. Da er det vanskeligere ? skille mellom datast?y og reelle funn.

Mange data blir dessuten samlet inn av ulike instanser. Mye av informasjonen er rotete.

– Problemet er at jo st?rre datamengdene blir og jo mer uryddig de er lagret, desto vanskeligere er det ? dra nytte av dem. En viktig del av statistikkfaget er ? bidra til ? samle? inn de mest relevante dataene, sier Céline Cunen.

Etisk ansvar

Selv om statistikk er et n?dvendig verkt?y for ? forst? verden, brukes det ofte uvettig.

– Statistikk kan misbrukes. Det f?lger derfor med et etisk ansvar. Noen statistikere tenker ikke alltid p? menneskehetens beste, beklager Nils Lid Hjort.

Et eksempel er statistikerne som jobber med de moderne overv?kingssystemene i Kina. Overv?kingen premierer folk med god oppf?rsel og gj?r det vanskeligere for dem som ikke f?lger systemet.

– Her brukes avansert statistikk og komplekse algoritmer, med mulige konsekvenser for millioner av borgere. Jeg mener dette kan lede til misbruk.

Et annet misbruk er n?r statistikk brukes til ? p?virke et valgresultat. Det amerikanske firmaet Cambridge Analytica fikk med tvilsomme metoder tak i data fra flere millioner Facebook brukere. Flere amerikanske politikere, som Donald Trump og valgkamporganisasjonen hans, tilpasset det politiske budskapet ved ? analysere brukernes atferd p? Facebook.

Statistikerne ved UiO ?nsker derimot ? bruke anvendt statistikk til ?menneskehetens beste?.

– Karl Marx sa i 1845 at filosofene bare brydde seg om ? forst? verden. Vi vil med marxistisk forstand ogs? bruke statistikk til ? forandre verden – til det bedre, poengterer Nils Lid Hjort.

Statistikerne beklager ogs? at faget blir misbrukt av enkelte forskere. De leter for mye etter mulige funn. Roter de lenge nok i h?ystakken, vil de finne ting som ser ut som n?ler, selv om svarene ikke er statistisk gyldige.

– Problemet er at noen forskere ikke forst?r de grunnleggende tingene ved komplekse, statistiske metoder og legger frem tilsynelatende signifikante funn, som egentlig bare er ?st?y?. De fleste gj?r dette i god tro, men noen gj?r det ogs? med vilje, p?peker Céline Cunen.

Publisert 28. jan. 2019 09:27 - Sist endret 7. nov. 2025 15:10