Datamengdene i b?de det private n?ringslivet og det offentlige er n? blitt s? store at det ikke lenger nytter ? bruke dagens statistiske metoder til ? analysere dem p? en best mulig m?te.
Med Universitetet i Oslo i spissen har Norsk Regnesentral, Oslo universitetssykehus, NAV og Skatteetaten g?tt sammen med tunge akt?rer i n?ringslivet som Telenor, Gjensidige og DnB om ? danne det splitter nye senteret for forskningsdrevet innovasjon, Big Insight. Senteret skal de neste ?tte ?rene utvikle nye statistiske metoder for ? effektivisere det offentlige og gj?re n?ringslivet bedre og mer konkurransedyktig, ikke bare nasjon- alt, men ogs? internasjonalt.
– Datamengdene er blitt s? enorme at vi n? trenger langt mer sofistikerte, statistiske metoder for ? kombinere og tolke de mange typene data som finnes. Ellers f?r vi bare ut s?ppel, forteller lederen for det nye forskningssenteret, Arnoldo Frigessi, som ogs? er professor i statistikk ved Det medisinske fakultet p? Universitetet i Oslo. Han har de siste femten ?rene v?rt en av de ledende statistikerne p? Norsk Regnesentral og skal n? lede det nye innovasjonssenteret sammen med professor Ingrid Glad fra Matematisk institutt.
Det er vanlig ? bruke statistiske modeller til ? beskrive hypoteser av virkeligheten. Hvis sannsynligheten er sv?rt liten for at dataene stemmer med hypotesen, blir hypotesen forkastet.
– I enormt store datamengder er dataene s? detaljerte at det aldri vil v?re mulig ? lage hypoteser som stemmer med alle dataene. Da vil uansett enhver hypotese bli forkastet. Vi m? derfor tenke nytt og utvikle helt nye statistiske metoder, forteller Frigessi.
Selv om oppgavene til de ulike 澳门葡京手机版app下载spartnerne er sv?rt forskjellige, lover han at de nye statistiske metodene vil kunne bli allmenngyldige.
– Det er ikke s? stor forskjell p? statistiske metoder selv om de skal brukes p? s? ulike ting som brystkreft, mobiltrafikk og forsikringspoliser.
Frigessi er p? jakt etter to typer statistiske l?sninger. Den ene skal v?re en mirakelkur for personaliserte problemstillinger. Den andre skal kunne forutsi n?r stabile systemer av en eller annen grunn kommer ut av likevekt og begynner ? bevege seg i en uvanlig retning.
Persontilpassete l?sninger
?nskene om persontilpassete l?sninger er mange:
Kreftcocktail. Hvis du f?r kreft, hadde det v?rt best om du kunne f? en medisinsk cocktail spesialtilpasset sykdomsgenene dine.
Det store problemet er: Sykdomsgenene dine er helt unike. Du er den eneste i verden som har dem. Hvordan er det da mulig ? finne en persontilpasset behandling?
Da m? sykdomsgenene til alle dem som har f?tt den samme krefttypen, sammenlignes. Her er det snakk om ? kombinere geninformasjonen fra tusenvis av pasienter som ligner p? deg.
Mikrol?n i U-land. Telenor har allerede 36 millioner mobilkunder i Pakistan. Mange av dem bor sv?rt landlig til, uten tilgang til banker. Telenor ?nsker n? ? tilby mobilkundene mikrol?n.
– Tenk deg at en fyr ringer deg og ?nsker ? l?ne 2000 dollar for ? kj?pe en ku. Du vet ikke om han har jobb, hus eller barn. Det eneste du vet, er hvordan han har ringt med mobilen, n?r og hvor han har v?rt. Basert p? hvordan han bruker telefonen, skal du kunne beslutte om han skal kunne f? et l?n. Da m? du bruke statistikk til ? estimere risikoen til den enkelte kunde. Kan du stole p? personen? Vil han betale tilbake l?net? Hvis Telenor klarer dette, kan de tilby persontilpassete, finansielle l?sninger i bankl?se omr?der i Pakistan, forteller Frigessi.
Avdekker svindlere. Skatteetaten ?nsker ? bruke de nye metodene til bedre ? finne ut av hvem som betaler den skatten de skal.
– De ?nsker alts? ? finne sannsynligheten for at en skattebetaler sniker seg unna.
NAV deltar i det nye forskningssenteret for ? bli i stand til ? finne ut av hvem som feilaktig f?r st?tte.
DnB ?nsker ? bruke de nye metodene til ? avdekke hvitvasking av penger.
– Banken m? raskt kunne beregne sannsynligheten for at enhver transaksjon over et visst bel?p kan v?re hvitvasking. L?sningen er ? finne en algo ritme som automatisk avdekker de f? personene som b?r sjekkes n?rmere manuelt.
Personlig forsikring. N?r du tar kontakt med Gjensidige, ?nsker de ? bruke de nye metodene p? de enorme kundedataene sine for ? kunne gi deg individuelle produkter og priser. Da f?r du en unik forsikringsavtale som ingen andre har.
Ute av likevekt
Den andre generelle, statistiske metoden skal forutsi overraskende hendelser for ustabile systemer.
Tenk deg at sv?rt mange sensorer overv?ker en pasient, minutt for minutt etter en operasjon.
Overv?kingen skal kombinere all mulig informasjon og sammenligne den med pasientjournalen og automatisk si ifra hvis noe kan g? galt.
– Vi m? da ha et system som l?rer fra tusenvis av andre pasienter om hva som kan skje.
Store skip p? havet blir overv?ket av hundrevis av sensorer, som kontinuerlig m?ler slike ting som trykk, temperatur og lyd i kontrollrommet. Her m? mange typer data kobles sammen. Ett eksempel er lyd. Lyden er forskjellig avhengig av om det bl?ser eller ei og om b?ten er i havn eller til sj?s. For ? unng? falsk alarm, m? sensordataene kobles med posisjonen til skipet og meteorologisk informasjon for ? sl? fast hva lyden kan v?re. Poenget er ? stoppe skipet i tide f?r det havarerer.
Konkurransefortrinn
Hele ideen er ? utvikle s? gode statistiske metoder at 澳门葡京手机版app下载spartnerne i det nye forskningssenteret skal f? et konkurransefortrinn foran alle andre.
– De kan da bruke de nye metodene i to til tre ?r f?r de blir publisert vitenskapelig og dermed tilgjengelige for alle. Det gir likevel et stort nok forsprang. Etter noen ?r m? metodene uansett forbedres. Hver gang vi f?r nye typer data, blir det et kappl?p om nye metoder.
Til sammen skal senteret knytte til seg over hundre forskere, derav vel tretti stipendiater og ti postdoktorer.
– Det er ikke nok at vi blir best i Norge. Vi skal i tet internasjonalt. Vi valgte 澳门葡京手机版app下载spartnere som ikke er konkurrenter, er i front internasjonalt og som har spennende og enormt store datamengder som aldri er blitt skikkelig analysert.
Frigessi ?nsker likevel ? tone ned forventningene og p?peker at risikoen er stor for at problemene de kaster seg over, ikke lar seg l?se.
– Innovasjonsdrevet forskning er um?telig krevende. Vi m? med god fantasi koble sammen data fra mange kilder. Hvis alt lar seg l?se, har vi valgt for enkle problemstillinger. Vi skal l?se supervanskelige ting og kommer til ? feile mange ganger. Kanskje halvparten av prosjektene g?r galt. Vi m? l?re av disse feilene og hvorfor vi ikke fikk det til. S?nn er det i vitenskapen, poengterer Frigessi.