import re tekst = "Kari Nordmann studerer p? IFI, Institutt for Informatikk, og er der hver uke fra mandag til fredag. Bygget ligger i Gastaudall¨¦en 23B." # vi kan ekstrahere egennavn fra teksten slik: egennavn = r"[A-Z][a-z]+\s[A-Z][a-z]+" egennavn_tokens = re.findall(egennavn, tekst) print(egennavn_tokens) # s?, vil vi ekstrahere ukedagene i teksten: ukedager = r"(man|fre)(dag)?" """ siden vi bruker flere grupper, f?r vi litt rare resultater, der hver match er fordelt i 'tupler'. For ? unng? dette, endrer vi uttrykket til ? bli en 'non-capturing group' med '?:' i hver gruppe. Pr?v ? bruk begge versjoner for ? se forskjellen!""" ukedager = r"(?:man|fre)(?:dag)" ukedager_tokens = re.findall(ukedager, tekst) print(ukedager_tokens) # Til slutt, vil vi ekstrahere adressen i teksten: adresse = r"[A-Z][a-z¨¦]+\s[0-9]{2}[A-Z]" adresse_tokens = re.findall(adresse, tekst) print(adresse_tokens)