Legal Tools
Logg inn

Teknisk Vist · Hvordan AI-en leser tid

Hvordan Tidslinje vet når ting skjedde.

En full gjennomgang av 3-pass ekstraksjonsrørledningen, gjenkjenning av norsk datoformat, hendelsesklassifiseringsskjema, live SSE-strømming og nedlasting som Word-dokument.

12+ datoformater
5 hendelsestyper
3 rørledningspass
2 motoralternativer

Arkitektur

Tre pass. Hvert med en distinkt oppgave.

Rørledningen er bevisst sekvensiell — Pass 1 er regelbasert og nesten umiddelbar; Pass 2 er LLM-ekstraksjonen; Pass 3 etterbehandler og vurderer utdataene.

Pass 1 · PHP / regex

Oppdag & normaliser kjente formater

Et deterministisk mønster-matching pass kjører før noen LLM-anrop. Det skanner hele inngangen for datoer som matcher 12+ norske formater og normaliserer dem til ISO 8601:

  • dd.mm.yyyyYYYY-MM-DD
  • d. månedsnavn yyyy → løst kalenderdato
  • Dagbok-format linjer (som starter med en dato + kolon) → automatisk merket som hendelser
  • To-sifrede år → alltid tolket som 20YY

Normaliserte anker injiseres i LLM-prompten for å redusere hallusinerte eller feiltolket datoer.

Pass 2 · gpt-4o-mini / gpt-4o

Ekstrahere, klassifisere & vurdere

LLM leser hele dokumentet sammen med pre-pass anker. For hver tidsreferanse returnerer den et strukturert JSON-hendelsesobjekt:

  • date — resolved ISO date, or verbatim string if unresolvable
  • date_typeabsolute | relative | recurring | conditional | period
  • confidencehigh | medium | low
  • actor — attributed entity (from source text, not inferred)
  • description — one-sentence event summary
  • source_excerpt — verbatim text fragment (max 200 chars)

Prompten instruerer eksplisitt modellen om ikke å finne på datoer eller aktører som ikke er til stede i kilden. Temperaturen er satt til 0,1 for deterministisk utdata.

Pass 3 · PHP post-processor

Filtrere, sortere & sette sammen

PHP anvender alle aktive filtre før resultatet returneres:

  • Fokusfilter — fjerner hendelser som ikke samsvarer med den forespurte fokusmodusen (frister / høringer / CPS)
  • Konfidensfilter — fjerner hendelser med LAV konfidens hvis forespurt
  • Bakgrunnsfilter — fjerner bakgrunns/narrative hendelser hvis ikke avkrysset
  • Dato-type filter — fjerner relative/gjentakende hendelser hvis ikke avkrysset

Post-prosessoren setter deretter sammen what_remains_uncertain listen og next_practical_step anbefalingen.

Dato gjenkjenning

12+ norske datoformater, alle gjenkjent.

Norske juridiske dokumenter bruker et bredt spekter av datonotasjoner. Pass 1 pre-pass gjenkjenner alle disse deterministisk; LLM håndterer resten i Pass 2.

Format Eksempel Notater
dd.mm.yyyy 30.07.2015 Standard norsk numerisk
dd.mm.yy 09.04.25 To-sifret år → alltid 20YY
d. månedsnavn yyyy 3. mars 2024 Skriftlig måned på bokmål/nynorsk
d. månedsnavn 15. januar År utledet ved nærhetsskanning
yyyy-mm-dd 2024-03-12 ISO 8601
månedsnavn yyyy mars 2024 Måned + år kun
yyyy 2024 År-referanse
Season + year høsten 2023 Sesongreferanse → Q3/Q4
Diary-format line 18.09.2025: Møte avholdt Dato + kolon → automatisk merket som hendelse
Relative reference tre uker etter vedtaket Forankret til nærmeste løste hendelse
Recurring pattern hver mandag Klassifisert som gjentakende
Period / range fra mars til juni 2024 Gir start_dato + slutt_dato

Klassifiseringsskjema

Fem hendelsestyper. Tre tillitsnivåer.

date_type verdier

date_type Definisjon Eksempel
absolute En spesifikk, løselig kalenderdato 30.07.2015 → 2015-07-30
relative En dato uttrykt relativt til en annen hendelse tre uker etter vedtaket
recurring Et mønster som gjentar seg etter en timeplan each Monday, every 6 months
conditional En dato avhengig av at en betingelse er oppfylt if no response within 14 days
period Et datointervall eller varighet med start og slutt fra mars til juni 2024

konfidensnivåer

konfidens Betydning Visuell i tidslinje
high Datoen er eksplisitt og entydig angitt i kildeteksten Grønn merkelapp
medium Datoen er utledet, omtrentlig, eller angitt med liten tvetydighet Amber merkelapp
low Datoen er implisert, uten dato, eller hentet fra et forringet/tvetydig avsnitt Grå merkelapp

Regler for aktørattribusjon

Regel Eksempel
Navngitt enhet i samme setning “Trude [saksbehandler] ringte 14. mars” → actor: Trude
Rollemerkelapp uten navn “Barnevernet fattet vedtak” → actor: Barnevernet
Ingen klar attribusjon i setningen actor: [unattributed]
Standard på dokumentnivå Hvis ingen aktør per hendelse, standardiseres til dokumentets avsender/utstedende organ

Motorer

To motorer, ett strukturert utdata.

Begge motorer returnerer det samme JSON-skjemaet — etterbehandleren håndterer dem identisk. Valg av motor påvirker hastighet, kvalitet og kreditt-kostnad.

Engine Modell Forsinkelse Best for
Azure gpt-4o-mini ★ gpt-4o-mini (Azure West Europe) ~15 s Standard. Rask, kostnadseffektiv, håndterer de fleste juridiske dokumenter godt.
Azure gpt-4o gpt-4o (Azure West Europe) ~45 s Komplekse dokumenter, overlappende hendelser, dårlig kvalitet eller tett kilde tekst.

Live oppdateringer og eksport

Se fremgangen i sanntid. Last ned i Word.

SSE + DOCX

SSE-strømming + DOCX-eksport

Tidslinje bruker Server-Sent Events (SSE) for å strømme live statusmeldinger til nettleseren mens ekstraksjon kjører. I stedet for å stirre på en spinner i 30–60 sekunder, ser du «Forbereder dokument…», «Kaller gpt-4o-mini…», «Analyserer hendelser…» i sanntid.

Når ekstraksjon er fullført, klikk Eksporter til Word for å laste ned en formatert .docx med hver hendelse som et merket avsnitt, kildesitater og en skillelinje mellom hendelsene.

Server-Sent Events OOXML / .docx ZipArchive live progress Save to My Docs

Personvern & sikkerhet

Dine dokumenter forlater aldri sesjonen din.

Personvern ved design

  • Alle opplastede filer blir ekstraktert til tekst i minnet ved hjelp av PHPs in-process filbehandlere. Den rå binære data skrives aldri til disk på serveren.
  • Sesjonskonteksten (innlimt tekst, opplastet innhold, ekstrakterte tidslinjehendelser) er avgrenset til din autentiserte sesjon og kastes når sesjonen avsluttes.
  • Azure OpenAI (gpt-4o, gpt-4o-mini) er konfigurert på Vest-Europa regionen. Data behandlet via Azure OpenAI brukes ikke til modelltrening under den standard bedriftsavtalen.
  • Azure OpenAI kalles kun under ekstraksjonspasset. Ingen dokumentinnhold beholdes av Azure etter at svaret er returnert, i henhold til bedriftsavtalen for datahåndtering.
  • Telemetri logget: verktøynavn, motor, fokusmodus, hendelsestall, forsinkelse. Ingen dokumenttekst, saksreferanser, aktørnavn eller ekstrakterte hendelser blir logget.

Se det fungere i din sak.

Gratis for Do Better Norge medlemmer. Alle motorer tilgjengelig for hvert medlem.

Logg inn for å bruke Tidslinje → Registrer gratis Brukerveiledning