Legal Tools
Logg inn

Teknisk Vist · Hard-RAG · Finjustert LLM · 3-pass pipeline

Hvordan Korrespond vet hva den skal skrive.

En full gjennomgang av retrieval-augmented generation pipeline, sitasjonsverifiseringssystem, finjustert juridisk modell, og den formelle sitasjonsforbedringspasset som produserer rettsferdige referanser.

220K+ indekserte passasjer
8 korpusbiter
3 pipeline-passeringer
gpt-4o utkastmodell

Arkitektur

Tre pass. Hvert med en distinkt oppgave.

Pipeline er bevisst sekvensiell — Pass 1 er billig og raskt (gpt-4o-mini); Pass 2 er kostbart og kjøres kun hvis situasjonen er klar nok; Pass 3 er valgfritt og utløses av brukeren.

Pass 1 · gpt-4o-mini

Klassifiser & gap-sjekk

Parser inntaket og returnerer en strukturert JSON-klassifisering:

  • summary — one-sentence case summary
  • parties — identified actors
  • applicable_acts — relevant statute sets
  • missing_facts[] — gaps that would hurt draft quality
  • suggested_goal — inferred goal if none stated

Hvis missing_facts ikke er tom → sender ut avklaringsport. Ingen kreditt trekkes før Pass 2 starter.

Pass 2 · gpt-4o

Hent → utkast → sjekk → oversett

Fire deltrinn, hver verifisert før videreføring:

  • Hent: hybrid tett + BM25 søk over de forhåndsinnstilte korpusdelene; topp 8 passasjer returnert med kilde-IDer
  • Utkast: gpt-4o genererer brevet ved å bruke [CITE:N] tokens som kun refererer til hentede kilde-IDer
  • Egenkontroll: fjerner enhver [CITE:N] token hvis kilde-ID ikke er i den hentede puljen; flagger frist/mål/tonemessig overholdelse
  • Oversett: Norsk utkast → arbeidsspråk (enkeltanrop)
Pass 3 · optional

Formell sitering forbedring

Brukerutløst (+1 kreditt). Jurisdiksjonsavgrenset henting, deretter omskriver inline-sitater til formell stil og legger til Rettskilder-blokk:

  • Norsk: jf. forvaltningsloven § 17
  • ECHR: fullt saksnavn, søknadsnummer, dato, paragraf
  • Begge: kombinerte nasjonale + ECHR grunnlag

Hard-RAG

Hver § sitering er verifisert før den når deg.

Hard-RAG betyr at modellen er begrenset til kun å sitere det den hentet. Ingen § nummer kan vises i det endelige utkastet med mindre en tilsvarende kildepassasje faktisk ble funnet og hentet.

Brukerinntak + kropp forhåndsinnstilling
Korpusdelvalg
Hybrid søk (tett vektor + BM25)
Topp 8 passasjer med kilde-IDer
Passasjer injisert i gpt-4o prompt
Utkast med [CITE:N] tokens kun
Egenkontroll: verifiser at hver [CITE:N] løser
Fjern uverifiserte sitater

Selvkontrollpasset analyserer hver [CITE:N] token i utkastet og ser opp kilde-ID N i den hentede poolen. Hvis det ikke stemmer — blir sitatet fjernet og avsnittet skrevet om uten det. Utdataene flagger også om fristen ble adressert, om det angitte målet ble oppnådd, og om tonen matchet den valgte brikken.

Hva skjer når ingen lov passer?

Hvis ingen korpuspassasje nært matcher situasjonen, blir utkastet produsert i klart språk uten § referanser. En merknad i utdataene sier: "Ingen siterte lovkilder — utkastet er klart språk (ingen § referanser tilgjengelig fra korpus)." Dette er den bevisste, ærlige oppførselen — et tomt utkast er bedre enn ett med falske sitater.

Kunnskapsbase

220 000+ passasjer på tvers av 8 korpusbiter.

Den juridiske korpusen er delt opp i navngitte biter. Hver mottakerorganpresetter kartlegger til et sett med biter, slik at henting alltid er avgrenset til riktig rettsområde.

220K+ totalt indekserte passasjer
8 korpusbiter
1,731 FNV tribunalavgjørelser
23 EMK norske familietilfeller
Azure AI Søk (Vest-Europa)
Hybrid tett vektor + BM25

Korpusbiter

child_welfare echr family_core bufdir_guidance norwegian_courts broader_legal dbn_resources hague

Mottakerorgan → bitkartlegging (eksempler)

MottakerorganKorpusbiter lastet
Barnevernetchild_welfare · echr · family_core
Bufdirfamily_core · echr · bufdir_guidance
NAVbroader_legal (NAV-loven)
Skole / Barnehage / SFObroader_legal (opplæringslova / barnehageloven)
Statsforvalterenchild_welfare · broader_legal
Trygderetten / Tingrettennorwegian_courts · broader_legal

Finjustert modell

dbn-legal-agent: trent på norsk juridisk tekst.

QLoRA finjustering

dbn-legal-agent

En QLoRA (Quantized Low-Rank Adaptation) finjustering trent på norsk barnevern og forvaltningsrett. I motsetning til en generell LLM, har dbn-legal-agent internalisert det prosedyremessige vokabularet og resonnementmønstrene i forvaltningsloven: hva som utløser en § 17 rett til å bli hørt, hva en lovlig § 24 begrunnet beslutning må inneholde, hvordan barnevernsloven § 6-3 rammer barnets beste standard.

I Korrespond-pipelinen kjører dbn-legal-agent som en domeneadapter sammen med Azure gpt-4o. Hentingsprompten er konstruert ved hjelp av dbn-legal-agents representasjon av inntaket, mens gpt-4o håndterer den endelige genereringen innenfor Hard-RAG begrensningen. Denne separasjonen gir strukturell klarhet (gpt-4o) og domenepresisjon (dbn-legal-agent) i samme pipeline.

QLoRA forvaltningsloven barnevernsloven child-welfare corpus Norwegian bokmål output gpt-4o co-pipeline

Model responsibilities in the pipeline

PassModellRolle
Pass 1 classifygpt-4o-miniRask strukturert klassifisering + gapdeteksjon
Pass 1 clarify questionsgpt-4o-mini + dbn-legal-agentDomenebevisst spørsmålsgenerering
Pass 2 draftgpt-4oFull brevgenerering innenfor Hard-RAG begrensninger
Pass 2 self-checkgpt-4o-miniSiteringsverifisering + tone/mål/frister revisjon
Pass 2 translategpt-4o-miniNorsk → arbeidsspråk oversettelse
Pass 3 refinegpt-4oFormell siteringsomskrivning + Rettskilder blokk

Pass 3 — Formell siteringsforbedring

Rettsklare siteringer i to stiler.

Det valgfrie tredje passet gjør et jurisdiksjonsavgrenset henting, deretter omskriver utkastet med formelle inline-siteringer og en Rettskilder vedlegg. To distinkte siteringsformater støttes:

🇳🇴

Norsk lovstil

Inline-siteringer bruker jf. (med henvisning til) og det offisielle lovnavnet + paragraf: jf. forvaltningsloven § 17, jf. opplæringslova § 9 A-4, jf. barnevernsloven § 6-3. Paragrafnumre verifiseres mot korpuset før inkludering.

⚖️

EMK siteringsstil

Full format for sitering fra Den europeiske menneskerettighetsdomstolen: sakens navn · søknadsnummer · dato · kammer/Stor kammer · avsnitt. Eksempel: Strand Lobben m.fl. mot Norge, EMD-37283/13 (Storkammer, 10.09.2019), § 207. Kilder hentes fra ECHR-korpusutdraget og HUDOC.

Eksempel på forbedret utdata

Refined output showing formal citations including opplæringslova §9 A-4 and EMK artikkel 8

Forbedret utkast (norsk + engelsk) med opplæringslova § 9 A-4 og EMK artikkel 8 inline-siteringer.

Ankerforespørsel for EMD-modus

For Barnevernet og Bufdir-saker kjører EMD-finepasset spesifikke ankerforespørsel som retter seg mot de mest siterte norske familiesakene i HUDOC-korpuset:

Strand Lobben m.fl. mot Norge Johansen mot Norge K.O. og V.M. mot Norge Aune mot Norge EMK Art. 8 family life Norway EMK Art. 6 fair trial

Personvern & sikkerhet

Dine dokumenter forlater aldri sesjonen din.

Personvern ved design

  • Alle opplastede filer blir ekstrahert til tekst i minnet ved hjelp av PHPs in-process filbehandlere. Den rå binære data skrives aldri til disk på serveren.
  • Sesjonskonteksten (din fortelling, opplastet tekst, utkast) er begrenset til din autentiserte sesjon og kastes når sesjonen avsluttes.
  • Azure OpenAI (gpt-4o, gpt-4o-mini) er konfigurert på Vest-Europa regionen. Data behandlet via Azure OpenAI brukes ikke til modelltrening under den standard bedriftsavtalen.
  • Azure AI Search (bnl-legal-search) lagrer kun det offentlige juridiske korpuset — lover, tribunalavgjørelser, EMD-dommene. Ingen av dine saksopplysninger lagres i søkeindeksen.
  • Qdrant vektordatabasen lagrer kun de offentlige korpusinnlemmelsene — ingen brukerdata.
  • Telemetri logget: verktøynavn, språk, utgangstype, passantall, latens, kildeantall. Ingen saks tekst, ingen navn, ingen saksreferanser blir logget.

Se det fungere på din sak.

Gratis for Do Better Norge-medlemmer. Alle 3 passer tilgjengelig for hvert medlem.

Logg inn for å bruke Korrespond → Registrer gratis Brukerhåndbok