Teknisk Vist · Hard-RAG · Finjustert LLM · 3-pass pipeline
En full gjennomgang av retrieval-augmented generation pipeline, sitasjonsverifiseringssystem, finjustert juridisk modell, og den formelle sitasjonsforbedringspasset som produserer rettsferdige referanser.
Arkitektur
Pipeline er bevisst sekvensiell — Pass 1 er billig og raskt (gpt-4o-mini); Pass 2 er kostbart og kjøres kun hvis situasjonen er klar nok; Pass 3 er valgfritt og utløses av brukeren.
Parser inntaket og returnerer en strukturert JSON-klassifisering:
summary — one-sentence case summaryparties — identified actorsapplicable_acts — relevant statute setsmissing_facts[] — gaps that would hurt draft qualitysuggested_goal — inferred goal if none statedHvis missing_facts ikke er tom → sender ut avklaringsport. Ingen kreditt trekkes før Pass 2 starter.
Fire deltrinn, hver verifisert før videreføring:
[CITE:N] tokens som kun refererer til hentede kilde-IDer[CITE:N] token hvis kilde-ID ikke er i den hentede puljen; flagger frist/mål/tonemessig overholdelseBrukerutløst (+1 kreditt). Jurisdiksjonsavgrenset henting, deretter omskriver inline-sitater til formell stil og legger til Rettskilder-blokk:
Hard-RAG
Hard-RAG betyr at modellen er begrenset til kun å sitere det den hentet. Ingen § nummer kan vises i det endelige utkastet med mindre en tilsvarende kildepassasje faktisk ble funnet og hentet.
Selvkontrollpasset analyserer hver [CITE:N] token i utkastet og ser opp kilde-ID N i den hentede poolen. Hvis det ikke stemmer — blir sitatet fjernet og avsnittet skrevet om uten det. Utdataene flagger også om fristen ble adressert, om det angitte målet ble oppnådd, og om tonen matchet den valgte brikken.
Hvis ingen korpuspassasje nært matcher situasjonen, blir utkastet produsert i klart språk uten § referanser. En merknad i utdataene sier: "Ingen siterte lovkilder — utkastet er klart språk (ingen § referanser tilgjengelig fra korpus)." Dette er den bevisste, ærlige oppførselen — et tomt utkast er bedre enn ett med falske sitater.
Kunnskapsbase
Den juridiske korpusen er delt opp i navngitte biter. Hver mottakerorganpresetter kartlegger til et sett med biter, slik at henting alltid er avgrenset til riktig rettsområde.
| Mottakerorgan | Korpusbiter lastet |
|---|---|
| Barnevernet | child_welfare · echr · family_core |
| Bufdir | family_core · echr · bufdir_guidance |
| NAV | broader_legal (NAV-loven) |
| Skole / Barnehage / SFO | broader_legal (opplæringslova / barnehageloven) |
| Statsforvalteren | child_welfare · broader_legal |
| Trygderetten / Tingretten | norwegian_courts · broader_legal |
Finjustert modell
En QLoRA (Quantized Low-Rank Adaptation) finjustering trent på norsk barnevern og forvaltningsrett. I motsetning til en generell LLM, har dbn-legal-agent internalisert det prosedyremessige vokabularet og resonnementmønstrene i forvaltningsloven: hva som utløser en § 17 rett til å bli hørt, hva en lovlig § 24 begrunnet beslutning må inneholde, hvordan barnevernsloven § 6-3 rammer barnets beste standard.
I Korrespond-pipelinen kjører dbn-legal-agent som en domeneadapter sammen med Azure gpt-4o. Hentingsprompten er konstruert ved hjelp av dbn-legal-agents representasjon av inntaket, mens gpt-4o håndterer den endelige genereringen innenfor Hard-RAG begrensningen. Denne separasjonen gir strukturell klarhet (gpt-4o) og domenepresisjon (dbn-legal-agent) i samme pipeline.
| Pass | Modell | Rolle |
|---|---|---|
| Pass 1 classify | gpt-4o-mini | Rask strukturert klassifisering + gapdeteksjon |
| Pass 1 clarify questions | gpt-4o-mini + dbn-legal-agent | Domenebevisst spørsmålsgenerering |
| Pass 2 draft | gpt-4o | Full brevgenerering innenfor Hard-RAG begrensninger |
| Pass 2 self-check | gpt-4o-mini | Siteringsverifisering + tone/mål/frister revisjon |
| Pass 2 translate | gpt-4o-mini | Norsk → arbeidsspråk oversettelse |
| Pass 3 refine | gpt-4o | Formell siteringsomskrivning + Rettskilder blokk |
Pass 3 — Formell siteringsforbedring
Det valgfrie tredje passet gjør et jurisdiksjonsavgrenset henting, deretter omskriver utkastet med formelle inline-siteringer og en Rettskilder vedlegg. To distinkte siteringsformater støttes:
Inline-siteringer bruker jf. (med henvisning til) og det offisielle lovnavnet + paragraf: jf. forvaltningsloven § 17, jf. opplæringslova § 9 A-4, jf. barnevernsloven § 6-3. Paragrafnumre verifiseres mot korpuset før inkludering.
Full format for sitering fra Den europeiske menneskerettighetsdomstolen: sakens navn · søknadsnummer · dato · kammer/Stor kammer · avsnitt. Eksempel: Strand Lobben m.fl. mot Norge, EMD-37283/13 (Storkammer, 10.09.2019), § 207. Kilder hentes fra ECHR-korpusutdraget og HUDOC.
Forbedret utkast (norsk + engelsk) med opplæringslova § 9 A-4 og EMK artikkel 8 inline-siteringer.
For Barnevernet og Bufdir-saker kjører EMD-finepasset spesifikke ankerforespørsel som retter seg mot de mest siterte norske familiesakene i HUDOC-korpuset:
Personvern & sikkerhet
Personvern ved design
bnl-legal-search) lagrer kun det offentlige juridiske korpuset — lover, tribunalavgjørelser, EMD-dommene. Ingen av dine saksopplysninger lagres i søkeindeksen.Gratis for Do Better Norge-medlemmer. Alle 3 passer tilgjengelig for hvert medlem.