Pokaz techniczny · Hard-RAG · Dostosowany LLM · 3-etapowy proces
Pełne przejście przez proces generacji wzbogaconej o wyszukiwanie, system weryfikacji cytatów, dostosowany model prawny oraz formalny etap poprawy cytatów, który produkuje gotowe do sądu odniesienia.
Architektura
Proces jest celowo sekwencyjny — Etap 1 jest tani i szybki (gpt-4o-mini); Etap 2 jest drogi i uruchamia się tylko, jeśli sytuacja jest wystarczająco jasna; Etap 3 jest opcjonalny i uruchamiany przez użytkownika.
Analizuje dane wejściowe i zwraca uporządkowaną klasyfikację JSON:
summary — one-sentence case summaryparties — identified actorsapplicable_acts — relevant statute setsmissing_facts[] — gaps that would hurt draft qualitysuggested_goal — inferred goal if none statedJeśli missing_facts jest niepuste → emituje bramkę wyjaśniającą. Żaden kredyt nie jest odejmowany, dopóki nie rozpocznie się Etap 2.
Cztery podkroki, każdy weryfikowany przed kontynuacją:
[CITE:N] tokenów odnoszących się tylko do pobranych identyfikatorów źródeł[CITE:N] token, którego identyfikator źródła nie znajduje się w pobranej puli; oznacza zgodność z terminem/celami/tonemWywołane przez użytkownika (+1 kredyt). Wyszukiwanie w zakresie jurysdykcji, następnie przepisuje cytaty inline na styl formalny i dodaje blok Rettskilder:
Hard-RAG
Hard-RAG oznacza, że model jest ograniczony do cytowania tylko tego, co pobrał. Żaden numer § nie może pojawić się w ostatecznym szkicu, chyba że odpowiadający fragment źródła został faktycznie znaleziony i pobrany.
Przechodzenie przez samosprawdzanie analizuje każdy [CITE:N] token w projekcie i wyszukuje identyfikator źródła N w pobranej puli. Jeśli nie pasuje — cytat jest usuwany, a akapit jest przepisywany bez niego. Wynik również wskazuje, czy termin został uwzględniony, czy określony cel został osiągnięty oraz czy ton odpowiadał wybranemu chipowi.
Jeśli żaden fragment z korpusu nie pasuje ściśle do sytuacji, projekt jest tworzony w prostym języku bez odniesień do §. W notatce w wyniku jest napisane: "Brak cytowanych źródeł prawnych — projekt jest w prostym języku (brak dostępnych odniesień do § z korpusu)." To jest zamierzone, uczciwe zachowanie — pusty projekt jest lepszy niż taki z fałszywymi cytatami.
Baza wiedzy
Korpus prawny jest podzielony na nazwane kawałki. Każdy preset ciała odbiorcy mapuje na zestaw kawałków, więc wyszukiwanie zawsze jest ograniczone do właściwego obszaru prawa.
| Ciało odbiorcy | Załadowane kawałki korpusu |
|---|---|
| Barnevernet | child_welfare · echr · family_core |
| Bufdir | family_core · echr · bufdir_guidance |
| NAV | broader_legal (NAV-loven) |
| Skole / Barnehage / SFO | broader_legal (opplæringslova / barnehageloven) |
| Statsforvalteren | child_welfare · broader_legal |
| Trygderetten / Tingretten | norwegian_courts · broader_legal |
Model dostosowany
Model QLoRA (Quantized Low-Rank Adaptation) dostosowany do tekstów dotyczących norweskiego prawa opieki nad dziećmi i prawa administracyjnego. W przeciwieństwie do ogólnego modelu LLM, dbn-legal-agent zinternalizował proceduralne słownictwo i wzorce rozumowania z forvaltningsloven: co wywołuje prawo do wysłuchania zgodnie z § 17, co musi zawierać zgodna z prawem decyzja uzasadniona zgodnie z § 24, jak barnevernsloven § 6-3 określa standard najlepszego interesu dziecka.
W pipeline Korrespond, dbn-legal-agent działa jako adapter domenowy obok Azure gpt-4o. Zapytanie o odzyskiwanie jest konstruowane przy użyciu reprezentacji intake dbn-legal-agent, podczas gdy gpt-4o zajmuje się ostateczną generacją w ramach ograniczeń Hard-RAG. To rozdzielenie zapewnia strukturalną klarowność (gpt-4o) i precyzję domenową (dbn-legal-agent) w tym samym pipeline.
| Zaliczony | Model | Rola |
|---|---|---|
| Pass 1 classify | gpt-4o-mini | Szybka strukturalna klasyfikacja + wykrywanie luk |
| Pass 1 clarify questions | gpt-4o-mini + dbn-legal-agent | Generowanie pytań z uwzględnieniem domeny |
| Pass 2 draft | gpt-4o | Pełna generacja listu w ramach ograniczeń Hard-RAG |
| Pass 2 self-check | gpt-4o-mini | Weryfikacja cytatów + audyt tonu/celu/terminu |
| Pass 2 translate | gpt-4o-mini | Norweski → tłumaczenie na język roboczy |
| Pass 3 refine | gpt-4o | Przepisanie formalnych cytatów + blok Rettskilder |
Zaliczony 3 — Udoskonalenie cytatów formalnych
Opcjonalny trzeci etap wykonuje wyszukiwanie w zakresie jurysdykcji, a następnie przepisuje szkic z formalnymi cytatami w tekście i aneksem Rettskilder. Obsługiwane są dwa odrębne formaty cytatów:
Cytaty w tekście używają jf. (z odniesieniem do) oraz oficjalnej nazwy ustawy + sekcji: jf. forvaltningsloven § 17, jf. opplæringslova § 9 A-4, jf. barnevernsloven § 6-3. Numery sekcji są weryfikowane w stosunku do korpusu przed włączeniem.
Pełny format cytatów Europejskiego Trybunału Praw Człowieka: nazwa sprawy · numer wniosku · data · izba/Wielka Izba · paragraf. Przykład: Strand Lobben m.fl. mot Norge, EMD-37283/13 (Storkammer, 10.09.2019), § 207. Źródła pobrane z fragmentu korpusu ECHR i HUDOC.
Udoskonalony szkic (norweski + angielski) z opplæringslova § 9 A-4 i EMK artikkel 8 cytatami w tekście.
Dla spraw Barnevernet i Bufdir, proces udoskonalania ECHR uruchamia specyficzne zapytania kotwiczące, które celują w najczęściej cytowane norweskie sprawy rodzinne w korpusie HUDOC:
Prywatność i bezpieczeństwo
Prywatność przez projekt
bnl-legal-search) przechowuje tylko publiczny korpus prawny — ustawy, decyzje trybunałów, wyroki ECHR. Żadne informacje o twojej sprawie nie są przechowywane w indeksie wyszukiwania.Darmowe dla członków Do Better Norge. Wszystkie 3 przejścia dostępne dla każdego członka.