Технічна демонстрація · Hard-RAG · Тонко налаштована LLM · 3-прохідний конвеєр
Повний огляд конвеєра генерації з підкріпленням, системи перевірки цитат, тонко налаштованої юридичної моделі та формального етапу уточнення цитат, який створює готові до суду посилання.
Архітектура
Конвеєр навмисно послідовний — Прохід 1 дешевий і швидкий (gpt-4o-mini); Прохід 2 дорогий і виконується лише якщо ситуація достатньо ясна; Прохід 3 є необов'язковим і ініціюється користувачем.
Аналізує вхідні дані та повертає структуровану JSON класифікацію:
summary — one-sentence case summaryparties — identified actorsapplicable_acts — relevant statute setsmissing_facts[] — gaps that would hurt draft qualitysuggested_goal — inferred goal if none statedЯкщо missing_facts не порожній → видає ворота уточнення. Жоден кредит не знімається, поки не почнеться Прохід 2.
Чотири підкроки, кожен з яких перевіряється перед продовженням:
[CITE:N] токени, що посилаються лише на отримані ідентифікатори джерел[CITE:N] токен, чий ідентифікатор джерела не входить до отриманого пулу; позначає відповідність термінам/цілям/тонуКористувачем ініційовано (+1 кредит). Витяг з юрисдикції, потім переписує внутрішні цитати у формальному стилі та додає блок Rettskilder:
Hard-RAG
Hard-RAG означає, що модель обмежена лише тим, що вона отримала. Жоден номер § не може з'явитися в остаточному проекті, якщо відповідний фрагмент джерела не був фактично знайдений і отриманий.
Процес самоперевірки аналізує кожен [CITE:N] токен у проекті та шукає ідентифікатор джерела N у отриманому пулі. Якщо він не збігається — посилання видаляється, а абзац переписується без нього. Вивід також вказує, чи було дотримано терміни, чи було досягнуто заявлену мету та чи відповідав тон обраному чіпу.
Якщо жоден фрагмент корпусу не відповідає ситуації, проект створюється простою мовою без посилань на §§. У виводі зазначається: "Не вказано джерел закону — проект простомовний (немає доступних посилань на §§ з корпусу)." Це свідома, чесна поведінка — порожній проект кращий, ніж той, що містить фальшиві посилання.
База знань
Юридичний корпус розділений на названі частини. Кожен попередньо налаштований орган отримувача відображає набір частин, тому отримання завжди обмежується правильною галуззю права.
| Орган отримувача | Завантажені частини корпусу |
|---|---|
| Barnevernet | child_welfare · echr · family_core |
| Bufdir | family_core · echr · bufdir_guidance |
| NAV | broader_legal (NAV-loven) |
| Skole / Barnehage / SFO | broader_legal (opplæringslova / barnehageloven) |
| Statsforvalteren | child_welfare · broader_legal |
| Trygderetten / Tingretten | norwegian_courts · broader_legal |
Модель з тонкою настройкою
Модель QLoRA (Квантована низькорозмірна адаптація), навчена на текстах норвезького законодавства про захист дітей та адміністративного права. На відміну від універсальної LLM, dbn-legal-agent засвоїв процедурну лексику та моделі міркування forvaltningsloven: що викликає право на слухання за § 17, що повинно містити законне обґрунтоване рішення за § 24, як § 6-3 барневернсловен формулює стандарт найкращих інтересів дитини.
У pipeline Korrespond dbn-legal-agent працює як доменний адаптер разом з Azure gpt-4o. Запит на отримання інформації складається з використанням представлення dbn-legal-agent про прийом, тоді як gpt-4o обробляє фінальне генерування в межах обмеження Hard-RAG. Це розділення забезпечує структурну ясність (gpt-4o) та доменну точність (dbn-legal-agent) в одному pipeline.
| Пройти | Модель | Роль |
|---|---|---|
| Pass 1 classify | gpt-4o-mini | Швидка структурована класифікація + виявлення прогалин |
| Pass 1 clarify questions | gpt-4o-mini + dbn-legal-agent | Генерація запитань з урахуванням домену |
| Pass 2 draft | gpt-4o | Повне генерування листа в межах обмежень Hard-RAG |
| Pass 2 self-check | gpt-4o-mini | Перевірка цитат + аудит тону/мети/терміна |
| Pass 2 translate | gpt-4o-mini | Норвезька → переклад робочою мовою |
| Pass 3 refine | gpt-4o | Переписування формальних цитат + блок Rettskilder |
Проходження 3 — Уточнення формальних цитат
Додатковий третій прохід виконує запит на отримання інформації в межах юрисдикції, а потім переписує проект з формальними внутрішніми цитатами та додатком Rettskilder. Підтримуються два різні формати цитат:
Внутрішні цитати використовують jf. (з посиланням на) та офіційну назву закону + розділ: jf. forvaltningsloven § 17, jf. opplæringslova § 9 A-4, jf. barnevernsloven § 6-3. Номери розділів перевіряються на відповідність корпусу перед включенням.
Повний формат цитування Європейського суду з прав людини: назва справи · номер заявки · дата · палата/Велика палата · параграф. Приклад: Strand Lobben m.fl. mot Norge, EMD-37283/13 (Велика палата, 10.09.2019), § 207. Джерела отримуються з фрагмента корпусу ЄСПЛ та HUDOC.
Уточнений проект (норвезькою + англійською) з внутрішніми цитатами opplæringslova § 9 A-4 та EMK стаття 8.
Для справ Barnevernet та Bufdir, проходження уточнення ЄСПЛ виконує специфічні якорні запити, націлені на найбільш цитовані норвезькі сімейні справи в корпусі HUDOC:
Конфіденційність та безпека
Конфіденційність за дизайном
bnl-legal-search) зберігає тільки публічний юридичний корпус — статути, рішення трибуналів, рішення ЄСПЛ. Жодна з ваших інформацій про справи не зберігається в індексі пошуку.Безкоштовно для членів Do Better Norge. Усі 3 проходження доступні кожному члену.