Legal Tools
Увійти

Технічна демонстрація · Hard-RAG · Тонко налаштована LLM · 3-прохідний конвеєр

Як Korrespond знає, що писати.

Повний огляд конвеєра генерації з підкріпленням, системи перевірки цитат, тонко налаштованої юридичної моделі та формального етапу уточнення цитат, який створює готові до суду посилання.

220K+ індексовані фрагменти
8 частини корпусу
3 проходи конвеєра
gpt-4o модель складання

Архітектура

Три проходи. Кожен з чіткою задачею.

Конвеєр навмисно послідовний — Прохід 1 дешевий і швидкий (gpt-4o-mini); Прохід 2 дорогий і виконується лише якщо ситуація достатньо ясна; Прохід 3 є необов'язковим і ініціюється користувачем.

Pass 1 · gpt-4o-mini

Класифікація та перевірка прогалин

Аналізує вхідні дані та повертає структуровану JSON класифікацію:

  • summary — one-sentence case summary
  • parties — identified actors
  • applicable_acts — relevant statute sets
  • missing_facts[] — gaps that would hurt draft quality
  • suggested_goal — inferred goal if none stated

Якщо missing_facts не порожній → видає ворота уточнення. Жоден кредит не знімається, поки не почнеться Прохід 2.

Pass 2 · gpt-4o

Отримати → скласти → перевірити → перекласти

Чотири підкроки, кожен з яких перевіряється перед продовженням:

  • Отримати: гібридний щільний + BM25 пошук по заздалегідь визначеним фрагментам корпусу; повертаються 8 найкращих фрагментів з ідентифікаторами джерел
  • Скласти: gpt-4o генерує лист, використовуючи [CITE:N] токени, що посилаються лише на отримані ідентифікатори джерел
  • Самоперевірка: видаляє будь-який [CITE:N] токен, чий ідентифікатор джерела не входить до отриманого пулу; позначає відповідність термінам/цілям/тону
  • Перекласти: норвезький проект → робоча мова (один виклик)
Pass 3 · optional

Уточнення формальної цитати

Користувачем ініційовано (+1 кредит). Витяг з юрисдикції, потім переписує внутрішні цитати у формальному стилі та додає блок Rettskilder:

  • Норвезька: jf. forvaltningsloven § 17
  • ECHR: повна назва справи, номер заявки, дата, абзац
  • Обидва: об'єднані внутрішні + ECHR підстави

Hard-RAG

Кожна § цитата перевіряється перед тим, як вона до вас потрапить.

Hard-RAG означає, що модель обмежена лише тим, що вона отримала. Жоден номер § не може з'явитися в остаточному проекті, якщо відповідний фрагмент джерела не був фактично знайдений і отриманий.

Введення користувача + попередньо визначене тіло
Вибір фрагмента корпусу
Гібридний пошук (щільний вектор + BM25)
8 найкращих фрагментів з ідентифікаторами джерел
Фрагменти вставлені в запит gpt-4o
Проект з токенами [CITE:N] тільки
Самоперевірка: перевірити, чи кожен [CITE:N] вирішується
Видалити неперевірені посилання

Процес самоперевірки аналізує кожен [CITE:N] токен у проекті та шукає ідентифікатор джерела N у отриманому пулі. Якщо він не збігається — посилання видаляється, а абзац переписується без нього. Вивід також вказує, чи було дотримано терміни, чи було досягнуто заявлену мету та чи відповідав тон обраному чіпу.

Що робити, коли жоден закон не підходить?

Якщо жоден фрагмент корпусу не відповідає ситуації, проект створюється простою мовою без посилань на §§. У виводі зазначається: "Не вказано джерел закону — проект простомовний (немає доступних посилань на §§ з корпусу)." Це свідома, чесна поведінка — порожній проект кращий, ніж той, що містить фальшиві посилання.

База знань

220,000+ фрагментів у 8 частинах корпусу.

Юридичний корпус розділений на названі частини. Кожен попередньо налаштований орган отримувача відображає набір частин, тому отримання завжди обмежується правильною галуззю права.

220K+ всього проіндексованих фрагментів
8 частини корпусу
1,731 рішення трибуналу FNV
23 справи ЄСПЛ про норвезькі сім'ї
Azure AI Пошук (Західна Європа)
Hybrid щільний вектор + BM25

Частини корпусу

child_welfare echr family_core bufdir_guidance norwegian_courts broader_legal dbn_resources hague

Відображення органу → частина (приклади)

Орган отримувачаЗавантажені частини корпусу
Barnevernetchild_welfare · echr · family_core
Bufdirfamily_core · echr · bufdir_guidance
NAVbroader_legal (NAV-loven)
Skole / Barnehage / SFObroader_legal (opplæringslova / barnehageloven)
Statsforvalterenchild_welfare · broader_legal
Trygderetten / Tingrettennorwegian_courts · broader_legal

Модель з тонкою настройкою

dbn-legal-agent: навчена на норвезькому юридичному тексті.

QLoRA тонка настройка

dbn-legal-agent

Модель QLoRA (Квантована низькорозмірна адаптація), навчена на текстах норвезького законодавства про захист дітей та адміністративного права. На відміну від універсальної LLM, dbn-legal-agent засвоїв процедурну лексику та моделі міркування forvaltningsloven: що викликає право на слухання за § 17, що повинно містити законне обґрунтоване рішення за § 24, як § 6-3 барневернсловен формулює стандарт найкращих інтересів дитини.

У pipeline Korrespond dbn-legal-agent працює як доменний адаптер разом з Azure gpt-4o. Запит на отримання інформації складається з використанням представлення dbn-legal-agent про прийом, тоді як gpt-4o обробляє фінальне генерування в межах обмеження Hard-RAG. Це розділення забезпечує структурну ясність (gpt-4o) та доменну точність (dbn-legal-agent) в одному pipeline.

QLoRA forvaltningsloven barnevernsloven child-welfare corpus Norwegian bokmål output gpt-4o co-pipeline

Model responsibilities in the pipeline

ПройтиМодельРоль
Pass 1 classifygpt-4o-miniШвидка структурована класифікація + виявлення прогалин
Pass 1 clarify questionsgpt-4o-mini + dbn-legal-agentГенерація запитань з урахуванням домену
Pass 2 draftgpt-4oПовне генерування листа в межах обмежень Hard-RAG
Pass 2 self-checkgpt-4o-miniПеревірка цитат + аудит тону/мети/терміна
Pass 2 translategpt-4o-miniНорвезька → переклад робочою мовою
Pass 3 refinegpt-4oПереписування формальних цитат + блок Rettskilder

Проходження 3 — Уточнення формальних цитат

Цитати, готові до суду, у двох стилях.

Додатковий третій прохід виконує запит на отримання інформації в межах юрисдикції, а потім переписує проект з формальними внутрішніми цитатами та додатком Rettskilder. Підтримуються два різні формати цитат:

🇳🇴

Стиль цитування норвезького законодавства

Внутрішні цитати використовують jf. (з посиланням на) та офіційну назву закону + розділ: jf. forvaltningsloven § 17, jf. opplæringslova § 9 A-4, jf. barnevernsloven § 6-3. Номери розділів перевіряються на відповідність корпусу перед включенням.

⚖️

Стиль цитування ЄСПЛ

Повний формат цитування Європейського суду з прав людини: назва справи · номер заявки · дата · палата/Велика палата · параграф. Приклад: Strand Lobben m.fl. mot Norge, EMD-37283/13 (Велика палата, 10.09.2019), § 207. Джерела отримуються з фрагмента корпусу ЄСПЛ та HUDOC.

Приклад уточненого виходу

Refined output showing formal citations including opplæringslova §9 A-4 and EMK artikkel 8

Уточнений проект (норвезькою + англійською) з внутрішніми цитатами opplæringslova § 9 A-4 та EMK стаття 8.

Якірні запити для режиму ЄСПЛ

Для справ Barnevernet та Bufdir, проходження уточнення ЄСПЛ виконує специфічні якорні запити, націлені на найбільш цитовані норвезькі сімейні справи в корпусі HUDOC:

Strand Lobben m.fl. mot Norge Johansen mot Norge K.O. og V.M. mot Norge Aune mot Norge EMK Art. 8 family life Norway EMK Art. 6 fair trial

Конфіденційність та безпека

Ваші документи ніколи не залишають вашу сесію.

Конфіденційність за дизайном

  • Всі завантажені файли витягуються в текст в пам'яті за допомогою обробників файлів PHP в процесі. Сирий бінарний файл ніколи не записується на диск на сервері.
  • Контекст сесії (ваша наратив, завантажений текст, чернетки) обмежений вашою автентифікованою сесією і знищується, коли сесія закінчується.
  • Azure OpenAI (gpt-4o, gpt-4o-mini) налаштовано на регіоні Західна Європа. Дані, оброблені через Azure OpenAI, не використовуються для навчання моделі за умовами стандартної корпоративної угоди.
  • Azure AI Search (bnl-legal-search) зберігає тільки публічний юридичний корпус — статути, рішення трибуналів, рішення ЄСПЛ. Жодна з ваших інформацій про справи не зберігається в індексі пошуку.
  • База даних векторів Qdrant зберігає тільки вектори публічного корпусу — жодних даних користувачів.
  • Лог телеметрії: назва інструменту, мова, тип виходу, кількість проходжень, затримка, кількість джерел. Жоден текст справи, жодні імена, жодні посилання на справи не реєструються.

Подивіться, як це працює у вашій справі.

Безкоштовно для членів Do Better Norge. Усі 3 проходження доступні кожному члену.

Увійти, щоб використовувати Korrespond → Зареєструватися безкоштовно Посібник користувача