Legal Tools
Увійти

Технічна демонстрація · Як ШІ читає час

Як Хронологія знає, коли відбулися події.

Повний огляд трьохетапного процесу витягування, розпізнавання норвезьких форматів дат, схеми класифікації подій, потокового оновлення SSE та завантаження у форматі Word.

12+ формати дат
5 типи подій
3 етапи процесу
2 варіанти двигунів

Архітектура

Три етапи. Кожен з чіткою задачею.

Процес навмисно послідовний — Етап 1 базується на правилах і майже миттєвий; Етап 2 — витягування LLM; Етап 3 обробляє та оцінює вихідні дані.

Pass 1 · PHP / regex

Виявлення та нормалізація відомих форматів

Детермінований етап зіставлення шаблонів виконується перед будь-яким викликом LLM. Він сканує весь вхід на наявність дат, що відповідають 12+ норвезьким форматам, і нормалізує їх до ISO 8601:

  • dd.mm.yyyyYYYY-MM-DD
  • d. månedsnavn yyyy → визначена календарна дата
  • Рядки формату щоденника (починаючи з дати + двокрапка) → автоматично позначаються як події
  • Двозначні роки → завжди інтерпретуються як 20YY

Нормалізовані якорі вводяться в запит LLM, щоб зменшити випадкові або неправильно прочитані дати.

Pass 2 · gpt-4o-mini / gpt-4o

Витягти, класифікувати та оцінити

LLM читає повний документ разом з попередніми якорями. Для кожного тимчасового посилання він повертає структурований об'єкт події JSON:

  • date — resolved ISO date, or verbatim string if unresolvable
  • date_typeabsolute | relative | recurring | conditional | period
  • confidencehigh | medium | low
  • actor — attributed entity (from source text, not inferred)
  • description — one-sentence event summary
  • source_excerpt — verbatim text fragment (max 200 chars)

Запит чітко інструктує модель не вигадувати дати або акторів, які не присутні в джерелі. Температура встановлена на 0.1 для детермінованого виходу.

Pass 3 · PHP post-processor

Фільтрувати, сортувати та збирати

PHP застосовує всі активні фільтри перед поверненням результату:

  • Фільтр фокусу — видаляє події, які не відповідають запитаному режиму фокусу (строки / слухання / CPS)
  • Фільтр впевненості — видаляє події з НИЗЬКОЮ впевненістю, якщо запитано
  • Фільтр фону — видаляє фонові/наративні події, якщо не вибрано
  • Фільтр типу дати — видаляє відносні/повторювані події, якщо не вибрано

Постобробник потім збирає список what_remains_uncertain та рекомендацію next_practical_step.

Визнання дати

12+ норвезьких форматів дати, всі визнані.

Норвезькі юридичні документи використовують широкий спектр позначень дати. Попередній прохід Pass 1 розпізнає всі ці дати детерміновано; LLM обробляє решту в Pass 2.

Формат Приклад Примітки
dd.mm.yyyy 30.07.2015 Стандартний норвезький числовий
dd.mm.yy 09.04.25 Дворічний рік → завжди 20YY
d. månedsnavn yyyy 3. mars 2024 Написаний місяць у bokmål/nynorsk
d. månedsnavn 15. januar Рік, виведений шляхом сканування близькості
yyyy-mm-dd 2024-03-12 ISO 8601
månedsnavn yyyy mars 2024 Тільки місяць + рік
yyyy 2024 Посилання тільки на рік
Season + year høsten 2023 Сезонне посилання → Q3/Q4
Diary-format line 18.09.2025: Møte avholdt Дата + двокрапка → автоматично позначена як подія
Relative reference tre uker etter vedtaket Закріплена за найближчою вирішеною подією
Recurring pattern hver mandag Класифікована як повторювана
Period / range fra mars til juni 2024 Видає start_date + end_date

Схема класифікації

П'ять типів подій. Три рівні впевненості.

значення date_type

date_type Визначення Приклад
absolute Конкретна, вирішувана календарна дата 30.07.2015 → 2015-07-30
relative Дата, виражена відносно іншої події tre uker etter vedtaket
recurring Шаблон, що повторюється за розкладом each Monday, every 6 months
conditional Дата, що залежить від виконання умови if no response within 14 days
period Діапазон дат або тривалість з початком і закінченням fra mars til juni 2024

рівні впевненості

впевненість Значення Візуалізація в хронології
high Дата чітко і однозначно вказана в вихідному тексті Зелений значок
medium Дата виведена, приблизна або вказана з невеликою неоднозначністю Помаранчевий значок
low Дата має на увазі, без дати або витягнута з зіпсованого/неоднозначного уривка Сірий значок

Правила атрибуції акторів

Правило Приклад
Названа сутність в одному реченні “Trude [saksbehandler] ringte 14. mars” → actor: Trude
Мітка ролі без імені “Barnevernet fattet vedtak” → actor: Barnevernet
Немає чіткої атрибуції в реченні actor: [unattributed]
За замовчуванням на рівні документа Якщо немає актора для кожної події, за замовчуванням використовується відправник/видавець документа

Двигуни

Два двигуни, один структурований вихід.

Обидва двигуни повертають однакову JSON-схему — пост-обробник обробляє їх однаково. Вибір двигуна впливає лише на швидкість, якість і вартість кредитів.

Engine Модель Затримка Найкраще для
Azure gpt-4o-mini ★ gpt-4o-mini (Azure West Europe) ~15 s За замовчуванням. Швидко, економічно, добре обробляє більшість юридичних документів.
Azure gpt-4o gpt-4o (Azure West Europe) ~45 s Складні документи, перекриття подій, текст джерела низької якості або щільний.

Живі оновлення та експорт

Дивіться прогрес у режимі реального часу. Завантажуйте у Word.

SSE + DOCX

SSE-потік + експорт DOCX

Хронологія використовує Server-Sent Events (SSE) для потокової передачі живих повідомлень про стан у браузер під час виконання вилучення. Замість того, щоб дивитися на індикатор завантаження 30–60 секунд, ви бачите «Підготовка документа…», «Виклик gpt-4o-mini…», «Аналіз подій…» у режимі реального часу.

Після завершення вилучення натисніть «Експортувати до Word», щоб завантажити відформатований .docx з кожною подією як позначеним абзацом, цитатами з джерел і роздільником між подіями.

Server-Sent Events OOXML / .docx ZipArchive live progress Save to My Docs

Конфіденційність та безпека

Ваші документи ніколи не залишають вашу сесію.

Конфіденційність за дизайном

  • Усі завантажені файли витягуються в текст в пам'яті за допомогою обробників файлів PHP в процесі. Сирий бінарний файл ніколи не записується на диск на сервері.
  • Контекст сесії (вставлений текст, завантажений вміст, витягнуті події хронології) обмежується вашою автентифікованою сесією і знищується, коли сесія закінчується.
  • Azure OpenAI (gpt-4o, gpt-4o-mini) налаштовано на регіоні Західна Європа. Дані, оброблені через Azure OpenAI, не використовуються для навчання моделі за умовами стандартної корпоративної угоди.
  • Azure OpenAI викликається лише під час проходу вилучення. Жодний вміст документа не зберігається Azure після повернення відповіді згідно з корпоративною угодою про обробку даних.
  • Логування телеметрії: назва інструменту, двигун, режим фокусу, кількість подій, затримка. Жоден текст документа, посилання на справи, імена учасників або витягнуті події не реєструються.

Перегляньте, як це працює у вашій справі.

Безкоштовно для членів Do Better Norge. Усі механізми доступні для кожного члена.

Увійти, щоб використовувати Хронологію → Зареєструватися безкоштовно Посібник користувача