Sau Evals

← Rubrics/protocol_planner_alignment
Judge model
gpt-5.4
Scale
PASS_FAIL
Description
Проверяет архитектурную границу Scribe: протокол должен документировать выводы Planner/Advisor/Pharma и encounter state, а не самостоятельно создавать новые диагнозы, гипотезы, планы или клиническое рассуждение.
# Рубрика: согласованность протокола с Planner

Оценивайте **финальный протокол** в сопоставлении с upstream-данными трейса:
сообщениями Planner/Advisor/Pharma, working diagnosis, plan, hypothesis set,
decision log и evidence table. Scribe — документационный специалист; он
может структурировать и формулировать, но не должен добавлять новую клиническую
логику, которой не было выше по потоку.

Не штрафуйте нормальное редактирование языка, объединение дублей, перенос данных
между разделами или сохранение неопределённости. Штрафуйте, если в протоколе
появляется новая клиническая сущность, решение или рекомендация без upstream
основания.

## Измерения

### diagnosis_matches_planner

**Критерии:** Диагноз, рабочая оценка, дифференциальный ряд и уровень
неопределённости в протоколе должны соответствовать тому, что было передано
Planner/Advisor/Pharma или явно зафиксировано в encounter state. Scribe
не должен усиливать «подозрение» до подтверждённого диагноза, менять приоритет
гипотез или добавлять новую нозологию без upstream-основания.

**Условие PASSED:** Все диагнозы/гипотезы в протоколе имеют явную опору в
upstream-части трейса и сохраняют тот же уровень уверенности.

**Условие FAILED:** В протоколе появился новый диагноз/дифференциал, которого нет
в upstream-логике, или неопределённая гипотеза оформлена как установленный
диагноз.

### plan_matches_planner

**Критерии:** План в протоколе должен документировать план, уже сформированный
Planner/Advisor/Pharma: обследования, лечение, маршрутизация, follow-up,
safety-net. Scribe не должен самостоятельно назначать новые препараты,
обследования, консультации, госпитализацию или сроки наблюдения без upstream
основания.

**Условие PASSED:** Существенные пункты плана в протоколе прослеживаются к
upstream-сообщениям/decision log/plan. Допустимы стилистические переформулировки
и детализация формата.

**Условие FAILED:** Протокол добавляет новое лечение, обследование, направление,
срок контроля или режим маршрутизации, которого не было в upstream plan.

### no_new_protocol_reasoning

**Критерии:** Протокол не должен содержать самостоятельное клиническое
рассуждение от имени Scribe: новые причинно-следственные объяснения,
пересчёт риска, повторную дифференциальную диагностику, алгоритм выбора тактики.
Он может документировать уже переданное reasoning с provenance.

**Условие PASSED:** Рассуждение в протоколе является краткой фиксацией upstream
логики и не создаёт новых выводов.

**Условие FAILED:** В протоколе есть новые аргументы «потому что...», новая
стратификация риска, новая причинная гипотеза или новый приоритет тактики, не
найденные в upstream-части трейса.