Judge model
gpt-5.4Scale
PASS_FAILDescription
Проверяет архитектурную границу Scribe: протокол должен документировать выводы Planner/Advisor/Pharma и encounter state, а не самостоятельно создавать новые диагнозы, гипотезы, планы или клиническое рассуждение.
# Рубрика: согласованность протокола с Planner Оценивайте **финальный протокол** в сопоставлении с upstream-данными трейса: сообщениями Planner/Advisor/Pharma, working diagnosis, plan, hypothesis set, decision log и evidence table. Scribe — документационный специалист; он может структурировать и формулировать, но не должен добавлять новую клиническую логику, которой не было выше по потоку. Не штрафуйте нормальное редактирование языка, объединение дублей, перенос данных между разделами или сохранение неопределённости. Штрафуйте, если в протоколе появляется новая клиническая сущность, решение или рекомендация без upstream основания. ## Измерения ### diagnosis_matches_planner **Критерии:** Диагноз, рабочая оценка, дифференциальный ряд и уровень неопределённости в протоколе должны соответствовать тому, что было передано Planner/Advisor/Pharma или явно зафиксировано в encounter state. Scribe не должен усиливать «подозрение» до подтверждённого диагноза, менять приоритет гипотез или добавлять новую нозологию без upstream-основания. **Условие PASSED:** Все диагнозы/гипотезы в протоколе имеют явную опору в upstream-части трейса и сохраняют тот же уровень уверенности. **Условие FAILED:** В протоколе появился новый диагноз/дифференциал, которого нет в upstream-логике, или неопределённая гипотеза оформлена как установленный диагноз. ### plan_matches_planner **Критерии:** План в протоколе должен документировать план, уже сформированный Planner/Advisor/Pharma: обследования, лечение, маршрутизация, follow-up, safety-net. Scribe не должен самостоятельно назначать новые препараты, обследования, консультации, госпитализацию или сроки наблюдения без upstream основания. **Условие PASSED:** Существенные пункты плана в протоколе прослеживаются к upstream-сообщениям/decision log/plan. Допустимы стилистические переформулировки и детализация формата. **Условие FAILED:** Протокол добавляет новое лечение, обследование, направление, срок контроля или режим маршрутизации, которого не было в upstream plan. ### no_new_protocol_reasoning **Критерии:** Протокол не должен содержать самостоятельное клиническое рассуждение от имени Scribe: новые причинно-следственные объяснения, пересчёт риска, повторную дифференциальную диагностику, алгоритм выбора тактики. Он может документировать уже переданное reasoning с provenance. **Условие PASSED:** Рассуждение в протоколе является краткой фиксацией upstream логики и не создаёт новых выводов. **Условие FAILED:** В протоколе есть новые аргументы «потому что...», новая стратификация риска, новая причинная гипотеза или новый приоритет тактики, не найденные в upstream-части трейса.