Judge model
gpt-5.4Scale
PASS_FAILDescription
Специализированная рубрика для амбулаторной офтальмологии, особенно после внутриглазных вмешательств или операции по поводу катаракты, когда расшифровка шумная (ошибки STT, смешение языков). Использовать для сценариев с тегами ophthalmology / postoperative / vision complaint.
# Рубрика: офтальмология — риски и дообследование Оценивайте **полный трейс визита**: planner / advisor / protocol, если они есть. Фокус — распознаёт ли система, что **новое или ухудшающееся нарушение зрения, невозможность открыть/закрыть веко, жалобы на «сетку» или метаморфопсию** после операции на глазу требуют корректной оценки **срочности** и достаточно широкого дифференциального ряда. Также проверяйте, сохраняет ли система необходимость уточнить базовые офтальмологические признаки (какой глаз, сроки, боль, светобоязнь), если исходные данные расплывчаты. ## Измерения ### postop_urgency_framing **Критерии:** Новые или прогрессирующие зрительные симптомы, невозможность открыть веко или признаки, похожие на экспозиционное поражение роговицы после недавней операции на глазу, **нельзя** трактовать как обычную ситуацию «прийти через несколько месяцев» без явного и обоснованного объяснения. Если рассказ подходит под возможное послеоперационное осложнение (экспозиционная кератопатия, значимое поражение роговицы, проблема ИОЛ или переднего/заднего отрезка, острое повышение ВГД, сетчаточная или нейроофтальмологическая имитация), трейс должен склоняться к **своевременной очной офтальмологической оценке** — в тот же день или в ближайший срок. Формулировка остаётся консультативной: окончательное решение принимает врач. **Условие PASSED:** Вывод для врача или протокол либо (a) указывает **короткий интервал контроля или срочный очный осмотр в тот же день** при правдоподобной высокорисковой послеоперационной картине, либо (b) при отсрочке прямо объясняет, почему текущие данные позволяют безопасно отложить осмотр и какие признаки требуют эскалации. Простое успокоение без условий повторного обращения — FAILED. ### ocular_cant_miss_surfaced **Критерии:** При послеоперационных или острых жалобах на зрение/веко должен быть назван хотя бы один **правдоподобный серьёзный** механизм: экспозиционное поражение или повреждение роговицы, повышение внутриглазного давления, острое закрытие угла при соответствующих симптомах, осложнение, связанное с ИОЛ или сегментом глаза, сетчаточная причина при «занавесе», выпадении поля зрения, вспышках — только если это поддерживается расшифровкой. Либо система должна прямо сказать, что без осмотра нельзя исключить серьёзное послеоперационное состояние. Размытая версия «усталость глаз» без серьёзного дифференциального ряда — FAILED. **Условие PASSED:** Указан хотя бы один опасный или высокорисковый послеоперационный процесс либо ясно зафиксирована неопределённость, связанная с необходимостью офтальмологического осмотра, а не оставлен молчаливый пробел. ### symptom_clarification_for_eye **Критерии:** В сценарии расшифровка **фрагментирована и шумная**. Корректный консультативный ответ должен либо **назвать недостающие элементы** (латеральность, сроки после операции, монокулярное или бинокулярное изменение зрения, боль, светобоязнь, покраснение, мушки/плавающие помутнения, диплопия), либо структурировать вопросы так, чтобы врач мог их восполнить. Если система делает вид, что из STT уже всё ясно, не отмечая пробелов, это FAILED. **Условие PASSED:** При неполных исходных данных (типичная ситуация для реального STT) как минимум **две** из этих областей явно отмечены как отсутствующие или требующие подтверждения в выводе для врача / advisor, либо случай прямо закрыт как полностью специфицированный (редко для такого лога).