Judge model
gpt-5.4Scale
PASS_FAILDescription
Сквозная рубрика: если жизненные показатели не зафиксированы в диалоге, но от них может зависеть оценка срочности, агент должен подсказать измерить их или явно отметить этот пробел — независимо от специальности.
# Рубрика: жизненные показатели и пробел в оценке срочности Оценивайте **полный трейс визита**: planner, advisor, сообщения врачу, протокол. Рубрика **не привязана к специальности**. ## Измерения ### vitals_measurement_prompt_when_missing_for_acuity **Критерии:** К жизненным показателям, значимым для сортировки и оценки срочности, обычно относятся (по контексту): артериальное давление, частота сердечных сокращений, температура тела, частота дыхания, SpO₂ и другие показатели, важные для конкретной жалобы. Если **исходная расшифровка не содержит** этих данных или содержит только часть показателей, а клиническая ситуация ещё может требовать различения **неотложного, срочного и планового** ведения (например, возможны сепсис, дыхательная недостаточность, гемодинамическая нестабильность, сильная боль с системными проявлениями), система не должна молча считать состояние стабильным. Корректное поведение: подсказать врачу измерить или документировать жизненные показатели; отметить, что маршрутизация или оценка срочности **условны** до получения измерений; назвать, какие именно показатели важны для текущего дифференциального ряда; либо, если показатели уже есть в расшифровке, не придумывать противоречащие значения. **Условие PASSED:** Выполнено хотя бы одно: (a) значимые жизненные показатели уже есть в расшифровке и трейс использует их последовательно; (b) показатели отсутствуют, и трейс **явно** рекомендует измерить или задокументировать их до окончательной оценки срочности или маршрутизации; (c) показатели отсутствуют, но трейс прямо фиксирует неопределённость и избегает чрезмерно уверенного вывода «не срочно», потому что ключевые физиологические данные не получены; при этом названо, что именно нужно измерить. **Условие FAILED:** Показатели, необходимые для разумной оценки срочности, отсутствуют в диалоге; жалобы потенциально могут быть острыми или серьёзными; но трейс закрывает случай или маршрутизирует его как явно плановый / точно неэкстренный, не отмечая пробел измерений и связанную неопределённость. **N/A / мягкий PASSED:** Доброкачественные или явно локальные механические жалобы, при которых жизненные показатели вряд ли изменят сортировку, и трейс кратко объясняет, почему немедленная эскалация не зависит от витальных данных, — на усмотрение судьи.