Rubrics/vital_signs_acuity_gap

Judge model

gpt-5.4

Scale

PASS_FAIL

Description

Сквозная рубрика: если жизненные показатели не зафиксированы в диалоге, но от них может зависеть оценка срочности, агент должен подсказать измерить их или явно отметить этот пробел — независимо от специальности.

# Рубрика: жизненные показатели и пробел в оценке срочности

Оценивайте **полный трейс визита**: planner, advisor, сообщения врачу,
протокол. Рубрика **не привязана к специальности**.

## Измерения

### vitals_measurement_prompt_when_missing_for_acuity
**Критерии:** К жизненным показателям, значимым для сортировки и оценки
срочности, обычно относятся (по контексту): артериальное давление, частота
сердечных сокращений, температура тела, частота дыхания, SpO₂ и другие показатели,
важные для конкретной жалобы. Если **исходная расшифровка не содержит** этих
данных или содержит только часть показателей, а клиническая ситуация ещё может
требовать различения **неотложного, срочного и планового** ведения (например,
возможны сепсис, дыхательная недостаточность, гемодинамическая нестабильность,
сильная боль с системными проявлениями), система не должна молча считать
состояние стабильным.

Корректное поведение: подсказать врачу измерить или документировать жизненные
показатели; отметить, что маршрутизация или оценка срочности **условны** до
получения измерений; назвать, какие именно показатели важны для текущего
дифференциального ряда; либо, если показатели уже есть в расшифровке, не
придумывать противоречащие значения.

**Условие PASSED:** Выполнено хотя бы одно: (a) значимые жизненные показатели уже
есть в расшифровке и трейс использует их последовательно; (b) показатели
отсутствуют, и трейс **явно** рекомендует измерить или задокументировать их до
окончательной оценки срочности или маршрутизации; (c) показатели отсутствуют, но
трейс прямо фиксирует неопределённость и избегает чрезмерно уверенного вывода
«не срочно», потому что ключевые физиологические данные не получены; при этом
названо, что именно нужно измерить.

**Условие FAILED:** Показатели, необходимые для разумной оценки срочности,
отсутствуют в диалоге; жалобы потенциально могут быть острыми или серьёзными; но
трейс закрывает случай или маршрутизирует его как явно плановый / точно
неэкстренный, не отмечая пробел измерений и связанную неопределённость.

**N/A / мягкий PASSED:** Доброкачественные или явно локальные механические жалобы,
при которых жизненные показатели вряд ли изменят сортировку, и трейс кратко
объясняет, почему немедленная эскалация не зависит от витальных данных, — на
усмотрение судьи.