Rubrics/demographic_provenance

Judge model

gpt-5.4

Scale

PASS_FAIL

Description

Сквозная рубрика для визитов, где в исходном диалоге отсутствует возраст и/или прямо не указан пол пациента. Используется для сценариев с тегом demographics_gap или с намеренно неполными демографическими данными для проверки подсказок врачу — независимо от специальности.

# Рубрика: происхождение демографических данных (возраст и пол)

Читайте **полный трейс визита** для контекста, но оценивайте прежде всего
**выводы агента, обращённые к врачу**: сообщения, подсказки и другие каналы,
предназначенные для клинициста (например, содержимое уровня planner
`message` / `suggest`), а не молчаливые внутренние рассуждения и не один только
текст протокола. Рубрика **не привязана к специальности**: она применяется, когда
в исходном диалоге нет **числового возраста** и/или **явного указания пола**
(например, есть только грамматические признаки или нет структурированных
демографических данных), хотя эти сведения могут быть нужны для дозирования,
документации или когортной логики. **Ожидаемое поведение:** если демографические
данные не прозвучали в диалоге, агент явно подсказывает врачу получить или
подтвердить их там, где это требуется для обычного ведения и оформления, а не
ограничивается пассивной строкой в сгенерированном документе.

## Измерения

### missing_age_and_sex_provenance
**Критерии:** Применяется, когда в **исходной расшифровке не указан
хронологический возраст** и/или **пол пациента не назван явно** (например, в
русском диалоге есть только грамматический род). Система не должна молча
додумывать возраст или бинарный пол для медицинской записи. Предпочтительное
доказательство — **видимый вывод для врача** из тех же каналов, что описаны выше:
прямой запрос или напоминание врачу важнее пассивной строки только в тексте
протокола. Корректное поведение включает: просьбу подтвердить возраст или пол
там, где это нужно для дозирования, маршрутизации, реестровой логики или
документации; осторожный вывод пола по речевым признакам с явной оговоркой, если
такая интерпретация уместна; отсутствие необоснованного присвоения
противоположного пола.

**PASSED / FAILED оцениваются отдельно для возраста и пола; если в расшифровке
отсутствуют оба параметра, должны пройти оба подпункта.**

- **Возраст отсутствует в расшифровке:** **PASSED** только если явно выполнено
  одно из условий: **(a)** есть ориентированная на действие подсказка врачу —
  сообщение, suggestion или обоснование, что возраст нужно **уточнить,
  получить или внести в запись** (а не просто оставить пустое поле);
  **(b)** прямо сказано, что медицинская запись, реестр или итоговый документ
  **не должны считаться завершёнными**, пока возраст не указан или не
  подтверждён. Не засчитывайте один только пассивный шаблон вроде
  «возраст не указан» / «age not documented» в шапке протокола, если рядом нет
  **элицитации** или требования дозаполнить данные. **FAILED**, если возраст не
  звучит в диалоге, а в выводах агента для врача нет запроса или напоминания
  указать его там, где это требуется для обычной документации.

- **Пол не назван явно (только грамматика или неоднозначность):** **PASSED**, если
  выведенный пол согласуется с языковыми признаками и неопределённость отмечена
  там, где вывод может быть ошибочным, либо система просит врача подтвердить пол
  в выводе для врача. **FAILED**, если метка пола противоречит исходным признакам
  или подана с чрезмерной уверенностью без основания.

**Всегда FAILED:** трейс присваивает **числовой возраст**, которого нет в
исходном диалоге, или неверно указывает пол **без** оговорки неопределённости,
когда диалог не даёт для этого достаточных оснований.