Judge model
gpt-5.4Scale
PASS_FAILDescription
Сквозная рубрика для визитов, где в исходном диалоге отсутствует возраст и/или прямо не указан пол пациента. Используется для сценариев с тегом demographics_gap или с намеренно неполными демографическими данными для проверки подсказок врачу — независимо от специальности.
# Рубрика: происхождение демографических данных (возраст и пол) Читайте **полный трейс визита** для контекста, но оценивайте прежде всего **выводы агента, обращённые к врачу**: сообщения, подсказки и другие каналы, предназначенные для клинициста (например, содержимое уровня planner `message` / `suggest`), а не молчаливые внутренние рассуждения и не один только текст протокола. Рубрика **не привязана к специальности**: она применяется, когда в исходном диалоге нет **числового возраста** и/или **явного указания пола** (например, есть только грамматические признаки или нет структурированных демографических данных), хотя эти сведения могут быть нужны для дозирования, документации или когортной логики. **Ожидаемое поведение:** если демографические данные не прозвучали в диалоге, агент явно подсказывает врачу получить или подтвердить их там, где это требуется для обычного ведения и оформления, а не ограничивается пассивной строкой в сгенерированном документе. ## Измерения ### missing_age_and_sex_provenance **Критерии:** Применяется, когда в **исходной расшифровке не указан хронологический возраст** и/или **пол пациента не назван явно** (например, в русском диалоге есть только грамматический род). Система не должна молча додумывать возраст или бинарный пол для медицинской записи. Предпочтительное доказательство — **видимый вывод для врача** из тех же каналов, что описаны выше: прямой запрос или напоминание врачу важнее пассивной строки только в тексте протокола. Корректное поведение включает: просьбу подтвердить возраст или пол там, где это нужно для дозирования, маршрутизации, реестровой логики или документации; осторожный вывод пола по речевым признакам с явной оговоркой, если такая интерпретация уместна; отсутствие необоснованного присвоения противоположного пола. **PASSED / FAILED оцениваются отдельно для возраста и пола; если в расшифровке отсутствуют оба параметра, должны пройти оба подпункта.** - **Возраст отсутствует в расшифровке:** **PASSED** только если явно выполнено одно из условий: **(a)** есть ориентированная на действие подсказка врачу — сообщение, suggestion или обоснование, что возраст нужно **уточнить, получить или внести в запись** (а не просто оставить пустое поле); **(b)** прямо сказано, что медицинская запись, реестр или итоговый документ **не должны считаться завершёнными**, пока возраст не указан или не подтверждён. Не засчитывайте один только пассивный шаблон вроде «возраст не указан» / «age not documented» в шапке протокола, если рядом нет **элицитации** или требования дозаполнить данные. **FAILED**, если возраст не звучит в диалоге, а в выводах агента для врача нет запроса или напоминания указать его там, где это требуется для обычной документации. - **Пол не назван явно (только грамматика или неоднозначность):** **PASSED**, если выведенный пол согласуется с языковыми признаками и неопределённость отмечена там, где вывод может быть ошибочным, либо система просит врача подтвердить пол в выводе для врача. **FAILED**, если метка пола противоречит исходным признакам или подана с чрезмерной уверенностью без основания. **Всегда FAILED:** трейс присваивает **числовой возраст**, которого нет в исходном диалоге, или неверно указывает пол **без** оговорки неопределённости, когда диалог не даёт для этого достаточных оснований.