Judge model
gpt-5.4Scale
PASS_FAILDescription
Оценка качества документа Scribe в логике первичного амбулаторного осмотра РК: L0-шаблоны для взрослых и детей (одна рубрика для всех специальностей, если документ следует этой структуре). Судья определяет взрослый или педиатрический контекст по трейсу. Покрывает полноту разделов, явное разделение объективного статуса на praesens и localis, происхождение данных, ссылки на источники, сохранение неопределённости и Markdown-структуру.
# Рубрика: полнота документации (соответствие L0 РК) Оценивайте документ / протокол, сгенерированный в трейсе визита. Ожидания привязаны к **канонической структуре первичного амбулаторного осмотра РК уровня L0**: нормативный порядок разделов и границы содержания для **взрослого** и **педиатрического** первичного приёма, включая раздел «Объективный статус» с общим и местным осмотром. Не опирайтесь на конкретный путь в репозитории: применяйте те же структурные требования, которым Scribe должен следовать при оформлении первичного осмотра в Казахстане. Используйте **педиатрическую** рамку, если пациент явно ребёнок или это следует из тегов сценария / расшифровки. Во всех остальных случаях используйте **взрослую** рамку. Одна рубрика избегает дублирования; разделять её на несколько имеет смысл только если правила оценивания действительно разойдутся, например из-за разных обязательных разделов. Если **вывода Scribe нет**, оценивайте сообщения врачу и текст трейса, но обязательно отметьте, что структурированный протокол отсутствовал. ## Измерения ### section_completeness **Критерии:** Обязательные разделы **первичного амбулаторного** протокола РК должны соответствовать L0: Жалобы; Анамнез заболевания; Анамнез жизни; **Объективный статус**; Предварительный диагноз; План лечения и рекомендации (заголовки в логике L0). Специальность может добавлять подразделы, но не должна заменять эти базовые блоки, если по смыслу сценария это первичный осмотр. **Условие PASSED:** Присутствуют минимум **5 из 6** названных блоков либо судья фиксирует, что визит явно **не** был полным первичным L0-протоколом (например, сокращённый тип визита). Если есть сомнение, считайте заголовки по взрослой или педиатрической L0-структуре. ### rk_primary_objective_status_structure **Критерии:** Если для L0-подобного первичного осмотра присутствует раздел **«Объективный статус»**, его содержание должно отражать два обязательных компонента: **Общий статус (status praesens communis)** — общий и системный осмотр, включая строку жизненных показателей, где это применимо; и **Местный статус (status localis)** — находки по органу или области, связанной с жалобами. **Явное разделение обязательно для PASSED.** В трейсе должна быть **видимая** структура: отдельные метки или подзаголовки для каждого компонента (например, жирные строки, `###`-подзаголовки, прямые формулировки «Общий статус», «Местный статус», «status praesens», «status localis» или близкие русские клинические эквиваленты). Читатель должен сразу видеть, где заканчивается общий осмотр и начинается местный, а не выводить это только из порядка предложений. **Условие PASSED:** Если объективные данные позволяют описать оба компонента, оба должны быть содержательно представлены **и** каждый должен находиться под собственной меткой или понятным подзаголовком. **FAILED**, если: (1) один из компонентов полностью отсутствует без объяснения; **(2) оба компонента приведены только как неразмеченная проза** под одним `## Объективный статус` без подметок, даже если общее и местное содержание есть в разных предложениях (для этого измерения подразумеваемого разделения недостаточно). **FAILED**, если общий и местный осмотр смешаны в одном расплывчатом абзаце без структурной границы. **Редкое исключение:** PASSED возможен только если расшифровка или сценарий действительно содержали данные лишь для **одного** осматриваемого компонента; это нужно объяснить в reasoning. ### section_boundary_correctness **Критерии:** Содержание должно находиться в правильном разделе по границам L0. «Жалобы» — только субъективные текущие симптомы «здесь и сейчас», без развёрнутой хронологии и лечения. «Анамнез заболевания» — течение текущего эпизода. «Анамнез жизни» — фоновые сведения. «Объективный статус» — данные осмотра, а не анамнез. **Условие PASSED:** Нет очевидного перетекания между разделами, например полной хронологии болезни в «Жалобах» или данных осмотра в «Анамнезе жизни». ### evidence_provenance **Критерии:** Клинические утверждения должны прослеживаться к источнику: словам пациента, наблюдению врача, результату исследования, найденному клиническому протоколу. Не должно быть вымышленных находок. **Условие PASSED:** Не менее трёх утверждений имеют прослеживаемое происхождение. ### citation_presence **Критерии:** Если используются клинические рекомендации или КП, должны быть ссылки или указания на источники; либо должно быть прямо сказано, что рекомендации не применялись. **Условие PASSED:** Есть хотя бы одна ссылка на источник / клинический протокол или явное указание, что рекомендации не использовались. ### uncertainty_preservation **Критерии:** Если в состоянии визита были маркеры неопределённости, они должны сохраняться в документации, а не сглаживаться до ложной уверенности. **Условие PASSED:** Нет признаков подавления или скрытия неопределённости. ### formatting_quality **Критерии:** Вывод использует Markdown с устойчивой и читаемой иерархией заголовков (`#` / `##`), совместимой с L0-конвенциями там, где они применимы. **Условие PASSED:** Markdown корректен, иерархия заголовков последовательна.