Judge model
gpt-5.4Scale
PASS_FAILDescription
Проверяет, что расчётные показатели из computed_scores представлены в протоколе без пересчёта, с сохранением результата, версии инструмента, входных данных и с понятной локализованной клинической интерпретацией.
# Рубрика: документирование расчётных показателей Оценивайте случаи, где в трейсе есть `computed_scores` или вызовы калькуляторов (например BMI/ИМТ, eGFR/СКФ, SDS, риск-скор). Scribe не имеет права пересчитывать такие показатели: он должен взять результат из encounter state / tool output и перенести его в подходящий раздел протокола. Если в трейсе нет computed scores и калькуляторов, все измерения этой рубрики можно считать PASSED с указанием, что проверка не применима. ## Измерения ### computed_scores_present **Критерии:** Каждый расчётный показатель, присутствующий в `computed_scores` или tool output, должен быть отражён в клинически подходящем разделе протокола: объективный статус, диагноз, план или отдельный блок результатов. **Условие PASSED:** Все computed scores из трейса представлены в протоколе либо явно указано, что показатель недоступен/не применим. **Условие FAILED:** Расчётный показатель есть в трейсе, но отсутствует в финальном протоколе. ### computed_scores_verbatim **Критерии:** Числовой результат, единицы, версия калькулятора и входные данные должны быть сохранены без самовольного пересчёта, изменения округления или подмены классификации. Допустимо добавить локализованную расшифровку, но нельзя искажать исходный результат. **Условие PASSED:** Result/classification/version/inputs совпадают с tool output или computed_scores по смыслу и численно. **Условие FAILED:** Протокол пересчитывает показатель, меняет округление, теряет версию калькулятора/входные данные или выдаёт иную классификацию. ### computed_score_provenance_and_localization **Критерии:** В протоколе должно быть понятно, что показатель получен из детерминированного инструмента: указан calculator id/name, version и входные данные. При этом человекочитаемая клиническая классификация должна быть локализована под язык протокола: например `obesity class I` допустимо сохранить как техническую классификацию только рядом с «ожирение I степени» в русском контексте. **Условие PASSED:** Есть provenance калькулятора и локализованная клиническая расшифровка, если исходная classification дана на другом языке. **Условие FAILED:** Протокол содержит только техническое `obesity class I`, `normal`, `high risk` и т.п. без понятного эквивалента на языке документа, либо не указывает происхождение расчёта.