Sau Evals

← Rubrics/computed_scores_documentation

Judge model

gpt-5.4

Scale

PASS_FAIL

Description

Проверяет, что расчётные показатели из computed_scores представлены в протоколе без пересчёта, с сохранением результата, версии инструмента, входных данных и с понятной локализованной клинической интерпретацией.

# Рубрика: документирование расчётных показателей

Оценивайте случаи, где в трейсе есть `computed_scores` или вызовы калькуляторов
(например BMI/ИМТ, eGFR/СКФ, SDS, риск-скор). Scribe не имеет права
пересчитывать такие показатели: он должен взять результат из encounter state /
tool output и перенести его в подходящий раздел протокола.

Если в трейсе нет computed scores и калькуляторов, все измерения этой рубрики
можно считать PASSED с указанием, что проверка не применима.

## Измерения

### computed_scores_present

**Критерии:** Каждый расчётный показатель, присутствующий в `computed_scores` или
tool output, должен быть отражён в клинически подходящем разделе протокола:
объективный статус, диагноз, план или отдельный блок результатов.

**Условие PASSED:** Все computed scores из трейса представлены в протоколе либо
явно указано, что показатель недоступен/не применим.

**Условие FAILED:** Расчётный показатель есть в трейсе, но отсутствует в финальном
протоколе.

### computed_scores_verbatim

**Критерии:** Числовой результат, единицы, версия калькулятора и входные данные
должны быть сохранены без самовольного пересчёта, изменения округления или
подмены классификации. Допустимо добавить локализованную расшифровку, но нельзя
искажать исходный результат.

**Условие PASSED:** Result/classification/version/inputs совпадают с tool output
или computed_scores по смыслу и численно.

**Условие FAILED:** Протокол пересчитывает показатель, меняет округление, теряет
версию калькулятора/входные данные или выдаёт иную классификацию.

### computed_score_provenance_and_localization

**Критерии:** В протоколе должно быть понятно, что показатель получен из
детерминированного инструмента: указан calculator id/name, version и входные
данные. При этом человекочитаемая клиническая классификация должна быть
локализована под язык протокола: например `obesity class I` допустимо сохранить
как техническую классификацию только рядом с «ожирение I степени» в русском
контексте.

**Условие PASSED:** Есть provenance калькулятора и локализованная клиническая
расшифровка, если исходная classification дана на другом языке.

**Условие FAILED:** Протокол содержит только техническое `obesity class I`,
`normal`, `high risk` и т.п. без понятного эквивалента на языке документа, либо
не указывает происхождение расчёта.