Judge model
gpt-5.4Scale
PASS_FAILDescription
Minimal smoke rubric — one dimension. Confirms the agent produced a coherent, non-empty clinical output. Use for dev/CI smoke tests where speed matters more than clinical depth.
# Рубрика: smoke-проверка вывода Минимальная рубрика для smoke-тестов. Единственное измерение проверяет, что агент сформировал непустой, связный клинический текст. ## Измерения ### produces_coherent_output **Критерии:** Финальный вывод агента должен содержать хотя бы один клинически связный абзац — диагноз, план или инструкции пациенту. Пустой вывод, вывод из одного слова или бессвязный набор символов считается провалом. **Условие PASSED:** Вывод содержит минимум одно связное предложение с клиническим содержанием.