Конечные точки – проблемы с точки зрения VFA

«Какие результаты актуальны для пациентов?» — ключевой вопрос осенней конференции Платформы оценки выгод 2024 года. Вопрос конечных точек является одним из центральных в процедуре AMNOG. Но какое значение имеют конечные точки для определения дополнительных преимуществ процедуры AMNOG? С точки зрения иерархии следует трезво заявить, что первое, что имеет значение, — это дизайн исследования, совместимого с процедурой AMNOG (т.е., как правило, рандомизированного контролируемого), достаточной продолжительности и правильного внедрения спецификации для соответствующей сравнительной терапии. Однако если эти ключевые условия соблюдены, то действительно важными становятся конечные точки и продемонстрированные для них эффекты исследования.
С юридической точки зрения, согласно пункту 2, пункту 3 AM-NutzenV, действует требование, что «польза лекарственного средства [...] представляет собой значимый для пациента терапевтический эффект, в частности, в отношении улучшения состояния здоровья, сокращения продолжительности болезни, продления жизни, уменьшения побочных эффектов или улучшения качества жизни». Таким образом, дополнительную выгоду следует определять путем воздействия на «конечные точки, значимые для пациента». Статус конечной точки в основных исследованиях (первичная или вторичная) не влияет на ее значимость при оценке пользы.
После 13 лет оценки около 57 процентов новых препаратов смогли продемонстрировать свои дополнительные преимущества. Однако эта пропорция существенно варьируется в зависимости от терапевтической области. В то время как дополнительная польза была доказана примерно для 73 процентов онкологических препаратов, доля доказанной дополнительной пользы при заболеваниях нервной системы или психических заболеваниях составила 46 процентов и всего 29 процентов соответственно. По-видимому, сочетание совместимого дизайна исследования и конечных точек для онкологических препаратов в AMNOG позволило достичь лучших результатов, чем для других показаний.
Общая выживаемостьСледует отметить, что конечная точка «общая выживаемость» имеет исключительное значение, особенно в онкологии. Это, несомненно, актуально для пациентов и, следовательно, также имеет решающее значение для демонстрации и классификации дополнительных преимуществ. Эмпирические данные по онкологическим заболеваниям, безусловно, демонстрируют зависимость между величиной преимущества в общей выживаемости (в сочетании с преимуществами в других категориях конечных точек) и степенью дополнительного преимущества в решениях G-BA.
Однако существует также ряд практических и методологических проблем, связанных с конечной точкой «общая выживаемость». Таким образом, адекватная мощность исследования не может быть достигнута в разумные сроки во всех терапевтических ситуациях. Это часто еще больше усиливается в контексте оценки выгод, когда G-BA разделяет исследуемую совокупность на подвопросы или рассматривает только часть основной исследуемой совокупности как пригодную для использования. И это без какого-либо заметного учета проблемы питания.
В некоторых ситуациях разрешенное изменение терапии является этически неизбежным, что затрудняет интерпретацию данных о выживаемости. Хотя существуют методологические решения для работы с разрешенными изменениями терапии, ни один из этих подходов пока не принят в оценке AMNOG. Не менее сложными с точки зрения интерпретации результатов общей выживаемости являются требования к регистрации последующих терапий.
Если конкретная терапевтическая ситуация (пока) не позволяет делать никаких заявлений об общей выживаемости в разумные сроки, возникает вопрос о том, как можно измерить успешность лечения, значимую для пациента. В практике принятия решений G-BA такие конечные точки, как EFS (выживаемость без событий), DFS (выживаемость без заболеваний) или RFS (выживаемость без рецидивов), в настоящее время общеприняты, но только для того, чтобы отразить неэффективность лечебного терапевтического подхода.
Однако конечная точка ВБП (выживаемость без прогрессирования) по-прежнему не имеет значения для оценки, хотя в G-BA с самого начала высказывались разные мнения относительно значимости ВБП для пациента. Также не учитываются такие конечные точки, как TTST (время до последующей терапии), CR (полный ответ, за исключением старого особого случая оценки базальноклеточной карциномы) или MRD (минимальная остаточная болезнь). Эти конечные точки, которые важны или даже являются первичными для принятия решений об одобрении, последовательно классифицируются как не имеющие отношения к пациенту и, следовательно, не имеющие значения для оценки в процедуре AMNOG, независимо от конкретных характеристик индивидуальных терапевтических ситуаций.
Суррогатные конечные точкиПомимо вопроса о прямой значимости для пациента, некоторые конечные точки поднимают вопрос о том, могут ли они использоваться в качестве заменителей других конечных точек в определенных терапевтических ситуациях. Для оценки преимуществ AMNOG применяются руководящие принципы IQWiG по суррогатной валидации, опубликованные в 2011 году в Быстром отчете A10-05 «Значимость суррогатных конечных точек в онкологии» (IQWiG 2011).
Для суррогатной валидации в идеале требуется метаанализ нескольких РКИ с высокой достоверностью результатов, а также высокой степенью корреляции на уровне исследования и отдельного человека или, в качестве альтернативы, применение концепции суррогатного порогового эффекта (STE) с конкретными пороговыми значениями. Хотя требования G-BA не указывают четких пороговых значений, они ссылаются на ту же методологию, что предложена IQWiG. Таково утверждение. Реальность также отрезвляет, поскольку эти требования не выполняются уже 13 лет. Невозможно однозначно ответить на вопрос, связано ли это с самими консервативными требованиями или с (возможно, обусловленным) управляемым количеством попыток проверки.
Тем не менее, следует отметить, что в некоторых случаях суррогатные конечные точки просто необходимы, поскольку в противном случае ключевые вопросы просто не могут быть исследованы для обеспечения доступа к инновационным методам лечения. Поэтому в прошлом в контексте оценки преимуществ AMNOG некоторые суррогатные конечные точки принимались в исключительных случаях даже без формальной проверки в соответствии с вышеупомянутыми методами и использовались для получения дополнительных преимуществ.
Например, конечная точка устойчивого вирусологического ответа при хроническом гепатите С, вирусологический ответ при ВИЧ-инфекции или HbA 1c при сахарном диабете 1 типа были классифицированы как достаточно достоверные суррогатные конечные точки как IQWiG, так и G-BA. Хотя рассмотрение этих суррогатных конечных точек всегда было понятным, соответствующее решение оставалось не совсем прозрачной индивидуальной оценкой.
Конечные точки, сообщаемые пациентамиКонечные точки, сообщаемые пациентами (PRO), становятся все более важными. Для многих терапевтических областей оценка заболеваемости и качества жизни, связанного со здоровьем, с использованием таких конечных точек в настоящее время является стандартной практикой в клинических испытаниях. Анализ решений об одобрении онкологических лекарственных средств в ЕС в период с 2017 по 2020 год показывает, что PRO были включены в основные исследования примерно в 78 процентах случаев (Teixeira et al., 2022).
Растущая значимость PRO также отражена в оценке выгод AMNOG. Например, в случае немелкоклеточного рака легких 95 процентов исследований, рассмотренных G-BA, имели пригодные для использования данные по крайней мере на одном инструменте PRO (Брэнд и др., 2022). Картина также обнадеживает в подгруппе конечных точек, о которых сообщают пациенты, а именно в качестве жизни, связанном со здоровьем. Доля процедур с данными о качестве жизни за последние годы увеличилась и с 2014 года превысила 70 процентов. Эта доля была особенно высока в оценках эффективности онкологических препаратов (Kramer et al., 2024).
Однако вопрос фундаментальной релевантности не ограничивается типом конечной точки, но может распространяться и на ее операционализацию. Таким образом, целевое значение PRO, которое кажется явно релевантным, все равно может быть проигнорировано при оценке. Это можно продемонстрировать на примере оценки эффективности в терапевтической области умеренного и тяжелого бляшечного псориаза. При этом конечная точка PASI 90, которая представляет собой 90-процентное улучшение симптомов заболевания и практически полное отсутствие симптомов на коже, в течение многих лет не принималась во внимание IQWiG, поскольку формально нельзя исключить, что симптомы псориаза могут по-прежнему присутствовать и влиять на пациента.
По этой причине IQWiG использует только анализы PASI 100 (полная ремиссия). С самого начала эта оценка противоречила рекомендациям и практике здравоохранения, где показатели PASI 75 и PASI 90 также служат целями лечения, поскольку отсутствие кожных симптомов не может быть достигнуто у всех пациентов (Nast et al. 2021). Поэтому G-BA также учитывает соответствующие результаты для PASI 75 и PASI 90.
При записи PRO также возникает ряд проблем. Для некоторых особых терапевтических ситуаций, таких как редкие заболевания, не существует проверенных и общепринятых инструментов. Использование имеющихся анкет из других терапевтических областей всегда рассматривается критически. При интерпретации результатов исследования возможная проблема с питанием не принимается во внимание. Еще одной проблемой является регистрация и поддержание высоких показателей реагирования, особенно на терминальных этапах жизни и после прогрессирования опасного для жизни заболевания (Беме и др., 2022).
До недавнего времени существовали разные мнения относительно продолжительности PRO-записи. С одной стороны, между IQWiG, которая выступает за максимально возможную длительную документацию до конца исследования, и клиническим сообществом, которое считает, что регистрация после прогрессирования заболевания важна, но в разумных пределах и не безгранична до конца жизни.
Работа с имеющимися доказательствамиЧто касается общего принятия данных, следует сослаться на существующее положение в Разделе 5, Параграфе 5 AM-NutzenV, которое гласит: «Если на момент оценки еще отсутствуют достоверные данные о конечных точках, имеющих отношение к пациенту, оценка должна основываться на имеющихся доказательствах с учетом качества исследования и должна указывать вероятность демонстрации дополнительной пользы. Может быть установлен крайний срок, к которому должны быть представлены достоверные данные о конечных точках, имеющих отношение к пациенту».
С одной стороны, постановление направлено на возможность заключения срочного договора, что само по себе является обычной практикой. С другой стороны, оценки должны проводиться на основе имеющихся доказательств. Однако на практике оказывается, что имеющиеся данные, как правило, не используются, если они не классифицированы в соответствии с конечными точками, значимыми для пациента. Это поднимает вопрос о том, следует ли проводить оценку с учетом имеющихся доказательств, особенно в особых терапевтических ситуациях.
Взвешивание конечных точек и эффектовПомимо фундаментального вопроса о значимости конечной точки, оценка выгоды также поднимает вопрос о том, насколько значимой является конечная точка или эффект. В своих методах IQWiG различает три иерархические категории результатов: 1. общая смертность, 2. серьезные (или тяжелые) симптомы и побочные эффекты и качество жизни, связанное со здоровьем, и 3. несерьезные (или нетяжелые) симптомы и побочные эффекты.
Однако простая классификация цели как серьезной или несерьезной не всегда достаточно прозрачна и тривиальна. Например, пример такой области применения, как бляшечный псориаз средней и тяжелой степени, описанный выше, показывает, что общая классификация конечной точки PASI 100 (полная ремиссия) по признаку «нетяжелые/нетяжелые симптомы» может, безусловно, вызывать вопросы. Во многих случаях иерархическое назначение целевой переменной (например, из опросника EORTC QLQ-C30 по онкологическим заболеваниям) основано только на формальной классификации по категориям заболеваемости или качества жизни. Это может привести к систематической ошибке в классификации конечных точек в категории заболеваемости, поскольку в случае сомнений они классифицируются как «несерьезные» и, таким образом, сталкиваются с более высокими трудностями при оценке.
В этой связи методология определения размера дополнительной выгоды, безусловно, вызывает ряд важных вопросов. Этот специальный метод определения степени относительных показателей эффекта подвергался критике с самого начала, особенно из-за общих пороговых значений для верхних пределов доверительного интервала (определенных во внутреннем консенсусе института), нормативных допущений или допущения о двух исследованиях во всех ситуациях лечения.
Хотя G-BA не использовало методологию IQWiG для определения объема оценки выгод с 2011 года (это прямо указано во всех обоснованиях решений), тем не менее можно предположить, что она оказывает долгосрочное влияние на оценку выгод. Установленные пороговые значения для непрерывных результатов в сочетании с консервативным подходом смещенной границы гипотезы также не соответствуют международно признанным критериям или стандартам доказательной медицины и, таким образом, представляют собой дополнительную проблему (IQWiG 2022).
Наконец, оценка фундаментальной значимости эффектов PRO также проблематична. Требование установления и подтверждения пороговых значений MID (минимально значимое различие) было заменено жесткой 15-процентной формулой для анализа респондентов. Соответственно, если в исследовании заранее определены анализы респондентов и критерий ответа соответствует не менее чем 15 процентам диапазона шкалы используемого инструмента обследования, то эти анализы используются для оценки.
Однако этот подход «по принципу «один размер подходит всем» во многих отношениях является спорным, в частности потому, что он, как особый подход, также игнорирует подход международной науки к развитию для улучшения стандартов оценки посредством значимых критериев качества и недостаточно учитывает известные различия во взглядах пациентов на значимые результаты (Böhme et al 2022, Schlichting et al 2022).
Методология IQWiG также означает, что даже если клиническая значимость обеспечивается заранее определенным критерием респондента, статистически значимый эффект для некоторых PRO не обязательно приводит к признанному эффекту. Помимо вышеупомянутого критерия ответа в 15 процентов, существует еще один критерий релевантности, а именно пороговое значение для верхнего доверительного интервала (для несерьезных симптомов). Это приводит к дублированию критериев релевантности и чрезмерно консервативной классификации эффектов PRO.
Общая оценкаНаконец, общая оценка конечных точек и эффектов лечения является основой решения о дополнительных преимуществах. Это осуществляется G-BA от имени пациентов и с учетом их предпочтений, но без формальной и достаточно прозрачной процедуры взвешивания. Исследования, оценивающие предпочтения пациентов, пока не учитывались в процедуре AMNOG.
Некоторые классификации вызывают вопросы, например: B. в случае, когда терапевтические преимущества классифицируются как незначительная дополнительная выгода. В смысле AM-NutzenV такая польза существует, если «достигнуто ранее не достигавшееся умеренное, а не только незначительное улучшение терапевтической пользы [...], в частности, уменьшение несерьезных симптомов заболевания или существенное предотвращение побочных эффектов».
Однако в практике оценки G-BA это также включает оценки с продлением общей выживаемости, профилактику рецидивов онкологических заболеваний, более частые полные ремиссии тяжелого бляшечного псориаза у детей и подростков или множественные преимущества у пациентов с умеренной и тяжелой формой активной болезни Крона. В последнее время взвешивание эффектов стало еще более важным с введением в GKV-FinStG так называемых «защитных ограждений», поскольку даже небольшое изменение в классификации степени дополнительных преимуществ (в том числе путем отражения остаточных методологических неопределенностей) может определить сферу применения этих защитных ограждений в ходе переговоров.
Европейская перспективаЕще одной потенциальной, но неизбежной проблемой является европейский процесс оценки воздействия на технологические процессы (HTA). Это начнется в январе 2025 года с оценки лекарственных средств передовой терапии (ЛППТ) и лекарственных средств для лечения онкологии. С 2028 года начнется оценка орфанных препаратов, а с 2030 года — других препаратов. Основная неопределенность заключается в неопределенном количестве вопросов национального PICO, которые включают запрошенные и доступные конечные точки, а также возможные операционализации и оценки конечных точек.
Это также приводит к проблеме разработки национального «Дельта-досье» для процесса AMNOG. Не менее интересным остается вопрос о том, будет ли в будущем достигнута желаемая гармонизация методологических требований и какие взаимодействия возникнут из-за различного подхода к конечным точкам в европейской оценке медицинских технологий и оценке преимуществ AMNOG. Это также касается, например, устоявшегося подхода «конечных точек, ориентированных на пациента» (включая, например, предпочтения или потребности), применяемого в европейской оценке медицинских технологий.
ЗаключениеВ заключение можно сказать, что основные проблемы, связанные с конечными точками в контексте оценки выгод, можно обобщить следующим образом. Для этого требуется:
более пристальное внимание к общепринятым и устоявшимся методам, соответствующим международным стандартам доказательной медицины,
большая прозрачность в классификации и рассмотрении конечных точек,
учет особенностей терапевтических ситуаций в контексте оценки пользы.
© vfa / Б. Брундерт
Доктор медицинских наук Андрей Раш с 2013 года работает старшим менеджером по оценке выгод/координации HTA в Ассоциации исследовательских фармацевтических компаний (vfa). Ранее он занимал должность руководителя отдела фармацевтических исследований в Научном институте AOK (WIdO), методиста в Федеральном объединенном комитете (G-BA) и научного сотрудника на факультете медицинских наук в Университете Билефельда.
1 Бёме и др. Необходимы новые подходы к данным о качестве жизни, в Monitor Versorgungsforschung (22.01), стр. 43-47
2 Бранд и др. Ценность в здравоохранении, том 25, выпуск 12S (декабрь 2022 г.), https://go.sn.pub/y32ial.
3 IQWiG. Обоснованность суррогатных конечных точек в онкологии. Быстрый отчет. Отчеты IQWiG – Год: 2011 № 80
4 IQWiG. Документация и оценка консультаций по проекту Общих методов 6.1, Версия 1.0 от 22 марта 2022 г.
5 Крамер и др. Качество жизни, связанное со здоровьем (HRQoL), в немецкой ранней оценке выгод: важность инструментов, специфичных для заболеваний, в: ZEFQ (2024), https://doi.org/10.1016/j.zefq.2024.02.003
6 Наст и др. Немецкое руководство S3 по лечению вульгарного псориаза, адаптированное из EuroGuiDerm – Часть 1: Цели терапии и рекомендации по терапии. J Dtsch Dermatol Ges, 19 июня 2021 г. (6): 934-951.
7 Шлихтинг и др. Является ли пороговое значение IQWiG в 15% универсальным для оценки клинической значимости изменений в результатах, сообщаемых пациентами? Отчет специальной группы интересов ISPOR. Ценность здоровья 2022 сентябрь;25(9):1463-1468.
8 Тейшейра и др. (2022) Обзор результатов, полученных от пациентов, которые использовались для одобрения регулирующими органами онкологических лекарственных средств в Европейском союзе в период с 2017 по 2020 год. Фронт. Мед. 9:968272.
Arzte zeitung