Нажмите "Enter", чтобы перейти к контенту

Как методологические различия влияют на результаты экономических анализов: систематический обзор анализов выпуска гамма-интерферона для диагностики LTBI

How Methodologic Differences Affect Results of Economic Analyses: A Systematic Review of Interferon Gamma Release Assays for the Diagnosis of LTBI
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3591384/

Конкурирующие интересы: авторы заявили, что конкурирующих интересов не существует.

Задуманные и разработанные эксперименты: OO AT DM. Анализировали данные: OO MP AT DM. Используемые реагенты / материалы / инструменты анализа: OO MP AT DM. Написал бумагу: OO.

Анализ эффективности затрат (CEA) может предоставить полезную информацию о том, как инвестировать ограниченные средства, однако они менее полезны, если другой анализ одного и того же вмешательства дает неясные или противоречивые результаты. Цель нашего исследования состояла в том, чтобы провести систематический обзор методологических аспектов СЕА, которые оценивают результаты исследований интерферон-гамма-релизов (IGRA) для выявления скрытой туберкулезной инфекции (LTBI), чтобы понять, как различия влияют на результаты исследования.

Был проведен систематический обзор исследований с уделением особого внимания качеству исследования и изменчивости входных данных, используемых в моделях, используемых для оценки экономической эффективности. Была разработана общая модель анализа решений стратегии скрининга IGRA по сравнению с Tuberculin Skin Test (TST), которая используется для количественной оценки влияния прогнозируемых результатов наблюдаемых различий в модельных поступлениях, взятых из выявленных исследований.

Тринадцать исследований были в конечном счете включены в обзор. В ходе исследований было выявлено несколько конкретных методологических проблем, включая выбор учебных материалов, несоответствия в методе калькуляции затрат, полезность QALY (Quality Adjusted Life Year) в качестве результата эффективности и способы выбора авторов и интерпретации результатов исследования. Когда сравнивали стратегии IGRA и TST, используя нашу общую модель анализа решений, прогнозируемая эффективность в основном перекрывалась.

Многие методологические проблемы, которые вносят вклад в несогласованные результаты и снижают качество исследования, были выявлены в исследованиях, в которых оценивалась экономическая эффективность теста IGRA. Более конкретные и соответствующие руководящие принципы необходимы, чтобы помочь авторам стандартизировать подходы к моделированию, исходные данные, допущения и способы представления и интерпретации результатов.

Глобальный контроль над туберкулезом (ТБ) в настоящее время сталкивается с большими возможностями, но также вызывает большие проблемы. За последнее десятилетие возможности для улучшения борьбы с туберкулезом резко возросли в результате увеличения финансирования со стороны правительств стран с низким и средним уровнем дохода (LMIC) и международных доноров и финансирующих учреждений [1]. В то же время число новых инструментов, особенно в области диагностики туберкулеза, быстро расширялось, предоставляя широкий спектр потенциальных технологий для реализации [2]. Одна из самых больших проблем для правительств и агентств-доноров заключается в том, чтобы решить, куда инвестировать средства для достижения наибольшей выгоды для большинства людей.

Экономический анализ может предоставить лицам, принимающим решения, дополнительную информацию о том, на какие основополагающие инвестиционные решения, путем сопоставления затрат и получаемых преимуществ для здоровья различных подходов. Анализ эффективности затрат (CEA) является одним из наиболее часто используемых экономических анализов в опубликованных исследованиях [3]. Можно оценить и сравнить затраты на единицу результата или влияние на здоровье различных вмешательств [3]. Если CEA проводятся с использованием строгих, стандартизированных и прозрачных методов, результаты различных анализов должны быть сопоставимыми и помогать директивным органам достигать консенсуса в отношении вмешательств, которые должны быть реализованы в конкретном населении или условиях [4]. Однако, если разные анализы одного и того же вмешательства дают противоречивые результаты, это может усилить путаницу и даже дискредитировать ценность этих анализов.

Прекрасным примером этого явления является область диагностики латентной туберкулезной инфекции (LTBI). До недавнего времени единственным методом диагностики LTBI был один тест — тест на туберкулез кожи (TST). В течение прошедшего десятилетия в разных странах были одобрены анализы выпуска интерферона гамма (IGRA), что привело к волне исследований их точности и полезности [5], [6]. Они включают анализ экономической эффективности, который предоставил, казалось бы, противоречивые сообщения.

В целом систематические обзоры предназначены для обобщения доказательств после тщательной оценки методологического качества всех доступных соответствующих исследований по конкретной теме [4]. В целях экономического анализа, в частности, цель систематического обзора заключается не в том, чтобы давать заявления о том, является ли конкретное вмешательство экономически эффективным, а скорее обобщать то, что известно из разных мест об экономических аспектах вмешательств, а также поощрять более прозрачные и последовательный подход к проведению и представлению докладов об экономических анализах [4]. Таким образом, целью нашего исследования было проведение систематического обзора методологических аспектов (качества исследования, исходных данных и методологического подхода) CEA, которые оценивают IGRA для выявления LTBI, чтобы оценить, могут ли методологические различия объяснять различия в результатах исследований и выводы. Вторая задача заключалась в разработке общей модели анализа решений, которая могла бы количественно оценить влияние на прогнозируемые затраты и эффективность наблюдаемых различий в затратах, которые были использованы в выявленных исследованиях.

Требование этики не требовалось для этой работы.

Мы искали CEA, который сравнивал IGRA с, по крайней мере, еще одной стратегией тестирования для диагностики LTBI. Включенные исследования использовали методы моделирования для прогнозирования конкретных результатов с течением времени с любым аналитическим горизонтом. Никаких ограничений на год публикации или языка не было. Прогнозируемые результаты интереса включали показатели качества жизни (QALY), активные случаи ТБ и общие затраты. Исследования были исключены, если они: 1) использовали животных; 2) оценили выявление активного заболевания; 3) были рефераты или разбирательства конференции; 4) оценивали выявление не туберкулезной микобактериальной инфекции или заболевания; и 5) использовали нестандартные тесты для LTBI.

Мы искали следующие базы данных с 1947 по 15 марта 2011 года: Scopus, Web of Science, Medline, Embase, Cinhal, Cochrane Library, CRD, Econlit, реестр CEA и сирень для соответствующих исследований. Обновление было выполнено 31 августа 2011 года. В дополнение к этим базам данных были также найдены справочные списки идентифицированных публикаций. Пример строки поиска, используемой для поиска базы данных Medline, можно найти в таблице S1.

Два независимых рецензента рассмотрели все названия и тезисы, чтобы выбрать полные исследования. Полный текстовый обзор для окончательной выборки исследования проводился независимо теми же двумя рецензентами, и любые разногласия были разрешены третьим рецензентом.

Стандартизованная форма абстрагирования данных была разработана и пилотирована на подмножестве исследований. После его завершения форма использовалась двумя рецензентами для независимого извлечения данных. Данные были извлечены по следующим темам; 1) Общая информация, 2) Модель / экономические входы и допущения, 3) Изучение исходных источников данных, 4) Прогнозируемые результаты и 5) Качество исследования (с использованием контрольного списка Drummond — см. Ниже раздел ниже). Более подробную информацию о типах данных, абстрагированных путем изучения, можно найти в таблице S2. Данные обоих обозревателей сравнивались, чтобы обеспечить точность абстракции данных. Любые различия между рецензентами решались путем обсуждения с третьим рецензентом. К авторам обратились за разъяснениями или отсутствовала ключевая информация.

Для каждого исследования общее методологическое качество каждого исследования оценивали с использованием Drummond et al. 35 контрольный список элементов [7]. Каждый отдельный элемент оценивался с использованием взаимоисключающих категорий «Да», «Нет», «Не ясно» или «Не применимо». Также было проведено детальное качественное сравнение результатов, представленных в тексте и абстрактном заключении.

Для каждого исследования были учтены следующие модельные входы: тестовые характеристики, переходные вероятности (например, риск заболевания, если они инфицированы), и затраты — особенно конкретные компоненты затрат для IGRA и TST. Прогнозируемые результаты абстрагирования включали: затраты на человека, прошедшие скрининг, и показатели эффективности (QALY или активные случаи) по тестовому сценарию. Все затраты были пересчитаны в доллары США [8] — [11] и скорректированы с учетом инфляции до 2011 года в долларах США [12].

Мы разработали общую модель анализа Маркова с использованием программного обеспечения TreeAge (TreeAge, версия 2011), в котором была включена основная структура и последствия всех моделей, используемых в исследованиях, включенных в обзор. Как показано на рисунке S1, модель имитирует две идентичные когорты популяции, некоторые из которых инфицированы туберкулезом. В первый год моделирования первая когорта тестируется с тестом IGRA, а вторая — с TST. В зависимости от основного состояния здоровья туберкулеза у населения и характеристик используемого теста население попадает в одно из четырех взаимоисключающих состояний (истинный положительный, ложноположительный, истинный отрицательный или ложный). В зависимости от состояния возникают различные последствия. Например, для тех, кто является положительным на результат теста, часть населения может придерживаться лечения и завершить эффективный курс лечения, что не приведет к отрицательному результату. Тем не менее, не может быть завершена и / или неэффективная терапия, что приводит к развитию активного ТБ — отрицательного прогнозируемого результата. Неблагоприятные события могут также возникать у всех, кто лечится, независимо от состояния здоровья ТБ. После того, как когорта завершит процесс скрининга и лечения в течение первого года модели, те, которые инфицированы и остаются с LTBI, в следующем году модели будут циклически входить в «зараженное состояние» и могут позже активировать и развивать активную болезнь. Те, кто вылечится после профилактической терапии или реактивируются на активное заболевание, не продолжают цикл в последующие годы.

В этой общей модели все патогенетические и стоимостные затраты определялись с использованием распределения входных значений, используемых в различных исследованиях, включенных в обзор. Эти стоимостные и входные значения, влияющие на эффективность, суммированы в таблицах 1 и 2. Метод вероятностной чувствительности по методу Монте-Карло использовался для более 10000 итераций для определения распределения результатов (затрат и эффективности) для каждого тестового сценария. Эффективность определялась как вероятность активного случая. Проценты (2,5 и 97,5) были рассчитаны для каждого распределения, и предсказанные результаты были построены для визуального сравнения результатов.

Более подробная информация представлена ​​в таблице S1.

Статус BCG населения не указан.

T Spot / GAME.

Список не является исчерпывающим списком всех расходов, включенных в исследования, но ограничивается теми расходами, которые включены в общую модель решения, описанную в основном тексте.

N / A = Стоимость не включена в исследование.

Полная стоимость LTBI tx = включает стоимость полного режима, указанного в публикации.

Активная стоимость ТБ = стоимость для пассивно диагностированного Активного случая.

Стоимость испытания IGRA = Все исследования считаются Quantiferon, за исключением Reference (12) (только T-Spot), Reference (16) (общий IGRA) и Reference (20) (включая QFN и T-spot).

Стоимость предназначена только для лекарств и стимулов. Административные расходы и расходы на доставку, связанные с лечением LTBI, включены в стоимость фиксированной программы в размере 150 долларов США (2007 год) в год на одного участника исследования. Эти дополнительные расходы не учитываются ни в одной из категорий расходов, перечисленных выше.

Стоимость, показанная для умеренного гепатита.

Затем был проведен анализ односторонней чувствительности по каждой переменной, включенной в эту общую модель анализа решений, для количественного определения относительного воздействия на прогнозируемые общие затраты за 20-летний аналитический горизонт различий в исследованиях. Для этого анализа диапазон ввода для каждой переменной был взят из максимального и минимального значений, используемых в разных исследованиях, включенных в обзор. Рассчитывалась спрэд (рассчитанный как разница между наименьшим прогнозируемым значением результата и наивысшим ожидаемым значением) и потенциальное влияние (рассчитанное как Спреды, деленное на среднее ожидаемое значение для каждого тестового сценария) каждой переменной.

Как показано на рисунке 1, в начальном поиске найдено 714 уникальных ссылок. После обзора названий, тезисов и полного текста 11 исследований соответствовали критериям включения и были включены в обзор. Два дополнительных исследования, опубликованные после проведения первоначального обзора, были добавлены при выполнении обновления поиска. Резюме 13 исследований, включенных в обзор, приводится в таблице 3
[13] — [25]. Исследования в основном рассматривались в странах с высоким уровнем дохода. Были рассмотрены различные подгруппы исследований, включая контакты, иммигрантов, работников здравоохранения.

Для всех исследований, включенных в обзор, средняя доля значений «Да», указанных в контрольном списке качества, составляла 72%. Разбивка Да или Нет / Нечеткая для каждого из 35 пунктов контрольного списка представлена ​​на рисунке S2. Следующие пункты из контрольного списка имели самые низкие оценки по исследованиям; 1) Пункт 7: Выбор формы экономической оценки оправдан в отношении рассмотренных вопросов (8% Да), 2) Пункт 10: Даны сведения о методах синтеза или метаанализа входных значений (если они основаны на синтез ряда исследований) (27% Да), 3) Пункт 13: Даны сведения о субъектах, из которых были получены оценки (33% да), 4) Пункт 14: Изменения производительности (если они включены) сообщаются отдельно (25% Да), 5) Пункт 27: Выбор переменных для анализа чувствительности оправдан (38% Да). Сравнение результатов текста и абстрактного вывода показало диссонанс во многих исследованиях (суммировано в таблице S3). Результат, представленный в тексте и абстрактных выводах об эффективности затрат, был полностью согласован только в 5 исследованиях.

Основные входы по эпидемиологической модели, представленные в исследованиях, сильно различались, как показано в таблице 1. Более подробная информация об этих входах приведена в таблице S4. Даже после корректировки инфляции и валюты затраты на затраты, включенные в исследования, также сильно варьировались (Таблица 2). Например, стоимость тестирования для TST варьировалась от 17 до 121 долл. США (2011 долл. США), а для IGRA — от 21 до 219 долл. США (2011 долл. США). Глубокое исследование компонентов затрат этих параметров (таблица S5) показало, что подходы к калькуляции были разными во всех исследованиях. Например, 6 исследований включали затраты с точки зрения пациента 9, в явном виде заявили, что они включают «косвенные» или затраты на время медицинского персонала для проведения тестов, а 7 явно заявили, что затраты на кровоток / флеботомии, связанные с IGRA, были включены.

Во всех исследованиях предсказанные меры эффективности (полученные QALY или активные случаи были практически идентичны всем сценариям тестирования (таблица 4). QALY, полученные от использования IGRA по сравнению с использованием TST, также показаны как дни жизни, чтобы подчеркнуть очень небольшие различия в эффективности. Из всех исследований, сравнивающих эффективность с использованием IGRA и TST, только одно исследование предсказало прирост более чем на 1 день с использованием IGRA над аналитическим горизонтом в 20 лет. С другой стороны, предсказанные различия в расходах между использованием IGRA и TST широко варьировались между исследованиями и между подгруппами, рассмотренными в рамках одного и того же исследования (таблица 5).

Туберкулезные случаи предсказывались при положительном испытании при отсутствии вмешательства (лечение).

Отрицательный знак указывает больше случаев, предсказанных с помощью стратегии IGRA относительно TST.

Отрицательное число представляет собой экономию с IGRA относительно TST.

Распределение прогнозируемой эффективности (рис. 2а) и издержек (рис. 2б) в значительной степени перекрывалось, когда эти результаты были предсказаны из моделирования Монте-Карло с использованием нашей общей модели анализа решений. 2,5 и 97,5 процентиля для прогнозируемой эффективности (вероятность активного случая) были очень похожи на 0,246% и 4,07% для стратегии TST и 0,244% и 3,98% для стратегии IGRA. Прогнозируемые затраты показали большую разницу между стратегиями с 2,5 и 97,5 процентилями для стратегии TST в 398 долларов США и 2251 долларов США, а для стратегии IGRA — 279 долларов и 1953 долларов.

A. Прогнозируемая эффективность. B. Прогнозируемые затраты.

Используя ту же модель, когда входы модели изменялись в одном направлении с анализом чувствительности, предсказанный разброс затрат был большим (таблица 6). Для обеих стратегий параметр с наибольшим разбросом и, следовательно, наибольшее потенциальное влияние в модели, был «распространенностью LTBI» (потенциальное влияние: 147% и 97% для IGRA и TST соответственно). Важна также частота реактивации в отсутствие эффективной терапии LTBI (потенциальное влияние: 115% и 92% для IGRA и TST соответственно). Стоимость лечения активного туберкулеза и LTBI сопровождалась ранжированием влиятельных параметров. Полный рейтинг всех параметров приведен в таблице 6.

Тринадцать документов об эффективности затрат были рассмотрены в нашем исследовании. Различия в оценочной эффективности во всех исследованиях были очень незначительными. Хотя в целом качество было признано удовлетворительным, предполагаемые исходные затраты и переходные вероятности были весьма непоследовательными. В результате, прогнозируемые затраты и экономическая эффективность варьировались в широких пределах. Хотя СЕА должны предоставлять объективные доказательства для принятия решений, когда исследования показывают широко расходящиеся результаты, они менее полезны. Отсутствие стандартизации и расхождения в методах СЕА привело к разработке рекомендаций, сформулированных Группой по эффективности затрат в области здравоохранения и медицины в 1996 году [26]. Несмотря на наличие таких рекомендаций, многие вопросы по-прежнему остаются в том, как ведутся СЕА. Некоторые проблемы, по-видимому, вытекают из того, насколько хорошо авторы могут практиковать практические рекомендации. Однако уместность рекомендаций для конкретных областей оценочных исследований также вызывает определенную озабоченность.

Подробный обзор методов, проведенных в этом систематическом обзоре, выявил несколько конкретных методологических вопросов, касающихся анализа данных, представления и интерпретации результатов СЕА. Последствия некоторых из этих вопросов более подробно обсуждаются ниже:

Оценки патогенетических, затратных затрат и тестовых характеристик, используемых в разных исследованиях, сильно различались. Несмотря на то, что эти входы сыграли важную роль в определении результатов, большая часть изменчивости входных значений была недостаточно обоснованной. Как подчеркивается в оценках оценки экономических исследований Drummond et al [7], по возможности, исходные данные должны быть получены из систематических обзоров и метаанализов.

Подход к калькуляции затрат, включая конкретные компоненты затрат, варьировался в зависимости от учебы; это оказало существенное влияние на определение эффективности затрат. Рекомендации Группы экспертов по эффективности затрат в области здравоохранения и медицины [26] для идеального подхода к калькуляции должны соблюдаться по возможности. Однако авторы часто сталкиваются с практическими ограничениями, и в некоторых случаях может потребоваться определить приоритетность использования данных о затратах, которые легко получить.

Разница в измерении эффективности между стратегиями тестирования была настолько мала, чтобы быть клинически бессмысленной. Хотя экономическая эффективность определяется различиями в эффективности и различиями в стоимости, последняя была определена как основной определяющий результат исследования в этой конкретной области. QALY рекомендуется Группой по эффективности затрат в области здравоохранения и медицины как идеальный показатель эффективности здравоохранения [26]. Однако это исследование демонстрирует слабость использования этой меры для диагностических исследований. Учитывая, что ни одна из обычных мер эффективности не позволила выявить значимые различия между двумя стратегиями тестирования для выявления скрытой инфекции туберкулезом, основное внимание в экономических исследованиях в этой области следует уделять только затратам.

Проблемы были выявлены при представлении и интерпретации данных, при этом многие исследования четко не отображали данные, по которым тест был «наиболее экономически эффективным». Выводы о том, что определенная стратегия была «экономически эффективной» или «высокозатратной», часто не определялись или основывались на готовности заплатить порог в размере 50 000 долларов США за полученную QALY. Этот ориентир был разработан для оценки экономической эффективности вмешательств для лечения почечной недостаточности на конечной стадии в США в 1980-х годах [27], поэтому может не соответствовать сценариям тестирования, странам или группам населения.

Некоторые из этих результатов согласуются с оценкой концептуальных проблем, связанных с моделированием и экономическим анализом диагностики туберкулеза Dowdy et al. [28]. Несмотря на то, что они не фокусировались на IGRA для диагностики LTBI, они предложили улучшить современные подходы к экономическому анализу в диагностических исследованиях, в частности необходимость более четко определить пороговые значения для эффективности затрат.

Nienhaus et al. также недавно провел систематический обзор стратегий скрининга на туберкулез [29]. В отличие от нашего исследования, их целью было обобщить данные, чтобы сделать рекомендацию относительно предпочтительной стратегии скрининга LTBI. Несмотря на то, что авторы признали различия в затратах на ввод, моделируют допущения, оценивают стратегии и результаты, они по-прежнему рекомендуют предпочтительную стратегию тестирования, но предупредили, что необходимы дополнительные доказательства «общепринятых материалов для экономического анализа».

Анализ эффективности затрат является важным инструментом для оценки практики здравоохранения и все шире используется для определения приоритетности вмешательств. В нашем анализе выявлены некоторые специфические методологические проблемы, отмеченные в опубликованном СЕА по экранированию ИГРА. Хотя для стандартизации таких анализов существуют руководящие принципы, во многих случаях эти рекомендации не соблюдались, хотя некоторые аспекты могут не иметь отношения к диагностическому СЕА. Необходимы более конкретные и соответствующие рекомендации, и мы предлагаем следующее: 1. Было бы полезно разработать стандартные исходные данные и предположения для использования в исследованиях моделирования, подобных тем, которые включены в наш обзор. В качестве исходных данных для моделирования можно было бы регулярно использовать стандартные источники. 2. Следует также поощрять стандартизацию подходов к калькуляции затрат, чтобы все исследования включали аналогичные компоненты затрат — в идеале — с точки зрения общества, которая включает в себя экономическое воздействие на пациентов в дополнение к воздействию на систему здравоохранения. 3. Выбор первичной экономической меры также должен быть тщательно рассмотрен в этих типах исследований. Основываясь на нашем нахождении существенной разницы в эффективности между стратегиями тестирования, для этого вопроса — сравнения диагностических стратегий в LTBI — экономический анализ должен фокусироваться исключительно на стоимости и ресурсных последствиях в рассматриваемой обстановке. 4. Наконец, авторы должны приложить гораздо большие усилия для представления и интерпретации результатов экономической эффективности более прозрачным образом. Например, должны использоваться стандартные критерии готовности платить, а определение четко указано при заключении, если исследование «экономически выгодно». И, если разница в эффективности очень мала, это должно быть четко указано, и следует избегать любых выводов относительно эффективности затрат. В конечном счете, эти рекомендации должны улучшить экономические исследования, которые оценивают диагностические стратегии для LTBI и повышают их ценность для информирования о решениях в отношении отдельных людей и общественного здравоохранения.

Упрощенное изображение модели анализа принятия решений на основе общего состояния переходного периода.

(DOC)

Щелкните здесь для получения дополнительных данных.

График результатов методологической оценки качества по элементу контрольного списка.

(DOC)

Щелкните здесь для получения дополнительных данных.

Драммонд 35 Контрольный список предметов.

(DOC)

Щелкните здесь для получения дополнительных данных.

Пример строки поиска для Medline.

(DOC)

Щелкните здесь для получения дополнительных данных.

Форма абстракции данных.

(DOC)

Щелкните здесь для получения дополнительных данных.

Выводы рефератов по сравнению с результатами, указанными в тексте исследований, включенных в обзор.

(DOC)

Щелкните здесь для получения дополнительных данных.

Эпидемиологический входной стол — полная информация.

(DOC)

Щелкните здесь для получения дополнительных данных.

Компоненты затрат (включая как прямые затраты, так и затраты времени / зарплаты), включенные в исследование.

(DOC)

Щелкните здесь для получения дополнительных данных.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *