Нажмите "Enter", чтобы перейти к контенту

Исследование диагностической точности при глаукоме пока не сообщается полностью: применение стандартов для отчетности по диагностическим исследованиям точности (STARD) 2015

Diagnostic accuracy research in glaucoma is still incompletely reported: An application of Standards for Reporting of Diagnostic Accuracy Studies (STARD) 2015
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5730182/

Конкурирующие интересы: авторы заявили, что конкурирующих интересов не существует.

Исследования показали скромную приверженность исследованиям точности диагностических тестов (DTA) в глаукоме к Стандартам для отчетности по диагностическим исследованиям точности (STARD). Мы применили обновленный контрольный список STARD 2015 30 пунктов к набору исследований, включенных в систематический обзор Cochrane DTA инструментов визуализации для диагностики манифестной глаукомы.

Три пары рецензентов, в том числе один старший рецензент, который оценил все исследования, самостоятельно проверили приверженность каждого исследования STARD 2015. Приверженность была проанализирована на индивидуальной основе. Логистическая регрессия использовалась для оценки влияния года публикации и фактора воздействия на приверженность.

Мы включили 106 исследований DTA, опубликованных в период с 2003 по 2014 год в журналах со средним коэффициентом воздействия 2,6. Общая приверженность составляла 54,1% для 3286 индивидуальных рейтингов по 31 наименованию, при этом среднее значение составляло 16,8 (SD: 3,1, диапазон 8-23) на одно исследование. Значительная изменчивость в отношении соблюдения стандартов отчетности была обнаружена в отдельных элементах STARD 2015, от 0 до 100%. Девять наименований (1: идентификация как исследование точности диагностики в заголовке / реферате, 6: критерии приемлемости, 10: индексный тест (а) и эталонный стандарт (б) определение; 12: определения отсечения для индексационного теста (а) и эталонного стандарта (b), 14: оценка показателей точности диагностики, 21a: спектр тяжести заболевания, 23: кросс-табуляция индекса и эталонных стандартных результатов) были адекватно представлены более чем в 90% исследований. Напротив, 10 пунктов (3: научный и клинический фон теста индекса, 11: обоснование эталонного стандарта, 13b: ослепление результатов индексного теста, 17: анализ изменчивости, 18, расчет размера выборки, 19: блок-схема исследования; 20: базовые характеристики участников, 28: регистрационный номер и реестр, 29: наличие протокола исследования, 30: источники финансирования) были адекватно представлены менее чем в 30% исследований. Только четыре показателя показали статистически значимое улучшение с течением времени: отсутствующие данные (16), базовые характеристики участников (20), оценки точности диагностики (24) и источники финансирования (30).

Приверженность STARD 2015 среди исследований DTA в исследованиях глаукомы является неполной и лишь незначительно возрастает с течением времени.

Все соответствующие данные содержатся в документе и его файлах вспомогательной информации.

Исследователи, редакторы журналов и издатели признают необходимость адекватной отчетности о биомедицинских исследованиях в качестве средства повышения прозрачности и удобства использования журнальных статей [1, 2]. С этой целью был расширен набор инструментов для руководства авторами при подготовке статей, которые были собраны в рамках EQUATOR (http://www.equator-network.org/reporting-guidelines).

В 2003 году был выпущен инструмент «Стандарты отчетности по диагностическим методам точности» (STARD), предназначенный для составления отчетов по исследованиям точности тестирования (DTA) [3]. Исследования DTA имеют важное значение для исследования эффективности нового теста при выявлении целевого заболевания и могут в конечном итоге помочь врачам использовать диагностические тесты в клинической практике [4]. Недавно была опубликована обновленная версия STARD; STARD 2015 включает 9 новых элементов по сравнению с STARD 2003 и теперь состоит из списка из 30 основных предметов, которые должны быть представлены во всех отчетах исследования DTA [5].

В течение последних двух десятилетий были обнаружены устройства формирования изображения нервных волокон (RNFL) и оптического нерва (ONH) для обнаружения глаукомы, такие как оптическая когерентная томография (ОКТ), ретинальная томография Гейдельберга (HRT) и сканирующая лазерная поляриметрия (GDx), были введенные в офтальмологической клинической практике для выявления структурных повреждений, возникающих на ранней стадии глаукомы. Тем не менее, эффективность этих тестов при принятии клинических решений для выявления глаукомы все еще спорна [6], и с момента их введения было опубликовано большое количество исследований по их диагностической способности [7-9]. При наличии такого большого количества доказательств высокое качество отчетности имеет решающее значение для клиницистов, чтобы лучше оценить потенциал предвзятости и внутреннюю / внешнюю обоснованность таких исследований [10]. В случае субоптимальной отчетности имеющиеся данные могут вводить в заблуждение, и потенциальную роль этих тестов визуализации в принятии клинических решений можно было бы неправильно понять. Как следствие, предвзятая оценка чувствительности / специфичности инструментов визуализации для обнаружения глаукомы может привести к чрезмерному перенаправлению ложноположительных подозреваемых глаукомы или недопредставлению ложноотрицательных пациентов с глаукомой [11]. Применение первоначальной версии STARD в опубликованных исследованиях, посвященных точности изображений RNFL и ONH при диагностике глаукомы, показало общее скромное соответствие, но все они были опубликованы в первые несколько лет после запуска STARD в 2003 году [12-14]. В более поздних исследованиях была изучена приверженность STARD 2015 в исследованиях DTA, опубликованных в журналах визуализации, и оценка теста визуализации в различных областях, представляющих интерес, с показателем общего умеренного и переменного соответствия [15,16].

Цель нашего исследования состояла в том, чтобы оценить приверженность целому ряду исследований, включенных в систематический обзор Кокранов в STARD 2015. Мы исследовали общую приверженность, а также по каждому пункту, независимо от того, произошло ли какое-либо улучшение со временем и какие факторы были связаны с приверженностью ,

STARD 2015 был опубликован только недавно, и никаких официальных требований к соблюдению этого контрольного перечня отчетности не было. Тем не менее, методологические знания, лежащие в основе руководства STARD, постепенно были доступны в последние годы [12-14]. Кроме того, наше исследование должно стать «базовой» оценкой для руководства улучшением, которое следует за внедрением STARD 2015, что может быть полезно для ассоциаций специалистов по глаукоме в мониторинге качества исследований точности, а также в методических программах обучения.

В этом исследовании мы рассмотрели все 106 исследований, включенных в систематический обзор Кокрановского ДТА, опубликованный в 2016 году, который был направлен на оценку диагностической точности данных, полученных из RNFL и ONH, для диагностики проявленной глаукомы; подробности поиска и отбора исследований можно найти в другом месте [17].

Мы использовали обновленную версию STARD для оценки качества отчетности в прилагаемых исследованиях [5]. Контрольный список STARD 2015 включает 30 элементов, сгруппированных в 6 доменов: название и реферат, введение, методы, результаты, обсуждение и другую информацию. Четыре элемента STARD (10, 12, 13 и 21) состоят из двух подпунктов (a и b), один из которых обычно ссылается на индексный тест, а другой — на эталонный стандарт.

STARD был разработан для применения ко всем типам диагностических медицинских тестов и целевых заболеваний, а некоторые предметы нуждаются в дополнительной спецификации при применении к данному тесту или заболеванию. В пункте 10a, например, рекомендуется, чтобы авторы сообщали «индексный тест, достаточно подробно, чтобы разрешить репликацию». Какие данные теста наиболее релевантны, очевидно, могут варьироваться от теста к тесту. Чтобы адаптировать контрольный список STARD к конкретным тестам и целевым заболеваниям в текущем обзоре, мы сначала подготовили форму руководства и форму извлечения данных, в которой были установлены конкретные критерии для подсчета каждого элемента STARD. Затем формы были опробованы на тренировке, основанной на 5 из включенных исследований.

После пилота мы составили окончательную форму, которая не включала пункт 2 (структурированный реферат), поскольку конкретное руководство для рефератов докладов публикуется совсем недавно, и это должно стать предметом дальнейшего исследования [18]. Мы также исключили пункт 13a (информация, доступная для исполнителей / читателей индексного теста) и пункт 25 (связанные с тестированием побочные явления), поскольку они не были применимы к нашему индексу. Исключение пункта 13а было мотивировано тем фактом, что, хотя мы знаем из большого объема исследований, что знание эталонного стандарта во время интерпретации индексного теста является важным источником предвзятости [10,19], тест на визуализацию глаукомы результаты всегда анализируются стандартным встроенным программным обеспечением, которое обеспечивает объективную непрерывную меру, например, толщину RNFL, или классифицирует объект в соответствии со стандартными категориями. Morevoer, пункт 25 не рассматривался, поскольку тест не является инвазивным. В целом было оценено в общей сложности 31 объект, включая несколько подпунктов (Таблица 1).

AUC: площадь под кривой; ROC: рабочая характеристическая кривая приемника; N: количество исследований, положительно сообщающих об этом предмете; %: процент по отношению к общему числу включенных исследований; ONH: головка зрительного нерва; RNFL: слой нервных волокон сетчатки; (новый элемент) указывает элемент, недавно введенный с контрольным списком STARD 2015.

Каждое исследование оценивалось двумя независимыми авторами: один автор (MM) оценил все 106 исследований, в то время как три других автора (AM, VF, GC) каждый независимо оценивали треть статей. Для каждого исследования каждый элемент оценивался как «да» (с указанием того, что предмет был сообщен надлежащим образом) или «нет» (с указанием того, что элемент не был представлен надлежащим образом), как подробно объяснено в таблице 2. Затем мы оценили приверженность STARD на уровне предмета: для каждого элемента мы рассчитали процент исследований, набранных с помощью «да», в качестве меры приверженности STARD. Разногласия были решены путем обсуждения, и в случае необходимости старший автор (GV) принял окончательное решение.

AUC: область под кривой рабочих характеристик приемника; ONH: головка зрительного нерва; RNFL: слой нервных волокон сетчатки; CI: доверительный интервал; SE: стандартная ошибка; FP: ложноположительный; FN: ложный отрицательный; (новый элемент) указывает элемент, недавно введенный с контрольным списком STARD 2015.

Мы рассчитали общую приверженность STARD 2015 как среднее количество пунктов, представленных в каждом из включенных исследований. Мы использовали логистическую регрессию для оценки влияния года публикации на общую приверженность STARD, а также для проверки влияния влияющего фактора (IF) издательского журнала (в год публикации статьи) на общее соблюдение. В последнем анализе мы сформировали приблизительные термины ударного фактора для 106 исследований при отсечениях 2 и 3,5, предполагая, что различные ИФ, полученные ежегодно каждым из 25 издательских журналов, были независимыми. Влияние года публикации на приверженность STARD также проверялось на каждый предмет отдельно. Никакой корректировки для множественности анализов не было принято с учетом исследовательского характера нашего исследования.

Все расчеты проводились с использованием программного обеспечения Stata 14.2 (StataCorp, College Station, TX).

Читатели могут обратиться к Мичелли и др. За подробностями о включенных исследованиях [17]. Короче говоря, мы включили 106 исследований, из которых 40 исследований (5574 пациента) оценили диагностическую точность GDx, 18 исследований (3550 пациентов), что у HRT и 63 (9390 пациентов), что и у OCT. Двенадцать из этих исследований сравнили два или три теста. Шестьдесят семь исследований использовали повреждение визуального поля (VF) плюс ONH глаукоматозную оптическую невропатию в качестве эталонного стандарта; остальные 37 исследований полагались только на повреждение VF (только 29 исследований) или только повреждение ONH / RNFL (10 исследований) в качестве критериев определения для подтверждения глаукомы. Исследования были опубликованы в период с 2003 по 2014 год; медианный фактор воздействия составлял 2,6 (интерквартильный интервал от 1,0 до 3,7).

Общая приверженность составляла 54,1% для 3286 индивидуальных рейтингов по 31 наименованию, при этом среднее значение составляло 16,8 (SD: 3,1, диапазон 8-23) на одно исследование. В таблице 1 представлена ​​приверженность STARD 2015 для каждого элемента с объяснением основных шаблонов.

В целом значительная изменчивость в отношении соблюдения стандартов отчетности была обнаружена по всем статьям STARD 2015, от 0 до 100%. Девять статей были адекватно представлены в более чем 90% исследований: идентификация как исследование диагностической точности в названии (пункт 1); критерии приемлемости (пункт 6); индексный тест (пункт 10a) и эталонный стандарт (позиция 10b) достаточно подробно, чтобы разрешить репликацию; определения отрезков тестовой положительности для теста индекса (пункт 12а) и эталонного стандарта (пункт 12b); методы оценки мер диагностической точности (ст. 14); спектр тяжести заболевания (21а); кросс-табуляция теста индекса и эталонных стандартных результатов (пункт 23). В частности, три предмета были представлены во всех включенных исследованиях (пункты 1, 10b и 23).

Напротив, 10 пунктов показали приверженность STARD менее чем 30% исследований: научный и клинический фон, включая предполагаемое использование и клиническую роль теста индекса (пункт 3); обоснование эталонного стандарта (пункт 11); были ли слепые оценщики эталонного стандарта (13b); анализ изменчивости оценки (пункт 17); расчет размера выборки (пункт 18); блок-схема исследования (пункт 19); базовые характеристики участников (пункт 20); регистрационный номер и реестр (пункт 28); наличие протокола исследования (пункт 29); источники финансирования (пункт 30).

Четыре статьи показали смешанную отчетность среди включенных исследований с соблюдением порядка 50% отчетности: дизайн исследования как предполагаемый или ретроспективный (пункт 5); настройка, местоположение и даты (пункт 8); основу для выявления потенциальных участников, имеющих право на участие (пункт 7); интервал времени и интервенцию между индексным тестом и эталонным стандартом (пункт 22).

В целом, умеренный рост приверженности был обнаружен в год публикации (OR: 1,03 в год, 95% ДИ от 1,00 до 1,05, р = 0,032).

S1 Рис. Показывает долю приверженности STARD 2015 для каждого элемента в течение всего периода, охватывающего даты публикации всех включенных исследований, включая 36 исследований, опубликованных в период с 2003 по 2009 год, и 70 исследований, опубликованных в период с 2010 по 2014 год.

В то время как большинство тенденций были направлены на улучшение приверженности со временем, было обнаружено статистически значимое улучшение отчетности только по четырем статьям (OR: отношение шансов приверженности в год): как обрабатывались недостающие данные по индексу и эталонному стандарту (пункт 16, OR 1,22, p = 0,003); базовые демографические и клинические характеристики участников (пункт 20, OR 1.24, p = 0.010); оценки точности диагностики и их точности (например, доверительные интервалы 95%) (пункт 24, OR 1.22, p = 0.018); источники финансирования и другая поддержка; роль финансирующих организаций (пункт 30, пункт 1.20, p = 0.037). Ни один предмет не показал значительного снижения приверженности с течением времени.

Журналами, публикующими наибольшее количество исследований, были Исследовательская офтальмология и наука о зрении (n = 19), Офтальмология и Журнал глаукомы (n = 16) и Американский журнал офтальмологии (n = 12). Мы обнаружили немного лучшую общую приверженность для журналов с IF 3.5 или более против менее 2 (OR: 1,22, 95% ДИ от 1,02 до 1,47, p = 0,033).

Линейная модель смешанного эффекта показала, что большая часть дисперсии была обнаружена на уровне предмета, в то время как дисперсия на уровне журнала была более чем в 100 раз меньшей, что свидетельствует о незначительном влиянии журнала на приверженность.

Все включенные исследования были определены как диагностическое исследование точности в названии или реферате, главным образом путем представления данных о точности, таких как кривая ROC, чувствительность или специфичность (пункт 1).

Считалось, что только 9% исследований сообщили об уровне научной и клинической ситуации (пункт 3); хотя авторы часто сообщали об экспериментальных характеристиках визуализации и способности обнаруживать повреждения, в большинстве случаев недоставало целевого использования и клинической роли индексного теста по диагностическому пути. Цели исследования и гипотезы (пункт 4) были плохо описаны (38% случаев): хотя цели почти всегда сообщались, часто не хватало научной гипотезы. Предметы, связанные с дизайном исследования и охватом участников, были переменно представлены во всех включенных исследованиях. За исключением критериев приемлемости (пункт 6), о которых сообщалось в 97% исследований, другие статьи были адекватно представлены только в половине исследований: предполагаемый или ретроспективный характер исследования (пункт 5, 55% исследования), основа, на которой были идентифицированы потенциальные участники (пункт 7, 49% исследований), были ли участники сформированы последовательной, случайной или удобной серии (пункт 9, 42% исследований). Установление местоположения и даты (пункт 8) было сообщено в 53% исследований, причем даты чаще всего отсутствовали.

Усредненные тестовые устройства и эталонный стандарт (пункты 10а и 10б) были отчетливо представлены в 98% и 100% исследований соответственно. Определение и обоснование отрезков теста (пункты 12а и 12b) были надлежащим образом сообщены как для индексного теста, так и для эталонного стандарта в 92% и 98% исследований соответственно. Напротив, авторы сообщили о целесообразности выбора эталонного стандарта (или наличия альтернативы) только в 20% исследований, а информация о маскировке оценщиков эталонного стандарта была отмечена в 27% исследований.

Методы оценки или сравнения показателей точности диагностики были представлены практически во всех исследованиях (99%). Как были обработаны неопределенные результаты (пункт 16) в 88% исследований; исключение сканирования низкого качества было основным методом обработки неопределенных результатов. Напротив, как сообщалось о недостатках данных (пункт 17), в 58% случаев сообщалось. Авторы редко указывали, как были обработаны недостающие данные, и в большинстве случаев отсутствующие данные могли быть вычислены только путем сравнения количества зарегистрированных пациентов с теми, которые были включены в окончательный анализ.

Анализ изменчивости диагностической точности сообщался только в 27% случаев (в большинстве случаев связанных с размером диска ОНГ или тяжести заболевания участников), и только 6% исследований сообщили о предполагаемом размере выборки и о том, как она была определена ,

Во всех исследованиях сообщалось о перекрестной табуляции результатов теста индекса с результатами эталонного стандарта или данных для получения этой перекрестной табуляции (пункт 23), а 99% исследований сообщали о распространении тяжести заболевания у участников с целевое условие (пункт 21b). В большинстве исследований (84%) были представлены оценки точности диагностики и их точности (пункт 24). Когда этот предмет не был должным образом сообщен (16%), точность измерения, такая как 95% доверительные интервалы, отсутствовала.

Исходные демографические и клинические характеристики участников (пункт 20) считались должным образом сообщенными, если бы сообщалось о по крайней мере возрасте, полу, внутриглазном давлении (ВГД) и рефракционном статусе, что имело место в 26% исследований. Возраст почти всегда сообщался, в то время как секс, преломление и ВГД чаще всего отсутствовали. Ни одно исследование не представило блок-схему участников (пункт 19).

Ограничения исследования (ст. 26) были зарегистрированы в 75% исследований. Конструкция корпуса и низкая обобщаемость из-за характеристик включенных участников (таких как тяжесть заболевания или этническая принадлежность) были в основном представлены как ограничения. Только 32% исследований сообщили о последствиях для практики, а также о предполагаемом использовании и клинической роли теста индекса (пункт 27), иногда ссылаясь на изменения между вероятностью до и после теста.

Источники финансирования, включая роль финансирующих организаций (пункт 30), были представлены только в 21% исследований; часто авторы сообщали источник финансирования, но не описывали роль спонсоров. Регистрационный номер и название реестра (пункт 28), а также подробные сведения о подробном исследовании (пункт 29) были представлены только в 2% исследований.

В нашем обзоре изучалось соблюдение STARD 2015 в большом наборе исследований DTA, оценивающих диагностическую эффективность устройств визуализации для выявления проявленной глаукомы. В целом, полнота отчетности была скромной и сильно варьировалась по всем пунктам.

В целом, по данным 106 исследований, среднее значение составило 16,8 из 31 предмета, от 8 до 23 единиц.

По сравнению с 31 предметом, рассмотренным в нашем обзоре, некоторые пункты продемонстрировали почти идеальную приверженность STARD 2015, но отчетность по другим статьям была, безусловно, очень плохой. Пункты с более низким уровнем отчетности включали научный и клинический фон (пункт 3), основу, на которой были определены подходящие потенциальные участники (пункт 7), а также местоположение и даты установления (пункт 8). Эта информация имеет решающее значение, так как эффективность теста не является фиксированной, но может варьироваться, если применяется в разных условиях и среди пациентов с различными характеристиками [2]. Отсутствие этой информации затрудняет оценку обобщаемости результатов. Более того, только одна треть исследований обсуждала последствия ложноположительных и ложноотрицательных результатов в клиническом пути. Это может увеличить риск неправильного понимания того, как тест может изменить посттестовую вероятность заболевания.

Также была выявлена ​​плохая отчетность относительно обоснования выбора эталонного стандарта (пункт 11), маскировки оценщиков эталонного стандарта (пункт 13b) и обработки отсутствующих данных (пункт 16). Использование разных эталонных стандартов может привести к неоднородности в точности испытаний, поскольку один эталонный стандарт может быть более точным, чем другой. Наблюдение может возникать, когда результаты теста индекса известны эксперту эталонного стандарта. Неправильное обращение с отсутствующими данными также может быть связано с предвзятыми результатами.

Временной интервал между индексным тестом и эталонным стандартом (ст. 22) был представлен в половине исследований. Глаукома — прогрессирующее заболевание, и функциональное / структурное повреждение может возникать со временем не одновременно [20]. Различные временные интервалы между испытаниями структурных индексов и функциональными эталонными стандартами могут влиять на оценочную точность диагностики.

Часто часто сообщалось о демографических и клинических характеристиках участников (пункт 20) и альтернативных диагнозах у лиц без целевого состояния (ст. 21b). Подробная информация о зарегистрированном населении позволяет судить о возможности выбора и смещения спектра и принимать решение о применимости результатов к другим группам населения.

В включенных исследованиях никогда не сообщалось о одном предмете: поток участников с использованием диаграммы. STARD 2015 настоятельно рекомендует использовать блок-схему, чтобы облегчить понимание читателем дизайна исследования и поток участников в процессе обучения [21].

Другие исследования оценили приверженность STARD 2015 в исследованиях DTA. Hong et al. исследовали 142 исследования DTA, опубликованные в журналах изображений, и обнаружили, что среднее количество зарегистрированных элементов STARD составляет 16,6 / 30, при этом общая приверженность составляет 55%, что аналогично нашим результатам с обновленным инструментом [15]. Более четкое соблюдение STARD было найдено Choi et al., Который исследовал 63 исследования DTA, опубликованные в период с 2011 по 2015 год в одном специальном журнале (Корейский журнал радиологии) со средним соблюдением 20/27 пунктов (74%) [16] , Мы признаем, что приверженность может варьироваться в зависимости от типа диагностического теста (визуализация, биохимия, гистопатология), а также специальности. Более того, конкретные рекомендации, принятые различными рецензентами для оценки приверженности STARD, могут привести к различиям. Несмотря на эти потенциальные источники изменчивости, ограниченное количество исследований, проведенных по соблюдению STARD 2015, предполагает, что есть возможности для улучшения.

Мы также обнаружили, что за последние годы общая полнота отчетности несколько улучшилась. Только 4 пункта (13%) показали значительное улучшение с течением времени, но, несмотря на это улучшение, 3 из этих пунктов были зарегистрированы только в менее чем 60% случаев. Korevaar et al. было выявлено 16 обследований, анализирующих отчетность 1496 исследований ДТА, и было обнаружено умеренное улучшение отчетности в первые годы после введения СТАРД, но со значительной гетерогенностью среди исследований [22]. В 2015 году Fidalgo et al. исследовал использование STARD 2003 в 58 исследованиях по автоматизированной периметрии для глаукомы и зарегистрировал субоптимальную отчетность без улучшения в период с 1993 по 2004 год и 2004-2013 годы [23].

Мы также предположили, что журнал IF мог повлиять на полноту отчетности. В целом, более высокий ИФ был связан только с немного более качественными отчетами, предполагая, что потребность в улучшенной отчетности включает в себя как журналы с низким, так и высоким ПЧ.

Кокрановский обзор, из которого были получены наши исследования [17], оценил методологическое качество исследований с использованием инструмента QUADAS-2 [19]. Мы обнаружили, что связь между соблюдением стандарта STARD 2015 и методологическим качеством с QUADAS 2 была лишь частичной, что является предметом другого методологического исследования (принято).

Общая картина, вытекающая из литературы, заключается в том, что полнота представления результатов исследований изображений в разных дисциплинах является лишь умеренной, а исследования DTA в области визуализации для определения глаукомы соответствуют этим выводам. Члены и промоутеры STARD призвали редакторов журналов предписывать использование их контрольного списка в материалах. Хотя это привело к некоторому улучшению общей приверженности STARD, многие статьи по-прежнему не сообщаются в исследованиях, опубликованных в журнале, в которых был принят контрольный список STARD [15].

Наш обзор имеет ограничения и силу. Все включенные исследования были опубликованы до введения STARD 2015, так что авторы смогли использовать только предыдущую версию STARD, которая была опубликована в 2003 году. Однако мы включили очень большой набор исследований (70% из которых были опубликованы после 2010), и каждое исследование было оценено двумя независимыми рецензентами для повышения надежности оценки. Другим ограничением является то, что мы оценили только конкретный тест (ы), который может ограничивать обобщаемость. Кроме того, мы использовали когорту исследований, которые соответствовали включению в Кокрановский обзор, который, в зависимости от применяемых критериев включения, может привести к тому, что включенные исследования будут иметь более высокое качество или лучше, чем те, которые, возможно, не соответствовали включению в обзор.

В нашем исследовании мы уделяем повышенное внимание полноте отчетности об исследованиях DTA в офтальмологии, в частности в исследованиях глаукомы. В нашем исследовании также подтверждается, что приверженность исследованиям DTA в области глаукомы для STARD 2015 является скромной и что для улучшения полноты исследований требуется больше работы и усилий. Наконец, это исследование также заложило основу для будущих оценок того, как введение STARD 2015 изменит отчетность исследований DTA по глаукоме в течение следующих нескольких лет.

Каждый элемент пронумерован от 1 до 30.

(TIF)

Щелкните здесь для получения дополнительных данных.

(XLSX)

Щелкните здесь для получения дополнительных данных.

Вклад IRCCS Fondazione Bietti в этом документе был поддержан Министерством здравоохранения Италии и Фондом Рома.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *