Нажмите "Enter", чтобы перейти к контенту

Программное обеспечение с открытым исходным кодом для быстрого интеллектуального анализа данных в пространственной эпидемиологии (FGBASE)

An open source software for fast grid-based data-mining in spatial epidemiology (FGBASE)
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4233060/

Изучение того, являются ли случаи заболевания кластерами в космосе, является важной частью эпидемиологических исследований. Еще одна важная часть пространственной эпидемиологии — это проверка того, являются ли пациенты, страдающие от болезни, более или менее подверженными воздействию экологических факторов, представляющих интерес, чем адекватно определенные контрольные группы. Оба подхода включают определение количества случаев и контролей (или групп населения с риском) в определенных зонах. Для кластерных поисков это часто необходимо делать для миллионов разных зон. Выполнение этого путем вычисления расстояний может привести к очень длительным вычислениям. В этой работе мы обсудим вычислительные преимущества географических методов на основе сетки и внедрим программное обеспечение с открытым исходным кодом (FGBASE), которое мы создали для этой цели.

Географические сетки, основанные на проекции азимутальной равнины Ламберта, хорошо подходят для пространственной эпидемиологии, поскольку они сохраняют площадь: каждая ячейка сетки имеет одинаковую площадь. Мы описываем, как данные проецируются на такую ​​сетку, а также алгоритмы на основе сетки для пространственной эпидемиологической разведки данных. Разработанная нами программная программа (FGBASE) реализует эти сетевые методы.

Алгоритмы, основанные на сетке, работают очень быстро. Это особенно важно для поиска кластеров. При применении к когорте французских пациентов с диабетом типа 1 (T1D) в качестве примера алгоритмы на основе сетки обнаруживали потенциальные кластеры за несколько секунд на современном ноутбуке. Это очень выгодно сравнивается с эквивалентным кластерным поиском с использованием дистанционных вычислений вместо сетки, которая заняла более 4 часов на том же компьютере. В тематическом исследовании мы обнаружили 4 потенциальных кластера случаев T1D вблизи городов Гавр, Дюнкерк, Тулуза и Нант. Одним из примеров экологического анализа с нашим программным обеспечением было изучение того, можно ли найти значительную связь между расстоянием до виноградников с тяжелым пестицидом. Ничего не найдено. В обоих примерах программное обеспечение облегчает быстрое тестирование гипотез.

Грид-алгоритмы для горных пространственных эпидемиологических данных обеспечивают преимущества с точки зрения вычислительной сложности, что повышает скорость вычислений. Мы считаем, что эти методы и этот программный инструмент (FGBASE) снижают вычислительные барьеры для входа для тех, кто проводит эпидемиологические исследования.

Онлайн-версия этой статьи (doi: 10.1186 / 1476-072X-13-46) содержит дополнительный материал, доступный для авторизованных пользователей.

Изучение того, являются ли случаи заболевания кластерами в космосе, является важной частью эпидемиологических исследований (см.
[1-6]). Еще одна важная часть пространственной эпидемиологии — это проверка того, являются ли пациенты, страдающие от болезни, более или менее подвержены воздействию некоторых экологических факторов, представляющих интерес (см.
[7-11]). Поиск кластеров вписывается в гипотетический подход, в то время как проверка влияния конкретных факторов окружающей среды вписывается в подход, основанный на гипотезах. Оба эти подхода важны: подход, основанный на гипотезах, как правило, обеспечивает более высокую статистическую мощность, поскольку выполняется меньшее количество статистических тестов, тогда как метод без гипотез может обнаруживать ассоциации, о которых исследователи не думали. Поиск кластеров состоит в том, чтобы локализовать регионы, где число случаев (относительно контролей или относительно группы населения, подверженных риску) больше, чем можно было бы ожидать случайно. Это подход, основанный на данных, в том смысле, что исследователь не формулирует какую-либо априорную гипотезу относительно данных. Вместо этого данные проверяются, чтобы увидеть, есть ли у них какие-либо шаблоны, которые, возможно, не были сразу видны. Если такие шаблоны обнаружены, они могут предложить дальнейшие конкретные исследования и помочь выявить неожиданные факторы экологического риска.

Тестирование влияния конкретных факторов окружающей среды требует от исследователя указать природоохранные объекты (фабрики, свалки отходов, автострады и т. Д.). Влияние экспозиции на экспозицию на эти пространственные объекты часто количественно оценивается с использованием коэффициентов шансов и, когда это возможно, эффектов доза-эффект, которые могут указывать на причинную связь. Поскольку исследователь должен сформулировать априорную гипотезу, а именно существование связи между множеством пространственных объектов и болезнью, это вписывается в подход, основанный на гипотезах. После выбора гипотезы данные проверяются, чтобы проверить, поддерживает ли она гипотезу.

На практике оба подхода выигрывают от популяризации географических информационных систем. Адреса пациентов с болезнью, представляющей интерес, обычно геолокализованы, десятки баз данных информируют о качестве воздуха и воды, почвенном покрове, климате, местной социальной среде и т. Д. С постоянно увеличивающимся пространственным разрешением. Использование точных местоположений (в отличие от группировки административными единицами, как и в прошлом) происходит за счет вычислительных затрат, которые могут быть довольно большими, особенно для поиска кластеров. Популярный способ выполнения поиска кластера включает в себя перемещение фигуры (называемой окном сканирования) по области исследования и подсчет количества случаев и элементов управления в окне сканирования. Обычный метод, используемый, например, программным обеспечением SaTScan ™
[12, 13] — использовать круговые (или эллиптические) окна сканирования. После каждого шага оценивается количество случаев и количество элементов управления (или населения, подверженных риску), заключенных в окне сканирования, и вычисляется статистика. Статистика используется для оценки того, достаточно ли количество случаев в окне сканирования, что маловероятно из-за случайности. Окно, как правило, круговое, поэтому каждый раз, когда он перемещается, расстояние между его центром и каждым случаем / контролем должно быть рассчитано. Чтобы получить хорошие результаты, окно сканирования должно занимать много разных позиций на карте. Кроме того, для обнаружения небольших, а также больших кластеров следует использовать несколько окон сканирования разных размеров. Статистика, полученная Кулльдорфом в
[1] хорошо подходит для этой цели. Kulldorff получает статистический тест отношения правдоподобия для кластерных зон на основе биномиальной модели. Пусть p — вероятность того, что индивид внутри зоны Z является случаем, q — вероятность того, что индивид вне зоны Z будет случайным. Пусть nz — число особей внутри зоны Z и cz — число случаев внутри зоны Z. Наконец, пусть C — общее число случаев в области исследования, а N — общее число индивидов в области исследования , Нулевая гипотеза состоит в том, что зона Z не является кластером (т. Е. H0: p = q), а альтернативная гипотеза состоит в том, что зона Z является кластером (т. Е. H1: p> q). Отношение правдоподобия:

Поскольку знаменатель отношения правдоподобия для всех зон одинаковый, для поиска наиболее вероятных кластеров имеет значение только числитель.

Кульлдорф показывает, что если
 то supp> qL (z, p, q), равный:

И если
 то supp> qL (z, p, q) равно pc (1 — p) N — C.

Окна круговых сканирования и расчет расстояний хорошо работают, когда случаи локализованы для небольшого числа административных единиц. Однако, когда каждый случай и каждый элемент управления локализованы в его точное местоположение, время вычисления может стать очень большим. Рассмотрим следующий пример, который дает порядок величины количества вычислений. Когда коллекция сканирующих окон сканирует карту Франции с шагом 1 км, окно с фиксированным размером займет более полумиллиона позиций. Умножьте это на шесть, чтобы позволить разным размерам окна. Напомним, что после каждого перемещения необходимо вычислить расстояние от окна сканирования до каждого случая / элемента управления. Для изучения населения 10 000 человек это составляет тридцать миллиардов дистанционных вычислений. Расчетное бремя усугубляется тем фактом, что это не просто евклидовы расстояния, а расстояния на сфере, которые являются более вычислительно интенсивными.

Первоначальная мотивация этой работы заключалась в уменьшении этой вычислительной проблемы путем разработки сетевого подхода, который, как мы нашли, требует значительно меньшего вычислительного времени (см. Рис.
1). Цель этой статьи — представить соответствующее программное обеспечение с открытым исходным кодом, которое мы разработали для выполнения алгоритмов на основе сетки для обнаружения кластеров и пространственной эпидемиологии случайного контроля. Мы представим принципы программного обеспечения, его условия использования и подробно рассмотрим его применение к поиску потенциальных факторов окружающей среды диабета типа 1. Рисунок 1
Сравнение использования точечных местоположений с расчетами расстояний в сравнении с использованием подхода на основе сетки при поиске кластеров. (Выше): настройка, где данные о случаях и контролях состоят из точек (обозначенных широтой и долготой). Определение количества случаев и элементов управления в (круговой) области требует вычисления расстояний от центра региона до каждого случая и каждого элемента управления. Для кластерных поисков рассматриваются миллионы областей (потенциальные кластеры), что означает миллиарды расстояний для исследования среднего размера (случай / контроль). (Ниже): настройка, где события и элементы управления проецируются в сетку. Определение количества случаев и элементов управления в (прямоугольной) области требует только считывания значений из массивов с отображением памяти и их суммирования. Этот метод очень быстрый даже для кластерных поисков, где рассматриваются миллионы областей (потенциальные кластеры).

FGASE была разработана для удовлетворения потребностей экологических эпидемиологов в двух вышеупомянутых направлениях:
«Данные управляются», где эпидемиолог ищет, есть ли кластеры случаев, которые впоследствии могут быть истолкованы. В этом случае данные состоят из позиций пациентов и позиций органов управления (или плотности лежащих в основе групп риска).

«Гипотеза управляется», когда эпидемиолог хочет проверить, подвержены ли случаи заболевания, представляющие интерес, иначе, чем контроль факторов окружающей среды, которые географически указаны. В этом случае данными являются позиции пациентов и контролей на карте, а также положения экологических объектов, представляющих интерес.

Принцип метода заключается в использовании сетки с высоким разрешением, чтобы избежать дорогостоящих вычислений расстояний компьютера, как указано во введении.

Выбор стандарта географической сетки Несмотря на то, что программное обеспечение будет работать с сеткой любого типа, рекомендуется использовать сетки с равной площадью, основанные на проекционной системе азимутальной равнинной зоны Ламберта (LAEA). Этот тип сетки рекомендуется Директивой 2007/2 / E, которая была принята Европейским парламентом в марте 2007 года. Эта директива направлена ​​на создание инфраструктуры для пространственной информации в европейском сообществе (INSPIRE) для экологической политики
[14]. Директива INSPIRE рекомендует использовать проекцию Ламберта азимутальной равной площади (ETRS89-LAEA) для общеевропейского пространственного анализа и отчетности, когда требуется представление истинной области
[15]. Для каждой европейской страны сетки населения этого типа можно загрузить с веб-сайта Евростата Европейской комиссии
[16].

Проецирование данных на географическую сетку. Эпидемиологические данные обычно включают географические координаты, закодированные в системе координат WGS84. WGS84 — это Всемирная геодезическая система, созданная в 1984 году, которая хорошо известна благодаря использованию в Глобальной системе позиционирования (GPS). Чтобы проектировать координаты WGS84 на сетку, основанную на проекционной системе азимутальной равнинной области Ламберта (LAEA), первым шагом является преобразование координат WGS84 в координаты LAEA. Это преобразование координат может быть выполнено с помощью GDAL (Библиотека абстракции геопространственных данных)
[17]. Нужно знать коды EPSG исходных и целевых систем координат (EPSG: 4326) для WGS84 и (EPSG: 3035) для ETRS89-LAEA. Мы предоставляем сценарий python, с помощью которого пользователи могут проектировать свои координатные данные WGS84 в координаты сетки ETRS89-LAEA для использования в программном обеспечении FGBASE. Программное обеспечение FGBASE отображает географическую сетку как интерактивную карту (см. Рис.
2). Рисунок 2
Интерактивная карта программного обеспечения FGBASE. Интерактивная карта (расположенная здесь по городу Гавр, Франция) отображает ячейки сетки. Эти квадратные ячейки кодируются цветом в соответствии с определенными пользователем критериями. Здесь используются следующие цветовые коды: светло-серый, если квадрат необитаемый, темно-серый, если квадрат населен, фиолетовый, если квадрат содержит случаи болезни, желтый, если квадрат содержит 2 или более случаев, а отношение популяции к случаю квадрат ниже 1500. Карта имеет желтый прямоугольник выбора, который пользователь может перемещать и изменять размер. На панели ниже карты отображаются статистические данные, рассчитанные для региона, заключенного в прямоугольник выделения. Пользователь может загружать список городов с их географическими корнями, для легкого доступа через левую панель.

Представление интересов, представляющих интерес для подхода, основанного на гипотезе. Основанный на сетке подход хорошо подходит для изучения влияния конкретных факторов окружающей среды, когда эти факторы окружающей среды могут быть расположены в определенных точках на карте. Это могут быть изолированные точки (например, фабрики или свалки отходов). В более общем плане кривые и поверхности могут быть смоделированы в виде наборов точек, хотя выборка. Это позволяет применять подход, основанный на сетке, для изучения возможных экологических опасностей, связанных с дорогой, рекой или конкретным сельскохозяйственным покрытием с использованием пестицидов.

Необходимы три набора данных: (i) местоположения случаев (ii) местоположения органов управления (iii) местоположения представляющих интерес экологических точек (например, точек источника загрязнения). Эти пространственные объекты могут быть помечены атрибутом, который мы называем «классом», чтобы сгруппировать все те, которые имеют один и тот же признак, который будет указывать пользователь, на основе его знаний о конкретном домене. Например (см. Тематическое исследование, ниже), «сущностями» являются заводы, которые выделяют загрязняющие вещества. «Класс» относится к категории загрязняющего химического вещества (например, гидразина). Все «сущности» (фабрики), которые выделяют гидразин, принадлежат к одному и тому же «классу». Это используется программным обеспечением при сравнении расстояний дел и элементов управления с объектами (фабриками), которые имеют один и тот же класс (излучающий гидразин).

Для каждой исследуемой окружающей среды определены три уровня воздействия: (H = высокий, M = средний или L = низкий уровень воздействия). Расстояние до точки интереса определяет эти уровни воздействия на основе пользовательских пороговых значений. Отдельные лица, находящиеся в ячейках, которые близки к объекту в классе, классифицируются как сильно подверженные воздействию. Лица, расположенные в ячейках, которые немного дальше от объекта в классе, классифицируются как имеющие средний уровень воздействия. Лица, находящиеся в ячейках, которые еще находятся дальше от объекта в классе, классифицируются как имеющие низкий уровень воздействия. Наконец, индивиды, даже более отдаленные, классифицируются как не подверженные риску. Затем программное обеспечение вычисляет таблицу случайных ситуаций 2×2 таблицы непредвиденных ситуаций для каждого уровня экспозиции (H, M и L) по сравнению с изложением 0, наконец, программное обеспечение вычисляет отношение шансов и их доверительные интервалы 95% и тест на тенденцию к проверке, если существует зависимость доза-реакция. Если (OR / H)> (OR / M)> (OR / L) значительно, то есть индикация зависимой от дозы ассоциации. Факторы окружающей среды отображаются на интерактивной карте программного обеспечения FGBASE (см. Рис.
3 и рисунок
4). Рисунок 3
Загрузка экологических факторов в FGBASE. Загрузка виноградников из базы данных землепользования CLC в программное обеспечение FGBASE. Здесь карта сосредоточена в Бордо, Франция. Виноградники составляют значительную долю использования пестицидов. Анализ, проведенный с программным обеспечением, не показывает связи между этим фактором окружающей среды и диабетом типа 1.

Загрузка в FGBASE набора данных пространственных объектов, сгруппированных по классам: заводы IREP, сгруппированные по химическим выбросам. Пространственные объекты (фабрики IREP) загружаются в программное обеспечение FGBASE и отображаются на интерактивной карте. Эти объекты группируются в классы на основе химических веществ, которые они выбрали (объект может быть назначен нескольким классам). Алгоритм, управляемый гипотезой, проверяет каждый класс сущностей один за другим, читая из сетки количество случаев и элементов управления на нескольких разных уровнях близости от объектов этого класса.

В этом варианте места случаев рассматриваются в контексте либо набора контрольных местоположений, либо базовой плотности населения. Поиск кластера выполняется для определения областей, где количество случаев намного больше, чем можно было бы ожидать случайно. Необходимы два набора данных: (i) местоположения случаев (ii) местоположения контролей или соответствующие данные о плотности населения. Например, для всех европейских стран сетки населения можно загрузить с веб-сайта Евростата Европейской комиссии
[16]. (Для неевропейских стран решением может быть использование распределения плотности населения LandScan ™, см.
[18], но пользователь должен убедиться, что его / ее случаи и элементы управления проецируются в ту же сетку, что и для LandScan ™).

Развитие FGBASE было обусловлено программой поиска возможных факторов окружающей среды диабета типа 1 (T1D). Действительно, в ряде европейских стран заболеваемость T1D продолжает быстро развиваться и удвоилась с 80-х годов у детей в возрасте до 5 лет
[19]. Причина этого не может быть генетической, поскольку наблюдаемые изменения произошли за короткое время, когда генетическая структура населения не изменилась. В многочисленных исследованиях случайных исследований экологических ассоциаций с T1D были рассмотрены конкретные подходы к кандидатам-факторам (
[20-23]), но ни один фактор не получил дальнейшего признания в причинности T1D (
[24, 25]).

Население, используемое в этом примере, составлено среди участников «Изис-Диаб», постоянной проспективной когорты пациентов Т1D, завербованных с 2007 года сетью Изид-Диаб, состоящей из 99 диабетических центров, охватывающих почти все французские регионы (см. Описание и список участвующие центры в дополнительном файле
1: Таблица S1). Основной целью программы Isis-Diab является исследование взаимодействия окружающей среды и генной среды у пациентов с T1D. Критериями включения для текущего исследования были T1D, возникающие у детей в возрасте до 15 лет. T1D определяли в соответствии с Американской ассоциацией диабета
[26], и положительными аутоантителами к GAD, инсулину и / или IA2. Все изучаемые пациенты родились во Франции. Данные состоят из клинических, геномных и экологических воздействий. Здесь, в примере, показанном на примере гипотетического варианта FGBASE, мы не рассматриваем клинические и генетические характеристики пациентов, и мы фокусируемся на одном источнике загрязнения, описанном в следующем разделе.

Во Франции все промышленные загрязняющие отрасли зарегистрированы и должны предоставлять данные об загрязняющих выбросах, за которые они несут ответственность. Данные находятся в базе данных IREP (см.
[27]), в котором содержатся всеобъемлющие данные (= 93 809) об загрязняющих выбросах в отношении 159 зарегистрированных химических веществ. Набор данных состоит из трех таблиц базы данных. Первая таблица содержит список промышленных предприятий, таких как фабрики. (всего: n = 12 173) Каждый объект имеет числовой идентификатор (entityID), а также его географические координаты. Во второй таблице представлен список из 160 химических веществ, каждый из которых имеет числовой идентификатор (chemID). Третья таблица содержит полный перечень химических выбросов в течение 10 лет (с 2000 по 2009 год). Каждой эмиссии предоставляется ее дата, ее сущностьID и ее химия. Этот набор данных естественно вписывается в рамки пространственных сущностей, сгруппированных по классам. Здесь классы — зарегистрированные химические вещества (m = 160), и каждый класс связан с объектами, которые выбрасывают это химическое вещество. Объекты отображаются в сетке с использованием их географических координат.

Опция, зависящая от гипотезы: в гипотетических вариантах опций следует сравнивать с элементами управления. Здесь мы определили «виртуальные элементы управления», которые случайным образом перемещаются по Франции в местах сопоставимой плотности по сравнению с случаями. Силой этого метода является то, что определение элементов управления и проблемы выборки может быть устранено путем тиражирования алгоритма столько раз, сколько необходимо. В этом примере мы решили взять 100 серий из 4507 виртуальных элементов управления, причем каждая серия сравнивается со случаями. Алгоритм будет тестировать каждый класс отдельно, один за другим. Это обеспечивает более сильную статистическую мощность, но представляется классическим проблемам ложного обнаружения.

Используя опцию, основанную на данных, зоны, наиболее вероятные для кластеров случаев T1D, которые были обнаружены в окрестностях городов Гавр, Дюнкерк, Тулуза и Нант (см. Таблицу
1) .Таблица 1
Кандидатные кластеры случаев T1D, обнаруженные FGBASE, с использованием случаев из когорты Isis-Diab

Используя управляемую данными опцию программного обеспечения FGBASE, зоны, наиболее вероятно, будут кластерами случаев T1D, которые обнаружены вблизи городов Гавр, Дюнкерк, Тулуза и Нант.

Используя опцию, основанную на гипотезе, и исправление для множественных сравнений, загрязняющие химикаты в наборе данных IREP не показали статистически значимой связи с T1D.

SaTScan ™
[12] представляет собой программную программу, которая реализует статистику пространственного сканирования. Он очень широко используется (руководство пользователя SaTScan ™
[28] перечислить более сотни публикаций общественного здравоохранения, которые использовали его для получения результатов в широком спектре исследований). Несмотря на свою качественную и широкую базу пользователей, SaTScan ™ имеет ряд недостатков, которые гарантируют существование альтернативных программных инструментов, таких как FGBASE. Первый недостаток заключается в том, что, хотя SaTScan ™ свободно загружается, он не является открытым исходным кодом. Это сильно ограничивает его настраиваемость, поскольку пользователи не могут добавлять и изменять функции в соответствии с их потребностями. Например, мы (авторы) воспользовались возможностью настроить исходный код инструмента анализа геномного анализа с открытым исходным кодом Plink
[29], чтобы добавить определенные статистические тесты, которые нам нужны, но не были реализованы в исходном программном обеспечении. Другим преимуществом программного обеспечения с открытым исходным кодом является то, что через некоторое время пользовательский контроль исходного кода уменьшает количество ошибок и недостатков безопасности в программном обеспечении
[30]. Преимущества программного обеспечения с открытым исходным кодом в области географических информационных систем изучались в
[31].

Второй недостаток SaTScan ™ заключается в том, что он использует круги. Из руководства пользователя SaTScan ™
[28]: «С координатами широты / долготы, какая плоская проекция используется? Не используется проекция. SaTScan ™ рисует идеальные круги на сферической поверхности земли». Как обсуждалось в этой статье, использование кругов и вычислений расстояний, вычисляется намного медленнее, чем использование проекций сетки. Увеличение скорости SaTScan ™ за счет использования облачных сервисов было предложено в
[13], очевидно, что использование более быстрых алгоритмов является предпочтительным (и менее дорогостоящим) решением.

Третьим ограничением SaTScan ™ является отсутствие картографической продукции
[32], хотя это можно решить, хотя использование внешнего макроса
[32], интегрированная карта как таковая, доступная в FGBASE, повышает простоту использования при просмотре кластеров. Наконец, четвертое ограничение SaTScan ™ заключается в том, что он касается только кластерных поисков, а не тестирования факторов окружающей среды. Объединив оба типа анализов (поиск кластеров и тестирование факторов окружающей среды) в одном программном обеспечении, FGBASE облегчает интерпретацию кластеров с точки зрения факторов окружающей среды (как кластеры, так и факторы окружающей среды отображаются на одной карте).

Алгоритм, основанный на гипотезе, основанный на сетке, описанный в этой статье и реализованный в сопутствующем программном обеспечении (FGBASE), хорошо подходит в случае факторов окружающей среды, которые могут быть расположены в определенных точках. При выборке кривых и поверхностей в виде наборов точек они также хорошо обрабатываются. Ключевым аспектом является то, что изучаемые факторы окружающей среды должны иметь двоичный характер, другими словами, в любом данном месте фактор должен присутствовать или отсутствовать. Это касается фабрик, линий электропередач, автомагистралей и полей конкретных культур. Это не относится к факторам непрерывного характера, таким как температура, атмосферные концентрации данного газа или частицы или ультрафиолетовый индекс.

Грид-алгоритмы для интеллектуальных пространственных эпидемиологических данных обеспечивают преимущества с точки зрения сложности вычислений и повышения скорости вычислений. Эта работа начинается с изучения подходящих географических сетей и прогнозирования эпидемиологических данных для такой сетки. На основе этой структуры внедряются алгоритмы интеллектуального анализа данных, которые позволяют использовать подход, основанный на данных, и подход, основанный на гипотезах. Эти алгоритмы позволяют быстро обнаруживать кластеры случаев, а также тестирование конкретных факторов окружающей среды. Новый программный инструмент с открытым исходным кодом (FGBASE), реализующий эти алгоритмы, представлен вместе с тематическим исследованием его использования в когорте «Isis-Diab» французских случаев T1D. Мы надеемся, что эти методы и этот программный инструмент (FGBASE) уменьшат вычислительные барьеры для входа для тех, кто проводит эпидемиологические исследования.

Доступ к FGBASE можно получить в
http://www.fgbase.org.

Дополнительный файл 1: Таблица S1: Список 95 диабетических центров, участвующих в сети Isis-Diab, в алфавитном порядке. Исследование Isis-Diab координируется подразделением INSERM 986. Основными исследователями исследования Isis-Diab являются Pierre Bougnères и Alain-Jacques Valleron (см.
http://www.isis-diab.org/ для интерактивной карты, показывающей географическое перераспределение центров и количество пациентов, за которыми следует каждый центр). (DOCX 74 KB)

Конкурирующие интересы

Авторы заявляют, что у них нет конкурирующих интересов.

Вклад авторов

DB и AJV разработали метод на основе сетки и программное обеспечение FGBASE. DB реализовала программное обеспечение FGBASE. DB и AJV написал рукопись и утвердил окончательную версию рукописи.

Это исследование было поддержано грантом MRES-PRNPE-1-CVS-014 (Министерство окружающей среды Франции и Программа Hospitalier de Recherche Clinique Министерства здравоохранения Франции (AOM08049), Inserm, Лаборатория NovoNordisk. Мы признаем участие педиатры диабетических центров, вносящие вклад в когорту Isis-Diab (см. список участвующих центров в дополнительном файле
1: Таблица S1). Мы с благодарностью благодарим Софью Меуриссе за геокодирование пациентов. Мы благодарим пациентов и родителей, которые участвовали в исследовании. Наконец, мы хотели бы поблагодарить двух анонимных рецензентов за их полезные комментарии и предложения.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *