Нажмите "Enter", чтобы перейти к контенту

Моделирование распространения лихорадки Западного Нила и Лихорадки долины Рифта Culex pipiens в засушливых и полузасушливых регионах Ближнего Востока и Северной Африки

Modeling the distribution of the West Nile and Rift Valley Fever vector Culex pipiens in arid and semi-arid regions of the Middle East and North Africa
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4077837/

Регион Ближнего Востока Северной Африки (MENA) находится под постоянной угрозой повторного появления вируса Западного Нила (WNV) и вируса лихорадки Рифт-Валли (RVF), двух патогенов, передаваемых векторным видом Culex pipiens. Прогнозирование областей с высоким риском передачи болезни требует точной модели распределения векторов, однако, большинство Cx. Моделирование распределения пипинов ограничивалось умеренными, лесистыми местообитаниями. Моделирование распределений видов по гетерогенной ландшафтной структуре требует гибкого метода моделирования, позволяющего фиксировать вариации реакции комаров на предикторах, а также точки данных возникновения, взятые из достаточного диапазона типов мест обитания.

Мы использовали данные о присутствии только из Египта и Ливана для моделирования распределения населения Cx. пипьяны через часть БВСА, которая также охватывает Иорданию, Сирию и Израиль. Модели были созданы с набором экологических прогнозов, включая биоклиматические данные, плотность населения, гидрологические данные и индексы растительности, а также построены с использованием методов максимальной энтропии (Maxent) и усиленного регрессионного дерева (BRT). Модели были созданы с учетом и без учета плотности населения.

Прогнозы моделей Maxent и BRT были сильно коррелированы в местах обитания с высокой вероятностью возникновения (Pearson’s r = 0.774, r = 0.734) и более умеренно коррелировали при прогнозировании в областях, которые превышали диапазон данных обучения (r = 0,666, r = 0,558). Все модели соглашались на прогнозирование высокой вероятности заселения вокруг крупных городских районов, вдоль берегов Нила, долин Израиля, Ливана и Иордании и юго-западной Саудовской Аравии. Самые мощные предсказатели Cx. (80,6% Maxent моделей, 34,9% моделей BRT) и сезонности индекса растительности (EVI) (44,7% Maxent, 16,3% BRT). В моделях Maxent преобладал один предиктор. Области с высокой вероятностью соответствуют местам независимых обследований или предыдущих вспышек заболеваний.

Cx. появление пипинов было положительно связано с районами с высокой плотностью населения и постоянным растительным покровом, но не было в значительной степени обусловлено температурой и количеством осадков, предполагая, что изменение среды обитания человека, такое как ирригация и городская инфраструктура, оказывает большее влияние на распределение частиц в этом регионе, чем в умеренных зонах.

С быстро растущим городским населением последние движения беженцев, внутреннее перемещение и широкомасштабные гражданские беспорядки, части Ближнего Востока становятся все более уязвимыми перед переносчиками болезней (ВБД). Рост городов, в частности, расширился быстрее, чем предложение доступного жилья и вспомогательной инфраструктуры, в результате чего значительная часть населения живет в антисанитарных условиях, что может увеличить подверженность людей укусам зараженных векторов, которые размножаются в городских условиях [1- 4].

До недавнего периода гражданских конфликтов в регионе наблюдалось появление и возрождение двух смертельных заболеваний. Вирус лихорадки долины Рифт вызвал эпидемию в Египте в 1977, 1993 и 2003 годах и попал в Саудовскую Аравию и Йемен в 2000 и 2001 годах [5-7]. Кроме того, вирус «Западный Нил», почти «забытая» болезнь, вновь возникла в результате серьезной эпидемии в масштабах всей страны в Израиле в 2000 году с коэффициентом смертности 8,4% [8]. В период с 2010 по 2012 год в Израиле было зарегистрировано 200 случаев в Западном Ниле [9]. Хотя причины недавнего возрождения забытых тропических болезней, таких как вирус Западного Нила, вирус лихорадки долины Рифт и лейшманиоз, не полностью поняты, это является причиной возобновления интереса и повышенного внимания к динамике заболеваний в регионе [2,10,11] ,

Молекулярные и эпидемиологические исследования показали, что Cx. pipiens — это вектор вируса лихорадки долины Рифт и вируса Западного Нила [6,12-16]. Он предпочитает жить вблизи районов с высокой плотностью населения и размножаться в искусственных контейнерах, обильно находящихся в непосредственной близости от населенных пунктов [17,18] или загрязненных водоемов, связанных с деятельностью человека [19-22]. Этот вид также питается оппортунистически от широкого круга хозяев крови [23,24] и активен почти круглый год [21]. Эта обширная экологическая пластичность делает ее потенциально значимым вектором. Таким образом, понимая распределение Cx. pipiens во всем регионе является фундаментальным требованием для понимания динамики передачи.

Модели пригодности Хабитат для Cx. пипины в целом определили количество осадков, температуры и растительности в качестве основных факторов распределения населения [25,26]. Было также установлено, что плотность хозяев значительно коррелирует с пригодностью среды обитания для родственных видов [27]. Однако эти исследования в основном проводились в разных климатических регионах, чем те, которые доминируют в регионе MENA, и поэтому идентифицированные предиктора не обязательно будут объяснять распределение векторов в засушливых и полузасушливых регионах. Оценщики окружающей среды будут наиболее информативными в масштабах и регионах, где они обладают достаточной гетерогенностью, чтобы точно различать подходящие из непригодной среды обитания. Относительные информационные значения предикторов сдвигаются по мере изменения климатических условий, а также характер и идентичность наиболее значимых отношений между вектором и средой обитания в модели. В Египте климатические переменные, такие как температура окружающей среды, относительная влажность и скорость ветра, существенно не отличают участки с высокой и низкой передачей филяриоза, векторизованные Cx. pipiens, что положительно коррелировало с температурой и отрицательно коррелировало с осадками [28]. В Австралии критические климатические факторы для прогнозирования вспышек вируса реки Росс значительно различаются между различными регионами окружающей среды в одном государстве [29]. Моделирование моделей Cx. quinquefasciatus через южные Соединенные Штаты выявили значительно различную чувствительность популяций комаров к температуре и осадкам в засушливых и влажных местах обитания [30].

Целью настоящей работы является исследование взаимосвязи между распределением Cx. пипьянов и окружающей среды на Ближнем Востоке, а затем выводят поверхности распределения векторов. Соответственно, мы использовали данные, собранные из широкого круга мест обитания в регионе, и две разные, но надежные модели распространения видов присутствия (SDM), Maxent и усиленные деревья регрессии (BRT). В моделях изучалась роль популяций человека, климатических, гидрологических и растительных параметров при прогнозировании пригодности местообитаний.

Чтобы укрепить уверенность в прогнозировании Cx. pipiens мы включили два подхода к моделированию, максимальную энтропию, реализованную в программном обеспечении Maxent, и увеличенные деревья регрессии. Регрессионные модели являются мощными инструментами для выбора соответствующих предикторов и моделирования сложных взаимодействий, в то время как ускорение позволяет избежать проблем с неправильной классификацией, присущих единой модели дерева. Таким образом, наши комбинированные модели позволят мощный выбор релевантных предикторов и точное моделирование сложных взаимодействий. Ранее обсуждавшиеся неравномерные отношения между другими видами Culex и критическими климатическими факторами [30] предполагают, что такие взаимодействия могут существенно влиять на Cx. pipiens. Таким образом, использование модельных взаимных сравнений приводит к большей уверенности в предсказаниях распределения. Использование Maxent, поскольку наш альтернативный метод позволяет сравнивать с предсказаниями одной из наиболее знакомых и часто применяемых методов моделирования только присутствия [31-34].

Максимальная энтропия — это алгоритм машинного обучения, который дает прогнозы пригодности среды обитания, сравнивая условную плотность предикторов на местах присутствия с предельной плотностью предикторов в исследуемой области. Сырой выход Maxent является вероятностью пригодности среды обитания [35,36]. Чтобы сделать вывод модели более интерпретируемым, Maxent преобразует экспоненциальные значения своей исходной оценки оценки пригодности среды обитания в логистический вывод, который представляет оценку вероятности наличия [37].

Усиленные деревья регрессии предсказывают значение целевой переменной на основе значения нескольких входных переменных. Boosting использует алгоритм машинного обучения для создания модели конечного предсказания, которая представляет собой совокупность слабых моделей прогнозирования, в данном случае ансамбль деревьев регрессии. Модель построена поэтапно; дерево регрессии подходит к исходным данным, тогда остатки этой модели становятся новыми значениями данных, к которым подходит второе дерево, и так далее. При подгонке каждого последующего дерева в модели к остаткам предыдущего дерева данные становятся повторно взвешенными на каждой итерации. Очки, которые были неправильно классифицированы предыдущей моделью, теперь будут иметь больше веса, чем значения, которые были классифицированы правильно. В результате последующее дерево будет сосредоточено на подгонке этих ошибочно классифицированных точек. Процесс обусловлен скоростью обучения, которая контролирует вклад каждого дерева в конечную модель.

Конечная модель может состоять из тысяч деревьев, однако модели с избыточным коэффициентом преувеличивают незначительные колебания в данных, делая их слабыми предикторами. Усиленная регрессия использует кросс-валидацию, чтобы свести к минимуму переуплотнение, определяя, когда добавление дополнительных деревьев больше не улучшает прогнозирующую производительность и выбирает оптимальное количество деревьев.

Предиктивная ошибка измеряется как остаточная зависимость Бернулли между прогнозируемыми значениями модели и наблюдаемыми значениями тестовых данных. Все модели BRT установлены в R, используя библиотеки «gbm» и «demo» [38-40].

В интересующей нас области исследований (рис. 1) основное внимание уделяется примерно 5 миллионам квадратных километров региона MENA, который охватывает Египет, Израиль, Ливан, Сирию, Иорданию, а также значительную часть Турции, Саудовской Аравии и Ирака.

Месторасположение образцов
              
Culex pipiens

              ,

Cx. pipiens — наиболее распространенные виды москитов в мире и два биотипа Cx. pipiens L. присутствуют в нашей области исследования, автогенные и аутогенные биотипы. Эти биотипы москитов размножаются в перекрывающихся нишах и легко гибридизуются в областях, где они сосуществуют [41]. В Египте как аутогенная, так и автогенная Cx. пипины встречались в потомстве аутогенных или anautogenous женщин-родителей, и более 75% женщин, пойманных на поле, производили смешанные потомства [42].

Cx. pipiens — самый распространенный москит в Ливане, собранный как в помещении, так и на открытом воздухе. Активный и обильный круглый год, он антропофильный, эндофагий и эндофилл [21]. Этот вид очень поведенчески пластичен, а Cx. Пипены в мухафазе Аль-Шаркия в дельте Нила в Египте также демонстрируют эндофагическое и в первую очередь антропофильное поведение [24], наблюдалось, что комары в соседнем мухафазе переходят от внутреннего к наружному питанию с сезонными сдвигами температуры и скорости ветра [43]. Женщины будут питаться от самых разных хозяев, включая лошадей, коров, овец, собак, кошек, людей и крыс [23].

Cx. пипсенс в воде с высоким содержанием органического вещества [41]. В местах ливанского гнездования для Cx. pipiens включают контейнеры, размер которых варьируется от небольших банок, заполненных водой до бассейнов сада и оросительных канав [21]. В городской среде Каира распространены размножающиеся места обитания для Cx. pipiens — выгребные ямы, дренажные каналы, источники, выгребные ямы и оросительные канавы [22].

Данные о тренингах как из Египта, так и из Ливана были включены для максимизации выборки из диапазона окружающей среды видов, от горячего и гипераридного до холодного и субгумидного. Этот диапазон образцов максимизирует комбинации факторов окружающей среды, используемых при калибровке моделей, увеличивая их интеллектуальную мощность [44,45].

Записи о происшествии для Cx. pipiens были получены из ранее неопубликованных векторных обследований в Египте и Ливане (рисунок 1). Образцы для взрослых из Ливана были собраны летом 2009 года. Методы включали легкие ловушки CDC с аттрактантом сухого льда и ловушки BG-дозорного с феромоновым аттрактантом. Ловушки были помещены в наружную и внутреннюю среду обитания в 17:00 и собраны следующим утром. В дополнение к взрослой выборке, личиночные стадии москитов отбирались в летние месяцы 2002 и 2003 годов. Образцы собирали по классическому методу окунания с использованием белого лотка и / или ковша из искусственных и естественных мест разведения, включая болота, пруды, берега рек , ирригационные резервуары и резервуары для хранения воды. Координаты для мест отбора проб были получены из Google Earth и GPS. Взрослые образцы были закреплены, а личиночные образцы 4-го возраста были установлены на слайдах и идентифицированы морфологически с использованием локальных и региональных идентификационных ключей [46]. Записи об инцидентах из Египта (Gad, неопубликованные данные) были собраны с использованием аналогичных методов в рамках общенационального опроса.

Мы рассмотрели двадцать четыре переменных окружения в качестве потенциальных предикторов Cx. пипиен (табл. 1). Температура и осадки были представлены 19 переменными набора данных WorldClim [47]. Качество растительного покрова описывалось стандартным отклонением, средним и максимальным значениями расширенного индекса растительности (EVI), полученным из изображений спектрорадиометра с умеренным разрешением (MODIS) от Terra Satellite за 2001 год. EVI обеспечивает меру фотосинтеза активности или ландшафтной зелени и, следовательно, захватывает такие элементы растительности, как площадь листьев, покрытие купола, ресурсы сахара, которые могут обеспечить места отдыха и альтернативные источники пищи для этого векторного вида [48-50]. Поскольку доступная почвенная вода ограничивает первичную продуктивность в исследуемом регионе, средний и максимальный EVI обычно коррелирует с ежегодным количеством осадков, тогда как стандартное отклонение EVI обеспечивает меру сезонности растений, которая контролируется различными факторами, включая температуру, длину дня, инсоляции, орошения и биотических факторов [51]. Дополнительный ковариат, связанный с потенциальной средой для размножения векторов, был получен из топографических данных, индекс топографической влажности (TWI), который описывает тенденцию сбора воды в районах топографических минимумов [52]. Поскольку информация о распределении хостов значительно улучшает модели распределения москитов [53] и Cx. pipiens адаптирован к размножению и кормлению в измененных человеком ландшафтах, мы также включили плотность населения человека в качестве предиктора, используя данные Landscan ™ 2010. Уровни окружающей среды были привязаны к пространственному разрешению приблизительно 1 км (926,63 м), масштаб, который был захвачен как можно большему количеству гетерогенности окружающей среды в пределах возможностей компьютерной обработки.

Источники данных экологических предикторов, используемых в моделях распространения видов

1WorldClim Глобальная климатическая база данных v1.4, доступна по адресу: http: //www.worldclim.org/ {доступна 28/8/2013}.

2Moderate Resolution Imaging Spectrometer (MODIS), доступный по адресу: https://lpdaac.usgs.gov/ {доступ к 28/8/2013}.

3LandScan (2010) ™ Глобальный набор данных о населении, защищенный авторским правом UT-Battelle, LLC, оператора Национальной лаборатории Oak Ridge по контракту DE-AC05-00OR22725 с Министерством энергетики Соединенных Штатов.

4Global Land Survey Digital Elevation Model (GLSDEM), доступный по адресу: http://www.glcf.umd.edu/data/glsdem/ {доступ к 28/8/2013} (данные о высоте входа, установленные в GLSDEM для исследовательской зоны, — это ракета-носитель Shuttle Топографическая миссия (SRTM)).

Источники данных экологических предикторов, используемых при построении моделей распространения видов. Все слои были привязаны к пространственному разрешению 926,63 м и проецировались в синусоидальную проекцию MODIS.

Данные присутствия: все точки расположены как положительные для Cx. в качестве мест присутствия во всех моделях были включены опросы pipiens из Египта (n = 239) и Ливана (n = 83) (рис. 1).

Исходные данные. Оба метода ускоренной регрессии и максимальной энтропии прогнозируют области с высокой вероятностью наличия условий, подходящих для целевых видов, путем сравнения значений прогнозирующих факторов окружающей среды в местах присутствия с значениями тех же самых предсказателей при наборе случайных «фоновых» значений, местоположения, которые представляют диапазон доступных значений окружающей среды [54]. Поскольку наши данные, как и многие наборы данных присутствия [55, 56], показали сильное смещение в усилиях по выборке, мы выбрали фоновые точки с тем же географическим смещением, что и данные вхождения (дополнительный файл 1).

Независимый набор данных 79 Cx. Пыпсиен, 23 из Израиля и 56 из Египта [57], использовались для оценки точности предсказаний модели (дополнительный файл 2: рисунок S1). Эти данные использовались во всех расчетах данных Maxent.

Плотность населения человека может быть сильным предиктором Cx. среда обитания пипинов [53, 58]. Однако из-за того, что места проведения исследований по первоначальным исследованиям находились в непосредственной близости от населенных пунктов, плотность населения также является сильным предиктором отбора проб. Чтобы контролировать это, мы дважды запускали весь процесс моделирования; один раз на полный набор переменных окружения (N = 24) и один раз с использованием всех переменных окружающей среды, кроме плотности населения (N = 23). В том числе плотность населения позволяет нам исследовать относительное влияние важного социально-экономического фактора окружающей среды, в то время как исключение людей позволяет нам самим изучить биофизические факторы окружающей среды.

Для повышения интерпретируемости моделей оба набора предикторов были уменьшены с помощью функции «gbm.simplify», которая создает BRT-модели с любой возможной комбинацией начальных предикторов и на основе минимизации предсказательной ошибки ранжирует предикторов от большинства до наименее влиятельных и определяет оптимальный набор предикторов [59].

Модели BRT с использованием сокращенных наборов предикторов были установлены с использованием скорости обучения 0,05, сложности дерева 5, фракции мешка 0,75, 10-кратной проверки перекрестной и функции потери Бернулли. Все остальные параметры остались по умолчанию. Прогнозы в географическом пространстве были сделаны в R с использованием «растрового» пакета [60].

Модели Maxent с использованием сокращенных наборов предикторов были установлены с использованием Maxent v 3.3.3 k [61]. Пространственные предсказания модели были «зажаты», функция Maxent, которая уменьшает значение прогнозов при экстраполяции в области пространства параметров, которые превышают диапазон значений, присутствующих в данных обучения. Окончательная модель была средней логистической мощностью 10 повторений процесса моделирования. Дополнительные особенности спецификаций программ можно найти в дополнительном файле 1.

Модели Maxent оценивались с использованием площади под рабочей характеристической кривой приемника (AUC), скорректированного информационного критерия Aikaike (AICc) и коэффициента пропускания. Модели BRT оценивались с использованием AUC, точечной бисериальной корреляции (COR) и отклонения от Bernoulli. Поскольку эти два метода используют разные контрольные точки для внутренних показателей производительности модели, то бисериальная корреляция точек была также рассчитана для всех моделей с общим набором из 158 точек из 79 мест присутствия теста и 79 случайных фоновых точек (дополнительный файл 2: Рисунок S1). Коэффициент корреляции Пирсона использовался для измерения того, насколько точно согласованы прогнозы между этими двумя методами. Соглашение сравнивалось в «учебном регионе», используя общие 158 пунктов, а также «расширенный регион» из 158 пунктов, взятых из всей протяженности модели (дополнительный файл 2: рисунок S1).

Прогнозируемые карты подходящих Cx. пипсины представлены на рисунках 2, 3, 4 и 5. В целом, модели с максимальной энтропией предсказали более широкое распределение подходящей среды обитания, чем ускоренные методы регрессии, что привело к значительно более консервативным предсказаниям степени подходящей среды обитания и меньшей вероятности присутствия. Однако относительная пригодность мест обитания была согласована между моделями: области с наивысшей пригодностью, идентифицированные BRT, также были областями с наивысшей пригодностью, выбранными максимальной энтропией.

Макс. Поп. Вероятность присутствия Culex pipiens на основе модели распределения видов, сгенерированной с использованием максимальной энтропии, и набора экологических прогнозов (N = 9), включая плотность населения. Пригодность Хабитат была преобразована в вероятность наличия, при условии, что показатель распространенности равен 0,5. Внизу: увеличено, чтобы показать населенные пункты.

Maxent No Pop. Вероятность присутствия Culex pipiens на основе модели распределения видов, сгенерированной с использованием максимальной энтропии, и набора экологических предсказателей (N = 14), которые не включают плотность человеческой популяции. Пригодность Хабитат была преобразована в вероятность наличия, при условии, что показатель распространенности равен 0,5. Внизу: увеличено, чтобы показать населенные пункты.

BRT Pop. Вероятность присутствия Culex pipiens на основе модели распределения видов, сгенерированной с использованием деревьев с повышенной регрессией, и набора экологических прогнозов (N = 9), который включает в себя плотность человеческой популяции. Внизу: увеличено, чтобы показать населенные пункты.

BRT No Pop: Вероятность присутствия Culex pipiens на основе модели распределения видов, сгенерированной с использованием деревьев с повышенной регрессией, и набора экологических прогнозов (N = 14), который не включает плотность населения. Внизу: увеличено, чтобы показать населенные пункты.

Все четыре модели согласуются с предсказанием умеренной и высокой вероятности Cx. присутствующих в нескольких отдельных местах обитания: вдоль берегов Нила и всей дельты Нила на всех равнинных равнинах Израиля, Ливана и Сирии, а также долины Восточного Ливана и вдоль иорданской границы Израиля (рис. 2, 3, 4 и 5). В моделях, построенных с использованием данных популяции человека (рис. 2 и 4), места обитания с наибольшей вероятностью присутствия были обнаружены вблизи крупных населенных пунктов. Модели BRTPop и MaxentPop также указывают на умеренную вероятность присутствия вдоль берегов рек Тигр и Евфрат. Модели, построенные без демографических данных (рис. 3 и 5), предсказывали большую вероятность присутствия в полузасушливом регионе Центральной Анатолии Турции, равнине Джазира в северо-восточной части Сирии и Северном Ираке и болотах южного Ирака, чем модели с участием населения , Однако большая часть Ирака и Восточной Турции занимает область экологического пространства, которая выходит за рамки учебных данных (дополнительный файл 2: рисунки S3 и S4), поэтому прогнозы в этих областях следует интерпретировать осторожно.

Метрики оценки для моделей Maxent и BRT представлены в таблицах 2 и 3. Среди моделей Maxent оба набора предикторов выполнялись хорошо, причем значения AUC значительно превышали нулевую модель. Тестируемые значения AUC для обоих наборов предикторов были меньше, чем значения AUC тренировки, что указывает на незначительную переоценку моделей. Эта разница была меньше для модели, созданной без демографических данных. Модель «NoPop» также имела более высокое значение AUC теста, большую энтропию и меньшую пропускную способность, чем модель, которая включала популяцию. Модель с охватом населения была ниже AIC, чем модель «NoPop».

Параметры оценки для моделей распространения видов, построенных с использованием данных о населении

1 Источники данных, используемые для разработки моделей: Bioclim + Vegetation + Population (N = 24).

Источники 2Data, используемые для разработки модели: Bioclim + Vegetation (N = 23).

3Используется равная тестовая чувствительность и порог специфичности. Maxent Pop threshold = 0,22, Maxent Нет Порог порога = 0,34.

Параметры оценки для моделей распределения Culex pipiens, сгенерированных с использованием набора экологических прогнозов, включая плотность населения («Maxent Pop») и набор, исключающий плотность населения («Maxent No Pop»). Модели были построены с использованием 322 точек присутствия. Параметры «Null Model» представляют собой среднее значение моделей, построенных из ста 322-точечных фиктивных наборов данных. «Тест AUC» и «Частота пропуска» рассчитываются из независимого набора данных из 79 точек присутствия, не используемых при обучении моделей. «Test COR» и «Test Deviance» рассчитываются из набора данных, который включает 79 тестовых точек данных и 79 фоновых точек. «Test COR» = коэффициент корреляции Пирсона.

Параметры оценки для моделей распространения видов, за исключением данных о численности населения

1 Источники данных, используемые для разработки моделей: Bioclim + Vegetation + Population (N = 24).

Источники 2Data, используемые для разработки модели: Bioclim + Vegetation (N = 23).

Параметры оценки для моделей распределения Culex pipiens, сгенерированных с использованием деревьев с повышенной регрессией, из набора экологических прогнозов, включая плотность населения («BRT Pop») и набор, исключающий плотность населения («BRT No Pop»). Модели были построены с использованием 322 точек присутствия и оценивались с использованием 10-кратной перекрестной проверки. «CV AUC» и «CV Deviance» — это область под кривой (AUC) и отклонение Bernoulli, оцененное на удержанном наборе данных. «Тест COR» и «Test Deviance» рассчитываются по прогнозируемым значениям модели в 79 независимых точках возникновения, которые не используются при обучении режиму, и 79 фоновых точек из того же региона. «Test COR» = коэффициент корреляции Пирсона.

Модифицированные модели регрессии также хорошо зарекомендовали себя, а также продемонстрировали степень переустановки, аналогичную моделям Maxent. Среди моделей BRT модели с участием населения были несколько лучше, чем модели «NoPop» в тестовых данных, с более высокими значениями AUC с перекрестной проверкой, более высокими значениями COR с перекрестной проверкой и более низкими критериями оценки отклонения.

При оценке по стандартному набору точек модель Maxent «NoPop» имела самую сильную корреляцию (COR = 0,534) между предсказаниями модели и наличием / отсутствием отсутствия, модель BRT NoPop и Maxent с участием населения была одинаково хорошо реализована, а BRT модель с участием населения имела самую слабую корреляцию (COR = 0,413) четырех оцениваемых моделей.

При оценке по области обучения предсказания моделей Maxent и BRT были очень сильно коррелированы, а модели, включая данные о населении, более тесно коррелировали, чем модели, которые его исключили (рисунок 6). При оценке по всей смоделированной области корреляция между моделями была слабее.

Корреляция между прогнозами моделей распределения Culex pipiens, созданных с использованием алгоритмов усиленной регрессии (BRT) и максимальной энтропии (Maxent). «Область обучения» состоит из 158 точек, взятых из одной и той же географической области, к образцам, использующим здание модели, 79 фоновых точек и 78 независимых точек появления. «Расширенная область» измеряет модельное соглашение во всей моделируемой степени и сравнивает значения в 158 случайных точках, взятых с равной вероятностью по всей модели. Левые панели описывают модели, построенные с использованием плотности населения человека в качестве параметра (N = 9). Панели справа описывают модели, исключающие плотность населения (N = 14). COR = коэффициент корреляции Пирсона.

Уменьшение параметров полного набора предикторов (n = 24) привело к упрощению набора из 9 значимых предикторов. (Таблица 4). Уменьшение параметров полного предикторного набора, исключающего плотность населения (n = 23), привело к упрощению набора из 14 значимых предикторов (таблица 5).

Вклад экологических параметров в SDM, включая данные о людских популяциях

Вклад экологических параметров (таблица 1) в модели распределения видов для Culex pipiens, сгенерированных с использованием методов повышения регрессионных деревьев (BRT) и максимальной энтропии (Maxent).

Вклад экологических параметров в SDM, за исключением данных о людских популяциях

* Экологические характеристики, не используемые в модели с участием населения (Таблица 4).

Вклад экологических параметров (таблица 1) в модели распределения видов для Culex pipiens, сгенерированных с использованием деревьев с повышенной регрессией («BRT») и максимальной энтропии («Maxent»).

Обе методики моделирования выбрали аналогичные переменные, как наиболее важные экологические факторы, влияющие на распределение видов. Население было крупнейшим отдельным автором модельных прогнозов, которые оказались наиболее влиятельными как у BRT (34,9%), так и Maxent (60,6%).

В моделях, созданных без плотности населения, переменной с самым большим вкладом было стандартное отклонение расширенного индекса растительности (EVI). Среднее значение EVI также было высоко оценено во всех моделях и во всех наборах данных.

Наши модели показали сильное согласие между усиленной регрессией и максимальными энтропийными методами в выборе среды обитания с наивысшей вероятностью появления Cx. pipiens. Высокие значения AUC для всех четырех моделей показали, что местам размещения, вероятно, будет присвоена более высокая вероятность присутствия, чем фоновые сайты, независимо от метода. Сильная корреляция между выходами BRT и Maxent в областях с высокой долей известных Cx. среда обитания пипинов указывает на то, что модели полностью согласуются с потенциально опасными областями. Эти районы включали населенные районы в дельте Нила, долины Израиля, Ливана и Иордании, а также юго-западную Саудовскую Аравию.

Наши предсказания модели поддерживаются соглашением между прогнозируемыми областями с наивысшей вероятностью Cx. появление пипинов и недавние положительные векторные обследования или вспышки связанных с вектором заболеваний. Регионы Центрального Израиля, предсказанные нашими моделями, являются областями с высокой вероятностью Cx. присутствие пипинов соответствовали районам с наибольшей распространенностью вируса Западного Нила во время вспышки 2000 года [8]. Аналогично, регион с наивысшей вероятностью занятости в Саудовской Аравии соответствует последним коллекциям Cx. pipiens [62-64] и заболеваемость инфекцией во время вирусной эпидемии лихорадки долины Рифт в 2000 году [65]. Распределение подходящих Cx. место обитания пипинов в Саудовской Аравии представляет особый интерес из-за высокого потенциала повторного ввоза болезней в страну через большое количество паломников, путешествующих на ежегодный хадж [66]. Город Джидда дважды был поражен эпидемиями денге непосредственно после хаджа [67]. Наши результаты показывают, что эта же область является подходящей средой обитания для поддержки Cx. пипины и потенциально способны передавать вирус Западного Нила, если он будет повторно введен.

Согласование между предсказаниями модели было менее коррелировано при оценке по всему региону, включая области, в которых модели должны были экстраполироваться. Это результат различного поведения каждого алгоритма в экстремальных средах [68]. Maxent при зажатии экстраполирует в горизонтальной линии от подгонки до самого экстремального значения в данных обучения. BRT, который не использует зажим, экстраполируется с постоянным значением из последнего известного сайта. Эта разница в экстраполяции также может быть замечена в пространственных предсказаниях популяционно-эксклюзивных моделей при прогнозировании в самых разных областях модельного региона. БРТ присваивает более высокую относительную вероятность заселения среды обитания в северном Ираке и на юге Сирии, классифицируя площадь с вероятностью заселения, аналогичной той, что расположена в долине реки вдоль границы между Израилем и Иорданией. Модель Maxent, которая более жестко ограничивает его прогнозы, предсказывает гораздо более умеренную вероятность занятости. Такая же относительная переоценка алгоритма БРТ не столь очевидна в модели с участием населения, так как экологический предиктор, который больше всего превосходит свои учебные значения в этом регионе, является температурной сезонностью, которая не была столь же влиятельной, как предиктор в совокупности моделей, как это было в популяционных эксклюзивных моделях. Влияние зажима все еще можно увидеть в модели Maxent с участием населения. Преимущество использования двух разных методов моделирования — наша способность обнаруживать области пространства параметров, где выбор базового алгоритма моделирования оказывает наибольшее влияние на силу прогнозов. Результаты в этих областях должны интерпретироваться более осторожно, чем области, в которых обе модели согласны.

Методы моделирования, основанные только на присутствии, такие как те, которые используются в этом исследовании, делают предположение, что целевой вид одинаково обнаруживается во всех средах обитания [35]. Однако, если вероятность обнаружения выборки зависит от одного или нескольких прогнозирующих факторов окружающей среды, наша модель не будет различать среду обитания с более высокой вероятностью занятости и местообитания с большей обнаруживаемостью. Абсолютные значения прогнозов следует интерпретировать с осторожностью с учетом этого ограничения. Предсказания также должны оцениваться с учетом того, что модели только для присутствия обрабатывают плотно и редко занимаемые сайты одинаково, так как входные данные являются двоичными.

Чтобы эффективно прогнозировать распределение видов в исследуемой области, мы должны были урезать разрешение экологических предикторов до 1 км. Важно иметь в виду, что это может быть более чем оптимальный масштаб для изучения взаимосвязи между векторами и некоторыми предикторами с очень мелкой неоднородностью по шкале [25, 69].

Наше исследование уникально в своей цели определения основных экологических предикторов, управляющих Cx. pipiens через климатический градиент, который охватывает гиперсухие и субгумидные среды обитания. Новые аспекты наших выводов — это важность плотности населения и сезонности индексов растительности как мощных предикторов Cx. пипиенс.

Плотность населения человека была идентифицирована с помощью обоих методов моделирования как наивысший способствующий предиктор для пригодности среды обитания. Интерпретация этого результата сложна, потому что области плотного человеческого обитания могут быть благоприятными для комаров по нескольким причинам. Люди — это виды-хозяева, их жилища также обеспечивают защищенную зону отдыха, а в сельских районах деятельность человека, такая как ирригация и сельское хозяйство, также может обеспечить благоприятную среду обитания и нечеловеческие хозяева. Условия размножения москитов также благоприятны в трущобах, где высокая плотность населения сочетается с плохой инфраструктурой и неадекватными услугами [70]. Характеристика среды обитания москитов в городском Каире показала, что 93,5% гнездовых участков были обнаружены в районах трущоб, характеризующихся неполным строительством, дезорганизованными дорогами и плотными условиями [71]. Социально-экономические условия также были существенно связаны с Cx. пигментов в Вашингтоне, хотя в северном умеренном регионе отношения были отменены, места размножения были положительно связаны с наличием функциональных контейнеров, таких как цветочные горшки и ведра для мусора, которые были обнаружены прежде всего в районах с более высоким социально-экономическим статусом [27].

Наши результаты показывают, что качество и сезонность растительности являются мощным предиктором Cx. пипины в засушливых и полузасушливых местообитаниях. Связь между Cx. появление пипсинов и качество растительности были сильно положительно связаны с максимальной величиной расширенного индекса растительности (EVI) и отрицательно связаны со средним и стандартным отклонением (сезонностью) EVI. Это говорит о том, что в нашем регионе исследования высокое качество Cx. среда обитания пипинов состоит из районов с высокой первичной продуктивностью, которые сохраняют это качество среды обитания с очень небольшим изменением в течение года. В сельских районах Египта круглогодичное орошение поддерживает именно этот вид среды обитания. Индексы растительности не всегда являются наиболее информативными предикторами в регионе, в исследовании, изучающем другой Cx. Инфекция, связанная с пипсинами, филяриоз, Нормированный разброс индекса растительности не проводил различия между египетскими деревнями при высоком и низком риске заражения [72]. Положительная связь между Cx. pipiens и стабильные области высокой первичной производительности, предложенные нашими результатами, противоположны отношениям, наблюдаемым в лесных северо-восточных штатах США, где наиболее точная модель Cx. изобилие пипинов отрицательно коррелировало с лесным покровом и вообще не включало вегетативный индекс [25].

Топографический индекс влажности был значительным предиктором численности анофлина и риска малярии среди домашних хозяйств в Таиланде [73] и Кении [74,75]. Несмотря на это, в наших моделях это был значительный предиктор только в модели BRT «NoPop». Возможно, что в засушливых климатах с низкой влажностью и небольшим количеством осадков потенциал для объединения воды, как прогнозируется TWI, не переводится в водоемы с достаточной частотой, чтобы сделать TWI более сильным индикатором среды размножения животных. Возможно также, что даже если TWI точно прогнозирует распределение пулов прозрачных грунтовых вод в регионе, эти бассейны с чистой подземной водой могут не быть местом размножения, наиболее благоприятствуемым Cx. pipiens. В местах обитания, где москиты предпочитали чаще овигировать в искусственных или естественных контейнерах, а не в грунтовых бассейнах, это не будет отражено в TWI. Также примечательно, что ни одна из наших моделей не нашла осадков в качестве очень мощного предиктора. В этом контексте индексы растительности могут обеспечить лучшую информацию о влажности почвы, чем о гидрологии или параметрах осадков.

Наше исследование дает представление о драйверах Cx. пипинов в глуховатой области при растущем риске от повторного появления нескольких арбовирусов. Наиболее доминирующими предикторами в нашей модели распределения видов, плотности населения и сезонностью расширенного индекса растительности являются также экологические факторы с потенциальными корреляциями с урбанизацией и сельскохозяйственной практикой. Понимая взаимосвязь между этими предикторами и распределением векторов болезней, мы лучше понимаем, как изменения в землепользовании или изменениях моделей поселения людей могут влиять на передачу болезней. Учитывая возрождение переносимых переносчиками заболеваний, таких как Западный Нил и Лихорадка долины Рифт [10], понимание того, как выбор может влиять на экологию болезни посредством сельского хозяйства, урбанизации и роста населения, является вопросом, имеющим жизненно важное значение.

SDM: модель распределения видов; BRT: усиленное дерево регрессии; БЕНА: Ближний Восток и Северная Африка; MODIS: Спектрорадиометр с умеренным разрешением изображения; EVI: расширенный вегетативный индекс; TWI: индекс топографической влажности; VBD: болезни, переносимые вектором.

Авторы заявляют, что у них нет конкурирующих интересов.

AC разработал исследование, разработал модели распределения видов, провел статистический анализ и подготовил рукопись. DO задумал исследование, участвовал в его разработке, получил данные дистанционного зондирования и извлек итоговые данные из изображений MODIS и помог разработать рукопись. NH провела векторную съемку (Ливан) и помогла подготовить рукопись. AG провела векторную съемку (Египет). AH организовал векторные данные (Египет) и внес существенные изменения в рукопись. JB задумал исследование, принял участие в его разработке и координации и помог разработать рукопись. Все авторы прочитали и утвердили окончательную рукопись.

Дополнительные параметры, используемые для генерации и оценки моделей распространения видов.

Нажмите здесь для файла

Дополнительные карты фоновых точек и дополнительный выход Maxent.

Нажмите здесь для файла

Исследования, представленные в этой публикации, были поддержаны Национальным институтом общих медицинских наук Национального института здоровья по номеру награды R01GM093345. Контент принадлежит исключительно авторам и не обязательно отражает официальные взгляды Национального института здравоохранения.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *