Нажмите "Enter", чтобы перейти к контенту

Вычислительные и эмпирические исследования Предсказывают специфические Т-клетки Mycobacterium tuberculosis как биомаркер для инфекционного исхода

Computational and Empirical Studies Predict Mycobacterium tuberculosis-Specific T Cells as a Biomarker for Infection Outcome
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4827839/

Авторы заявили, что не существует никаких конкурирующих интересов.

Задуманные и разработанные эксперименты: SMAR HPG. Проводили эксперименты: SMar HPG SMan. Проанализированы данные: SMar SMan HPG. Используемые реагенты / материалы / инструменты анализа: SMAR HPG JLF SMan CG. Написал документ: SMAR HPG SMan JTM PLL JJL JLF DEK. Первоначальная калибровка модели и обработка экспериментальных данных: JTM.

Идентификация биомаркеров туберкулеза (ТБ) является постоянной проблемой при разработке иммунологических коррелятов результатов и защиты инфекции. Открытие биомаркеров также необходимо для разработки дизайна и тестирования новых методов лечения и вакцин. Чтобы эффективно прогнозировать биомаркеры для прогрессирования инфекции при любом заболевании, включая туберкулез, требуется большое количество экспериментальных данных для достижения статистической мощности и получения точных прогнозов. Мы приняли двухсторонний подход, используя как экспериментальное, так и вычислительное моделирование для решения этой проблемы. Сначала мы собрали 200 образцов крови в течение 2-летнего периода у 28 нечеловеческих приматов (NHP), инфицированных низкой дозой Mycobacterium tuberculosis. Мы идентифицировали Т-клетки и цитокины, которые они продуцировали (один и несколько) из каждого образца вместе с статусом обезьяны и данными о прогрессировании инфекции. Методы машинного обучения использовались для опроса экспериментальных наборов данных NHP без определения потенциального TB-биомаркера. Параллельно мы использовали наши обширные новые наборы данных NHP для построения и калибровки многоорганической вычислительной модели, которая объединяет то, что происходит в месте заражения (например, легкое), в масштабе одной гранулемы с показаниями уровня крови, которые можно отслеживать у обезьян и людей. Затем мы создали большой силиконовый репозиторий в силиконовых гранулемах, связанных с лимфоузлом и динамикой крови, и разработали в силиконе инструмент для масштабирования результатов гранулемы до полной шкалы хозяев, чтобы определить, что лучше всего прогнозирует результаты заражения Mycobacterium tuberculosis (Mtb). Анализ в силиконовых измерениях крови идентифицирует специфичные для Mtb частоты фенотипов эффекторных Т-клеток в различные моменты времени после инфицирования как перспективные показатели результата заражения. Мы подчеркиваем, что спаривание мокрого и вычислительного подходов с большой вероятностью ускоряет обнаружение биомаркеров ТБ.

Туберкулез (ТБ) — заболевание, вызванное инфекцией после вдыхания бактерий Mycobacterium tuberculosis. Не все больные туберкулезом заражаются. В результате были классифицированы два состояния, связанные с ТБ: скрытая туберкулезная инфекция (не больная, но все же укрывающая бактерии) и активное заболевание ТБ. Если лечение не проводится должным образом, активное заболевание ТБ может быть фатальным. Ежегодно около 1,3 миллиона человек умирают от туберкулеза во всем мире, с ~ 8,6 миллиона новых инфекций в 2013 году. Нет эффективной вакцины для защиты от туберкулеза, а лечение инфекции несколькими антибиотиками длительное (6-9 месяцев), с несоблюдением являясь основным фактором возникновения лекарственно-устойчивых штаммов. Ключевым шагом в разработке эффективных вакцин и, возможно, более коротким режимами лечения является способность идентифицировать биомаркеры, которые коррелируют с прогнозом и прогрессированием инфекции (подобно тому, как уровни холестерина являются мерой здоровья сердца). В этом исследовании мы показываем, как парное компьютерное моделирование, статистика и математика с наборами данных, полученными из исследований, связанных с приматом человека, могут ускорить обнаружение биомаркеров и предложить новый подход к выявлению коррелятов защиты, которые будут полезны в клинической практике, особенно в развивающихся странах, где ТБ наиболее распространен.

Все соответствующие данные содержатся в документе и его файлах вспомогательной информации.

Mycobacterium tuberculosis (Mtb) по-прежнему является глобальной угрозой для общественного здравоохранения, в результате которой в 2013 году было зарегистрировано 1,3 миллиона смертей из-за туберкулеза (ТБ) и 8,6 миллиона новых инфекций [1]. В то время как только 10% инфицированных индивидуумов развивают клинически активный туберкулез, другие 90% гастрономических бактерий и считаются клинически скрытыми [2] (латентный ТБ, или LTBI). Клинически скрытые индивидуумы могут подвергаться реактивации активному туберкулезу и, таким образом, служат большим резервуаром для передачи болезни. Основным препятствием в борьбе с туберкулезом является отсутствие точных биомаркеров, которые коррелируют с прогнозом и прогрессированием инфекции [3,4,5,6].

Идентификация биомаркеров как инфекционных, так и неинфекционных заболеваний является фокусом многих текущих биомедицинских исследований. В то время как кровь или моча могут быть получены от пациентов для измерения биомаркеров, события, происходящие в этих физиологических отделениях, могут не точно отражать динамику в местах заражения, таких как легкие [7]. Недавно мы показали, что при Mtb-инфекции ответы Т-клеток в крови не всегда отражают ответы Т-клеток в гранулемах, сайтах Mtb-инфекции в легких [8]. Биомаркеры, связанные с наблюдаемым спектром инфекции, от контроля инфекции (LTBI) до клинически активного ТБ [9], неизвестны. Это недостаток понимания присутствует в условиях как естественного, так и иммунодефицитного иммунитета [6]. Здесь мы фокусируем наше исследование на естественном иммунитете.

Неспецифические маркеры воспаления, если их рассматривать отдельно, не имеют достаточной прогностической ценности для клинического применения в ТБ [3,4]. На протяжении десятилетий тест на туберкулез кожи (TST) был наиболее распространенным диагностическим инструментом для воздействия Mtb. Однако отсутствие специфичности для выявления активного заболевания туберкулезом, невозможность провести различие между вакцинацией БЦЖ и инфекцией Mtb и невозможность обеспечить понимание прогрессирования болезни ограничивают прогностическую способность TST [3,4,5]. ИФН-γ (IGRA), которые измеряют Mtb-специфическое высвобождение IFN-γ из клеток крови, имеют более высокую специфичность для обнаружения постоянной инфекции ТБ (~ 80%) [10], но не могут служить как полезным коррелятом вакцинно- (т. е. из-за низкой чувствительности или истинной положительной скорости) [3,4]. Недавние исследования ассоциаций показывают, что отношения различных субпопуляций Т-клеток в крови (например, CD4 + и CD8 + Т-клетки) могут помочь различать этапы прогрессирования ТБ [2,11,12,13]. Данные о временном курсе у людей обычно доступны только из крови, а не из мест заражения Mtb (легкие или лимфатические узлы (LNs)). Кроме того, сложно определить время экспозиции и статус прогрессирования инфекции у людей, ограничивая способность использовать эти образцы для интеллектуальных исследований.

Профилирование экспрессии гена [2,14,15], микроРНК и открытие на основе метаболизма [16,17] и профилирование плазменных антител у инфицированных людей Mtb [18] и моделей животных [3,19] были сопряжены с интеллектуальным анализом данных и машиной инструменты обучения для выявления потенциальных биомаркеров туберкулеза. Недавно была успешно использована визуализация в качестве диагностического и прогностического инструмента в исследованиях ТБ (т. Е. ПЭТ / КТ), как в контексте естественной инфекции [20,21], так и при лечении наркотиками [22,23]. Несмотря на информативность, эти исследования пока не смогли определить ни один или набор практических биомаркеров, либо прогностические корреляты защиты, которые были бы полезны в клинической практике, особенно в развивающихся странах, где туберкулез наиболее распространен. Вероятно, это связано с сложностью заболевания туберкулезом, что кровь не может отражать динамику легочной инфекции [8], внутренние ограничения в исследованиях ex vivo и ограниченную доступность продольных данных in vivo. Более того, был выявлен спектр результатов инфекции, связанных с бинарными классификациями активного туберкулеза и латентной инфекции, что еще более затрудняет обнаружение биомаркеров для статуса инфекции [9].

Здесь мы представляем комплексный экспериментальный и вычислительный подход к открытию биомаркеров туберкулеза с целью прогнозирования результатов инфекции Mtb. На рис. 1 показана методологическая дорожная карта различных созданных наборов данных и анализов, выполненных в этом исследовании. Во-первых, с использованием машинного обучения были опрошены иммунологические данные из крови матки, зараженных Mtb, для биомаркеров, которые прогнозировали бы результат заражения. Анализ наборов данных NHP-крови не выявил потенциального биомаркера TB. Затем был использован отдельный набор данных, который помогал строить и откалибровать вычислительную модель иммунного ответа во время Mtb-инфекции. Наша уникальная многомасштабная и мультифизиологическая кумулятивная вычислительная модель генерирует силиконовые данные о динамике инфекции как в крови, так и в легких, захватывая образование независимых гранулем в легких и в то же время профили Т-клеток в крови. Затем мы построили виртуальные хосты приматов, не принадлежащие человеку, на основе данных гранулемы и статуса инфекции от макак, и использовали эти модели для определения потенциальных биомаркеров, которые могут предсказать результат заражения. Мы обнаружили, что Mtb-специфические частоты фенотипов эффекторных Т-клеток (то есть, как CD4 +, так и CD8 +) в крови могут быть нацелены на то, чтобы отличать результаты инфекции с четким разделением между средними траекториями активного и скрытого туберкулеза в конце прогрессирования инфекции (~ 300 дней).

В левой части диаграммы (серые квадраты) суммируются все наборы данных, сгенерированные в этом исследовании. Мы создали экспериментальные наборы данных из образцов крови и некропов легких нечеловеческих приматов (NHP) и наборов данных, созданных с помощью моделирования вычислительной модели (в силиконных данных). Правая сторона диаграммы (желтые поля) представляет собой анализ, выполняемый для каждого набора данных. Каждый набор данных отображается другой формой. Синие стрелки указывают на тип анализа, выполняемого для каждого набора данных. Циклические числа представляют собой хронологический порядок операций (называемый шагами в тексте). Подробная информация о том, какая фигура или таблица в рукописи содержит набор данных или анализ, приведены в каждом окне.

Чтобы помочь читателям перейти через множество созданных наборов данных и различные анализы, выполненные в этом исследовании, мы предоставляем подробную методологическую карту (рис. 1). Каждый шаг, обозначенный на рис. 1, относится к разделу в результатах с акцентом на порядок, в котором они были выполнены.

Мы оценили уровни CD4 + и CD8 + Т-клеток (и подмножеств памяти на основе экспрессии двух маркеров CD45RA и CD27, см. Таблицу 1 для деталей) и их продуцирование цитокинов в крови 28 нечеловеческих приматов (NHPs) (cynomologus macaques ) в 10 временных точках в течение экспериментальной инфекции Mtb (до 6 месяцев после инфицирования) (рис. 2А, таблица 1, таблицы S1-S6). Такой обширный временный курс отбора проб в модели NHP для туберкулеза, который повторяет человеческую инфекцию Mtb, ранее не был доступен для исследований биомаркеров. Эти NHP были клинически классифицированы как имеющие латентную инфекцию или активное заболевание туберкулеза, как описано ранее [24,25], но имеют ряд результатов, охватывающих эти клинические классификации [26]. На фиг.1 изображены репрезентативные участки проточной цитометрии, в которых излагаются стратегии стробирования, используемые для оценки уровней Т-клеток.

(A) Экспериментальная конструкция для сбора и измерения данных на 28 Примате, не относящемся к человеку. Все наборы данных доступны в режиме онлайн в качестве вспомогательной информации (таблицы S2-S6). (B) Схема, представляющая три отсека, захваченных нашей вычислительной моделью. Основное внимание уделяется описанию всех фенотипов лимфоцитов (как CD4 +, так и CD8 +), отслеживаемых во время анализа. Клетки заполняют три разных отделения / органы: легкие, лимфатические узлы и кровь. Легкое моделируется как модель на основе агентов (ABM), а кровь и лимфатический узел моделируются как модель на основе уравнений (EBM), а именно как система обычного дифференциального уравнения (ODE). Для большинства фенотипов отслеживаются как Mtb-специфические (цветные), так и не-Mtb-специфичные (серые) клетки. APC: представлен в качестве прокси-сервера в вычислительной модели (подробности см. В разделе «Материалы и методы» и тексты S1 и S2).

Для опроса этих уникальных и обширных наборов данных NHP-инфекции для биомаркеров (шаг 1 на рис. 1) мы применили четыре контролируемых алгоритма классификации: классический и оштрафованный дискриминантный анализ (LDA и PLDA), квадратичный дискриминантный анализ (QDA) и логистическая регрессия (полная информация приведенные в Методах и Дополнительных материалах). Коэффициенты ошибок чувствительности, специфичности и ошибочной классификации (MER) показаны в таблице 2 как для тренировочных, так и для тестовых наборов. Результаты учебного набора данных показывают высокую точность, даже если переобучение, скорее всего, приведет его в движение (поскольку у нас есть 28 образцов для более чем 150 функций). Однако аналогичные результаты не наблюдались в наборе тестовых данных, где ни один из четырех используемых методов не мог распознавать результаты заболевания (MER для набора тестов ~ 50%, таблица 2, S2 Fig). Суровые различия в точности прогнозирования между наборами учебных и тестовых данных указывают на чрезмерную установку, которая потенциально может быть уменьшена за счет увеличения размера выборки.

Чувствительность, специфичность и классификация Ошибки показаны для тренировочных и тестовых наборов. Было проведено 1000 повторных испытаний (как описано в Методах) для каждого алгоритма классификации. (A) для одного набора данных цитокинов. (B): результаты для набора данных цитокинов памяти. (C): результаты множественного набора данных цитокинов.

Затем мы повторно проанализировали наборы данных крови, используя неконтролируемые алгоритмы кластеризации (многомерное масштабирование, метод Уорда и другие иерархические методы, см. «Материалы и методы» для получения полной информации). Эти алгоритмы предполагали, что 28 макак можно разделить на 3-25 оптимальных кластеров (таблица S7), но не было договоренности между методами в отношении того, что должно быть кластеризацией. Кластеры содержат смеси NHP с активным заболеванием и латентной инфекцией, без четкого разделения между субъектами и без отчетливого ограничителя стадии заражения. Это, вероятно, связано с перекрывающимся спектром патологии, присутствующей у животных, которые клинически классифицируются как имеющие активное заболевание или латентную инфекцию [8,9,21,22,25], также описанные для людей [27]. В целом, наши многочисленные попытки использовать продольные данные Т-клеток крови, полученные от NHP для прогнозирования клинической бинарной классификации (то есть латентной инфекции или активного ТБ), не были успешными.

Наш набор данных о NHP-крови не может быть прогнозом результатов заражения, если кровь не отражает динамику легочной инфекции (как это было предложено в нашей предыдущей работе [8]) и / или если размер выборки не имеет необходимой статистической силы для дискримирования двоичных результатов. Кроме того, ТБ существует по спектру и определение бинарных исходов может быть искусственно навязанным ограничением и непрактичным [9]. Эти недостатки можно было бы смягчить, используя вычислительную модель, которая описывает иммунный ответ на инфекцию Mtb в трех физиологических отделениях, захватывающих кровь, LN и динамику легких, откалиброванных с помощью наших наборов данных NHP (шаг 2 на рис. 1 и рис. 2B). Основываясь на предыдущей работе нашей группы, мы разработали многомасштабную и многокомпонентную модель, связав нашу вычислительную модель GranSim, которая фиксирует образование и функцию отдельных гранулемы в легких с использованием модельной модели на основе агентов [28,29,30,31,32,33 ] с двумя дополнительными нелинейными моделями ОДУ, отражающими динамику как в LN, так и в крови [28,29] (рис. 2, текст S1).

Рисунки 3 и 4 иллюстрируют калибровку нашей модели силикона в нашем наборе данных NHP, причем как пространственные, так и временные подходят для отдельных данных отдельных гранулем в легких (рис. 3) и крови (рис. 4) (диапазоны значений параметров, приведенные в S8 и S9). Кроме того, бактериальная нагрузка на гранулему (в колониеобразующих единицах, КОЕ) в легком откалибрована до недавно опубликованных [8,22] и неопубликованных наборов данных NHP (рис. 3A, таблица S1). Временные курсы для количества бактерий Mtb из представленной гранулемы показаны на рис. 3B. Мы также показываем сравнение между пространственным распределением гранулемы (например, расположением иммунных клеток, бактериями, некротическим центром) из двух изображений гранулемы NHP и двумя снимками силиковой гранулемы с аналогичными уровнями бактерий Mtb и размером поражения (рис. 3C). Динамика Т-клеток NHP (таблица S5) от 9 животных использовалась для калибровки нашей в силиконовой динамике крови, а в силиконе траектории попадали в уровни CD4 + и CD8 + T-клеток из крови NHP (рис. 4).

На рисунке представлены экспериментальные данные NHP по КОЕ / гранулеме (таблица S1) в сравнении с силиконовыми наборами данных КОЕ / гранулемы (легочное отделение) из силиконового хранилища в 10 000 гранулем, связанных с кровью и динамикой LN). Хотя в силиконовом наборе данных есть курсы времени до 600 дней, ось х всегда показывает временной интервал инфекции до 200 дней, чтобы соответствовать данным крови NHP. Ось Y представляет собой CFU / гранулему (A-B). (A) В силиконовом наборе временных курсов КОЕ / гранулемы, вырабатываемых в легочном отделении (черные круги с черной сплошной линией, представляющей среднюю траекторию) по сравнению с экспериментальными данными по NHP CFU / гранулеме (с сплошной красной линией, представляющей медианную , и пунктирные красные линии, представляющие минимальные и максимальные значения в данных NHP). Рассчитаны медианные траектории как для NHP, так и для силиконовских данных, включая стерилизованные гранулемы, тогда как минимальные траектории исключают стерилизованные гранулемы. (B) Mtb-траектории (общая [сплошная толща], внеклеточное [твердое тело с пустыми кругами], внутриклеточное [пунктирное] и не реплицирующее [твердое тело]) в репрезентативной гранулеме (сдерживание) по сравнению с экспериментальными данными NHP CFU / гранулемы ( красные круги). (C) Снимки 4 разных гранулем. Верхний ряд панели C предназначен для окрашивания H и E двух гранулем NHP. Левая гранулема находится от NHP 22810, CFU ~ 40. Правая гранулема находится от NHP 17211, CFU ~ 1240. Обе гранулемы имеют диаметр ~ 2 мм (подробнее см. Таблицу S1). Нижний ряд Panel C предназначен для гранулем силикона, соответствующего размера поражения и CFU / гранулемы изображений NHP. Отображаются следующие типы клеток: макрофаги (оранжево-зеленые, активированные синие, инфицированные-оранжевые, хронически инфицированные-красные), эффекторные лимфоциты (провоспалительные IFN-γ, продуцирующие Т-клетки-Tγ в розовой, цитотоксической Т-клетке-Tc в фиолетовый, регуляторный Т-клетка-Трег светло-голубой), внеклеточные бактерии (оливково-зеленый), сосудистые источники (серые и некротические пятна (белые)).

Представлены экспериментальные данные NHP о фенотипах Т-клеток крови (таблица S5, набор данных Т-клеток), а также в силиконовых наборах данных фенотипов Т-клеток крови (отсек крови) из силиконового хранилища в 10 000 гранулем, связанных с кровью и динамикой LN. Хотя в силиконовом наборе данных есть курсы времени до 600 дней, ось х всегда показывает временной интервал инфекции до 200 дней, чтобы соответствовать данным крови NHP. Ось y представляет собой ячейки / см3. (AH) В силиконовом наборе данных из 10 000 временных интервалов из 8 Т-клеточных фенотипов, генерируемых в отсеке крови (черная сплошная линия [средняя] и черные пунктирные линии [5-й и 95-й процентили]) по сравнению с экспериментальными данными о фенотипах Т-клеток в крови Mtb-инфицированные NHP (красные пунктирные линии с красными открытыми кружками, представляющие мин и макс). Для минимума и максимума данных NHP мы выбрали самые низкие и самые высокие значения в любой момент времени для всех NHP. В силиконе прогнозы отображаются как медианные (черная сплошная линия) и минимальные и максимальные (штриховые черные линии). Мы показываем Naide CD4 + ((A) и CD8 + (E)), центральную память CD4 + (B) и CD8 + (F)), эффектор CD4 + (C) и CD8 + (G)) и память с эффектором CD4 + (D) и CD8 + (H ). Данные по силикону были получены путем суммирования соответствующих Mtb-специфических и не-Mtb-специфических уравнений отсека крови вычислительной модели.

В настоящее время Mtb-специфичность Т-клеток в модели NHP не может быть непосредственно измерена (например, тетрамеры недоступны). В качестве суррогата мы использовали наш набор данных NHP крови для расчета частоты Т-клеток, которые продуцировали любой из 6 измеренных цитокинов (IFN-γ IL-2, IL-6, IL-10, IL-17 и TNF) (таблица S6) после стимуляция двумя Mtb-специфическими иммунодоминантными антигенами ESAT-6 и CFP-10 (таблица S6). Эти частоты Т-клеток затем используются в качестве прокси для частот МТb-специфических Т-клеток (по крайней мере, с точки зрения функционального ответа на эти антигены). Это не дает прямого измерения клеток, которые действительно специфичны для Mtb-инфекции. НХП, используемые в этом исследовании, являются аутогенными обезьянами, которые могли быть подвергнуты воздействию не туберкулезных микобактерий (НТМ или воздействия окружающей среды), и тем не менее будут реагировать на стимуляцию этими антигенами до того, как мы заразим их Mtb. Это может объяснить ненулевые частоты в наборе данных NHP, присутствующем во многих фенотипах Т-клеток памяти, наблюдавшихся на ранней стадии инфекции (красные точки, рис. 5). Эта вычислительная модель не учитывает эти потенциальные эффекты.

Траектории в течение 200 дней от частот Т-клеток от вычислительной модели по экспериментальным данным NHP. Данные в силиконе были сгенерированы после шагов, показанных на рис. 6, а также в разделе «Материалы и методы». Учитывая ненулевые частоты на этапах предварительной инфекции, мы использовали начальные условия между 0,01% и 2% для МТБ-специфических фенотипов центральной и эффекторной памяти. Красные точки представляют собой экспериментальные данные NHP, а именно частоты Т-клеток, продуцирующих любой из 6 измеренных цитокинов (IFN-γ, IL-2, IL-6, IL-10, IL-17 и TNF) в ответ на ESAT-6 и стимуляции CFP-10 (подробнее см. раздел «Материалы и методы» и таблица S6 для данных). Здесь представлены только 9 данных NHP. Черные сплошные (средние) и пунктирные (5-й и 95-й процентили) линии представляют собой траектории силиконовых данных. Панель A: Частоты фенотипов центральной памяти CD4 + T-клеток. Панель B: Частоты фенотипов памяти блока эффектов CD4 + Т-клеток (терминально дифференцированная и эффекторная память). Панель C: Частоты фенотипов центральной памяти CD8 + Т-клеток. Панель D: Частоты фенотипов памяти блока эффектов CD4 + Т-клеток (терминально дифференцированная и память эффектора).

Затем мы использовали нашу калиброванную силиконовую модель для прогнозирования пространственно-временной динамики Tt-специфичных Т-клеток (подробности см. В разделе «Материалы и методы»). Для параллельной нашей вычислительной модели виртуальных NHP, которые ранее были бы подвергнуты воздействию микобактериальных антигенов, наши симуляции начинаются с ненулевых начальных условий на тех же частотах, что и данные NHP. Наши предсказания модели силикона для частот центральной центральной памяти Mtb (рис. 5A и 5C) и эффекторных Т-клеток (рис. 5B и 5D) находятся в пределах изменения данных NHP, полученных в качестве прокси-соединений для Mtb-специфичных ответов Т-клеток.

Далее мы применяем методы интеллектуального анализа данных и методы корреляции на них в силиконовых наборах данных для обнаружения потенциальных биомаркеров (шаг 4 на рис. 1). Поскольку наша вычислительная модель может прогнозировать динамику Mtb-специфических клеток в крови, легких и LNs, мы используем нашу модель для создания больших в силиконных наборах данных (10000 виртуальных гранулем), спаривания легочных выходов (т.е. CFU / гранулемы) с помощью мер крови (например, динамика иммунных клеток) во время прохождения инфекции (шаг 3 на фиг.1). Сначала мы применяем анализы основных компонентов (PCA) только в силиконовых анализах крови (S3 Fig), а затем мы расширяем анализ до 3 показаний отделения, объединенных вместе (например, кровь, лимфатический узел и одиночная гранулема в легком, см. S11 Таблица и S4 и S5 Рис.). Если анализ проводится только по Mtb-специфическим переменным Т-клеткам в крови, то только 2 главных компонента объясняют ~ 70% изменчивости набора данных (S3A Fig). Даже если не возникает кластер (S3B Fig), в верхние 2 основных компонента преобладают Mtb-специфические эффекторные CD4 + и эффекторные CD8 + T-клетки, уже через 42 дня после инфицирования, а также Mtb-специфичные центральные CD4 + и CD8 + T-клетки позже во время инфекции (S3C Fig). Чтобы исследовать этот вывод, мы сузили анализ силикатных наборов данных, сопоставив виртуальные МТb-специфические частоты Т-клеток в крови с виртуальным КОЕ / гранулемой в месте заражения (легкие). В силиконовых частотах Mtb-специфических Effector CD4 + и CD8 + T-клеток в крови хорошо предсказывают бактериальную нагрузку в масштабе гранулемы с четким разделением между низким и высоким CFU / гранулемой (все результаты, показанные в приложении к шкале гранулемы — S6 и S7 Figs , Таблица S10). Однако, поскольку инфекция обычно приводит к множественным гранулемам в пределах одного хозяина, было бы полезно использовать показание шкалы хозяина, а не одно показание шкалы гранулемы. Ниже мы приводим такой анализ.

Затем мы генерируем предсказания масштаба хозяина, комбинируя данные о некрозе легких легочной артерии и в силиконовом репозитории, описанном в предыдущем разделе (рис. 1, шаг 5). Наше основное предположение состоит в том, что клинические исходы принимающей стороны могут определяться комбинированным эффектом бактериальной нагрузки гетерогенной гранулемы хозяина [21]. Фактически, мы ранее продемонстрировали существенную гетерогенность и изменчивость в гранулемах NHP на уровне бактериальных и иммунных клеток как у животных, так и у одного животного [8,21,22]. Общая бактериальная нагрузка в легких NHP при вскрытии коррелирует с результатом заражения (то есть NHP с активным заболеванием имеют более высокую бактериальную нагрузку, чем при латентной инфекции) [25]. Вклад отдельных (и тотальных) гранулем в одном хозяине факторов, которые можно отслеживать в крови, неясен и, вероятно, ответственен за отсутствие корреляции ответов Т-клеток в крови с таковыми в гранулемах или с клиническим статусом в нашей предыдущее исследование [8].

Чтобы масштабировать результаты нашей вычислительной модели от единственной легочной гранулемы до всего хозяина, мы сначала генерируем большую выборку виртуальных хостов NHP, используя наш в силиконовом наборе данных для имитации NHP-инфекций (рис. 6), которые повторяют известные данные КОЕ / гранулемы (таблица S1). Мы создали виртуальные хосты, которые содержали количество гранулем и КОЕ / гранулемы, чтобы соответствовать нашему набору данных NHP (шаг 5 на рис. 1). Для каждого виртуального хозяина NHP мы выбираем из нашего силиконового хранилища в 10 000 гранулем (подробнее см. Раздел «Материалы и методы»). Затем мы объединяем все взятые в силикону гранулемы и исследуем их соответствующие данные силиконовой крови на уровнях иммунных клеток, которые генерируются из вычислительной модели. Этот метод позволяет нам прогнозировать временные интервалы многих различных фенотипов Т-клеток в крови с использованием нашей вычислительной модели (шаг 6 на рис. 1). Наша цель здесь — предсказать коллективное поведение скрытых и активных групп ТБ, а не траектории силиковой крови одного NHP. Таким образом, анализ масштабирования для хоста не включает вычисление специфичности, чувствительности и скорости ошибочной классификации.

Экспериментальные данные о 43 МТБ-инфицированных НХП, классифицированных как скрытые или активные ТБ, будут использоваться для руководства процессом виртуального NHP-строительства (подробнее см. Раздел «Материалы и методы»). Шаг 1. Выбирают один NHP из 43 (NHPi, i = 1, …, 43) и определяют количество гранулем (Ni) в образце из силиконового хранилища вместе с CFU на каждую гранулему (CFUj, j = 1, …, Ni). Шаг 2. Для каждого CFUj ​​мы выбираем подмножество из силиконовых гранулем из репозитория в пределах диапазона [(1-α) xCFUj, (1 + α) xCFUj]. Мы использовали α = 10%. Подмножество отбирается в момент времени для вскрытия NHPi (см. Подробности в таблице S1). Шаг 3. Статистические данные по показаниям крови рассчитываются (например, среднее, среднее, стандартное отклонение) и сохраняются. Шаг 4. Этапы 1-3 повторяют K раз для того же NHPi, чтобы имитировать изменчивость и гетерогенность результатов гранулемы в пределах одного хозяина. Затем сохраняются копии K, и вычисляются статистические данные по шкале хоста (т. Е. Среднее, среднее, стандартное отклонение) и объединяются для имитации траекторий в силиконовых анализах крови для прогнозирования результатов инфицирования, как показано на рис. 7.

Прогнозируемые числа CD4 + и CD8 + Т-клеток (включая подмножества Mtb-специфичных Т-клеток) в крови были получены для 43 виртуальных NHP (20 латентных инфекций, 23 активных ТБ, как в экспериментальном наборе данных NHP) (Рис. 7 и S8 и S9 Рис. ). Эти предсказания соответствуют набору данных о крови NHP, предполагая, что нельзя различать активные и скрытые результаты ТБ путем мониторинга общих уровней Т-клеток (рис. 7A-7C и S8A и S8C-S8E Fig).

Мы построили / откалибровали виртуальные NHPs, которые реплицировали гетерогенность гранулемы и изменчивость в легком 43 NHPs (до 600 дней после инфицирования, см. Таблицу S1). Здесь, в силиконовой крови, траектории полного уровня Т-клеток и частоты Т-клеток, специфичные для Mtb, сгруппированные по клиническим исходам (как показано в таблице S1), нанесены на график в течение 600 дней для того же набора виртуальных NHP. Данные силикона, показанные здесь, были сгенерированы следующими этапами, показанными на фиг. 6, а также в разделе «Материалы и методы». Две виртуальные траектории, представляющие 43 виртуальных NHP, отображаются во всех панелях как среднее +/- 2x (стандартная ошибка). Звездочки показывают значительный (p <0,05) студенческий t-тест между двумя траекториями в одно и то же время. Эти в силиконовых траекториях были сгенерированы с нулевыми начальными условиями для фенотипов памяти Т-клеток, специфичных для Mtb (за исключением Т-клеток, специфичных для Nait Mtb, подробности см. В разделе «Материалы и методы»). Никаких экспериментальных данных здесь не видно, поскольку показатели крови доступны только для ограниченного числа NHP (I.e., 12 out o 43) и только до 180 дней после инфицирования. Панель A: Всего уровней CD4 + Т-клеток. Панель B: общий уровень CD8 + Т-клеток. Панель C: общие уровни CD4 + Т-клеток, специфичные для Mtb. Панель D: общие уровни T8-клеток CD8 +, специфичные для Mtb. Панели E: Mtb-специфичные частоты Effector CD4 + T-клеток. Панели F: Mtb-специфичные частоты памяти с эффекторной памятью CD4 + Т-клетки. Панели G: Mtb-специфичные частоты Effector CD8 + T-клеток. Панели H: Mtb-специфичные частоты памяти с эффекторной памятью CD8 + Т-клетки.

Напротив, предсказанные уровни Mtb-специфических Т-клеток в крови позволяют нам отличать результаты заражения (активные против скрытых) через ~ 300 дней после инфицирования (как CD4 +, так и CD8 +, рис. 7C и 7D). Прогнозируемые частоты Mtb-специфичных эфферентных CD4 + и CD8 + T-клеток в виртуальных активных и скрытых хозяевах раздельно после 300 дней после инфицирования (рис. 7Е и 7G). Прогнозируемые частоты Mtb-специфических клеток с эффекторной памятью CD4 + и CD8 + T-клетки также свидетельствуют об исходе, но в более поздних временных точках (рис. 7F и 7H). В целом, мы прогнозируем, что частоты Mtb-специфических эффекторных CD4 + и CD8 + T-клеток в крови значительно выше (от 2- до 4-кратного) в активном по сравнению с латентным Mtb-инфицированным NHP и, таким образом, комбинация этих клеток и различное время точки пост-инфекции должны быть нацелены как потенциальные биомаркеры прогрессирования Mtb-инфекции.

Одним из величайших инструментов диагностики и лечения болезней является надежный биомаркер. В ТБ было много споров относительно того, существуют ли биомаркеры, и если да, то что могло бы служить в качестве соответствующих биомаркеров [3,4,5,10,11,12,13,14,15,16,17,18,19, 34,35]. На сегодняшний день ни один биомаркер (или набор биомаркеров) не был полезен для выявления степени заражения и болезней у людей. Одним из осложнений в прогнозировании состояния инфекции Mtb является спектр результатов заболевания, охватываемых бинарными классификациями активного туберкулеза и латентной инфекции [9,36,37]. Эта изменчивость в исходе болезни также сопровождается гетерогенностью результатов гранулемы как между отдельными, так и внутри отдельных НПЗ.

Ранее мы сообщали о том, что спектр гранулем с точки зрения количества, типов, иммунных реакций и бактериальной нагрузки обнаруживается у отдельных животных и у животных с активной или латентной инфекцией [8,22,25]. Недавние исследования нашей группы подтверждают, что прогрессивные и зажившие гранулемы могут сосуществовать внутри одного и того же животного, причем почти все животные способны стерилизовать по крайней мере подмножество отдельных гранулем [21]. Однако животные с активным туберкулезом обнаруживают подмножество поражений, которые не контролируют инфекцию, что, по-видимому, приводит к распространению [22]. Неудивительно, что, учитывая эту гетерогенность внутри хозяев, системные ответы Т-клеток в крови не точно отражают ответы Т-клеток гранулемы [8].

Здесь мы собрали уникальный и обширный набор фенотипических и функциональных данных Т-клеток в крови из 28 NHP, экспериментально инфицированных низкой дозой Mtb и с известным клиническим исходом (активным или скрытым ТБ). Мы представляем подход, который объединяет эти экспериментальные данные NHP в вычислительную модель, фиксирующую иммунную динамику в 3 физиологических отделениях. Мы применяем классические методы интеллектуального анализа данных для временных наборов данных из крови, которые получены как из исследований NHP, так и из нашей вычислительной модели. Важным преимуществом использования методов интеллектуального анализа данных в вычислительных данных является то, что в силиконовых наборах данных являются исчерпывающими как по времени, так и по плотности, что позволяет увеличить размеры выборки и статистическую мощность. Это может исключить небольшой размер выборки в качестве потенциальной ошибки в соответствующем исследовании на животных и указать на другие факторы в игре. Стандартные контролируемые и неконтролируемые алгоритмы классификации не давали четкой декомпозиции или оптимального распределения кластеров. Это указывало на то, что принятые меры по измерению концентрации NHP не смогли определить потенциальные биомаркеры прогрессирования заболевания, возможно, из-за совпадения между бинарными классификациями результатов заражения. Более того, если мы предположим, что клинический исход хозяев может в конечном счете быть обусловлен комбинированной деятельностью гранулемы человека, выборка крови, скорее всего, отразит среднюю динамику вариабельных локальных иммунных реакций на инфекцию. В конечном счете, мы не смогли идентифицировать биомаркеры из экспериментальных данных NHP, собранных в системном отделении (крови), что указывает на сложную природу локализованной болезни легких в ТБ.

Чтобы предложить дополнительные анализы, мы построили новую и уникальную многоорганизационную вычислительную модель, которая отслеживает динамику инфекции в легких, крови и LN, используя обширные наборы данных NHP для построения модели, калибровки и валидации. Это позволяет генерировать большие (порядка тысяч) параллельные в силиконовом массиве данные для потенциальных биомаркеров. Одним из аспектов нашей силиконовой системы является способность точно моделировать Mtb-специфические частоты Т-клеток со временем. Эти данные показывают, что Mtb-специфические эффекторные частоты CD4 + и CD8 + T-клеток в крови могут служить потенциальными биомаркерами для прогнозирования результата инфицирования. Хотя полные диапазоны Tt-специфических частот Mtb в настоящее время не измеряются у приматов, многие исследования теперь доступны для эпитопов белков Mtb (например, ESAT-6, Ag85B, 16kDa, 19kDa, Hsp65, Rv1490) для наиболее распространенных человеческих HLA ( рассмотрен в [38]). Для каждого эпитопа диапазоны для частот антиген-специфичных Т-клеток варьируются от 0,05% до 1-2%. Если предположить, что весь репертуар, специфичный для Mtb-специфики, может быть представлен суммой ответов на многие из этих эпитопов, наша новая методология масштабирования-хозяина предлагает прогнозы, которые количественно сравнимы с этими диапазонами (рис. 7 и S8 рис.), ,

Из-за изменчивости молекул HLA человека и большого числа потенциальных Mtb-антигенов различение тотальных Mtb-специфических частот T-клеток в крови еще не представляется возможным, особенно для CD8 + T-клеток. Однако в недавних исследованиях были идентифицированы новые эпитопные последовательности из Mtb, которые вскоре могут быть мишенями для различения и количественного определения Mtb-специфичных ответов Т-клеток [38,39]. Это позволит предсказать состояние инфекции или результат лечения с использованием образцов периферической крови у инфицированных хозяев [40,41,42,43,44,45]. Например, недавнее исследование, проведенное Sette et al. [39], содержит обширный список эпитопов, полученных с помощью Mtb, распознаваемых CD4 + Т-клетками у здоровых и LTBI-индивидуумов. Авторы подчеркивают, что CD4 + Т-клетки из обеих групп распознают эпителии, не являющиеся туберкулезными микобактериями (НТМ, или воздействие на окружающую среду) (вероятно, от предыдущего воздействия). Это может также объяснить большую изменчивость, определенную в данных Т-клеток NHP, полученных здесь (рис. 5). Список пептидов, которые отражают истинную реакцию Mtb-специфики и окружающей среды, отнюдь не является полным, но мы можем разумно предположить, что в ближайшем будущем будут идентифицированы больше Mtb-специфических эпитопов. Измеряя эти специфичные для патогена ответы, мы будем иметь более адекватную оценку специфического иммунитета Mtb, генерируемого при инфекции, для корреляции с защитой или результатами. Более того, включив эти комбинации Mtb-специфических эпитопов в нашу вычислительную модель, мы могли бы в конечном итоге предсказать исход инфекции раньше или различить спектр результатов заражения.

Недавнее исследование пациентов с МЛУ-ТБ показывает, как наш подход может быть жизнеспособным в клинических условиях. Riou и др. [40] идентифицировали подмножество активированных и пролиферирующих Mtb-специфических CD4 + Т-клеток (т.е. Ki67 + HLA-DR +) в качестве потенциального маркера в периферической крови, который прогнозирует время конверсии культуры мокроты у больных туберкулезом в начале лечения , Еще одно недавнее перспективное исследование доказательной концепции использует новый анализ Т-клеточного активационного маркера-туберкулеза (т. Е. TAM-TB) на криоконсервированных образцах мононуклеарных клеток периферической крови для диагностики активного туберкулеза у детей на основе соотношений CD27-фенотипа CD4-T-клеток производя IFNγ в ответ на антигены Mtb (т.е. ESAT6 и CFP10) [42].

Также было высказано предположение о том, что смещение Mtb-специфической центральной памяти на Mtb-специфическую память CD4 + T-клеток с эффекторной памятью предшествует клиническому диагнозу активного туберкулеза на многие месяцы [44]. Если мы ограничим наш анализ отношениями Mtb-специфической памяти эффектов к Mtb-специфическим частотам T-памяти центральной памяти (в силиконных данных), то между скрытыми и активными группами туберкулеза не обнаружено существенной разницы (см. S9A рис.). Тем не менее, наши предсказания силикона для временных курсов отношений специфичных к Mtb эффекторов к Mtb-специфической центральной памяти CD4 + T-клеток и более высокие отношения в активной группе ТБ (статистически значимые только после инфицирования после 300 дней) подтверждают обнаружение Schuetz et al (S9B Fig и [44]).

При сложных заболеваниях, таких как сердечные заболевания и рак, набор биомаркеров лучше всего прогнозирует результаты заболевания и точки вмешательства в лечение. Наши исследования подтверждают, что для туберкулеза сложная пожизненная инфекция, которая разделяется главным образом в легких, отдельные биомаркеры в крови могут оказаться нецелесообразной целью. В сочетании с идеей о том, что исход инфицирования у хозяев, вероятно, происходит по спектру, идентификация одного биомаркера может быть ошибочной целью. Наш новый подход к биологии систем в сочетании с постоянным прогрессом для выяснения и выведения на поверхность Mtb-специфических эпитопов может существенно повлиять на формирование гипотез для прогнозирования биомаркеров для ТБ. Любое из силиконовых прогнозов может быть подтверждено на клинических данных и исследованиях на животных, добавив важные знания к иммунитету человека к исследованиям вмешательства ТБ и ТБ.

Целью этого исследования было разработать методологию выявления биомаркеров для лечения туберкулезной инфекции. Наш подход к системной биологии объединяет наборы данных о человеческом примате (NHP) вместе с компьютерным моделированием, позволяя генерировать виртуальные хосты, которые мы используем для обнаружения биомаркеров. В следующих разделах показано: i) экспериментальные наборы данных, ii) алгоритмы классификации, iii) структура вычислительного моделирования, iv) анализ силосных наборов данных, v) калибровка модели и vi) создание виртуальных хостов. Обратитесь к Рисунку 1 для общей дорожной карты всех разных наборов данных, которые были сгенерированы, и всех многочисленных анализов, которые были выполнены в этом исследовании.

Все экспериментальные манипуляции, протоколы и уход за животными были одобрены Комитетом по уходу и использованию животных в Институте Питтсбургского университета медицины (IACUC). Номер подтверждения протокола для нашего IACUC — A3187-01. Наши конкретные номера утверждений протокола для этого проекта — 11090030 и 12060181. IACUC придерживается национальных руководящих принципов, установленных в Законе о благосостоянии животных (7 USC Sections 2131-2159) и Руководстве по уходу и использованию лабораторных животных (8-е издание) в соответствии с мандатом в соответствии с Политикой общественного здравоохранения США.

Все макаки, ​​используемые в этом исследовании, размещались в Университете Питтсбурга в комнатах с автономно контролируемой температурой, влажностью и освещением. Животные были размещены в клетке не менее 2 квадратных метров, что позволяло визуально и тактильно соприкасаться с соседними специалистами. Макаки кормили два раза в день печеньем, приготовленным для не-человеческих приматов, дополняли по крайней мере 4 дня в неделю крупными кусочками свежих фруктов или овощей. У животных был доступ к воде ad libitem. Поскольку наши макаки были по отдельности размещены из-за инфекционного характера этих исследований, расширенный план обогащения был разработан и контролируется нашим специалистом по обогащению приматов нечеловека. Этот план состоит из трех компонентов. Во-первых, поощряется видовое поведение. Все животные имеют доступ к игрушкам и другим манипулятам, некоторые из которых будут заполнены пищевыми продуктами (например, замороженные фрукты, арахисовое масло и т. Д.). Они вращаются на регулярной основе. В клетку помещаются кормушки для кормушек и картонные трубки, содержащие мелкие пищевые продукты, чтобы стимулировать поведение кормления. Регулируемые зеркала, доступные для животных, стимулируют взаимодействие между животными. Во-вторых, поощряется рутинное взаимодействие между людьми и макаками. Эти взаимодействия происходят ежедневно и состоят в основном из небольших пищевых объектов, предлагаемых в качестве обогащения, и придерживаются установленных протоколов безопасности. Наблюдателям животных рекомендуется взаимодействовать с животными (говоря или с выражением лица) при выполнении задач в жилом помещении. Регулярные процедуры (например, кормление, чистка клеток и т. Д.) Проводятся по строгому графику, чтобы животные могли акклиматизироваться к ежедневному ежедневному графику. В-третьих, все макаки обеспечены разнообразной визуальной и слуховой стимуляцией. Жилищные зоны содержат либо радиоприемники, либо телевизоры / видеооборудование, которые играют в мультфильмы или другие форматы, предназначенные для детей, по крайней мере, 3 часа в день. Видеоролики и радиообороты вращаются между комнатами животных, так что одно и то же обогащение не воспроизводится повторно для одной и той же группы животных.

Все животные проверяются не реже двух раз в день, чтобы оценить аппетит, отношение, уровень активности, состояние гидратации и т. Д. После заражения M. tuberculosis животных тщательно контролируют на наличие признаков заболевания (например, анорексия, потеря веса, тахипноэ, одышка, кашель ). Физические экзамены, включая вес, выполняются на регулярной основе. Животных успокаивают перед всеми ветеринарными процедурами (например, при рисовании крови и т. Д.) С использованием кетамина или других одобренных препаратов. Регулярная PET / CT-визуализация проводится на большинстве наших макак после заражения и оказалась очень полезной для мониторинга прогрессирования заболевания. Наши ветеринарные техники тщательно следят за животными за любыми симптомами боли или бедствия. Если какие-либо из них отмечены, то предоставляется соответствующая вспомогательная помощь (например, диетическое добавление, регидратация) и клинические методы лечения (анальгетики). Любое животное, которое считается перенесенным заболеванием или трудноизлечимой болью или страданием от любой причины, успокаивается кетамином, а затем гуманно эвтанатизируется с использованием пентобарбитала натрия.

Двадцать восемь киномолгусных макак (Macacca fasicularis) были инфицированы низкой дозой Mtb (штамм Эрдмана, ~ 25-50 КОЕ) и клинически клинически наблюдались признаки и симптомы туберкулеза до шести месяцев после инфицирования. Инфекция была подтверждена трансформацией кожного теста туберкулина и / или анализом пролиферации лимфоцитов через шесть недель после инфицирования. Макаки были классифицированы (как описано ранее в [22,23,25]), чтобы иметь либо клинически скрытую туберкулезную инфекцию, либо активный ТБ (таблица S1, третья колонка) на основе клинических, радиологических и микробиологических критериев. Периферическую кровь собирали в моменты времени: pre Mtb-инфекцию (только для 9 NHP) и в дни 10, 20, 30, 42, 56, 90 (или M3, 3 месяца), 120 (или M4), 150 (или M5 ) и 180 (или M6) инфекции. PBMC выделяли, стимулировали пули пептидов Mtb-специфических антигенов ESAT-6 и CFP-10 (10 мкг / мл каждого пептида) или диботирата phorbol (PDBu) и иономицина в качестве положительного контроля и среды в качестве отрицательного контроля в присутствии Brefaldin A (BD biosciences) в течение 6 часов при 37 ° C с 5% CO2. Многопараметрическую внутриклеточную проточную цитометрию проводили на свежем PBMC для оценки профилей цитокинов CD4 и CD8 (GMCSF (клон: M5D12), IFN-γ (B27), IL-2 (MQ1-17H12), IL-4 (8D4- 8) IL-6 (MQ2-6A3), IL-10 (JES3-9D7), IL-17 (64CAP17) и TNF (MA611)) в ходе инфекции Mtb. На рисунке S1 показаны репрезентативные участки проточной цитометрии, где мы излагаем наши стратегии стробирования, используемые при анализе Т-клеток в РВМС.

Мы создали четыре разных набора данных: один набор данных цитокинов (где каждая клетка была помечена для одного цитокина, таблица S2), множественный набор данных цитокинов (где каждая клетка была помечена для одновременного присутствия более 1 цитокина, таблицы S3), (S4 Table, где один и тот же профиль цитокинов одного набора данных цитокинов стратифицирован подкатегориями памяти CD4 + и CD8 + на основе экспрессии CD45RA и CD27, а именно Naivve-N [CD45RA + CD27 +], Central Memory-CM [CD45RA-CD27 +], Effector Memory-EM [CD45RA-CD27-] и Terminal Differentiated-TD или Effector-E [CD45RA + CD27-] и набор данных Т-клеток (где измеряются только уровни фенотипов памяти CD4 + и CD8 +, таблица S5 ). S6 Таблица суммирует частоты Т-клеток, стимулированных ESAT6 или CFP10-стимулированной памятью, которые продуцировали любой цитокин (т.е. IFN-γ, IL-2, IL-6, IL-10, IL-17 и TNF) при стимуляции.

Все эти наборы данных показаны на рис. 1 под серым ящиком с надписью NHP, с подробным описанием, приведенным в таблице 1. Полные наборы данных доступны в качестве дополнительного материала (таблицы S1-S6). Экспериментальная конструкция описана на фиг. 2A. Временные точки, измеренные в наборе данных Т-клеток (таблица S5), немного отличаются от трех других наборов данных (таблицы S2-S4, см. Таблицу 1 для подробной информации о четырех наборах данных). Первые три набора данных были использованы для машинного обучения (шаг 1 на рис. 1), в то время как набор данных Т-клеток (таблица S5) использовался для построения (рис. 2B) и калибровки в силиковой модели для отсека крови вычислительной модели (( шаг 2 на рис. 1 и рис. 4). Кроме того, набор данных Т-клеток памяти ESAT6-CFP10 (таблица S6) использовался для пробной проверки модели предсказаний частоты Mtb для нашей силиконовой модели (рис. 5). Таблица S1 (все были классифицированы как скрытые [зеленые] или активные [красные] ТБ), 28 из которых имеют иммунологические данные из крови (однократные, множественные и а также набор данных Т-клеток). Что касается числа гранулем и КОЕ на данные гранулемы, таблица S1 содержит все данные о 43 НХП, которые были вскрыты (со временем включения вскрытия), 12 из которых являются включенных в 28 NHP данных крови. Таблица S1 использовалась для калибровки легочного отделения e вычислительная модель (шаг 2 на рис. 1 и рис. 3).

Данные для некоторых профилей цитокинов были вменены (приписаны) с использованием методов, описанных в [46], которые полагаются на подход «ближайший сосед» или локальный метод усреднения для заполнения пропущенных значений. Метод вменения является стохастическим по природе [46] и, следовательно, чувствителен к начальному случайному семени. Результаты, представленные ниже, были получены путем усреднения более 1000 испытаний вменения и классификации. Результаты были качественно без изменений независимо от того, были ли профили цитокинов масштабированы, чтобы иметь единичную дисперсию. Анализ проводили в R (версия R 2.14.2) и в Matlab ((R2011b v7.13)).

Для определения возможных коррелятов защиты экспериментальных данных в таблицах S2-S4 мы применили два типа методов классификации, дискриминантный анализ и логистическую регрессию [47]. Самые популярные версии этих методов основаны на линейной зависимости (например, линейном дискриминантном анализе-LDA) между коррелятами защиты и результатом заражения туберкулезом макак. Из-за относительно низкой производительности этих классических подходов мы также применили три других метода, которые обладают дополнительной гибкостью. Первый — это квадратичный дискриминантный анализ (QDA), который может быть подходящим, если существуют квадратичные соотношения между возможными коррелятами и результатом туберкулезной инфекции [47]. В последних двух методах используется статистический метод, называемый l1-регуляризацией, который опирается на ограниченную оптимизацию для определения важных переменных в модели и, следовательно, минимизирует частоту ошибочной классификации разных моделей [47]. Мы ссылаемся на последние две модели как на оштрафованный линейный дискриминантный анализ (PLDA) и логистическую регрессию. Функции перекрестной проверки в пакете R используются для выбора параметров регуляризации для PLDA и логистической регрессии [48,49]. В дополнение к выполнению всех методов на наборах данных мы также применяли каждую технику к данным, проецируемым на первые 3 основных компонента, которые захватывали более 50% изменчивости данных. Наша цель заключалась в том, чтобы попытаться повысить производительность за счет сокращения числа ковариаций цитокинов.

Наша цель — предсказать результат заражения туберкулезом, двоичную переменную (1 для активных, 0 для скрытых), а результаты для разных методов измеряются набором специальных показателей, называемых чувствительностью, специфичностью и ошибкой ошибочной классификации. Чувствительность — это скорость, с которой правильно предсказаны активные туберкулезные инфекции (истинная положительная скорость), специфичность — это скорость, с которой правильно предсказаны латентные ТБ-инфекции (истинная отрицательная скорость), а частота ошибок ошибочной классификации — общая частота ошибок прогнозирования [48]. Чтобы избежать сообщения о чрезмерно оптимистичном (смещенном из-за переуплотнения) результатах, мы удерживаем 50% данных при оценке параметров модели и тестируем смонтированную модель на оставшихся данных. В дальнейшем мы ссылаемся на данные, полученные в качестве тестовых данных, и остальную часть данных, используемых для оценки модели в качестве данных обучения. Результаты качественно не изменяются для другого количества макак в наборе тестовых данных по сравнению с набором тренировок. Заметим также, что данные рассматриваются каждым из четырех методов для поперечного сечения, то есть непосредственное применение каждого метода игнорирует временную информацию.

Поскольку мы обнаружили, что шесть макак в исследовании были последовательно неправильно классифицированы по нашим алгоритмам классификации, мы повторно проанализировали данные крови с использованием неконтролируемых алгоритмов кластеризации (т. Е. Многомерного масштабирования, метода Уорда и других иерархических методов и k-средств) [47] , Эти алгоритмы пытаются найти присущие группировки в профилях цитокинов и, следовательно, потенциально могут идентифицировать возможный спектр латентности, а не определять между активными и скрытыми случаями.

Многомерное масштабирование (MDS) — это метод визуализации, который формирует двумерное представление макак, где расположение каждой макаки в двумерном пространстве оптимизировано так, что макаки, ​​близкие друг к другу, наиболее схожи.

Иерархическая кластеризация полной и средней иерархии, а также метод Уорда называются «агломеративными» или восходящими подходами, поскольку они начинаются с каждой макаки как своего собственного кластера, а затем группируют их вместе до тех пор, пока не будут выполнены критерии остановки. В отличие от агломеративных подходов, K-средство представляет собой метод разбиения сверху вниз, где первоначально все макаки принадлежат одному кластеру. Затем кластеры постепенно разбиваются на более мелкие кластеры (см. [47]). Можно было бы ожидать последовательных результатов между этими различными методами, хотя они принимают разные подходы к обнаружению групп макаков. Дико различающиеся результаты по методам указывают на то, что данные характеризуются высокими уровнями шума, которые маскируют возможную структуру между макаками.

Наша гибридная модель (ABM, маркированная GranSim) отслеживает инфекцию Mtb в 3 физиологических отделениях: легкое (место заражения), дренирующий лимфатический узел (LN, сайт генерации адаптивного иммунитета) и кровь (измеримый отсек, см. Рис. 2B для получения подробной информации). Наша вычислительная модель фиксирует образование и функцию одиночной гранулемы в легких [30,31,32,33], тогда как LN и отделения крови [28,29] представляют собой динамику всего организма в ответ на инфекцию. Мы имитируем заражение в течение периода времени 600 дней, причем правила и взаимодействия решаются на 10-минутном временном шаге, который можно найти по адресу http://malthus.micro.med.umich.edu/GranSim/.

Среда легкого представляет собой секцию ткани паренхимы легкого размером 2 × 2 мм. Подробности о инициализации легких можно найти в [30,31,32]. Типы клеток, захваченные в модели, представляют собой макрофаги и Т-клетки (или Т-лимфоциты). Переход макрофагов между следующими состояниями: покоящийся, активированный, инфицированный и хронически инфицированный. Т-клетки представлены их функциями: Tγ (т. Е. Т-клетки, продуцирующие IFNγ, необходимые для активации макрофагов), Tcyt (то есть цитотоксические Т-клетки) и Treg (регуляторные Т-клетки). Также отслеживаются две эффекторные молекулы, а именно фактор некроза опухоли-α (TNF) и интерлейкин 10 (IL-10).

LN и динамика крови захватываются раздельной системой обыкновенных дифференциальных уравнений (ODE) (см. S1 Text для уравнений и деривации). Мы обновили опубликованные многокамерные вычислительные модели34, 35, в которых мы теперь отслеживаем CD4 + и CD8 + T-лимфоциты с различными фенотипами памяти (т. Е. Naiv, Effector, Central и Effector Memory).

Здесь используются два новых механизма для GranSim: рекрутирование и пролиферация Т-клеток в месте заражения (подробно описано в S2 Text-T-клетке и пролиферации Т-клеток в легких).

Большим преимуществом силиконового представления является то, что мы можем отслеживать как Mtb-специфичные, так и не Mtb-специфичные Т-клетки (набор данных Т-клеток не различает специфичные для Mtb и не-Mtb-специфичные типы клеток). Динамика лимфатического узла-крови захватывается 31 уравнением ОДУ с 21 независимым параметром. Единицы измерения — это количество клеток в LN и клетке / мм3 в крови. Подробная информация о начальных условиях модели и диапазонах параметров приведена в таблицах S8 и S9. На фиг.2B показаны различные фенотипы Т-лимфоцитов, отслеживаемые в модели, и некоторые предположения относительно праймирования, торговли и дифференцировки клеток.

Наши экспериментальные данные показывают, что один LN истощает множественные гранулемы, образующиеся в легких [20,21,22]. Мы переносим крупнозернистую клетку с места заражения (GranSim) на дренажный лимфатический узел. Представление и праймирование антигена, происходящее в LNs, обусловлено проксимином для динамики антиген-представляющих клеток (APCs, (1.1) в S1 Text), который представляет собой количество макрофагов в легких, которые взаимодействуют с Mtb (MMtb) в любой момент во время инфекции (подробнее см. [28]). Однако считается, что только небольшая часть клеток (например, ~ 5-10%), которые сталкиваются с Mtb в легких, способны трафик и мигрировать в LNs [50,51,52,53,54]. Из-за вычислительного ограничения легочное отделение отслеживает образование и прогрессирование одной гранулемы, а не множественные гранулемы, развивающиеся одновременно. Таким образом, количество MMtb является завышенным для торговли APC с LN из одной гранулемы. Однако мы используем счет MMtb как разумный прокси для динамики APC для всего хоста. Это предположение подразумевает, что мы калибруем вычислительную модель, как если бы хозяин развивался между 10 и 20 подобными гранулемами в легких (сопоставляя 5-10% клеток, которые, вероятно, мигрируют к LN при инфекции) [25]. Это позволяет использовать набор данных Т-клеток для калибровки вычислительной модели в крови (поскольку данные крови, измеренные в этом наборе данных, отражают инфекцию туберкулеза цельного NHP), а также в легких, используя наши данные по КОЕ на гранулему в NHPs [21,22]. Исходя из вышеприведенных предположений, когда множественные гранулемы объединяются вместе для генерации виртуальных NHP и улавливают гетерогенные результаты гранулемы в пределах одного хозяина, в силиконовых анализах крови для всего хозяина вычисляют как средние и медианные (вместо сумм) по всем гранулемам (см. рис. 6 и 7 и S8 и S9 Рис.). В настоящее время мы работаем над вычислительной платформой, где одновременно можно моделировать множественные гранулемы и иметь потенциал для взаимодействия друг с другом, имитируя всю динамику легочной инфекции.

Два фенотипа Т-клеток между LN и кровью, а именно наивные и центральные ячейки памяти (отдельные уравнения описаны для CD4 + и CD8 + T-клеток, а также для Mtb-специфичных и не-Mtb-специфических, см. S1 Text для деталей). Mtb-специфичные наивные Т-клетки заправлены АРС в LN, чтобы стать Т-клетками-предшественниками, которые пролиферируют и в конечном счете дифференцируют в Mtb-специфическую центральную память и / или Mtb-специфический эффектор, в зависимости от силы стимуляции APC [55,56,57 , 58]. Mtb-специфические ячейки центральной памяти могут быть повторно стимулированы в LNs (подобно Naive) и снова стать предшественниками [59,60]. Mtb-специфические клетки-эффекторы могут дифференцироваться в ячейки памяти с эффекторной ячейкой Mtb [61]. Все клетки в отсеке LN (за исключением APC и предшественника) мигрируют в кровь (как показано на рис. 2B).

Мы смоделировали Mtb-специфические процессы CD4 + T-клеток в LN и отделениях крови, идентичные тому, как моделируются CD8 + T-клетки, за исключением Mtb-специфического прайминга Naivve CD8 +, который зависит от Mtb-специфического Naivve CD4 + -направки. Мы смоделировали не-Mtb-специфичные Т-клетки (серые круги на фиг. 2B) аналогично их соответствующим типам клеток, специфичным для Mtb (цветные круги на фиг.2B). Однако не-Mtb-специфичные клетки не реагируют на антиген, поэтому в какой-либо из этих популяций клеток в LN не происходит зачатия, и никакие клетки-предшественники не генерируются. Мы предполагаем, что ни эффекторные, ни эффекторные ячейки памяти не переходят в LN после миграции в кровь: они рециркулируют через кровь и в конечном итоге мигрируют в легкие (как показано на рис. 2B). Производство не-Mtb-специфичных эффекторных клеток фиксировалось как исходный термин в крови и калибровалось до набора данных Т-клеток до заражения (таблица S5).

GranSim — это модель на основе агентов, реализованная с использованием языка программирования C ++ в сочетании с библиотеками Boost (распространяется под лицензией Boost Software, доступной по адресу www.boost.org). Графический пользовательский интерфейс (GUI) был построен с использованием инфраструктуры Qt (с открытым исходным кодом, распространяемой по GPL-доступному на qt.digia.com), что позволяет нам отображать, отслеживать и отображать различные показания моделирования силиковой гранулемы в реальном -время. Отделения лимфатических узлов и крови моделируются вместе как система обычного дифференциального уравнения (ОДУ) (как показано на рис. 2В). Они сопряжены с GranSim численными решениями ODE, реализованными как часть платформы C ++, все внутри нашего собственного кода. Трехсекционная модель может использоваться с визуализацией GUI или без нее и является кросс-платформенной (Mac, Linux, Windows). Моделирование вычислительной модели было выполнено на XSEDE OSG Condor pool и NERSC Edison Cray XC30. Первоначальная калибровка модели ODE и анализ результатов были выполнены в Matlab, а также весь анализ после обработки данных, полученных нами в модели Silico. Мы используем данные предварительной инфекции NHP min-max из набора данных Т-клеток, чтобы установить диапазоны для начальных условий для модели ODE крови (гомеостаз, см. Таблицу S8 для получения подробных сведений об исходных условиях). Мы предполагаем, что эти уровни представляют собой поток клеток, постоянно осуществляющих торговлю через LN. Поэтому начальные числа клеток в сливном LN легких рассчитывались путем деления количества крови в крови на количество LN в хозяине (то есть параметр host_Ln в таблице S9). Мы также предположили, что частота Mtb-специфичных Naive T-клеток (параметр λ) составляет от 0,001 до 0,00001 (т. Е. [1e-3, 1e-5]) [62].

Большинство значений параметров модели, используемых здесь, взяты из наших ранее опубликованных исследований [28,29,30,31,53,63,64] и перечислены в таблице S9. Кроме того, мы полагаемся на методы анализа неопределенности, чтобы эффективно исследовать пространство параметров и сообщать о базовом поведении системы (анализ неопределенности-UA). Здесь мы использовали Latin Hypercube Sampling (LHS, рассмотренный в [65]) для UA. Алгоритм LHS представляет собой стратифицированный метод выборки методом Монте-Карло без замены [65]. Он был использован для создания 1000 уникальных наборов параметров, которые имитируются в репликации 10 раз (в общей сложности 10 000 в силиконовых симуляциях). Мы варьировали 21 параметр / механизм в клетках крови и LN, а также 8 начальных условий для Naiv, Эффектор, Эффекторная память и память для эффекторов CD4 + и CD8 + (см. Таблицы S8 и S9 для диапазонов, используемых для генерации в силиконовых гранулемах и крови / LN). Параметры / механизмы в GranSim были обновлены с учетом последних знаний и данных (см. [30] для деталей и http://malthus.micro.med.umich.edu/GranSim/) и были зафиксированы в наших экспериментах LHS как кровь и Параметры LN варьировались.

В силиконовом наборе данных представлены множества из 10 000 модельных симуляций (то есть 1000 × 10 повторений) одиночных гранулем, связанных с LN и динамикой крови в течение периода времени 600 дней после заражения (шаг 3 на фиг.1). Мы проанализировали следующие показания в трех отделениях: отсек крови (16 переменных), лимфатический узел (15 переменных), количество макрофагов и Т-клеток в легких, а также измерения в легких, такие как размер поражения, TNF и IL-10 общие уровни, цитотоксическое убийство и скорость разрыва инфицированных макрофагов (всего 48, см. таблицу S11 для полного списка). Мы использовали одни и те же моменты времени из экспериментальных данных (например, 9 временных точек из набора данных Т-клеток, 10-й, 20, 30, 42, 56, 90, 120, 150 и 180 пост-инфекции) и моделирования вычислительной модели для прямого сравнения между выходами in vivo и силиконовой модели для измерения крови (шаг 2 на рис. 1). Мы продолжили анализ до 600 дней, чтобы выполнить шаг масштабирования к хозяину, поскольку мы сопоставимы с NHP, которые были вскрыты между 200 и 600 днями после инфицирования. Анализ основных компонентов (PCA) проводился на силиконовом наборе данных (шаг 4 на рис. 1), после того как вычислительная модель была откалибрована к экспериментальным данным. Мы определили Mtb-специфичные частоты для каждого фенотипа Т-клеток как соотношение между количеством Tt-специфичных Т-клеток по сравнению с общим количеством Т-клеток.

Расчетная модель была откалибрована по динамике i) CFU / гранулемы на основе наших последних экспериментальных данных NHP [21,22] (см. Таблицу S1 и этап 2 на рис. 1), а также на ii) динамику Т-клеток крови, измеренную в набор данных Т-клеток (см. таблицу S5 и шаг 2 на рис. 1). Таблицы S8 и S9 показывают диапазоны, используемые для генерации нашего в силиконовом наборе данных из 10 000 гранулем (шаг 3 на рис. 1). Моделирование в 10 000 моделей привело к динамике CFU, а также динамике Т-клеток в крови, которые мы сравниваем с экспериментальными данными NHP (как показано на рис. 3 и 4). Поскольку набор данных Т-клеток измерял совокупность T-клеток, а не Mtb-специфических подмножеств, мы суммировали Mtb-специфические и не Mtb-специфичные в предсказаниях силиконов, чтобы соответствовать нашим экспериментальным данным. Из-за большой изменчивости в наборе данных Т-клеток мы не накладывали строгих критериев калибровки модели. Расчетная модель считалась адекватно откалиброванной, если минимальные, средние, средние и максимальные по силиковым траекториям находились в пределах продольных данных, измеренных в экспериментальных условиях.

Только 12 NHP (из 28 в наборах данных, используемых для классификации) имеют как данные о крови, так и данные о легких, поэтому мы использовали эти 12 NHP для первоначальной калибровки модели (рис. 4). Затем мы объединили данные о легких на CFU из 43 NHPs с данными крови из 12 NHPs, чтобы увидеть, имеют ли все виртуальные NHP динамики крови в пределах экспериментальных интервалов (рис. 4). 12 NHP смещены в сторону скрытых (9) против активного ТБ (3) и ограничены до 6 месяцев (в то время как экспериментальные данные легких доступны до 600 дней). На фиг.5 представлены данные фенотипа памяти Т-клеток, показанные как частоты Т-клеток, продуцирующих любой цитокин в ответ на стимуляцию ESAT6 / CFP10.

По причинам, изложенным выше, и поскольку временные интервалы экспериментальных данных по крови NHP недоступны для соответствия нашим предсказаниям частоты Т-клеток, специфичным для Mtb (шаг 6 на рис. 1), фиг.7, S8 и S9 показывают только на силико-временных курсах.

Чтобы позволить нашей модели быть непосредственно сопоставимой с NHP и данными о человеке, которые отслеживают прогрессию инфекции, мы разработали метод масштабирования одиночных результатов гранулемы в легких для определения уровня концентрации в крови. Подход виртуального NHP-генерации использует другой набор данных NHP по сравнению с подходом машинного обучения (шаг 5 на рис. 1). Мы направляем генерацию виртуальных NHP путем репликации гетерогенности гранулемы и изменчивости в легком до 600 дней после инфицирования (т. Е. # Грануломы и КОЕ / гранулема в таблице S1). Затем мы анализируем динамику силиконовой крови, чтобы предсказать возможные потенциальные биомаркеры для результата заражения. Полный протокол, показанный на фиг. 6, включает следующие этапы: i) выбрать количество гранулем для повторной репликации при заражении со временем в каждом известном NHP из наших экспериментальных данных NHP (см. Таблицу S1), ii) имитировать значения КОЕ / гранулемы по отбор проб только гранулем, которые имеют аналогичную нагрузку КОЕ из нашего хранилища в 10 000 в силиконовых гранулемах (на основе рис. 3 и 4, расчеты вычислительной модели находятся в пределах диапазона изменчивости, измеренной экспериментальными данными в легком и в крови, таким образом, выборка является оправдано), iii) собирать в силиконовых анализах крови, предсказанных для каждой гранулемы, а затем усреднять их по всем гранулемам; iv) повторять шаги ii) и iii) K раз (для захвата в пределах изменчивости хозяина мы использовали K = 1000) и генерировали статистику (например, средства, медианы, стандартные отклонения) на повторениях K для повторения в данных силиковой крови на одном виртуальном хосте, v) повторить шаги i) -iv) для всех NHP в наборе данных.

Например, NHP 21710 (латентный ТБ, строка 14 в таблице S1) имеет 12 гранулем; 8 из них являются стерильными, а 4 имеют следующее ОБЯЗАТЕЛЬНОЕ ОБЯЗАТЕЛЬСТВО: 38, 142, 38 и 1133. Виртуальный NHP 21710 был построен путем отбора проб 12 в гранулемах силикоса из нашего хранилища в тот день, когда NHP 21710 был вскрыт (т.е. через 370 дней после заражения) , Для стерильных гранулем мы используем критерии КОЕ <1 на гранулему, а для нестерильных гранулем мы отбираем из подмножеств в силиконовых гранулемах, которые попадают в ± ± диапазон экспериментальных данных NHP (рис. 6). Мы использовали α = 10%. Числа из силиконовых гранулем, которые удовлетворяют нашему условию для стерильных гранулем (то есть КОЕ <1) на 370 после инфицирования, составляют 2257 из 10 000. Для первой нестерильной гранулемы NHP 21710 (CFU = 38) мы сначала выбираем в силиконовых гранулемах с КОЕ в диапазоне ± 10%, а именно [30,46] (т. Е. 66 гранулем), а затем произвольно выбираем один без замена (таким образом, третья гранулема, которая имеет тот же КОЕ, не будет назначаться в силиконовой гранулеме, выбранной для первой). Вторая гранулема будет выбрана из диапазона [113, 170] (т. Е. 12 гранулем) и т. Д. После того, как все образцы гранулемы силикона были отобраны, мы усредняем показания крови по всем смоделированным гранулемам (12 гранулем для NHP 21710), а затем вычисляем значения для общих уровней Т-клеток, а также для Tt-специфичных частот T-клеток в кровь. Мы повторяем ту же процедуру K раз (K = 1000) для того же виртуального NHP, чтобы учитывать изменчивость результатов гранулемы и генерировать статистические данные (средние, медианные, стандартные отклонения) для переменных, используемых для корреляции в силовикских временных периодах крови с результатом инфекции (например, , общие уровни Т-клеток, а также МТb-специфические частоты Т-клеток, см. рис. 6).

Мы применили метод масштабирования к хозяину 43 NHPs, которые были классифицированы как скрытые (20 NHPs) или активные (23 NHPs) TB, и которые имеют данные о числах гранулем в легких и CFU / гранулеме для каждой гранулемы (выделены желтым цветом в таблице S1). После того, как все статистические данные для считывания крови были рассчитаны на 43 виртуальных NHP, мы сгенерировали траектории (см. Рис. 7, S8 и S9) путем группировки активных виртуальных виртуальных NHP, и мы тестируем, если какой-либо из них существенно отличается (t-тест) время и вероятный прогноз развития инфекции (шаг 6 на рис. 1). На рисунках 7, S8 и S9 показано, как мы использовали в силиконных предсказаниях для временных курсов для всех уровней CD4 + и CD8 + T-клеток, а также для частот T-клеток, специфичных для Mtb, для прогнозирования результата инфицирования виртуальных NHPs, используя клиническую известную классификацию между скрытыми и активные группы ТБ из таблицы S1.

Математическая модель, описывающая динамику популяции клеток в отделах крови и лимфатических узлов вычислительной модели, описанной на рис. 2B.

(DOCX)

Щелкните здесь для получения дополнительных данных.

Т-клеточный рекрутинг и пролиферация Т-клеток в легких.

(DOCX)

Щелкните здесь для получения дополнительных данных.

(2712- 6 месяцев после инфекции, стимулированной ESAT-6 (A-D) или P & I (E)), в которой излагаются стратегии стробирования, используемые в аналитических Т-клетках в РВМС. (A) Синглы были установлены на основе высоты прямого разброса (FSC-H) и области (FSC-A). Из синглетов, (B) Лимфоциты были выбраны на основе SSC и FSC (то есть размера и зернистости). Клетки CD4 или CD8 (C) были закрыты по популяции лимфоцитов. Из подмножеств памяти CD4 или CD8 T-клеток (D) были выбраны на основе CD45RA и CD27-маркеров следующим образом: CD45RA + CD27 + как Naïve, CD45RA-CD27 + в качестве центральной памяти, CD45RA-CD27- в качестве памяти эффектов и CD45RA + CD27- в качестве Effector или терминально дифференцированы. Цитокин, продуцирующий Т-клетки CD4 или CD8 или подмножества памяти, был показан, как показано (E). Стрелка указывает последовательность стробирования.

(TIF)

Щелкните здесь для получения дополнительных данных.

Показатели бинарных классификационных алгоритмов, показанные в таблице 2, были измерены в наборах данных одиночного и пассивного цитокинов путем расчета кривых их принимающей рабочей характеристики (ROC) (панели A и B). Площадь под кривой (AUC) и значения ошибки ошибочной классификации показаны на панелях C и D. Сценарий для генерации ROCs был записан в R, используя библиотеку «ROCR» и функцию производительности с истинным (т. Е. Tpr) и ложные положительные ставки (т. е. fpr) для функции стоимости (например, производительность (pred, «tpr», «fpr»)). Стоимость, связанная с tpr и fpr, одинакова.

(TIF)

Щелкните здесь для получения дополнительных данных.

(A-C): анализ основных компонентов (PCA), выполненный только по специфическим для Mtb переменным в отсеке крови из того же хранилища в 10000 случаев силиконовой гранулемы, используемого для генерации Рис. 4. (A): участок Pareto из 10 лучших PCA. Мы можем достичь ~ 70% объясненной дисперсии, суммируя верхние 2 СПС. Панель B: диаграмма рассеяния PCA1 и PCA2. Панель C: biplot, связанная с панелью B, с категориями, перечисленными в четырех квадрантах. Каждая категория указана как фенотип Т-клеток, специфичный для Mtb, в определенный промежуток времени после инфицирования. Например, «E8 42» относится к эффекторным CD8 + Т-клеткам на 42-й день после инфицирования. (Показаны другие фенотипы Т-клеток: CM [центральная память]).

(TIF)

Щелкните здесь для получения дополнительных данных.

Показания крови и легких (всего 49 отсчетов). (A) — (C): разброс графиков 1-го основного компонента по сравнению с 2-м, 3-м и 4-м основным компонентами соответственно. (D) — (E): разброс графиков 2-го основного компонента по сравнению с третьим и четвертым основными компонентами. (F): график рассеяния 3-го и 4-го основных компонентов.

(TIF)

Щелкните здесь для получения дополнительных данных.

См. Таблицу S11 для получения подробной информации о метках оценок. Число после знака подчеркивания относится к дню после заражения, на котором эта переменная измеряется. Мы составляем верхние 4 основных компонента, потому что они объясняют ~ 60 изменчивости. (A) — (C): биплоты оценок, связанных с диаграммами рассеяния 1-го основного компонента по сравнению с 2-м, 3-м и 4-м главными компонентами (как показано на S4 Fig, панели (A) — (C)) соответственно. (D) — (E): биплоты оценок, связанных с диаграммами рассеяния 2-го основного компонента по сравнению с 3-м и 4-м главными компонентами (как показано на S4 Fig, панели (D) — (E)). (F): биплот оценок, связанных с графиком рассеяния 3-го и 4-го основных компонентов (как показано на рис. 5, панель (F)).

(TIF)

Щелкните здесь для получения дополнительных данных.

На каждой панели показано то же хранилище 10 000 в силиконовых гранулемах, связанных с кровью и динамикой LN, используемой для генерации рис. 3 и 4. Каждая точка на графиках представляет собой один в силиковой гранулеме. Здесь мы связываем информацию как с кровью (осью x), так и с легким (ось y). Ось y представляет собой CFU / гранулему, тогда как ось x представляет собой отношение Mtb-специфических vs не-Mtb-специфичных уровней Effector CD4 + клеток в крови на день 167 после инфекции. Обе оси отображаются в шкале журнала. Панели B и F используются в S7 Fig (панели C и D) для детальных исследований. (A) — (D): рассеивают графики CFU на гранулему (ось y) по сравнению с Mtb-специфическими частотами различных фенотипов CD4 + T-клеток (то есть Naiv, эффектор, центральная память и память эффектора). (E) — (H): диаграммы рассеяния CFU на гранулему (ось y) по сравнению с Mtb-специфическими частотами различных фенотипов CD8 + T-клеток (то есть Naiv, эффектор, центральная память и память эффектора).

(TIF)

Щелкните здесь для получения дополнительных данных.

(A-D): диаграммы рассеяния того же хранилища в 10 000 в силиконовой гранулеме, связанные с кровью и динамикой LN, используемой для генерации рис. 3 и 4. Каждая точка на графиках представляет собой один в силиковой гранулеме. Здесь мы связываем информацию как с кровью (осью x), так и с легким (ось y). Ось y представляет собой CFU / гранулему, а ось x — это специфическая частота Mtb для уровней клеток Effector CD4 + (A-день 140 / C-day 167) и CD8 + (B-day 140 / D-day 167) в кровь (A-день 140 / B-день 167). Mtb-специфическую частоту рассчитывают путем деления числа Mtb-специфичных клеток на все Т-клетки в каждом конкретном фенотипе. Так, например, значения на оси x панели D вычисляются путем деления Mtb-специфических счетчиков эффектов CD4 + T-клеток на общее количество отсчетов Т-клеток Effector CD4 +. Обе оси отображаются в шкале журнала. Горизонтальные черные линии расположены на 100 КОЕ на гранулему, и они разделяют гранулематозные кластеры, выходящие из 10000 силиконовых симуляций, как на низкие или высокие гранулемы КОЕ. Вертикальные красные линии представляют собой пороговые значения частоты, определенные в Mtb, предлагаемые на каждой панели для прогнозирования гранулемы с низким и высоким КОЕ. Мы выбрали эти два момента времени (т. Е. День 140 и день 167), поскольку они показали наилучшее разделение между кластерами гранулемы с низкой и высокой нагрузкой КОЕ. Все другие специфичные для Mtb частоты, которые могут быть рассчитаны по силиковым данным (а именно, наивные, эффекторные, центральные и эффекторные отношения памяти для CD4 + и CD8 + Т-клеток) и нанесены на график CFU / гранулемы в последний момент времени, измеренный в наборе данных памяти (т. е. после инфицирования в день 167) показаны на S6 Рис. Существует небольшое количество гранулем, которые не попадают ни в одну из этих групп (т. е. когда высокий коэффициент CFU связан с низкими МТb-специфическими частотами Т-клеток, ложноположительная группа если мы используем порог частоты как биомаркер).

(TIF)

Щелкните здесь для получения дополнительных данных.

Траектории более 600 дней уровней Т-клеток, как общих, так и Mtb-специфических, а также Mtb-специфических Т-клеточных частот. Представленные данные были сгенерированы после шагов, показанных на рис. 6, а также в разделе «Материалы и методы». 43 виртуальных NHP были классифицированы на основе известного клинического результата и отображаются во всех панелях как среднее +/- 2x (стандартная ошибка). Звездочки показывают значительный (p <0,05) студенческий t-тест между двумя траекториями в одно и то же время. Панель A: уровни Т-клеток. Панель B: общий уровень CD4 + Т-клеток. Панель B: общие уровни T-клеток, специфичные для Mtb. Панель C: общие уровни T-клеток, не специфичные для Mtb. Панель D: общее количество нечетких CD4 + T-клеток, не содержащих Mtb. Панель E: общие уровни, не содержащие Mtb CD8 + Т-клеток. Панель F: Частота МТb-специфичных Naiv CD4 + Т-клеток. Панель G: Частота МТБ-специфической центральной памяти CD4 + Т-клеток. Панель H: частота МТb-специфичных Naivve CD8 + Т-клеток. Панель I: Частота Mtb-специфической центральной памяти CD8 + T-клеток.

(TIF)

Щелкните здесь для получения дополнительных данных.

Траектории более 600 дней отношения МТb-специфических уровней CD4 + Т-клеток. Показанные данные были сгенерированы после шагов, показанных в 6, а также в разделе «Материалы и методы». 43 виртуальных NHP были классифицированы на основе известного клинического результата и отображаются во всех панелях как среднее +/- 2x (стандартная ошибка). Звездочки показывают значительный (p <0,05) студенческий t-тест между двумя траекториями в одно и то же время. Панель A: отношение памяти эффектора к центральной памяти Mtb-специфических CD4 + Т-клеток. Панель B: отношение эффектора к центральной памяти Mtb-специфических CD4 + Т-клеток.

(TIF)

Щелкните здесь для получения дополнительных данных.

(XLS)

Щелкните здесь для получения дополнительных данных.

(XLSX)

Щелкните здесь для получения дополнительных данных.

(XLS)

Щелкните здесь для получения дополнительных данных.

(XLSX)

Щелкните здесь для получения дополнительных данных.

(XLS)

Щелкните здесь для получения дополнительных данных.

(XLS)

Щелкните здесь для получения дополнительных данных.

(PDF)

Щелкните здесь для получения дополнительных данных.

(PDF)

Щелкните здесь для получения дополнительных данных.

(PDF)

Щелкните здесь для получения дополнительных данных.

(DOC)

Щелкните здесь для получения дополнительных данных.

(PDF)

Щелкните здесь для получения дополнительных данных.

Мы благодарим Пола Вольберга за техническую поддержку при разработке вычислительной модели.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *