Нажмите "Enter", чтобы перейти к контенту

BRCA-Monet: специальная сеть лечения рака, предназначенная для лечения рака молочной железы, для эффективного прогнозирования лечения с использованием крупномасштабной базы данных микрочипов

BRCA-Monet: a breast cancer specific drug treatment mode-of-action network for treatment effective prediction using large scale microarray database
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4029357/

Карта подключения (cMap) — это недавно разработанный набор данных и алгоритм для выявления и понимания эффекта обработки малых молекул на разных линиях раковых клеток. Он широко используется, но все еще остаются проблемы для точных прогнозов.

Здесь мы предлагаем BRCA-MoNet, сеть лекарственного способа действия (MoA), специфичную для рака молочной железы, которая построена на основе набора данных cMap. Для более эффективного прогнозирования эффектов лекарственного средства разработаны алгоритм выбора подписей на лекарственные препараты, соответствующие характеристике данных cMap, схема контроля качества, а также новый алгоритм запросов на основе BRCA-MoNet.

BRCA-MoNet применялась к трем независимым наборам данных, полученным из базы данных GEO: клеточная линия MCF7, обработанная эстрондом, клеточная линия MCF7, обработанная BMS-754807, и набор данных микрочипов пациента с раком молочной железы. В первом случае BRCA-MoNet может идентифицировать МТС, которые могут использовать один и тот же эффект обратного лечения. Во втором случае результат продемонстрировал потенциал BRCA-MoNet для перестановки лекарств и прогнозирования эффектов лечения для препаратов, а не данных cMap. В третьем случае демонстрируется возможная процедура персонализированного выбора лекарств.

Результаты наглядно продемонстрировали, что предлагаемый подход BRCA-MoNet может обеспечить повышенную мощность прогнозирования cMap и, таким образом, будет полезен для идентификации новых терапевтических кандидатов.

Веб-сайт: веб-приложение разработано и может быть доступно по следующей ссылке: http://compgenomics.utsa.edu/BRCAMoNet/

Конечной целью персонализированной медицины является разработка методов лечения, которые оптимизируют терапевтические преимущества и минимизируют потенциальный риск токсичности для отдельного пациента. Современные исследования фармакогеномики направлены на то, чтобы направлять сложную разработку и выбор лекарств для этой цели. Эта растущая потребность в персонализированном лечении подтолкнула развитие высокотехнологичных технологий, таких как микрочипы и высокопроизводительное секвенирование, к исследованию на первый план, когда были разработаны методы комплексного отбора, основанные на профилировании ДНК или мРНК, для достижения максимальной пользы от терапевтического вмешательства, но на в то же время низкий риск побочных эффектов [1-6]. В то же время эти высокопроизводительные технологии профилирования могут быть применены для выяснения механизма обработки соединений при индуцировании или ингибировании регуляции экспрессии генов на разных уровнях. В этом исследовании основное внимание уделяется использованию профилирования экспрессии генов для экрана лекарственного средства и эффективного прогнозирования лечения.

Помимо исследований генома в целом, существующие подходы, основанные на генной экспрессии, в основном основаны на концепции «набор генов сигнатур», которая была усовершенствована в течение последних 14 лет неустанных усилий в профилях генной экспрессии рака, сердечно-сосудистых заболеваний, диабета и других исследования болезней. [7-10]. Основные отличия этого подхода к набору сигнатурных генов от традиционного изучения генетической генетики лежат в двух аспектах. Во-первых, подход «набор генов подписи» может идентифицировать геномную вариацию, будь то в SNP, изменение количества копий ДНК или пропущенную регуляцию экспрессии генов. Во-вторых, он может прогнозировать соответствующие биологические пути, сети взаимодействия белка и белка и функциональные группы онтологий генов, таким образом идентифицируя новые терапевтические цели / биомаркеры для открытия лекарств, надеясь, что их вариации от пациента к пациенту могут объяснить большую часть вариации дозы , резистентность и эффективность препарата [11]. Таким образом, можно также предположить, что действия (относительное изобилие и взаимодействие) этих сигнатурных генов могут быть частью мишеней для лекарственного средства или способ действия (MoA), поскольку эти гены могут быть использованы для объяснения типов опухолей и различий в химиотерапевтическом ответе пациентов. Другими словами, активность сигнатурных генов может быть использована для прогнозирования чувствительности препарата. Кроме того, можно продолжить эту гипотезу, так что это предсказание фармакологических уровней в типе клеток может быть экстраполировано на другие типы клеток. Приложения этих гипотез были разработаны во многих исследованиях [12,13]. Одной из наиболее заметных работ является проект карты связи (cMap) [12], в котором 4 человеческие клеточные линии (MCF7 / ssMCF7, HL60, PC3 и SKMEL5) обрабатывались 1309 химическими соединениями в разных дозах, а их профили экспрессии были генерироваться. Был также разработан алгоритм прогнозирования, основанный на анализе обогащения генов (ГСЭГ) [14], для ранжирования соединений на основе генов входной сигнатуры, полученных при сравнении опухолей. Этот проект был широко адаптирован и разработан в области обнаружения наркотиков. Несколько кандидатов на лечение были обнаружены для линий раковых клеток в проекте cMap, непосредственно применяя подход cMap [15-17]. С идеей поиска «обратной подписи» к фонотипу интереса этот подход был расширен, чтобы предсказать возможности лечения соединений, не включенных в проект cMap [18-22]. В дополнение к первоначальному подходу cMap было разработано несколько других методов на основе данных cMap для новых подходов к репозиционированию лекарств [23-28] или повышения эффективности существования cMap [29-31].

Хотя cMap широко применяется, проблемы остаются нерешенными для надежного прогнозирования. Во-первых, cMap не дифференцирует клеточные линии в своем предсказании. Часто время, верхние ранжированные препараты были от линий клеток, отличных от линии клеток запроса. Однако наше исследование (см. «Результат») показало, что эффект лекарственного средства зависит от линии клеток, а высшие разряды препаратов из других клеточных линий будут больше влиять на клеточные линии, а не на эффекты лекарств. В результате, если рассматривать образцы лекарственного средства из других клеточных линий, то они представляют собой только прогнозирование уровня шума для лекарств. Во-вторых, качество образцов данных в cMap противоречиво. Некоторые образцы одной и той же лекарственной терапии могут значительно отличаться от остальных. Эти образцы неизбежно представят ошибочные прогнозы. В-третьих, ген сигнатуры запроса, установленный в cMap, выбирается так, чтобы включать верхние и нижние регулируемые гены. Однако размер набора генов определяется довольно ad hoc. В результате можно было бы пропустить важные сигнатурные гены, выбирая меньший набор генов или, наоборот, приводить к несвязанным генам, которые могли бы только ухудшить предсказание. В качестве примера мы использовали данные экспрессии для линии клеток MCF7, обработанной эстрадиолом (E2) [32], в качестве запроса к cMap, и гены, соответствующие самым высоким 100 и самым низким 100-кратным изменениям, были использованы в качестве набора гена запроса. Естественно, мы ожидали бы, что E2 занимает место в прогнозируемом списке препаратов. Тем не менее, E2 занимала лишь 828 среди более 1200 наркоманов. Причина этого низкого ранжирования заключается в том, что результатом является сводка ранжирования всех клеточных линий образцов E2, которые смешиваются (ssMCF7: ранг 12, HL60: ранг 31, MCF7: ранг 3091, PC3: ранг 3508; Дополнительный файл 1, см. Также пример приложения BRCA-MoNet 1). Однако, даже если мы сосредоточились на E2 для клеточной линии MCF7, его рейтинг по-прежнему остается низким (3091). Недавний обзор подробных результатов показал, что рандомизированная E2-обработанная клеточная линия MCF7 была сводкой результатов по 19 отдельным E2-обработанным клеточным линиям MCF7, и их оценки обогащения не согласуются друг с другом (таблица 1). Среди 19 образцов, лишь немногие имеют высокие оценки обогащения. Весьма вероятно, что остальные образцы не имеют высокого качества и, таким образом, не смогут поймать реальный эффект лечения E2. Другой потенциальной причиной этого плохого результата является неэффективный выбор сигнатурных генов. Однако, как пользователь, у нас нет лучшего способа выбора эффективного набора генов для достижения лучшего прогноза. Эти результаты подчеркивают необходимость контроля качества и систематического выбора сигнатурных генов.

Детальное предсказание приводит к линии MCF7 для обработанного E2 запроса запроса проектом cMap.

Для решения вышеуказанных задач мы предложили BRCA-MoNet в этом документе. BRCA-MoNet выгодна по трем аспектам по сравнению с cMap. Во-первых, он фокусируется только на клеточной линии рака молочной железы. Несмотря на то, что при этом игнорируются другие данные линии клеток в данных cMap, он тем не менее удаляет интерференцию, зависящую от клеточной линии, от истинного эффекта лекарственного средства. Во-вторых, разработана процедура контроля качества, а также новый алгоритм выбора генных наборов сигнатур подписи лекарств для устранения возможного шума в данных cMap и более систематизированного воздействия препарата. В-третьих, мы определяем Способ действия (MoA) как группу соединений, которые имеют сходную дифференциальную сигнатуру экспрессии генов. Поскольку сигнатура экспрессии лекарственного средства указывает на степень его чувствительности к клетке, группа лекарственного средства MoA должна обладать аналогичным терапевтическим эффектом. Конструкция MoA вводит дополнительную мощность прогнозирования. Это связано с тем, что препараты с аналогичным эффектом лечения могут быть ранжированы низкими из-за высокого уровня шума в данных, если мы будем рассматривать предсказание каждого препарата независимо. Напротив, этот образец с высоким уровнем шума может быть оценен как высокий, поскольку запрос согласуется с его MoA. MoA также отличается от других существующих определенных групп соединений, таких как их классификация по анатомическому терапевтическому соединению (ATC), поскольку MoA определяется дифференцирующей экспрессией гена после лечения, хотя можно ожидать некоторого перекрытия между различными составными классификациями. Связь различных МОР с точки зрения их терапевтического эффекта может быть смоделирована и визуализирована BRCA-MoNet. BRCA-MoNet представляет глобальный взгляд на лекарственные эффекты на геномном уровне. Эта сеть дополняет и улучшает текущее понимание составного MoA, определяемого главным образом с точки зрения физиологии, и подчеркивает взаимосвязь различных соединений. С вычислительной точки зрения, МОР и количественная зависимость между препаратами в BRCA-MoNet обеспечивают модель системного уровня, решающую для оптимального скрининга лекарств: новое соединение может быть легко назначено на MoA в BRCA-MoNet, так что терапевтическая эффективность соединения может быть экстраполированы или выведены соответственно.

В данных cMap каждый профиль лечения наркозависимости включает в себя несколько обработанных образцов из разных клеточных линий. Следует ли исследовать влияние одних и тех же препаратов на различные клеточные линии до того, как будет создана сеть МОВ. С этой целью образцы данных cMap были сначала сгруппированы на основе соединений и были сохранены соединения с более чем 30 образцами. Обратите внимание, что поскольку данные уже были нормализованы и сбрасывались с изменением по образцу управления в той же линии соты, следует исключить смещение, зависящее от клеточной линии; любые различия в уровнях экспрессии в образцах того же самого соединения являются проявлением различий в хемоэффективности из-за различий в клеточной линии, концентрации лекарств или их комбинации. Иерархическая кластеризация была проведена с образцами в каждой группе соединений, чтобы выявить потенциальные различия в моделях экспрессии в одном и том же соединении. Корреляция результатов кластеризации с типами и концентрациями клеточных линий (рис. 1А) показала, что химическая эффективность зависит главным образом от клеточных линий и не зависит от концентрации, когда она эффективна. Этот вывод является значительным, поскольку он предполагает, что построение сети и предсказания лекарств должны выполняться путем рассмотрения клеточных линий отдельно. Знание влияния одного препарата на лечение рака молочной железы не дает информации об его эффективности при раке легкого; включая образцы из клеток, отличных от клеток рака молочной железы, вносят только шум в строительство сети лечения наркомании. В результате удаление образцов из других ячеек смягчает помехи и, следовательно, повышает точность и надежность результата предсказания. Так как группа клеток MCF7 для рака молочной железы MCF7 содержит наибольшее количество образцов (2911 по сравнению с HL60 1229 и PC3 1741), и в ней содержится больше образцов репликации лекарств, чем в других клеточных линиях, мы сосредоточили внимание на этой работе по разработке специфической сети МОР с раком молочной железы.

Результат исследования клеточной линии, выбор подписи и контроль качества. A) Кластерграмма образцов экспрессии из (HDAC) семейств ферментов. Иерархическая кластеризация 175 образцов экспрессии, обработанных препаратом TRS A. Строки и столбцы представляют собой гены и образцы соответственно. Столбцы были помечены клеточной линией (сверху) или концентрациями (вниз). Кластеры могут быть четко соблюдены и дальнейшее исследование образцов в одном кластере показывает, что они все из одной и той же линии клеток. Однако такое соответствие не было представлено для концентрации препарата. Это показало, что эффективность лекарственного средства зависит от клеточной линии. B) Пример контроля качества. Показаны диаграмма тепловыделения и парная двухкаскадная диаграмма рассеяния 4 cMap-образцов из одного и того же препарата. Они показали, что только два образца показали одинаково, а два других — нет. В этом примере образцы s2 и s4 были удалены как шум. C) Пример выбора набора сигнатурных генов. Наброски двух выборочных выборок выбранных сигнатур генов для трех препаратов. Красные точки пересечения представляли выбранные гены, а черные точки представляли остальную часть гена. Таблицы содержат символы и выражения вверх или вниз по регуляции для выбранных генов трех препаратов.

Цель выбора набора генов-сигнатур состоит в том, чтобы идентифицировать набор генов, которые имеют значительное дифференциальное выражение после лечения наркотиками. Однако использование традиционных методов дифференциального анализа, таких как t-тест, затруднено отсутствием биологических повторов в наборе данных cMap. Это ограничение становится еще более серьезным после контроля качества. Для линии клеток MCF7 среди всех 1251 препаратов в cMap только 32 препарата имеют более 5 образцов, а 1055 — ≤2 образца. При таком небольшом размере выборки любой статистический дифференциальный анализ становится неосуществимым. С этой целью мы предложили два критерия, на основе которых был выбран набор генов сигнатурного набора: во-первых, гены-сигнатуры должны иметь высокую экспрессию сгибания, а во-вторых, уровни смены смены сигнатурных генов должны быть постоянно высокими среди реплицировать образцы. На основе этих двух критериев был разработан новый алгоритм выбора набора генов подписи, предназначенный для небольших образцов (подробнее см. МЕТОД). Для клеточной линии MCF7 среди 1251 препаратов были установлены сигнальные гены разных размеров для 1108 препаратов. Никаких наборов генов для остальных 118 препаратов не было, потому что гены в их образцах не были последовательно дифференцированы. Есть также 25 препаратов, которые имеют только 1 образец в клеточной линии MCF7. В результате этих 118 несовместимых с клетками клеток MCF7 препаратов, а также 25 препаратов с одним образцом были удалены. На рисунке 1.C показаны идентифицированные наборы генов сигнатуры для трех препаратов: эстрадиола, эстрола и ралоксифена. Эстрадиол (E2) и Эстроль представляют собой две формы эстрогена, которые играют важную роль в раке молочной железы человека. Поэтому природа должна видеть, что наборы генов-сигнатур этих двух препаратов имеют много генов, которые также имеют похожие шаблоны экспрессии. Например, гены EGR3, MYBL1 и C8orf33 значительно отрегулированы, а EFNA1 снизились после лечения обоими препаратами. Кроме того, эти гены очень важны для рака молочной железы. EGR3 кодирует регулятор транскрипции, который принадлежит к семейству EGR и, как было показано, участвует в пути передачи сигналов эстрогена при раке молочной железы [33]. MYBL1 относится к группе генов, которые кодируют прото-онкогенный белок MYB; Было показано, что MYB высоко экспрессируется в ER + опухолях молочной железы и линиях опухолевых клеток и имеет важное значение для пролиферации ER + клеток рака молочной железы [34]. EFNA1 кодирует член семейства ephrin (EPH). Он сильно раздроблен в нормальной ткани груди и потерян при инвазивных раках; вероятно, будет наблюдаться его регуляция вниз после обработки E2. Для третьего препарата, ралоксифена, он является известным модуляторным рецептором эстрогена, направленным на индуцирование уровня эстрогена. Наша приведенная подпись включает в себя как гены EGR3, так и MYBL1, которые регулируются вниз. Это сходство между идентифицированными наборами сигнатурного набора Estrol и Estradiol указывает на то, что они могут иметь сходный MoA. Напротив, обратная корреляция между сигналами гена ралоксифена и E2 свидетельствует о том, что их МО может быть противоположно друг другу. Более поздний анализ действительно показал, что E2 и Estrol, а также другие 15 препаратов обнаружены в пределах одного и того же MoA, в то время как ролоксифен был предсказан сверху в списке обратного прогноза с независимым образцом для обработки E2 (подробности в заявке 1 BRCA-MoNet). Эти результаты показали, что набор генов сигнатур, выбранный нашим предлагаемым алгоритмом, является биологически значимым.

Контроль качества применяется к препаратам клеточных линий cMap MCF7 с более чем 3 образцами. Целью контроля качества является удаление образцов, которые не выражаются последовательно другими. Наше исследование данных cMap показало, что имеется значительное количество образцов выброса, образцы экспрессии которых значительно отличаются от остальных в одном и том же препарате (рис. 1B). Включение этих выбросов приведет к появлению только шума при определении MoA, и поэтому важно удалить образцы выбросов. Обратите внимание, что выбор набора генов подписи также может служить цели контроля качества, поскольку некоторые лекарственные средства могут прекратить выбранный набор генов. Для клеточной линии MCF7 в результате выбора и подписи генной подписи и контроля качества было идентифицировано и удалено 1564 выборки из 747 лекарств, и 1347 образцов из 504 препаратов переданы в структуру BRAC-MoNet. Эти образцы можно считать правильно зафиксировать эффект лечения на клеточной линии MCF7 и поэтому использовались для последующего исследования.

Составной способ действия (MoA) определяется как группа соединений, которые имеют сходные образцы экспрессии генов. Таким образом, лекарственные средства, образующие один МО, будут иметь по существу общие гены в их наборе генов-сигнатур, которые также имеют аналогичные образцы экспрессии. Для получения MoAs кластеризация применяется для группировки препаратов с аналогичными образцами экспрессии генов-сигнатур. Существуют множественные алгоритмы кластеризации, и в нашей работе принят простой, но эффективный метод иерархического кластеризации (HC). Есть две основные причины выбора HC. Во-первых, количество кластеров не требуется для HC; во-вторых, разумно ожидать, что некоторые препараты сами по себе образуют отдельные MoAs, а HC может создавать кластеры с одним членом. Для выполнения HC, после контроля качества была получена матрица расстояний, которая измеряет расстояния между лекарственными средствами между лекарственными средствами. С этой матрицей расстояний было получено в общей сложности 109 MoAs на пороге, и была построена BRCA-MoNet (рисунок 2) (см. Метод для деталей). В этой сети каждый узел представлял собой один препарат; группа узлов, имеющих одни и те же красы, представляет собой BRCA-MoA, полученный HC. Для каждого МОА была рассчитана центральность каждого из них, и препарат с наибольшей центрированностью между центрами был установлен как центр МОВ. Два MoAs были связаны с черным краем, если расстояние между ними было меньше порога, и эта ссылка указывала на отношение вторичного уровня между двумя MoAs.

BRCA-MoNet. Каждый узел представляет собой лекарство. Группа узлов, связанных краями того же цвета, представляет собой MoA. Черный край связывал два MoAs, которые показывают коррелированные эффекты.

После создания BRCA-MoNet была проверена его мощность прогнозирования. Были исследованы три вопроса. Во-первых, может ли BRCA-MoNet предсказать правильное лекарственное средство MoA? Во-вторых, в какой степени BRCA-MoNet может предсказать препарат МЗ неизвестного или нового препарата? В-третьих, в какой степени BRCA-MoNet может рекомендовать лекарства для пациентов? Чтобы ответить на эти вопросы, для исследования были выведены независимые массивы данных с использованием микрочипов из Gene Expression Omnibus (GEO). Чтобы избежать возможной платформы и экспериментального смещения, при выборе наборов данных соблюдались следующие критерии. Во-первых, данные должны быть обработаны соединением по клеточной линии MCF7 и содержать один или несколько контрольных образцов; это соответствовало состоянию данных cMap. Во-вторых, мы выбираем только те наборы данных, которые были обработаны наркотиками, которые существовали в проекте cMap или в известном лечебном эффекте при раке молочной железы. В-третьих, чтобы избежать возможного осложнения платформы, данные должны генерироваться с той же платформы, что и данные cMap, или GPL96 (Affymetrix Human Genome U133A Array). С учетом вышеизложенного были проведены следующие три тематических исследования.

Сначала мы выбрали набор данных GSE 4025 [35] в качестве нашего набора данных запроса. GSE 4025 включает образцы клеток MCF7, обработанных 17-бета-эстродиолом (E2), формой эстрогена, в течение 24 часов. Мы притворились, что мы не знаем идентичности соединения (E2), и целью было использовать этот образец лечения в качестве запроса к нашей BRCA-MoNet, чтобы предсказать его MoA. Обратите внимание, что E2 — это соединение, проверенное в данных cMap, а также в нашем BRCA-MoNet. Таким образом, ожидается, что алгоритм точного прогнозирования будет ранжировать М2, связанный с MoA, в верхней части прогнозируемого списка MoA для аналогичного эффекта лечения и, возможно, ранга MoAs, связанных с антагонистом рецептора эстрогена, в верхней части списка обратного прогноза. Верхние аналогичные прогнозы показаны в таблице 2 (см. Дополнительный файл 2 для получения полного результата). Все препараты ранжируются на основе их сигнатур гена MoA, которые обратимо связаны с E2. В результате предсказания MoA (BRCA_MoA64), который содержит E2, занял 2-е место среди всех 109 MoAs, а E2 занял 4-е место среди всех 504 эффективных препаратов MCF7, выбранных для BRCA-MoNet. Этот результат показывает, что наш BRCA-MoNet может достичь очень высокой точности. Мы более подробно исследовали связанный с E2 BRCA_MoA64 и обнаружили, что среди 17 препаратов 11, как известно, связаны с эстрогеном. В частности, три из них (эстропипат, альфа-эстрадиол, эстрон) были различными формами эстрогена и шестью другими (норэтистерон, этистерон, нортинодрел, левоноргестрел, этинодиол, мегестрол) представляют собой различные формы прогестогена, предшественника эстрогена. Эпиандростерон может индуцировать андрогенную активность, которая также может привести к предшественнику эстрогена, а Эпитиостанол является формой антиэстрогена. Среди оставшихся шести препаратов Нарингинин является слабым эстрогенным биофлавоноидом, проявляющим антиэстрогенную активность [32]; Известно, что аминофиллин взаимодействует с эстрогеном [36]; kaempferol — диетический флавоноид, который функционирует как селективный модулятор рецептора эстрогена [37-39]; Оксибензон (также известный как бензофенон-3) представляет собой соединение, широко используемое в солнцезащитном креме, и несколько исследований показывают, что оксибензон имитирует эффекты эстрогена и может вызывать более высокий риск рака молочной железы; Было показано, что Lorglumide вызывает противоположный эффект эстрогена в [40]; только nefopam не имеет доказательств, которые предполагают любое взаимодействие с эстрогеном и раком молочной железы. Это значительное чрезмерное представление соединений, связанных с эстрогеном, в ассоциате E2, ассоциированном с E2, дает убедительные доказательства того, что сконструированные MoAs в нашем BRCA-MoNet содержат препараты подобного эффекта. Затем мы предсказали МОР с обратным эффектом лечения. Результат (таблица 3, дополнительный файл 3) также многообещающий. В наивысшем рейтинге MoA (BRCA-MoA 80) два из трех препаратов (ралоксифен, фулвестрант) являются селективными модуляторами рецептора эстрогена, которые имеют антиэстрогенные действия, а другой (monastrol) является препаратом против рака молочной железы [41 ]. Второй рейтинг MoA, BRCA-MoA86, содержит один препарат: бакампицилин. Бакампицилин является антибиотиком пенициллина, и исследование показало, что оно взаимодействует с эстрогеном для снижения эффекта эстрогена [42]. Третий рейтинг MoA, BRCA-MoA52, содержит два препарата: ципротерон и набуметон. Cyproerone представляет собой стероидный антиандроген с дополнительными прогестогенными и антигонотропными свойствами. Он может подавлять активность андрогенных гормонов и впоследствии снижать продуктивность эстрогена. Он также изучался в клинических исследованиях I и II по его потенциалу в качестве препарата против рака молочной железы [43].

Топ-20 прогнозируемых препаратов и соответствующий BRC-MoA для аналогичного прогноза эффекта для E2.

E2 занимает 4-е место (выделено).

Топ-20 препаратов и соответствующий BRC-MoA для прогнозирования обратного эффекта для E2

Эти данные запроса были также применены к первоначальному предсказанию cMap, где в качестве генов подписи запроса использовались самые 200 генов с повышением и понижением частоты. Как и ожидалось, проект cMap дал результаты микширования (таблица 4) как в предсказаниях препаратов с аналогичным эффектом (с положительным показателем обогащения), так и с обратным эффектом (с отрицательным показателем обогащения). Сам E2 занимал только 828 (таблица 5) в целом 1309 соединений. В cMap рангом была сводка результатов предсказания препарата в каждом образце всех разных клеточных линий. E2 имеет множество выборок в данных cMap по всем 5 клеточным линиям, а оценки обогащения этих образцов имеют большие вариации: от 0,707 (ssMCF7) до -0,040 (PC3) (таблица 6), и это большое изменение приводило к незначительному ранжирование прогноза. В предсказании обратного эффекта ралоксифен, антиэстрогенный модулятор, как оказалось, оказался в ранге 9 (таблица 4), но фулвестрант, еще один антиэстрогенный модулятор, занимал только 861 (таблица 7). Более пристальный взгляд на результаты детальной клеточной линии показал, что фулвестрант имел отрицательную оценку обогащения в клеточной линии MCF7, но положительный показатель обогащения в клеточной линии HL60, и комбинированный результат приводил к низкому рангу. (Таблица 8). В целом, сравнение результатов предсказания cMap и BRCA-MoNet показывает, что BRCA-MoNet добавляет значительную силу прогнозирования к существующим данным cMap и значительно улучшает точность прогнозирования как при аналогичном, так и в обратном прогнозе.

Результат 20-го прогноза, полученный с помощью cMap с использованием сигнатуры обработки GSE4025 E2 в качестве запроса

Результат общего предсказания cMap для E2

Результат предсказания детали cMap для E2

Результат общего предсказания cMap для фулвестранта

Результат предсказания детали cMap для фулвестранта

Один дополнительный набор данных, обработанный препаратом BMS-754807, был протестирован против нашего BRCA-MoNet. Этот набор данных (GSE33366) поступал от мышей, несущих ксенотрансплантаты MCF7, обработанных BMS-754807. MBS-784807 является двойным ингибитором IGF-1R / InsR, который может синергизировать гормональные агенты и, как было показано, является потенциальным лекарством от рака молочной железы [44-47]. Исследование показало, что повышенная активность IGF-IR специфична при тройном отрицательном раке молочной железы, и из-за этого BMS-784807 может быть возможным лечением тройного отрицательного рака молочной железы [48]. Он был исследован в нескольких клинических испытаниях Фазы I и Фазы II как противораковый препарат [49-52]. Этот набор данных был протестирован против нашего BRCA-MoNet для аналогичных прогнозов эффекта обработки. Верхний рейтинг MoA был MoA 37 (таблица 9 и дополнительный файл 4 для полного прогноза). Интересно, что этот MoA содержит вальпроевую кислоту, которая занимает первое место среди всех 504 препаратов BRCA-MoNet. Вальпроевая кислота относится к общему классу лекарств, называемых противосудорожными препаратами, и первоначально использовалась в качестве неопиоидной обезболивающей. Он также использовался для предотвращения головных болей мигрени [53]. Показано, что вальпроевая кислота обладает большим потенциалом в качестве эпигенетического препарата для противораковой активности путем ингибирования пролиферации раковых клеток при различных типах рака [54-56]. Этот результат предсказания показывает, что оба препарата с большим противораковым потенциалом фактически обнаруживаются, чтобы иметь аналогичный MoA по BRCA-MoNet. Этот вывод полностью подтверждает тот факт, что BRCA-MoNet может выявить противораковый МОВ нового препарата, назначив его известному МОВ.

Топ-20 препаратов для аналогичного эффекта BMS-754807

Исследовалась сила предсказания BRCA-MoNet на реальных пациентах с раком молочной железы. С этой целью набор данных GSE2740 [57] был загружен из ГЕО. Этот набор данных включает образцы из 4 платформ (GPL885, GPL887, GPL1390 и GPL1708) и различных подтипов рака молочной железы. Чтобы избежать возможного смещения из-за подтипов платформы и рака молочной железы, были выбраны только образцы пациентов подтипа Lumina A (LumA) и с платформы с наибольшим размером выборки (GPL1390). В общей сложности 97 образцов образцов микрочипов пациентов с раком молочной железы были протестированы против нашего BRCA-MoNet с использованием обратного прогноза. Результат ранжирования показан на рисунке 3-A (подробнее в дополнительном файле 5). В частности, несколько BRCA-MoAs последовательно занимали первое место, где BRCA-MoA24 заняла первое место в 30,21% всех пациентов и заняла первое место среди 20 лучших среди 61,46% из всех 109 BRCA-MoAs. BRCA-MoA24 включает в себя пять препаратов: спиронолактон, рифабутин, вориностат, трихостатин А и СР-690334-01. Среди этих пяти препаратов спиронолактон является синтетическим, стероидным антиминералокортикоидным средством с антиандрогенами, слабыми прогестогенными свойствами и непрямыми эффектами эстрогена. Он был использован для уменьшения повышенной или нежелательной активности андрогенов в организме [58]. (Андроген, как упоминалось ранее, является предшественником всех эстрогенов). Таким образом, спиронолактон может быть потенциально использован для индуцирования антиэстрогенной активности против рака молочной железы. Рифабутин является полусинтетическим ансамицином и в основном используется для лечения туберкулеза. Интересно отметить, что ансамицин оказался ингибитором HSP90, и многие его синтетические соединения находятся в испытаниях как лекарство против рака молочной железы. [59-61] Vorinostat является членом гистондезацетилаз (HADC) с широким спектром эпигенетических активностей; он был одобрен Управлением по контролю за продуктами и лекарствами для лечения кожной Т-клеточной лимфомы в 2006 году. Поскольку было показано, что он оказывает влияние на лечение рака молочной железы [62-68], он подвергся множественным клиническим испытаниям I и II фазы в качестве антигруди рака [69-73]. Трихостатин А (TSA) представляет собой органическое соединение, которое служит в качестве противогрибкового антибиотика и селективно ингибирует ферменты семейства HADC млекопитающих I и II [74]. В последние годы он приобрел чрезвычайно пристальное внимание и активно изучается в связи с его мощной противоопухолевой активностью против рака молочной железы с 2001 года [75-79]. Хотя информация о последнем препарате (CP-690334-01) недоступна, чрезмерное представительство лекарств, связанных с раком молочной железы, в этом MoA дает нам четкое представление о значительной мощности обнаружения BRCA-MoNet при применении к реальным данным пациента.

Результат прогноза пациента с раком молочной железы. A) Top MoAs для прогнозирования обратного эффекта у пациентов с UNC lumA. Цвет карты тепла показывает предсказанный ранг МОВ в возрастающем порядке от красного до желтого. B) Препараты BRC-MoA24.

Сеть MoA с лекарственным эффектом для линий клеток рака молочной железы BRCA-MoNet была построена с использованием данных экспрессии cMap. Он был разработан для решения проблем алгоритма cMap и обеспечения надежности и более точных предсказаний для прогнозирования эффективности лечения и скрининга лекарств. Это улучшение было частично результатом тщательного контроля качества данных cMap. В отличие от cMap, предсказание BRCA-MoNet является специфичным для линии сотовой связи и снимает нагрузку для пользователя, чтобы выбрать набор генов подписи эффекта. Кроме того, BRCA-MoNet оценивает влияние терапии на основе MoA, а не на индивидуальные препараты. Эта сетевая модель не только приводит к улучшению результатов прогнозирования, но также раскрывает основную структуру MoA данных cMap, которая до сих пор не была полностью обнаружена.

Проведенные нами тематические исследования привели к положительным результатам и проницательным выводам. Для случая клеточной линии MCF7, обработанного E2, была обнаружена мощность обнаружения и понимание мозаичного кода BRCA-MoNet E2. Случай BMS-754807 показал, что BRCA-MoNet способна назначить новый противораковый препарат существующим противораковым МОВ и дать понимание понимания обнаружения МОА наркотиков. Случай пациентов с раком молочной железы UNC продемонстрировал потенциал BRCA-MoNet для использования в качестве инструмента для персонализированной рекомендации лечения на основе экспрессии генов пациентов.

Подход BRCA-MoNet обеспечивает дополнительные значения для проекта карты соединений и позволяет использовать новые и лучшие возможности для идентификации возможных терапевтических кандидатов. Будущее направление, скорее всего, поддается двум путям: расширить концепцию MoNet до других раковых и клеточных линий, включив множество наборов данных для лечения наркозависимости, а также повысить способность предсказания BRCA-MoNet для реальных пациентов. Мы ожидаем, что быстрое развитие проектов профилирования рака, включая The Cancer Genome Atlas (TCGA), принесет большую пользу нашим усилиям в этих будущих направлениях

Предлагаемая схема генерации специфической сети MoA для рака молочной железы или BRCA-MoNet из данных cMap приведена на рисунке 4. На первом этапе были разработаны и применены новые методы предварительной обработки данных, выбора подписей лекарств и алгоритмов кластеризации для определения МОР. На втором этапе была оценена взаимосвязь между МОР с точки зрения их эффективности. На основе MoAs BRCA-MoNet была сконструирована так, чтобы отображать взаимосвязь эффективности соединения. BRCA-MoNet и сигнатуры лекарств использовались для последующего прогнозирования. В BRCA-MoNet могут быть реализованы два типа прогноза, включая аналогичное предсказание и обратное предсказание. Для того чтобы найти эффективность препарата на образце опухоли, профиль экспрессии отдельного образца опухоли используется в качестве запроса, где принимается обратное предсказание, и запрос будет обратным коррелированным с МОР для прогнозирования эффектов лечения. Результат предсказания включает список МОР, оцененных в возрастающем порядке их отрицательной корреляции с профилем опухоли. Поскольку ожидается, что эффективные соединения окажут неблагоприятное воздействие на опухоль, МОР с отрицательными корреляциями с профилем опухоли, вероятно, будут кандидатами выбора для лечения этой индивидуальной опухоли. Для того, чтобы найти эффект обработки нового соединения, профиль выражения запроса из обработанного образца нового соединения будет использоваться вместо этого в качестве входного сигнала для BRCA-MoNet, и оба аналогичных и обратных прогноза будут представлять интерес, поскольку они являются соединениями соответствующей аналогичной и неблагоприятной эффективности в выражении. BRCA-MoNet может обновляться, когда доступны новые профили экспрессии, обработанные соединением. Можно воспользоваться преимуществом существующего BRCA-MoNet и обновить его, просто представив новый MoA и их отношения к другим группам. Алгоритмы подробно обсуждаются в Методах.

Рабочий процесс предлагаемого BRCA-MoNet. Стрелка показывает рабочий процесс проекта. Весь проект можно разделить на три части: 1. Извлечение данных и предварительная обработка; 2. Контроль качества и подписи; 3. Конструкция BRCA-MoNet и прогнозирование нового запроса.

Профили экспрессии генов сложных обработок были загружены с веб-сайта Mapivity Broad Broad (http: // hRp: //www.broadinsUtute.org/cmap/). В этом исследовании использовались два массива Affymetrix (за исключением 184 массивов из версии HT-HG-U133A с ранним доступом): HG-U133A (всего 807 массивов) и HT-HG-U133A (массивы 6029), что составило 1267 соединений различные дозировки. Кроме того, данные включают в себя 5 клеточных линий: HL60, PC3, SKMEL5 и MCF7 / ssMCF7. Каждый обработанный образец сопровождается несколькими образцами контрольных / транспортных средств. Что касается нормализации, интенсивность уровня зонда Perfect-Match (PM), полученная из одного типа массива Affymetrix (включая обработанную и необработанную гибридизацию), была сначала выполнена корректировка фона вместе с использованием процедуры Robust Multi-array Average (RMA). после корректировки фона RMA для обоих типов массивов, нормализация квантилей была выполнена для всех необработанных образцов; обработанные образцы затем разделяли в соответствии с типом матрицы, клеточной линией транспортного средства и соединением; для каждой группы (такой же тип массива, клеточная линия и соединение, нормализация ранга-инварианта была выполнена против их соответствующих необработанных образцов (базовая линия нормализации была медианой необработанных транспортных средств) на уровне зонда для устранения возможных нелинейных аномалий. , вычисленные значения экспрессии образцов были рассчитаны с помощью медианной полировки. Наконец, все образцы (обработанные и необработанные и оба типа массивов) были собраны в матрицу в соответствии с идентификаторами набора параметров Affymetrix.

Цель выбора набора генов-сигнатур заключается в выборе генов, которые выражаются по-разному. Поскольку большинство препаратов в cMap содержит только два образца, обычные алгоритмы дифференциального анализа, такие как t-тест, не могут применяться. Мы предложили следующую тестовую статистику для измерения, если ген, скажем, i, последовательно дифференцированно выражен в паре образцов

р
                
                
                  я
                
              
              знак равно
              
                
                  
                    
                      Икс
                    
                    
                      я
                    
                  
                
                
                  
                    
                      σ
                    
                    
                      Икс
                    
                  
                
              
              *
              
                
                  
                    
                      Y
                    
                    
                      я
                    
                  
                
                
                  
                    
                      σ
                    
                    
                      Y
                    
                  
                
              
              —
              
                
                  
                    
                      
                        
                          Икс
                        
                        
                          я
                        
                      
                    
                    
                      
                        
                          σ
                        
                        
                          Икс
                        
                      
                    
                  
                  —
                  
                    
                      
                        
                          Y
                        
                        
                          я
                        
                      
                    
                    
                      
                        
                          σ
                        
                        
                          Y

Где xi и yi — выражение гена i в образце × и образце y соответственно, а σx и σy — соответствующее стандартное отклонение выборки. Эти статистические значения представляют собой гены, которые наиболее дифференцированно экспрессируются в обоих образцах, в то время как вариация выборки учитывается. Эмпирическое распределение этой статистики R при нулевой гипотезе о том, что ген не дифференциально экспрессируется, может быть получено случайной выборкой из реплик данных cMap. Основываясь на распределении, p-значения могут быть вычислены для каждого гена. Установлено, что набор генов сигнатур любых парных образцов лекарственного средства содержит ген с р-значением <0,1%. Алгоритм обобщен на рисунке 5. Для лекарств, имеющих больший образец размером не более 2, процедура определения набора генов сигнатуры является одинаковой. Каждая пара образцов будет использоваться для определения набора генов, а затем общее подмножество всех определенных наборов генов будет окончательным набором сигнатур. На основании вышеуказанных наборов генов сигнатур расстояние Dab между любыми двумя образцами лечения а и b лекарственного средства определяется как

Псевдокод предлагаемой схемы выбора набора генов.

D
                
                
                  
                  б
                
              
              знак равно
              
                
                  D
                
                
                  м
                  
                  Икс
                
              
              —
              
                
                  1
                
                
                  2
                
              
              *
              
                (
                
                  
                    
                      1
                    
                    
                      N
                    
                  
                  
                    
                      
                        Σ
                      
                      
                        
                          
                            я
                          
                          
                            N
                          
                        
                      
                    
                  
                  
                    
                      
                        
                          г
                        
                        
                          
                            
                              
                              —
                              б
                            
                          
                          я
                        
                      
                    
                    
                      v
                      
                      р
                      
                        (
                        
                          б
                        
                        )
                      
                    
                  
                  +
                  
                    
                      1
                    
                    
                      м
                    
                  
                  
                    
                      
                        Σ
                      
                      
                        
                          
                            J
                          
                          
                            м
                          
                        
                      
                    
                  
                  
                    
                      
                        
                          г
                        
                        
                          
                            
                              б
                              —
                              
                            
                          
                          J
                        
                      
                    
                    
                      v
                      
                      р
                      
                        (
                        
                          
                        
                        )
                      
                    
                  
                
                )

где Dmax является максимальным расстоянием среди всех парных образцов лекарственной терапии, ga-bi — это уровень экспрессии гена гена образца, установленный в образце b, n и m, — размер наборов сигнатурных генов (общее количество генов ) для выборок a и b, и, следовательно, var (a), а var (b) — выборочная дисперсия a и b, с уважением.

Контроль качества осуществляется в два этапа обработки. В первом раунде, который является частью селекции генов, некоторые препараты приходили с отсутствием наборов генов-сигнатур; это результат того, что никакие гены последовательно не экспрессируются в образцах из этого препарата. Образцы из этих лекарств удаляли. Хотя некоторые лекарственные средства были определены с использованием набора сигнатурных генов, один или несколько образцов выброса могут не совпадать с остальными. Для решения этой проблемы на образцах cMap был также выполнен второй этап дальнейшего процесса контроля качества. Чтобы удалить эти несогласованные образцы, на рисунке 6 была предложена новая схема.

Псевдокод предлагаемой схемы контроля качества.

Согласно определению MoA, два соединения находятся в одном и том же MoA, если они имеют одну и ту же геномную подпись. Это эквивалентно тому, что образцы из этих двух соединений сильно коррелированы. Напротив, образцы из разных МОР должны иметь корреляцию, распределенную в соответствии с распределением корреляции населения. Чтобы определить, принадлежат ли два препарата i и j MoA, разрабатывается гипотетическая тестовая формулировка с нулевой гипотезой, определяемой формулой

ЧАС
                
                
                  0
                
              
              :
              
                
                  D
                
                
                  я
                  J
                
              
              ~
              
                
                  п
                
                
                  б
                
              
              
                (
                
                  D
                
                )

где Dij — оценка расстояния между образцом i и j, а pb (D) — распределение расстояния популяции. pb (ρ) оценивается эмпирически на основе парных расстояний между всеми парами образцов одной и той же линии клеток. Затем в качестве уровня значимости выбирается значение р 0,01, а соответствующее расстояние определяется как порог. Иерархическая кластеризация выполняется на всех выборках расстояний; то кластеры определяются путем разрезания связи на пороге, а приведенные кластеры определяются как MoAs. Обратите внимание, что, поскольку каждый MoA генерируется полностью на основе порога, полученного из распределения фона, некоторые MoAs могут содержать большое количество образцов, в то время как другие MoAs содержат только несколько образцов из одного или двух препаратов; это естественно и разумно, потому что некоторые соединения просто не делят эффективность лечения с другими.

Как только МОР были идентифицированы, тогда было желательно выявить связь МОР с точки зрения их терапевтических эффектов. Вместо того, чтобы исследовать индивидуальное соединение изолированным образом, MoNet позволит исследовать исследование набора соединений (МОР), которые используют одни и те же гены подписи MoA (потенциальные мишени), а также их коррелированные МОР.

Используя MoNet и MoA, можно: 1) предсказать эффективность препарата нового соединения (аналогичное предсказание) и / или 2) экранных соединений для прогнозирования терапевтической эффективности различных соединений при применении к отдельной опухоли (обратное предсказание). Для прогнозирования эффективности лекарственного средства необходимо получить профиль экспрессии клеток / тканей, обработанных новым соединением, и целью является определение MoA соединения. Для терапевтического прогнозирования требуется профиль экспрессии гена запроса образца опухоли. Цель состоит в том, чтобы определить степень неблагоприятной зависимости между MoAs и экспрессией генов опухолевых маркеров, которая показывает, насколько вероятно соединение должно обратить вспять экспрессию генов маркера опухоли. С точки зрения разработки алгоритма прогнозирование эффекта лекарственного средства и скрининга соединений в основном одно и то же. Единственное различие заключается в критериях расстояния: когда применяется аналогичное предсказание, МОР сначала оценивается на самом большом положительном расстоянии, а затем каждый наркотик в рамках МОР затем оценивается по тем же критериям; когда применяется обратное предсказание, тогда МОВ сначала оценивается на наименьшее отрицательное расстояние, а затем каждый наркотик в каждом МОВ занимает одно и то же место.

Карта подключения: cMap; Способ действия: МОВ; Сеть действия рака молочной железы: BRCA-MoNet; Иерархическая кластеризация: HC; Выражение генов Omnibus: GEO; 17бета-эстродиол: E2; Атлас генома рака: TCGA.

Авторы заявляют, что у них нет конкурирующих интересов.

CM, YH и YC задумали идею и разработали эксперименты. CM и HC подготовили данные и провели эксперименты. MF разработала веб-приложение. MF, YH и YC написал статью.

Подробный результат предсказания cMap для запроса обработки E2.

Нажмите здесь для файла

Подробный результат предсказания BRCA-MoNet для аналогичного прогнозирования индивидуального запроса на лечение E2.

Нажмите здесь для файла

Подробный результат предсказания BRCA-MoNet для обратного прогнозирования индивидуального запроса на лечение E2.

Нажмите здесь для файла

Подробный результат предсказания BRCA-MoNet для аналогичного прогнозирования индивидуального запроса на лечение BMS784807.

Нажмите здесь для файла

Подробный результат предсказания BRCA-MoNet для набора данных микрочипов пациента с раком молочной железы.

Нажмите здесь для файла

Эта работа поддерживается грантом Национального научного фонда (CCF-1246073) YH и YC, грантом Национального исследовательского фонда Катара (09-874-3-235) для YC и YH, а также грантом Национального института здравоохранения (NIH- NCATS UL1TR000149) до YC.

Гонорары за публикацию были поддержаны грантом Национального фонда исследований Катара (09-874-3-235).

Эта статья была опубликована в рамках Биологии систем BMC Volume 7, Приложение 5, 2013: Избранные статьи Международной конференции по интеллектуальной биологии и медицине (ICIBM 2013): Системная биология. Полное содержание дополнения доступно в Интернете по адресу: http://www.biomedcentral.com/bmcsystbiol/supplements/7/S5.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *