Нажмите "Enter", чтобы перейти к контенту

MEDICI: данные о важности горного дела для определения критических взаимодействий для выявления и развития лекарственных средств для лечения рака

MEDICI: Mining Essentiality Data to Identify Critical Interactions for Cancer Drug Target Discovery and Development
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC5261804/

Конкурирующие интересы: авторы заявили, что конкурирующих интересов не существует.

Концептуализация: LADC SH CSM.

Синтез данных: LADC SH JDM FOG CSM.

Формальный анализ: LADC SH JDM FOG CSM.

Получение финансирования: FRK HF CSM.

Исследование: JDM YD FOG AAI MAJ FRK HF SH LADC CSM.

Методология: LADC SH CSM.

Администрирование проекта: LADC MAJ FRK HF CSM.

Ресурсы: YD AAI MAJ FRK HF LADC CSM.

Программное обеспечение: LADC SH.

Надзор: LADC FRK HF CSM.

Проверка: LADC SH CSM.

Визуализация: LADC SH CSM.

Письмо — оригинальная черновик: LADC SH CSM.

Написание — просмотр и редактирование: JDM YD FOG AAI MAJ FRK HF SH LADC CSM.

Белки-белковые взаимодействия (ИЦП) опосредуют передачу и регуляцию онкогенных сигналов, которые необходимы для клеточной пролиферации и выживания, и, таким образом, представляют собой потенциальные мишени для антираковых терапевтических открытий. Несмотря на их значимость, нет никакого способа экспериментально нарушить и опросить сущность отдельных эндогенных ИЦП. Возможность вычислительного прогнозирования или определения важности ИЦП поможет определить приоритеты ИЦП для открытия лекарств и помочь продвинуть понимание биологии рака. Здесь мы вводим вычислительный метод (MEDICI) для прогнозирования существенности PPI путем объединения исследований нокдауна генов с сетевыми моделями путей взаимодействия белка в аналитической структуре. Наш метод использует сетевую топологию для моделирования того, как глушитель генов может нарушать ИЦП, связывая неизвестные существенности отдельных ИЦП с экспериментально наблюдаемыми свойствами белка. Затем эта модель деконструируется для восстановления неизвестных существенностей отдельных ИЦП. Мы демонстрируем обоснованность нашего подхода путем прогнозирования чувствительности к соединениям на основе важности ИЦП и различий в существенности, основанных на генетических мутациях. Мы также показываем, что пациенты с раком легкого улучшили общую выживаемость, когда конкретные ИПП больше не присутствуют, что указывает на то, что эти ИЦП могут быть потенциально новыми целями для терапевтического развития. Программное обеспечение свободно доступно по адресу https://github.com/cooperlab/MEDICI. Наборы данных доступны по адресу https://ctd2.nci.nih.gov/dataPortal.

Программное обеспечение свободно доступно по адресу https://github.com/cooperlab/MEDICI. Наборы данных доступны по адресу https://ctd2.nci.nih.gov/dataPortal.

Успехи в технологии высокопроизводительного скрининга позволили провести широкие исследования геномного белка в целом по геному. Высокопроизводительное одногенное shRNA / siRNA молчание [1-4] и инактивация CRISPR-Cas9 [5] являются хорошо известными экспериментальными подходами к изучению существенности белка в геномных экранах. Наблюдение пролиферативных эффектов глушения каждого гена / узла в сети PPI может обеспечить понимание биологии опухоли и помочь определить перспективные терапевтические цели, особенно в сочетании с геномными характеристиками. Всенаправленные скрины siRNA были объединены с геномическими профилями и экранами лекарств в аденокарциноме легкого для выявления специфичных для конкретного контекста чувствительности к лекарственным средствам и их генетических биомаркеров [6]. В настоящее время проект Achilles предоставляет объединенную базу данных скрининга shRNA с более чем 11 000 генов в 216 клеточных линиях [7]. Систематический анализ этих данных позволил выявить специфические генетические уязвимости в генетических контекстах в нескольких исследованиях [7-11].

Интерфейс PPI становится все более узнаваемым как приемлемая мишень для терапии малых молекул, о чем свидетельствует недавнее клиническое развитие ингибиторов малых молекул р53 / МДМ2 и БЕТ Бемодомена [2, 12, 13]. Несмотря на терапевтический потенциал белково-белковых взаимодействий (ИЦП) в качестве лекарственных мишеней [14], специфический анализ существенности протеин-взаимодействия или существенности взаимодействий в биологических сетях («реброз») находится в зачаточном состоянии [15, 16]. Современные технологии сосредоточены на молчании одиночных генов в крупномасштабных экранах shRNA; однако молчание shRNA одного гена эффективно нарушает множественные ИЦП и маскирует вклад отдельных ИЦП в общую сущность белка. Высокопроизводительной технологии для прерывания конкретных ИЦП на шкале целого взаимодействия не существует, и методы экспериментального измерения сущности отдельных эндогенных ИЦП в геноме будут, вероятно, оставаться нерешенной проблемой в обозримом будущем. В то время как широкомасштабные экраны ИПП измеряли влияние мутаций болезни на конкретные ИЦП [15, 16], они не дают данных о существенности эндогенных взаимодействий для выживания клетки. Таким образом, мы были заинтересованы в разработке вычислительного подхода для оценки существенности ИЦП путем интеграции топологии сети PPI с экранами цельной геномной решетки. Измеряя существенность каждого гена (узла) в сети и понимая, как белки связаны через белковые взаимодействия (ребра), мы стремимся оценить существенность отдельных ИЦП, которые затухают в совокупности, поскольку ген сбивается с помощью shRNA.

Интеграция функциональных экранов с сетями PPI была ранее изучена с упором на смягчение шумов экранирования для повышения надежности функциональных измерений. Сети PPI были интегрированы с экранами RNAi с использованием метода диффузионного ядра [17], чтобы успешно уменьшить ложноположительные и ложноотрицательные результаты на экранах Drosophila. В методе IMPACT использовались белковые взаимодействия как способ снижения эффектов вне мишени и улучшения биологической интерпретации экранированных фенотипов [18]. Кроме того, сети KEGG были интегрированы с экранами siRNA для уточнения сети передачи сигналов инсулина с использованием подхода к посеву / обрезке сети [18]. Был разработан кратчайший путь для анализа сетей ИЦП и применен к раку поджелудочной железы [19]. Кроме того, подход NEST улучшает данные CRISPR для анализа существенности генов или узлов [20]. Однако, насколько нам известно, ни один из доступных методов не использует возможности функционального скрининга генома для вычисления важности отдельных ИЦП в биологических сетях. Здесь мы описываем MEDICI (данные о важности горных работ для определения критических взаимодействий), новый вычислительный подход, который использует высокопроизводительные данные о нокдауне гена и топологию сети взаимодействия белка для ранжирования ИЦП на основе их критичности для выживания и пролиферации раковых клеток. Этот подход не предсказывает новые ИЦП, а скорее относит относительную важность известных ИЦП в раковой клетке к выживанию клеток.

Мы получили оценки нокдауна shRNA из Project Achilles [7] v2.4.3 (http://www.broadinstitute.org/achilles). Файл The.gct, содержащий несколько shRNAs для каждого гена (Achilles_QC_v2.4.3.rnai.Gs.gct), анализировали для проведения измерений уровня гена. Мы использовали значение второй самой летальной shRNA для каждого гена для смягчения побочных эффектов вне мишени, как описано ранее [7]. Кроме того, генные решения для shRNAs в этом наборе данных также были скорректированы для внецелевых эффектов с использованием программного обеспечения ATARiS [21]. Метаданные линии клеток были получены как из Ахиллеса, так и из Энциклопедии клеточной линии рака [22] (CCLE, http://www.broadinstitute.org/ccle), включая гистологию и сайт органа, мутации, изменение количества копий и чувствительность к соединениям в Библиотека CCLE.

Суперпути были построены путем комбинирования кураторских моделей пути из базы данных взаимодействия с каналом NCI [23] (PID, http://pid.nci.nih.gov/), к которой можно получить доступ через MSigDB (http://software.broadinstitute.org / gsea / msigdb) [24] с результатами скрининга белка-взаимодействия, полученными с помощью TR-FRET [25]. Символы генов для пути PID сначала были сопоставлены с официальными символами HUGO, чтобы устранить двусмысленность и помочь в интеграции с набором данных Achilles. Объекты пути, которые не могли быть сопоставлены с HUGO, были вырезаны из модели пути. Все 196 ПИД-путей были агрегированы для формирования суперпути с 1548 узлами и 7906 взаимодействий. Мы добавили 208 новых взаимодействий, идентифицированных при скрининге ИПП [25], к этому суперпути и аннотировали их для дальнейшего использования. Мы использовали мутации и изменения количества копий из наборов данных CCLE [22], чтобы удалить потерянные узлы и построить 206 контекстно-зависимых сетей сотовой сети. Затем данные астральной shRNA были объединены с каждой сетью, чтобы создать суперпути, прочно связанные с генами, для каждой клеточной линии. Узлы пути, которые не имели соответствующих измерений shRNA, были вырезаны из сетевой модели. Окончательный набор 7906 достоинств PPI по 206 ячейкам доступен в таблице S1. Все наборы данных, используемые в анализе, доступны для загрузки на портале данных обнаружения рака и развития (CTD2) (https://ctd2.nci.nih.gov/dataPortal/). Мы также удобно упаковали данные, необходимые для воспроизведения анализа на Synapse. В настоящее время мы разрабатываем сайт портала PPI, где данные о важности PPI, а также данные нашего скринингового исследования OncoPPi [25] можно добывать и просматривать (А. Иванов, Б. Ревеннау и др., Рукопись в процессе подготовки). Этот веб-сайт позволит пользователям экспортировать данные для анализа в excel или Cytoscape или для захвата сетевых изображений в виде файлов png.

Биологические сети состоят из белков (как узлов) и взаимодействий (как ребер) между ними. Для этого исследования мы анализируем взаимодействия между белками с учетом всех других взаимодействий и белков в сети. Для начала мы сначала рассмотрим PPI между двумя белками. Эти два белка обычно также участвуют во взаимодействиях с другими узлами. Если ИЦП имеет важное значение, то более вероятно, что другие взаимодействия этих двух белков необходимы. Кроме того, можно было бы ожидать, что взаимодействия, происходящие в непосредственной близости от этого взаимодействия, также необходимы. Другими словами, для ИЦП существует определенность.

Чтобы продолжить, мы сделаем локализацию ИПП более формальной, инвертируя сеть путей и представляя каждый из ИЦП в качестве узлов, и каждый из белков в виде ребер. Два ИЦП соединены в сети, если они разделяют белок, т. Е. Каждый край нового графа соответствует белку. Таким образом, мы создаем новый график, кодирующий близость для ИЦП (рис. 1). Поскольку мы ожидаем, что ИЦП, связанные с более важными белками, будут иметь более высокую корреляцию в существенности, мы выбираем весовые коэффициенты в двойной сети, чтобы быть пропорциональными существенности соответствующего белка, полученного из данных скрининга shRNA.

Описание обработанного пути интегрировано с новыми взаимодействиями, обнаруженными при скрининге PPI, чтобы создать суперпути взаимодействия. Измерения существенности генов накладываются на узлы суперпути, а сетевая топология преобразуется в двойной граф, где гены становятся краями сети, а генные взаимодействия становятся сетевыми узлами. Сущность гена затем рассеивается по их взаимодействию, чтобы вывести весомость существенности взаимодействия.

После того, как мы построили нашу модель с двойным графиком, мы делаем вывод о существенности ИЦП неконтролируемым образом. Следуя хорошо известному алгоритму PageRank [26], чтобы повысить местность существенности, мы используем итерационное обновление существенностей. На каждом шаге существенность каждого узла (или ИЦП) обновляется, чтобы быть средним для местностей его соседей. Это согласуется с нашей интуицией локальности оценки сущности. Если взаимодействие имеет важное значение, вполне вероятно, что взаимодействие поблизости также жизненно важно. Более того, менее существенное взаимодействие обычно близко к менее важным. Другими словами, близкие взаимодействия коррелированы, и величина этой корреляции пропорциональна существенности узлов между структурой и сетью. Более интересно, эти обновления структурно мотивированы, т. Е. Полученные оценки отражают структурную важность ИЦП во всей сети взаимодействия.

Двойная сеть построена из данной сети, т. Е. Сеть преобразуется так, что каждый PPI / edge представлен узлом. Два узла в двойном графе соединены тогда и только тогда, когда их соответствующие ребра (в исходном графе) имеют общую конечную точку. Вдохновленный местностью существенности, предлагается итерационный метод, в котором существенность узла в двойном графе усредняется по существенности его прямых соседей. В частности, мы определяем существенность узла i (в двойном графе) на t-м шаге на ei (t). Также пусть ei (0) является случайной инициализацией между 0 и 1. На шаге (t + 1) оценка каждого узла является средневзвешенной оценкой соседей, сглаженной ее значением на предыдущем этапе, с 0 <α ≤ 1,0 , Интуитивно значение каждого узла распространяется на его соседей.

Например, в сети, приведенной на рис. 1, существенность для узлов 1 и 2 двойного графа (ребра e1 и e2 в исходной сети) обновляются следующим образом:
е1 (т + 1) = (1-α) е1 (т) + α (р1 е2 (т) + р2 е3 (т) p1 + p2)
е2 (т + 1) = (1-α) е2 (т) + α (р1 е1 (т) + р3 е3 (т) + р3 е4 (т) p1 + p2 + p3)

На вес каждого ребра влияет существенность белка. т. е. мы имеем экспоненциальное ядро ​​exp (w * pi), где pi — существенность белка i, а w — коэффициент. Установив разный w, мы можем включить наше предыдущее убеждение в важности существенности белка в существенности краев.

После достаточно большого количества шагов оценки сходятся, а окончательный балл не зависит от инициализации. Нетрудно видеть, что стационарные значения (когда сходится вычисление существенности) можно просто вычислить по разложению по собственным значениям варианта матрицы смежности двойственного графа.

Вышеуказанные обновления подвержены переопределению и чувствительны к шуму. Следовательно, на каждом шаге новое значение существенности может резко измениться из-за изменений в соседних ИЦП. Чтобы контролировать это нежелательное поведение, мы вводим шаг сглаживания к модели для регуляризации решения. На каждом шаге новое значение представляет собой взвешенную сумму предыдущего значения и ценность, которую вдохновляют соседи. Параметр сглаживания 0 <α ≤ 1, контролирует этот компромисс между локальностью и регуляризацией. Новое значение (1 - α) умножает предыдущее значение плюс α раз на значения, вычисленные из соседей.

Мы проанализировали α = 0,9, 0,5, 0,1 и отметили, что параметр сглаживания не оказывает существенного влияния на ранжирование существенностей. Он изменяет только значения, но не влияет на порядок. Более низкий α будет ослабить существенность и приблизит их друг к другу. Например, α = 0 приведет к равномерной существенности (все равны). Низкие значения α делают правило обновления неохотно изменением сущностей в итерациях, и значения меняются плавно, поэтому конечные значения будут близки друг к другу. С другой стороны, по мере увеличения α эффект соседей будет возрастать, изменения имеют более высокие величины, и разница более очевидна. Сглаживание сделает численные значения более стабильными. Вычисление собственных векторов обрезается для вырождения результатов, когда наименьшее собственное значение близко к 0. Сглаживание будет увеличивать наименьшее собственное значение, и поэтому на вычисление сходимости не будут влиять вырожденные случаи. Кроме того, сглаживание можно рассматривать как метод шумоподавления. Если данные шумные, сглаживание приведет к удалению тонкой настройки из-за шума. Поэтому изменения, вызванные шумом, не повлияют на модель.

Мы определили, что значение α = 0,5 было оптимальным для анализа в этом исследовании. Второй параметр w показывает, насколько существенность белков влияет на существенность взаимодействий между ними. Другими словами, более высокие значения w показывают, что взаимодействие является существенным, если соответствующие белки необходимы, а меньшие значения w показывают, что независимо от того, насколько существенны соответствующие взаимодействия с белками, важно, например, из-за его роли в PPI сеть. Рассматривая разные значения, мы устанавливаем w на 0,5. См. Методы S1, где мы демонстрируем, что это итеративное обновление гарантировано сходится и имеет закрытый ответ. Кроме того, конечное значение не зависит от инициализации. Конечная оценка существенности варьируется от 0 (не существенная) до 1 (что совершенно необходимо для выживания клеток). Все программное обеспечение MEDICI доступно для общедоступной загрузки по адресу https://github.com/cooperlab/MEDICI.

Мы применили MEDICI к профилям генной важности shRNA из 206 клеточных линий в базе данных Achilles [8]. Для каждой клеточной линии была создана контекстно-зависимая сеть PPI с использованием мутационных и CNV-событий для повторной проводки топологии суперпути-предшественника [23], содержащей 2 186 белков и 11 488 ИЦП. Этот суперпути был подмножеством базы данных взаимодействия с каналом NCI [23], которая теперь размещается в сети обмена данными в сети [27] (http://www.ndexbio.org/). Измерения существенности генов были интегрированы с повторно подключенными сетями, а затем деконструированы путем построения двойного графика для прогнозирования неизвестных существенных значений ИЦП из измеренных характеристик генов и топологии сети PPI (рис. 1). Чтобы оценить эти ИЦП в образцах пациентов, мы использовали мутации, профили экспрессии CNV и мРНК, чтобы определить, какие ИЦП отсутствуют у каждого пациента. Затем для измерения прогностической значимости этих групп использовали анализ пропорциональных рисков Кокса. ИЦП из линий производных аденокарциномы легких были ранжированы для определения наиболее важных ИЦП, статистические данные КС были рассчитаны для рангов по этим линиям, а положительная статистика КЗ> 0,5 использовалась как порог для значительных ИЦП в клеточных линиях ЛАДА.

Мы использовали контекстно-ориентированные сети для вычисления сущностей 7906 ИЦП в 206 ячейках линии из набора данных Achilles проекта и сообщили об этом в таблице S1. Контекстно-ориентированные сети были основаны на суперпути, которая была построена путем объединения 196 кураторских моделей путей из базы данных взаимодействия с каналом NCI с 208 новыми взаимодействиями, выявленными при скрининге PPI [25], а также с изменениями мутаций и копий из наборов данных CCLE [22]. Изучение ИЦП с наивысшей средней сущностью определило, что в топ-20 доминировали взаимодействия CTNNB1 и AKT1. Десять из 20 лучших ИЦП включали CTNNB1, а 8 из 20 участвовали в AKT1. Два других первых 20 ИЦП были SOS1-SRC и MYC-SMAD4. Очень существенными взаимодействиями CTNNB1 в нисходящем порядке были те, у которых были SRC, RAC1, JUN, PTPN11, HDAC1, EGFR, RHOA, CTNNA1, CDC42 и AR. Верхние взаимодействия AKT1 были с SRC, RAC1, SOS1, PIK3CA, PTPN11, PIK3R1, JAK1 и MTOR. SRC был компонентом 3 из 20 лучших ИЦП, а два первых ИЦП по всем линиям клеток были CTNNB1-SRC и SRC-AKT1, что указывает на то, что путь SRC-AKT1-CTNNB1 потенциально представляет общий интерес для ориентации PPI. Предыдущие исследования показали синергические эффекты с использованием комбинаций ингибиторов SRC и AKT [28] при мелкоклеточном раке легкого.

Данные были отфильтрованы для удаления клеточных линий с большим количеством недостающих узлов (> 20% отсутствовали из-за мутации или удаления генов) и ИЦП с одинаковой существенностью по клеточным линиям, в результате чего была окончательная матрица из 165 клеточных линий на 5798 ИЦП для кластеризации существенности PPI анализ. Неконтролируемая иерархическая кластеризация выявила сильные кластеры некоторых подмножеств ИЦП (S1 Рис.). В общем, ИПП в этих кластерах совместно использовали один доминирующий онкоген (например, AKT1 или CTNNB1) или супрессор опухоли (например, TP53) в качестве одного из взаимодействующих партнеров.

Чтобы углубиться в эти ИЦП с терапевтическим потенциалом, мы проанализировали подмножество из 360 наиболее важных ИЦП со средней существенностью> 0,5 по всем линиям клеток. Оценка существенности 0 является несущественным ИЦП, тогда как оценка 1 является полностью необходимым ИЦП для выживания клеток. Кластеризация этих 360 ИЦП по 165 линиям клеток выявила 12 основных кластеров ИЦП. Каждый из этих кластеров был сильно связан либо с одним белком, либо с одним путем (фиг. 2A). Особый интерес представляют PPI ​​среди 20 наиболее часто встречающихся связующих белков, которые доминируют в отдельных кластерах PPI, таких как AKT1-SRC, AKT1-MTOR и CTNNB1-SRC. Интересно, что клеточные линии не кластеризовались в основном тканями происхождения, за исключением линий клеток, полученных из двоеточия, которые были вызваны большим кластером CTNNB1. Вместо этого кластеризация клеточных линий, вероятно, была вызвана совместной активацией онкогенных путей.

(A) Неконтролируемая иерархическая кластеризация из 360 наиболее важных ИЦП по 165 линиям клеток идентифицирует 12 основных кластеров. 360 ИЦП со средней оценкой существенности> 0,5 использовались для кластеризации 165 клеточных линий, используемых в скрининговом исследовании ахиллесовой shRNA с использованием программного обеспечения Cluster и Java Treeview [29]. Данные о важности ИЦП были средними по центру и сгруппированы по средней корреляции. Красный указывает на более высокую сущность, а синий означает более низкую сущность. Справа расположены основные концентраторы для каждого кластера. (B) Кластеризация значений 5798 PPI-MPER по 165 линиям клеток. Красный указывает на то, что значение ИЦП больше, чем максимальная степень белка, а синий указывает на то, что значение ИЦП меньше, чем макс.

Напротив, когда мы сгруппировали 165 клеточных линий белковыми узлами с использованием генно-центричных данных чувствительности ацетил-shRNA по 5711 генам, клеточные линии сгруппированы в основном в ткани происхождения (S2 Fig). Несколько сильных кластеров были очевидны в неконтролируемой кластеризации данных астральной shRNA, которая включала в себя наборы факторов транскрипции, рибосомных белков или генов неизвестной функции. Чтобы сравнить контролируемую кластеризацию ребер на рис. 2 с использованием данных узла shRNA, мы выделили 343 белка с максимальной средней чувствительностью shRNA по всем линиям клеток (<-0,05) и выполнили идентичную иерархическую кластеризацию (S3 Fig). Клеточные линии продолжали кластеризоваться тканями происхождения, и было несколько различных кластеров, за исключением одного небольшого кластера, содержащего рецепторы класса I МНС.

Чтобы сравнить существенность протеинов и ИЦП, мы оценили каждое взаимодействие по существенности ИЦП, а затем сравнили это с максимальной степенью протекания источника и цели взаимодействия. Особенно интересны взаимодействия с высокой значимостью ИЦП, но с низкой степенью важности источника / цели, поскольку они представляют собой уязвимости, которые не будут выявлены при однократном нокдауне. Мы далее вычислили отношения существенных значений ИЦП к максимальной существенности либо взаимодействующего белка, либо выполнили иерархическую кластеризацию данных PPI / maxProteinEssentiality (PPI-MPER) (рис. 2B). Мы заметили, что PPI-MPER 2294 (29%) имели PPI-MPER, который был> 1 в половине из 165 линий клеток (таблица S3). Из исследованных 7814 ИЦП 6503 (83%) имели PPI-MPER> 1 по меньшей мере в одной клеточной линии. Важно отметить, что PPI 2562 (33%) имели средний PPI-MPER <0,5, что указывает на то, что максимальная существенность белка была в 2 раза или выше, чем существенность PPI, по меньшей мере, в половине линий клеток. Эти данные свидетельствуют о том, что программное обеспечение MEDICI отличает важные ИЦП от несущественных ИЦП, даже когда они происходят между основными белками. Среди ИЦП с неизменно высокими значениями PPI-MPER были CDK2_RB1 [30], PIK3R1_YWHAZ [31], JAK3_MAPK14, CREBBP_CTNNB1 [32] и HIF1A_SMAD4 [33]. Некоторые из этих взаимодействий хорошо документированы как ключевые взаимодействия в критических путях передачи сигналов, в то время как другие, тем не менее, предполагают, что они могут потребовать дальнейшего изучения.

Другие PPI, такие как YAP1_CTNNB1 [34], AR_CTNNB1 [35, 36] и SMAD7_CTNNB1 [37], были гораздо более существенными, чем любой белок (S4 Fig), но только в подмножестве клеточных линий. Например, уровень персистенции прочности AR_CTNNB1 PPI был очень высоким в ряде клеточных линий, включая COLO704 овариальный (99% -ный), и BT20 (98% ile) и тройной отрицательный рак молочной железы MDA-MB-453 (97%) Сотовые линии. Было показано, что как Wnt [38], так и андрогенная сигнализация [39] важны в подгруппах яичников и тройных отрицательных раковых опухолей молочной железы [40-42]. Другим примером сигнальных перекрестных помех, идентифицированных этим анализом, является анализ взаимодействий YAP1_CTNNB1 в клетках миеломы L363 (94%), саркомах CADO-ES1 Ewing (96%) и клетках рабдомиосаркомы A204 (96%). Передача сигналов Wnt и Hippo важна при раках миеломы, кости и мягких тканях [43-47]. Мы также наблюдали потенциальные перекрестные помехи сигналов TGFβ и Wnt в колоректальных клетках RKO (95% ile), поджелудочной железе KP4 (97% ile) и 22RV1 клетках рака предстательной железы (99% ile). SMAD7 участвует в развитии рака толстой кишки [48, 49] и во взаимодействии с β-catenin при раке поджелудочной железы [50] и раке предстательной железы [37].

Отсутствие даже технологии с низкой пропускной способностью для создания измерений существенности PPI затрудняет проверку целей. Этот факт побуждал нас оценивать наши прогнозы важности ИЦП путем совместного анализа существенности ИЦП и данных о чувствительности к лекарственным средствам. Мы использовали данные чувствительности к лекарственным средствам на более чем 200 линиях клеток из Энциклопедии клеточной линии рака (CCLE) [22] и изучили корреляции существенных свойств ИЦП и чувствительности к 19 различным соединениям. Таким образом, мы провели анализ PPI, специфичный для контекста, удалив любой ИЦП из сети сотовой сети, если был удален исходный или целевой белок, была инактивирующая мутация или не была выражена на уровне РНК. Из-за нашего контекстно-специфического подхода, который использует генетические изменения и генную регуляцию для изменения топологии сети PPI для каждой клеточной линии, определенное количество ИЦП варьировалось от линии клеток до клеточной линии, но в среднем включало 104 клеточных линии на ИЦП. Затем мы вычислили статистическую значимость корреляций существенности PPI с чувствительностью к лекарственным средствам (как определено AUC в анализе CCLE). Интересно отметить, что наиболее значительная корреляция (p = 4.63E-07) была связана с взаимодействием BRAF-KRAS с PLX4720, соединением, которое нацелено на BRAF. Самая высокая абсолютная корреляция (r = 0,71, p = 0,0013) была между PPKDC-TP53 PPI и чувствительностью к AZD6244, ингибитору MAPK1 (рис. 3). Эта сильная корреляция подтверждается многочисленными исследованиями, свидетельствующими о том, что сигнализация MAPK имеет решающее значение для остановки клеточного цикла в ответ на повреждение ДНК [51, 52] и что ингибирование p38-MAPK сенсибилизирует клетки рака легких к ДНК-разрушающим агентам [53].

Мы сопоставляли показатели чувствительности лекарств от CCLE с оценками существенности взаимодействия для определения критических взаимодействий, которые прогнозируют терапевтическую чувствительность. Чувствительность к ингибитору MAPK AZD6244 сильно коррелирует с существенностью взаимодействия PRKDC-TP53, что согласуется с хорошо установленной роль p38-MAPK в остановке клеточного цикла в ответ на повреждение ДНК [51-53].

Всесторонний анализ корреляций с чувствительностью к лекарственным средствам был проведен путем сравнения силы корреляций для двух наборов пар наркотиков / PPI: 1) пары лекарств / PPIs, в которых ИППП включает в себя белок, нацеленный на этот препарат, и 2) ИПП с участием неизвестного белка-мишени. Изучая 19 соединений CCLE, для которых были получены данные о важности PPI, мы обнаружили, что целевые ИЦП были значительно более важными, чем нецелевые ИЦП, по анализу ранжировки Уилкоксона для 14 из 19 соединений (таблица 1). Для каждого набора целевых и нецелевых наборов белков был выполнен случайный перестановочный анализ для вычисления ложных скоростей обнаружения и исправления для множественного тестирования гипотез. Корреляции существенности ИЦП для каждой из 14 значимых пар наркотиков / ИПП были значимыми с помощью FDR <0,05 (таблица 1).

Чувствительность к лекарственным средствам была получена из данных CCLE AUC. Значение обогащения для целевых значений ИПП PP-мишеней по сравнению с нецелевыми значениями ИЦП было рассчитано по критерию оценки уровня Уилкоксона и было значительным для 14 из 19 соединений. Целевые и нецелевые наборы генов были случайным образом перегруппированы 1000 раз для вычисления FDR и исправления для множественного тестирования гипотез.

Чтобы дополнительно проверить предсказания существенности MEDICI, мы исследовали ассоциации между известными генетическими изменениями и важностью ИЦП. Мы разделили данные о важности PPI из 165 линий клеток, проанализированных на рис. 2, на основе наличия или отсутствия генов-супрессоров опухолей PTEN или APC дикого типа. Мы предположили, что клеточные линии с мутантным PTEN будут иметь повышенную зависимость от ИЦП в пути PI3K-AKT, тогда как клетки с мутантным APC будут иметь повышенную зависимость от β-catenin (CTNNB1). Действительно, когда мы проанализировали данные о важности PPI для клеточных линий с мутациями PTEN (n = 25) по сравнению с PTEN (n = 140), мы обнаружили, что наиболее важные ИЦП были связаны с сигналами PI3K-AKT (фиг. 4A ). Лучшие ИЦП включали JAK1-AKT, JAK1-PIK3R1, SRC-AKT1 и PIK3R1-AKT1 (FDR (BH) = 2.13e-4)). Изучение клеточных линий с мутантным APC (n = 14) по сравнению с таковыми с APC дикого типа (n = 151), 95 наиболее значимых ИЦП включали все взаимодействия с β-катенином (FDR (BH) = 2.13e-4)). 20 лучших ИЦП из этого анализа показаны на рис. 4B.

(A) Сети ИЦП, наиболее существенно возрастающие в клетках с мутацией или потерей гена-супрессора опухоли PTEN. Показаны 14 наиболее важных ИЦП. Значительные различия в важности PPI были рассчитаны в GenePattern [54]. Сети были визуализированы с помощью Cytoscape [55]. (B) Сети ИЦП, наиболее существенно возрастающие в клеточных линиях с мутацией или потерей гена-супрессора опухоли APC. Показаны 20 наиболее значимых ИЦП.

Затем мы хотели рассмотреть вопрос о том, может ли потеря конкретного ИЦП дать преимущество в выживании пациентам с раком легких. Чтобы проверить, было ли это так, мы проанализировали геномные данные из наборов данных аденокарциномы легкого (LUAD) [56] из сети The Cancer Genome Atlas (TCGA). Мы отделили пациентов к тем, у кого или нет каждый ИЦП в нашей сети суперпути, основанный на наличии или отсутствии бессмысленных мутаций, мутаций с чередованием или гомозиготных делеций для каждого из белков-партнеров. Затем мы вычисляли значения р-значений логарифма для выживаемости на основании того, присутствовал ли или отсутствовал каждый из ИЦП. Кривые QQ наблюдаемых vs ожидаемых значений p-значения log-ранга для пациентов LUAD (рис. 5A) указывают на сильную тенденцию к более значительным p-значениям, чем ожидаемые случайно. Тем не менее, p-значения ранга журнала, скорректированные для нескольких тестов с использованием коррекции Бенджамини-Екутиели [57], не достигли статистической значимости и поэтому должны быть предопределены с осторожностью. Затем мы рассмотрели набор ИЦП с номинальным р-значением р-ранга <0,05, которые также были важны в клеточных линиях аденокарциномы легких на основе нашего анализа данных Ахиллеса. Для пациентов LUAD этому критерию был удовлетворен 15 ИЦП (таблица S2, рис. 5B). Из этих 15 ИЦП шесть включили JAK1 в качестве обязательного партнера, два из которых включают JAK2, а одно - взаимодействие JAK1-JAK2. Недавно было показано, что ингибирование JAKs ослабляет рост мелкоклеточного рака легкого in vitro и in vivo [58] и что активация JAK-сигнализации индуцирует устойчивость к мутациям EGFR в немелкоклеточных раковых опухолях легких [59]. Также потенциальный интерес представляет собой взаимодействие ATM-NBN, которое участвует в двухцепочечном восстановлении разрыва ДНК и взаимодействиях PI3KR1, участвующих в активации пути PI3K.

(A) график QQ наблюдаемых по сравнению с ожидаемыми значениями p-значения log-ранга для пациентов LUAD, разделенных на основе 5798 ИЦП. (B) Сеть ИЦП со значительным значением p-значения log-ранга для различения выживаемости для пациентов TCGA LUAD, которая сосредоточена на JAK1. (C) кривая Каплана-Мейера пациентов TCGA LUAD, отделенных в зависимости от наличия или отсутствия PPI JAK1-PIK3R1. Пациенты без ИППП JAK1-PIK3R1 улучшили выживаемость по сравнению с пациентами, которые сохраняют этот ИЦП.

В то время как большинство лекарств от рака либо вызывают повреждение ДНК, либо нацеливают активные сайты ферментов, таких как протеинкиназы, все большее число новых соединений мешает критическим белково-белковым взаимодействиям (ИЦП). Хотя фармацевтическая промышленность неохотно разрабатывает соединения, которые нацелены на ИЦП, становится ясно, что эти типы лекарств могут обеспечить летальный и специфический нацеливание на раковые клетки. Примеры этих соединений включают Navitoclax (ABT-263) [60], который ингибирует взаимодействия BCL2-BAX; Nutlin-3 [61], который блокирует взаимодействия MDM2-TP53; PRI-724 [62], что препятствует взаимодействию β-catenin-CBP; и JQ-1 [13] и I-BET726 [63], которые препятствуют связыванию BRD4 с ацетилированными гистонами. Эти новые соединения демонстрируют перспективность для лечения ранее трудно контролируемых путей, включая супрессор опухолей р53 [12], путь Wnt [62] и Myc oncogene [64].

Тем не менее, хотя в каждом конкретном типе клеток может быть в среднем примерно 10 000-15 000 белков, вероятно, на порядок больше ИЦП или более 600 000 ИЦП в клетках млекопитающих [65]. Таким образом, определение приоритетов того, какие ИЦП могут иметь важное значение для развития лекарств, представляет еще большую проблему, чем определение отдельных белков в качестве потенциальных мишеней для лекарств. Было показано, что топология сети мишеней с раковыми лекарственными средствами является более узкоподобной, чем непереносимая мишень, что указывает на то, что ИЦП могут быть полезны при идентификации белков-мишеней для лечения рака [66] и неврологических заболеваний [67]. Таким образом, комбинации вычислительных и экспериментальных методов будут иметь решающее значение для выявления наиболее перспективных ИЦП, которые необходимы для выживания раковых клеток.

В этом исследовании мы описали новый подход к вычислительному выводу существенности ИЦП на основе комбинации топологии сети и высокопроизводительных исследований скрининга гена нокаутом. Это исследование представляет собой нашу первую попытку обеспечить основу для прогнозирования и определения приоритетности ИЦП в качестве потенциальных целей для терапевтического открытия, которое, как ожидается, созреет с включением дополнительных наборов данных и биологической информации. Хотя этот подход является довольно общим, здесь мы применили его только к одному большому набору данных от Project Achilles [8], который по определению, будучи интегрированным с нашим суперпути, ограничил наши анализы, включив только 7906 ИЦП. Будущие исследования, включающие в себя дополнительные высокопроизводительные массивы данных из экранов siRNA, shRNA и / или CRISPR / Cas9, будут интегрировать множественные комплементарные наборы данных, которые могут обеспечить более надежные прогнозы существенности PPI. Другим ограничением нашего текущего исследования является то, что экраны shRNA могут иметь нецелевые эффекты. По этой причине мы ограничили наш анализ только теми ахиллесовыми сетчатыми мишенями, которые были проверены несколькими shRNAs, нацеленными на одни и те же гены.

Наш анализ также ограничен нашим пониманием и знанием всей сети PPI в раковых клетках. Разнообразные подходы, в том числе методы масс-спектрометрии, дрожжевые двухгибридные и TR-FRET, постоянно расширяются и улучшают наше понимание сетей PPI. По мере того как наше понимание топологии этих сетей PPI улучшается, потенциальная точность, широта и полезность выводов относительно важности PPI с использованием наших методов, описанных здесь, естественно улучшатся в результате.

Здесь мы разработали сетевые топологии сотовой сети, удалив ИЦП, в которых один ген партнера удален, мутирован или не выражен. Однако, кроме этого, мы не учитываем различия в экспрессии генов или обилие различных белков-партнеров PPI. Дополнительные способы потенциального усовершенствования нашего подхода включают анализ транскрипционного профиля клеточных линий для определения того, какое подмножество ИЦП, которое возможно внутри клетки, действительно имеет место. В настоящее время наш подход предполагает, что два белка будут взаимодействовать в клеточной линии, если они, как известно, взаимодействуют, выражаются и не мутируются. Однако пути передачи сигналов могут значительно изменить созвездие потенциальных ИЦП в ячейке, и, таким образом, данные активации канала распределения на наших нынешних сетевых топологиях могут улучшить наш подход.

Несмотря на это, представленные здесь анализы показывают, что наборы оснований ИЦП, которые мы вычислили, имеют большую биологическую значимость. Корреляции существенностей чувствительности к лекарственным средствам и генетических мутаций подтверждают наш общий подход и дают новое представление о потенциально важных ИЦП, которые могут быть использованы для руководства разработкой целевых показателей рака.

Данные о важности ИЦП были средними по центру и сгруппированы по средней корреляции. Красный указывает на более высокую сущность, а синий означает более низкую сущность.

(TIF)

Щелкните здесь для получения дополнительных данных.

Клеточные линии кластеризуются в основном тканями происхождения. Основные сильные кластеры генов были обусловлены наборами факторов транскрипции, рибосомных белков или генов неизвестной функции.

(TIF)

Щелкните здесь для получения дополнительных данных.

Клеточные линии кластеризуются в основном тканями происхождения. Присутствуют несколько отдельных кластеров на основе генов, за исключением одного небольшого кластера, содержащего рецепторы класса I MHC.

(TIF)

Щелкните здесь для получения дополнительных данных.

Чтобы оценить полезность MEDICI, мы сравнили оценочные значения важности PPI с экспериментально измеренными сущностями для отдельных белков. Каждая точка в диаграммах рассеяния панелей (A-D) представляет ранг существенности одного PPI и максимального ранга существенности белков составляющих белков в этом взаимодействии. Цвет указывает плотность точек. Показаны графики для четырех клеточных линий (A) рака легких A549, (B) рак поджелудочной железы BXPC3, (C) рак желудка MKN7 и (D) линии клеток глиомы U87MG. PPI EGFR-ERBB3 обозначается на каждом графике стрелкой. Большое количество ИЦП появляется в верхнем левом углу каждой панели, где существенность ИЦП значительно превышает максимальную составляющую белка. В этих записях содержится информация о чувствительности к взаимодействию, которая не может быть легко обнаружена в данных об измерении уровня белка. Ранги / процентили использовались для генерации этих графиков, чтобы избежать каких-либо последовательных смещений в величине PPI по сравнению с содержанием белка.

(TIF)

Щелкните здесь для получения дополнительных данных.

NaN указывает, что один из белков во взаимодействии удаляется, мутируется или не выражается в этой клеточной линии.

(XLS)

Щелкните здесь для получения дополнительных данных.

(XLSX)

Щелкните здесь для получения дополнительных данных.

Также показаны проценты PPI ранжирования и максимальные проценты прочности основного белка.

(ТЕКСТ)

Щелкните здесь для получения дополнительных данных.

(DOCX)

Щелкните здесь для получения дополнительных данных.

Эта работа была поддержана Национальными институтами здравоохранения [номер гранта U01 CA168449].

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *