Нажмите "Enter", чтобы перейти к контенту

CRISPR-CAS9 D10A-мишень-специфическая флуоресцентная маркировка ДНК с двойной цепью для картирования всего генома и анализа структурных изменений

CRISPR-CAS9 D10A nickase target-specific fluorescent labeling of double strand DNA for whole genome mapping and structural variation analysis
Источник: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4737172/

Мы разработали новую стратегию маркировки ДНК, специфичную для последовательности, которая значительно улучшит картографирование ДНК в сложных и структурно-вариантных геномных областях, а также упростит высокопроизводительное автоматическое картирование всего генома. Этот метод использует белок Cas9 D10A, который содержит мутацию с нуклеазой, отключающей в одном из двух нуклеазных доменов Cas9, для создания направляющего РНК-направленного ДНК-ника в контексте комплекса CRISPR-CAS9-ДНК, собранного in vitro. Флуоресцентные нуклеотиды затем включаются рядом с сайтом замачивания ДНК-полимеразой для маркировки ориентированных последовательностей мишеней, определяемых РНК. Эта стратегия маркировки очень эффективна при нацеливании повторяющихся последовательностей, а также в штриховом кодировании геномных областей и структурных вариантов, не поддающихся нынешним методам мечения, которые основаны на неравномерном распределении мотивов рестрикционных сайтов в ДНК. Важно отметить, что эта меченой двухцепочечной ДНК доступна в длинных нетронутых отрезках для высокопроизводительного анализа в наноканальных массивах, а также для более точного анализа помеченных областей ДНК с использованием альтернативных способов растяжения и визуализации меченых длинномерных молекул ДНК. Таким образом, этот метод значительно улучшит как автоматическое высокопроизводительное картирование генома, так и целенаправленный анализ сложных областей, содержащих повторяющуюся и структурно-вариантную ДНК.

Две основные проблемы в анализе генома — сборка последовательности генома de novo, основанная на «короткометражном» определении дробовика и анализе структурных изменений. Было предпринято несколько подходов и комбинаций различных подходов к решению этих задач. Наиболее широко принятая стратегия основана на глубокой последовательности библиотек дробовика и последовательности библиотек сопряженных пар, что увеличивает последовательность последовательности короткочитаемого секвенирования (1). Подход с парным секвенсированием включает в себя обычные библиотеки сопряженных пар, трудоемкие библиотеки fosmid или BAC (2), пары чтения Hi-C для лесов с хромосомной шкалой (3) и библиотеки, опосредованные транспозазой (4). Другой подход основан на стохастическом разделении соответствующих фрагментов геномной или полимеразной цепной реакции (ПЦР) в физически различные пулы с последующей последующей фрагментацией для получения более короткой последовательности (5-8). Благодаря соответствующей обработке с высокой пропускной способностью и штриховому кодированию эта стратегия уменьшает сложность и, следовательно, может улучшить качество сборок. Более продолжительные технологии секвенирования, такие как SMRT от PacBio и последовательность Oxford Nanopore, обещают в конечном итоге дальнейшее улучшение смежности сборки. Например, секвенирование SMRT было успешно применено для закрытия некоторых пробелов и выявления некоторых структурных изменений в человеческом эталонном геноме (9). Однако их высокая частота ошибок, низкая пропускная способность и высокая стоимость пока не позволили широко распространяться.

Тем не менее, ни один из вышеупомянутых подходов не позволяет адекватно решать проблемы прилегания и валидации на дальнем расстоянии de novo, последовательности неправильной сборки в сложных сегментарно дублированных и повторяющихся областях, а также обнаружения и определения структурных вариантов. Для этих целей были разработаны целые технологии картирования генома в качестве дополнительных инструментов для обеспечения лесов для сборки генома и анализа структурных изменений. Оптическое картирование, впервые предложенное Дэвидом Шварцем и его коллегами, было использовано для создания карт ограничений для различных геномов и оказалось очень полезным в обеспечении лесов для сборки последовательности дробовика и выявления структурных изменений (10,11). Совсем недавно мы разработали высокоавтоматизированное картирование всего генома в массиве наноканалов (12,13).

Обе вышеописанные стратегии картирования генома основаны на сопоставлении распределения коротких (от 6 п.п. до 8 п.н.) мотивов последовательности по всему геному. Однако распределение мотивов последовательности неравномерно в разных геномных областях. Часто в повторяющихся геномных областях нет подходящих мотивов последовательности, что приводит к большим сегментам генома, которые нельзя сопоставить (14) (рис. 1А). Другая проблема заключается в обнаружении и типировании структурных изменений или клинической диагностики конкретных структурных вариантов. Для получения точных точек разломов требуется целенаправленная маркировка структурных изменений для последовательности, но это не может быть достигнуто путем отображения последовательности-мотивов (рисунок 1B).

Схемы последовательности флюоресцентной маркировки ДНК последовательности и специфической флуоресцентной маркировки ДНК, специфичной для целевой последовательности. (A) Повторяющиеся элементы не содержат мотивов распознавания для никирующих ферментов (синие круги), и поэтому эта область не поддается определению с помощью стандартного ник-маркировки, зависящего от последовательности. Тем не менее, эта область может быть сопоставлена ​​новым методом флуоресцентного никеля Cas9n (красные круги). (B) Флуоресцентная система маркировки Cas9n может идентифицировать транслокации путем конструирования gRNAs для нацеливания Cas9n D10A на ник-специфические последовательности вблизи точек останова (Красные алмазы). Эти регионы прерывания транслокации затем могут быть точно отображены визуализацией целевых зависимых от системы сигналов флуоресцентной ник-маркировки Cas9n по сравнению с обычными штриховыми кодами, зависящими от мотивов, которые сгенерированы на соседних больших участках ДНК (синих кругах).

Недавно был разработан новый инструмент для редактирования генома, основанный на бактериальной CRISPR (Clustered Regular Interspaced Short Palindromic Repeats) -соединенной белок-9 нуклеазы (Cas9) от Streptococcus pyogenes для генерации разрывов двойной цепи ДНК in vivo (15). Для достижения специфического для сайта распознавания и расщепления ДНК белок Cas9 должен образовывать комплекс с дуплексом, состоящим из кРНК и транс-активирующей кРНК (tracrRNA), которая частично комплементарна к crRNA. HNH и RuvC-подобные нуклеазные домены Cas9 вырезали обе цепи ДНК, генерируя двухцепочечные разрывы (DSB) в местах, определяемых 20-нуклеотидной последовательностью семян в ассоциированном транскрипте crRNA (16,17). Мутации обоих сайтов генерируют дефицит нуклеазы Cas9 (dCas9), который все еще способен связываться с дуплексом crRNA: tracrRNA и перемещаться к целевой последовательности (18) и был использован для визуализации повторяющихся последовательностей ДНК (19,20). Мутантная форма, известная как Cas9 D10A, которая не обладает только активностью активности нуклеазного домена, подобной RuvC, только ушивает цепочку ДНК, комплементарную ее кРНК, и характеризуется как низину Cas9 (Cas9n). Этот мутант Cas9 был использован с парной выделенной направляющей РНК (sgRNA), нацеленной на противоположные нити одного и того же локуса для получения DSB с большой точностью (16,21). Здесь мы адаптируем зависимый от Cas9n протокол никинга для флуоресцентной маркировки определенных последовательностей для картирования всего генома с помощью ник-маркировки in vitro. Такие Cas9n-флуоресцентные меток, специфичные для маркировки на основе никеля, могут использоваться для нацеливания на повторяющиеся области, которые часто не имеют подходящих мотивов места рестрикции. Этот метод также может помочь точно отобразить точки разрыва структурных изменений, таких как транслокации, путем создания направляющих РНК (gRNAs) для распознавания и прямой маркировки последовательностей вблизи этих точек останова перед анализом с высокой пропускной способностью одной молекулы (рис. 1B). Новые комбинации традиционного картографирования последовательности и целевого отображения позволят полностью реализовать потенциал нашего метода картирования генома на основе наноканалов (12,13).

Целевую последовательность-специфическую маркировку с флуоресцентной никелевой маркировкой Cas9n проводили на клоне BAC CH17-353B19, фосмиды, несущие клонированные фрагменты ДНК-терминальной ДНК, оканчивающиеся на несколько сотен оснований (TTAGGG) n (Stong et al., 2014), ВИЧ-1 цельная геном-содержащая плазмида pEcoHIV-NL4-3-eLuc (подарок от доктора Вон-Бин Янга в Университете Питтсбурга) и геномной ДНК, выделенной из клеток B-лимфоцитов человека NA12878 (Исследовательский институт Корриэля, Нью-Джерси, США).

Последовательность семян из 20 нуклеотидов, комплементарных 3′-5′-нити ДНК-матрицы-мишени, была разработана с помощью инструмента для проектирования gRNA (веб-инструмент Feng Lab CRISPR Design Web по адресу http://crispr.mit.edu.). Каждая последовательность семян была включена в кРНК. Две КРНК для геномных последовательностей домена DUF1220 (в клоне BAC), 1 для последовательности повторения теломер (TTAGGG) n и 7 для субтеломерных последовательностей, наряду с универсальной tracrRNA, были синтезированы GE Dharmacon. Фракции fosmid и CH17-353B19 были созданы путем предварительной инкубации tracrRNA (0,5 нмоль) и соответствующей кРНК (0,5 нмоль) с 1X NEB Buffer 3 и 1X BSA при 4 ° C в течение 30 мин.

Три однонаправленные РНК (sgRNAs), содержащие последовательность семян, нацеленных на участки структурного гена ВИЧ-1 (Gag, Pol и Env), были разработаны для эффективности и специфичности с использованием инструментов анализа биоинформатики. Все олигонуклеотиды для каждой целевой последовательности (таблица 1) были синтезированы в альфа-ДНК (Монреаль, Канада) и клонированы в вектор pKLV-WG-sgRNA, модифицированный из вектора pKLV-U6gRNA (BbsI) -PGKpuro2ABFP, подарок от Kosuke Yusa (адгезивная плазмида # 50946) (21). Вектор расщепляли BbsI и обрабатывали антарктической фосфатазой, а линеаризованный вектор очищали комплектом для удаления нуклеотидов QIAquick (QIAGEN). Пара олигонуклеотидов для каждого целевого сайта отжигали, фосфорилировали и лигировали с линеаризованным вектором. Кассета экспрессии sgRNA была подтверждена путем секвенирования с помощью праймера для секвенирования U6 в GENEWIZ. Валидированный вектор использовали в качестве матрицы для ПЦР с прямым T7-U6 и обратным праймером sgRNA для генерирования кассеты экспрессии gRNA, промотирующей промотор T7. Затем sgRNA для каждой мишени транскрибировали in vitro с использованием набора транскрипции MEGAshortscript ™ T7 (Life Technology). Качество ВИЧ-1 sgRNAs было подтверждено электрофорезом в 5% -ном денатурирующем полиакриламидном геле.

Номера Loci обозначают метки слева направо на рисунках 3-5.

ГРНК или sgRNAs (5 мкМ) инкубировали с 600 нг Cas9n D10A (PNA Bio Inc), 1X NEB Buffer 3 и 1X BSA (NEB) при 37 ° C в течение 15 мин. К смеси добавляли ДНК (500 анг) и инкубировали при 37 ° С в течение 60 мин. Затем зарубленную ДНК метили 4,12 единиц ДНК Taq-полимеразы (NEB), 0,1 мкМ ATTO-532 dUTP dAGC и 1X Thermopol Buffer (NEB) при 72 ° C 60 мин. Меченые фосмиды и ВАС были разрезаны и линеаризованы 5 единицами фермента NotI (NEB) при 37 ° C в течение 60 мин. Меченой pecoHIV-NL4-3-eLuc-плазмидой (17 099 пар оснований) расщепляли 20 единиц уникального рестрикционного фермента EcoRI (при 5744 bp) (NEB). NotI и EcoRI инактивировали при 65 ° С в течение 20 мин.

После замачивания Cas9n D10A, как описано ранее в секции флуоресцентного никелевого маркирования Cas9n, образец расщепляли RNAseA (190 нг / мкл, QIAGEN) при 37 ° C в течение 20 минут. После переваривания образец помещали в течение 1 часа с использованием ATX 532-dATP, dTGC (100 нМ) и 2,5 единиц ДНК Taq полимеразы (NEB) в присутствии 1X Thermopol Buffer (NEB) при 72 ° C. Образец обрабатывали 1 единиц SAP (продукты USB) и RNAseA (100 нг / мкл) при 37 ° C в течение 20 минут, а затем 65 ° C в течение 15 минут. Ники восстанавливали с помощью 500 мкМ NAD +, 100 нМ dNTP и 20 кД ДНК-лигазы Taq при 45 ° C в течение 20 мин. Затем образец обрабатывали 6 мА QIAGEN Protease при 56 ° C в течение 10 мин и 70 ° C в течение 15 мин. Образец диализовали в TE на мембране 0,1 мкм (Millipore) в течение 2 часов. После диализа образец был зазубрен 10 единицами Nt. BspQI (NEB) при 72 ° C в течение 2 часов. Затем зарубленную ДНК метили 2,5 единиц Taq ДНК-полимеразы (NEB), 0,1 мкМ ATTO-647 dUTP dAGC и 1X Thermopol Buffer (NEB) в течение 60 мин при 72 ° C. ДНК-основа была окрашена YOYO-1, и она показана синим цветом на всех рисунках. Окрашенные образцы загружали и отображали внутри наноканалов по установленному протоколу (13).

Мы рассчитали расстояния между пятнами с помощью ImageJ. Гистограмма распределений меток была построена в Excel. Если шаблон соответствует прогнозируемому шаблону, мы считаем метки как истинные положительные. Отсутствующие метки использовались для расчета эффективности маркировки, а дополнительные метки использовались для расчета ложноположительного процента.

Мы включили технологию CRISPR-Cas9 в нашу процедуру маркировки никейлей для целенаправленного, специфичного для последовательности никотинга и флуоресцентной маркировки в одном цвете, за которым следует глобальная маркировка мотивов, зависящая от мозаичного фрагмента, во втором цвете. Мы использовали две разные формы направляющих РНК. Для экспериментов с ВИЧ-плазмидой последовательность-мишень клонировали, амплифицировали и затем транскрибировали in vitro с получением экспрессируемой однонаправленной РНК (sgRNA). Для всех других экспериментов РНК CRISPR (crRNAs) и транс-активирующая РНК CRISPR (tracrRNA) были приобретены у GE Dharmacon и предварительно инкубированы с образованием каждой направляющей РНК (gRNA). В обоих случаях gRNA-направленный Cas9n D10A обеспечивает точное однократное срезание в одной цепи целевой двухцепочечной ДНК трех нуклеотидов выше по сравнению с протоплазмирующим смежным мотивом (PAM) и флуоресцентными нуклеотидами, непосредственно включенными в эти специфические сайты ников с использованием ДНК Taq Полимераза (фиг. 2). Этот подход обещает значительно улучшить картографирование ДНК в сложных и структурно-вариантных геномных областях, а также облегчить автоматическое картирование полного генома с высокой пропускной способностью.

Схемы специфической флуоресцентной маркировки целевой последовательности Cas9n / gRNA для картирования ДНК всего генома. Флюоресцентная система маркировки Cas9n использует направляющую РНК (gRNA) для направления нуклеазы Cas9 на целевой сайт. ГРНК состоит из транс-активирующей crRNA (tracrRNA) и crRNA, которая содержит 20 нуклеотидную последовательность, которая является комплементарной интересующему сайту. Мутация в нуклеазе, подобной RuvC, изменяет фермент Cas9, чтобы сделать только один разрез трех нуклеотидов выше по сравнению с протоплазивным смежным мотивом (PAM) 3′-5′-цепи ДНК-мишени. В методе маркировки ников после того, как Cas9n D10A генерирует ник, флуорофоры непосредственно включаются в сайты ников с использованием ДНК-полимеразы Taq. Эти флуорофоры могут быть обнаружены с помощью флуоресцентной микроскопии.

Мы впервые установили флюоресцентные условия никелевого маркирования Cas9n и исследовали эффективность маркировки с помощью клонов BAC, фосмид и плазмид в качестве модельных систем. На рисунке 3А показаны результаты флуоресцентной никинизации Cas9n для трициллов HLS DUF1220 на клоне BAC. Гистограмма распределения меток показана в нижнем графике на рис. 3А. Геномные последовательности, кодирующие доменные белки DUF1220, претерпели исключительное увеличение количества копий человека (HLS), которое связано с размером человеческого мозга, патологией и эволюцией (22). Единственный экземпляр триплета HLS DUF1220 охватывает около 4.7 kb, а 12 клонов BAC CH17-353B19 — 12 копий. Зонд gRNA был спроектирован так, чтобы таргетировать одну единицу триплетов. Ясно, что на этом клоне BAC 240 кб обнаружено 12 копий, а расстояние между каждым триплетом составляет 4,7 кб, что хорошо согласуется с последовательностью клона. Эффективность маркировки каждого локуса определяли путем оценки 192 меченых молекул ВАС в диапазоне от 87% до 98%. Интересно, что средние копии (ярлыки № 6-8 слева от самой метки на рисунке 3A) помечены с более низкой эффективностью маркировки. Флюоресцентная маркировка Cas9n очень специфична.

Маркировка Cas9n-nick. Ожидаемая схема маркировки и расстояния между метками показаны выше соответствующих изображений флуоресцентной микроскопии. (A) Единственная копия триплета HLS DUF1220 составляет приблизительно 4,7 kb, что не может быть идентифицировано с помощью метода маркировки последовательности-мотива из-за отсутствия сайтов распознавания в области повтора. Флюоресцентный метод никелирования Cas9n способен маркировать эту область с использованием гРНК, разработанной для триплета DUF1220. Эти сайты распознавания обозначены красными надписями. Тандемные повторы разделяют приблизительно на 4,7 т.п.н., как и прогнозировалось. Гистограмма меток gRNA DUF1220 показана ниже молекул. Для оценки эффективности маркировки было оценено в общей сложности 192 молекулы. (B) Три sgRNAs были предназначены для нацеливания на три разных местоположения (Gag, Pol, Env) в геноме ВИЧ-1. Участки были правильно помечены ожидаемыми расстояниями между каждой sgRNA. На изображении показана линеаризованная ДНК после расщепления EcoRI. (C) Три gRNAs, предназначенные для хромосомы 1q subtelomere, генерировали ожидаемый шаблон. Четвертая гРНК, нацеленная на повторяющуюся последовательность теломер (TTAGGG) n, правильно маркировала область теломер на левом конце этого фрагмента ДНК-теломера 1q.

Дополнительные метки за пределами домена DUF использовались для вычисления ложных срабатываний на рисунке 3A. Фрагментные метки внутри домена DUF сложнее определить, потому что молекулы ДНК внутри наноканала не являются статическими. Их небольшие движения и ограничение оптического разрешения могут приводить к неточному измерению повторяющихся последовательностей 4,7 кб во время изображения (200 мс). Когда все ложные пятна внутри и снаружи домена DUF использовались, ложноположительный процент составляет 0,6%.

Затем мы применили метод флуоресцентного никелевого маркирования Cas9n к плазмиде, содержащей геном ВИЧ-1. ВИЧ-1 интегрируется в геном человека в разных местах (23), каждый из которых может быть идентифицирован непосредственно посредством соответствующей маркировки сайта интеграции и глобальной стратегии картирования генома. Идентификация таких сайтов в латентных клетках ВИЧ-1 необходима для понимания молекулярных и эпигенетических механизмов, лежащих в основе латентности ВИЧ-1 (24). Аналогичным образом этот подход, основанный на последовательности, может использоваться для идентификации сайтов случайной интеграции лентивирусов в клетках-хозяевах, что может нарушить экспрессию экспрессии эндогенного гена и векторных генов (25). Множественные sgRNAs были спроектированы и протестированы для определения структурной области ВИЧ-1 (Gag, Pol, Env) для определения наиболее эффективной гРНК, которая маркирует геном ВИЧ-1. Участки были правильно помечены ожидаемыми расстояниями между каждой sgRNA (рисунок 3B). Однако эффективность этикетирования на каждом участке составляет 36%, 58% и 44% от левой маркировки соответственно, что указывает на то, что эффективность маркировки может быть зависимой от последовательности или региона. Также может быть разница в эффективности маркировки sgRNA против gRNA. Эффективность этикетирования гРНК намного выше, чем при использовании sgRNA. В третьей модели системы fosmid, содержащий субтеломерный сегмент человеческого 1q, заканчивающийся на 100 оснований (TTAGGG) n, использовался для проверки флуоресцентной маркировки Cas9n. Мы разработали четыре направляющих РНК-зонда для нацеливания тракта (TTAGGG) n и трех различных локусов на субтеломере. Схема маркировки очень тесно связана с положениями семенных последовательностей gRNA в контрольной последовательности 1q (рисунок 3C). Однако эффективность меток относительно ниже для теломер с 30%, тогда как эффективность меток субтеломерных маркеров составляет 95%, 79% и 99% соответственно от левой левой метки на 1q (рисунок 3C). Это может быть связано с парами не-Ватсона-Крика гексамерных повторов, высоким содержанием G + C или вторичной структурой направляющих РНК-зондов, нацеленных на повторение (TTAGGG) n.

Затем мы проверили комбинацию флуоресцентной никелевой маркировки Cas9n с маркировкой мотивации на основе нативного эндонуклеаза. Этот подход имеет потенциал для поиска широкого применения в картировании генома повторяющихся последовательностей, а также генотипирования структурных изменений и идентификации / картирования сайтов вирусной интеграции. На фиг.4А триплетные повторы DUF1220 сначала помечены флуоресцентной никелевой маркировкой Cas9n красных флуоресцентных нуклеотидов. Эти меченые молекулы ДНК затем были глобально никелированы зелеными нуклеотидами с использованием Nt.BspQI для нацеливания на образец GCTCTTC. Было обнаружено двенадцать копий триплетов DUF1220, охватывающих около 52 кб. Было показано, что только фланкирующие области этого 52 kb имеют мотив GCTCTTC, который можно сопоставить с эталонным геномом, чтобы указать геномные положения триплетной матрицы DUF1220. Гистограмма распределения меток показана в нижнем графике на рис. 4А. Очевидно, что комбинация меток маркировки флуоресцентной никемии Cas9n и никотиновой эндонуклеазной последовательности не только может определять номера копий триплетов DUF1220, но также может отображать местоположения повторов.

Сочетание специфичной последовательности последовательности Cas9n и маркировки мозаичного рисунка. Флюоресцентная никелевая система Cas9n эффективна при маркировке специфических повторяющихся последовательностей и размещении их по отношению к фланкирующим крупным сегментам ДНК, помеченным с использованием традиционной маркировки последовательности-мотив. Ожидаемая схема маркировки и расстояния между метками показаны выше соответствующих изображений флуоресцентной микроскопии. (A). Флюоресцентный метод никелевого маркирования Cas9n использовался для обозначения повторяющихся последовательностей триплета DUF1220 и был показан красными метками. Эти молекулы затем помечены обычным способом маркировки последовательности-мотив с помощью Nt.BspQI (зеленые метки). Гистограмма этикеток показана ниже молекул. Красные пики представляют собой метки DRF gRNA и зеленые сайты маркировки Nt.BspQI. Всего было оценено 43 молекулы для эффективности маркировки. (B). Метод флуоресцентного никелевого маркирования Cas9n был использован для обозначения повторяющихся последовательностей теломер в левом конце этих фрагментов ДНК, связанных с теломер (красные метки). Метод маркировки последовательности-мотив с Nt.BspQI был выполнен после маркировки телосистемы Cas9n / gRNA и отображается зелеными надписями.

Тот же подход был применен и для измерения длины повторения теломера фрагмента теломер-концевой хромосомы 8q, клонированного в фосмиде. Этот fosmid переносит 800 пар оснований повторяющейся последовательности (TTAGGG) n, в которой отсутствуют сайты для определения мотив, распознаваемые имеющимися в настоящее время никейными эндонуклеазами, и поэтому их нельзя маркировать текущими методами основанного на последовательности мотива. Была спроектирована гРНК, специфичная для теломер. На рисунке 4B теломер сначала был помечен флуоресцентной никелевой маркировкой Cas9n красных флуоресцентных нуклеотидов. Меченые молекулы ДНК затем мечеными зелеными нуклеотидами с помощью Nt.BspQI ник-маркировки для нацеливания на образец GCTCTTC. Теломер правильно помечен в конце последовательности. Длина этой области теломер может быть определена путем измерения длины красной области флуорофора и интенсивности ее флуоресценции относительно известных контролей после визуализации. Маркировка последовательностей с мотивом над расширенными областями субтеломеров, связанными с одиночными крупными молекулами ДНК, с флуоресцентной никеймингом Cas9n (TTAGGG) n, может быть использована для идентификации конкретного субтеломера по сравнению с картами генома.

Флюоресцентную ник-маркировку Cas9n можно использовать для создания специфичных для локуса и специфических штрих-кодов. Мы разработали gRNAs для создания штриховых кодов, чтобы отличать отдельные субтеломеры, связанные с отдельными молекулами (TTAGGG) n трактов (рис. 5A, Chr 1q и Chr 11q), и различать варианты копий сильно сходных субтеломерных сегментных дупликаций (Chr 15q и Chr 12p) с использованием Cas9n последовательности меток маркировки. Было высказано предположение, что кратчайшая теломера или небольшое подмножество самых коротких теломер в клетке определяет начало старения, апоптоза или нестабильность генома (26, 27), способность систематически измерять отдельные дисфункционально короткие (TTAGGG) n пути (скорее чем средние длины теломер в образце, как это обычно измеряется в настоящее время) предоставит важную новую информацию высокого разрешения о конкретном функциональном статусе теломера и идентичности на уровне одной молекулы. На теломерных фосмидах из Chr 15q и Chr 12p (рис. 5A) контактирующие с Cas9n-gRNA ники в двух локусах в сегментно дублированной субтеломерной области, содержащей семейство генов WASH (Linnardopoulou et al., 2007), были помечены красным цветом. Одна и та же пара gRNAs генерировала сигналы, разделенные 5,87 kb на 15q fosmid и 7,5 kb на Chr 12p fosmid, как и предсказывали эталонные последовательности этих двух сильно сходных, но структурно не идентичных областей. Шаблоны, созданные тремя целевыми специфическими gRNAs на Chr1q и двумя gRNAs на 11q, уникальны, легко различимы друг от друга и из обоих шаблонов, связанных с WASH-геном, и соответствуют точно тому, что ожидается от их соответствующих эталонных последовательностей. Эти первоначальные эксперименты показывают, что конкретные gRNAs можно объединить для создания нескольких конкретных ников, которые при маркировке могут создавать пользовательские штрих-коды, которые точно прогнозируются соответствующими ссылочными последовательностями.

Специфические для Locus специфические штриховые коды, основанные на маркировке Cas9n. Флюоресцентная ник-маркировка Cas9n создает специфичные для локуса и специфические штрих-коды. Ожидаемая схема маркировки и расстояния между метками показаны выше соответствующих изображений флуоресцентной микроскопии. (A) Для каждой из испытуемых субтеломерных областей специфические gRNAs были сконструированы и объединены в реакционную смесь для инжиниринга in vitro для получения уникальной картины. В каждом случае была получена ожидаемая картина красных флуорофоров в системе флуоресцентной никелевой маркировки Cas9n. (B) Геном человека человека был помечен Alu gRNAs, за которым следует обычная маркировка последовательности с Nt.BspQI. Традиционные сайты с маркировкой, зависящие от последовательности, зависящие от мотивов (зеленые метки), встречаются редко в этих зонах геномной ДНК. Однако алюмоспецифичные gRNAs непосредственно Cas9n D10A для генерации богатых информацией длиннофокусных штрих-кодов (красные метки).

На фиг. 5B показаны результаты экспериментов, объединяющих маркирование флуоресцентной маркировки никеля марки Cas9n и никейной последовательности эндонуклеазы с целью сопоставления элементов Alu в геноме человека. Последовательности Alu, содержащие около миллиона копий, являются наиболее распространенными ретроэлементами у людей и составляют до 10% человеческого генома. Эти последовательности SINE (Short Interspered Nuclear Elements), исключительно находящиеся в геномах приматов, были особенно активны в человеческом родоразрешении даже после расхождений между человеком и шимпанзе, где они предположили, что они способствовали некоторым специфическим для человека характеристикам, таким как размер мозга (28). Последовательность gRNA была разработана для целевых 280 000 сайтов Alu из миллиона копий. Типичные молекулы геномной ДНК изображены и показаны на рисунке 5B. Одна молекула 180 kb отображает плотные элементы Alu с двумя мотивами GCTCTTC. Другая молекула ДНК показывает плотные элементы Alu с двумя мотивами GCTCTTC. Комбинированную информацию можно использовать для сопоставления молекул ДНК с эталонным геномом и профиля распределения элементов Alu на всей шкале генома.

Мы продемонстрировали возможности нашего интегрированного подхода флюоресцентной маркировки последовательности и маркировки, специфичной для последовательности, с помощью флуоресцентной никелирующей системы Cas9n. Гибкая и эффективная флуоресцентная маркировка определенных последовательностей позволяет нам получать информацию о специфической последовательности по длинным линейным молекулам ДНК в наноканале BioNano Genomics. Наша глобальная схема маркировки ярлыков пропускает короткие последовательности распознавания, пространственное отношение которых можно перевести в геномную карту. Мало того, что эта интегрированная флуоресцентная ДНК-маркировка с двойной цепью делает отображение всего генома более точным и предоставляет дополнительную информацию, но также может специально ориентироваться на определенные локусы для клинических испытаний. Важно отметить, что эта меченый двухцепочечный ДНК доступен в длинных нетронутых отрезках для анализа с высокой пропускной способностью в наноканальных массивах, а также для более точного анализа помеченных областей ДНК с использованием альтернативных методов для растяжения и визуализации меченых крупных молекул ДНК. Таким образом, этот метод значительно улучшит как автоматическое высокопроизводительное картирование генома, так и целенаправленный анализ сложных областей, содержащих повторяющуюся и структурно-вариантную ДНК.

CH17-353B19 Клон BAC — это подарок от доктора Пуй-Яна Квок из Калифорнийского университета в Сан-Франциско. ГРНК, ориентированная на элементы Alu, была разработана д-ром Михал Сакин из Калифорнийского университета в Сан-Франциско.

Национальные институты здоровья [HG005946 Пуй-Янь Квок и M.X, CA177395 — H.R и M.X]. Финансирование платы за открытый доступ: NIH.

Конфликт интересов. Ничего не объявлено.

Комментариев нет.

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *