Картирование генома человека: физическое: введение
В отличие от генетических карт сцепления физические карты генома отражают реальное расстояние между маркерами, выражаемое в парах оснований. Физические карты различаются по степени их разрешения, т.е. по тем деталям структуры генома, которые на них представлены ( рис. II.39 ). Исчерпывающая физическая карта генома человека максимального разрешения будет содержать полную нуклеотидную последовательность всех его хромосом. На другом полюсе физических карт с минимальным разрешением находятся хромосомные (цитогенетические) карты генома.
Главной задачей проекта Геном Человека в 90-х гг было создание детальной физической карты генома. С практической точки зрения это означало что необходимо иметь набор хорошо охарактеризованных маркеров, перекрывающих весь геном человека с определенной частотой. В качестве маркеров можно использовать либо сами гены, либо охарактеризованные каким-либо образом фрагменты ДНК. В качестве таких маркеров могут использоваться рестриктные сайты , клонированные последовательности ДНК , известные гены.
В принципе возможны два принципиально различных вида карт - карты распределения маркеров и "карты контигов", т.е. набор клонированных последовательностей, перекрывающих определенную область генома, взаимное расположение которых известно.
Вообще говоря, любая характерная особенность того или иного участка генома, отличающая его от любого другого участка, может быть использована в качестве маркера. Это может быть наличие рестриктных сайтов, транскрибирующихся или повторяющихся последовательностей, регуляторных элементов и так далее. В конечном счете, сама последовательность данного участка ДНК является маркером. В этом смысле, полная первичная структура генома является предельным случаем физической карты такого типа.
При построении карт генома человека высокого разрешения экспериментально реализуются два альтернативных подхода, получивших названия
картирования сверху вниз (top-down mapping) и
картирования снизу вверх (bottom-up mapping).
При картировании сверху вниз ( рис. II.40,а ) исходным в анализе является препарат ДНК индивидуальной хромосомы человека. ДНК разрезается крупнощепящими рестриктазами (например, NotI ) на длинные фрагменты, которые после разделения электрофорезом в импульсном электрическом поле подвергаются дальнейшему рестрикционному анализу с другими рестриктазами. В результате получают макрорестрикционную карту, на которой достаточно полно представлены все последовательности исследуемой хромосомы или ее части, однако ее разрешение невысоко. На такой карте очень трудно локализовать индивидуальные гены. К тому же каждая индивидуальная карта редко охватывает протяженные сегменты ДНК (как правило, не более 1-10 м.п.о.).
При картировании генома человека снизу вверх ( рис. II.40,б ) на основе препарата суммарной ДНК генома или индивидуальной хромосомы получают серию случайных клонов протяженных последовательностей ДНК (10-1000 т.п.о), часть из которых перекрывается друг с другом. В качестве вектора для клонирования в этом случае часто используют искусственные минихромосомы бактерий (BAC) или дрожжей (YAC) . Серия частично перекрывающихся и дополняющих друг друга клонов образует непрерывную состыкованную (contiguous) последовательность нуклеотидов ДНК, получившую название контига (contig) . Правильность полученных контигов подтверждают гибридизацией in situ (FISH) с одновременной их привязкой к определенным участкам исследуемых хромосом. Карты, основанные на контигах, представляют полную информацию о структуре отдельных сегментов хромосом и позволяют локализовать отдельные гены. Однако такие карты трудно применять для реконструкции целых хромосом или протяженных их участков из-за отсутствия соответствующих клонов в имеющихся клонотеках генов
Основная проблема, которую приходится решать при использовании обоих подходов к построению физических карт высокого разрешения, - объединение разрозненных фрагментов ДНК в непрерывные последовательности нуклеотидов. Чаще всего для этого применяют специальные клонированные фрагменты ДНК, получившие название связующих (linking) клонов. Фрагменты ДНК из связующих клонов содержат в своих внутренних частях последовательности нуклеотидов крупнощепящих рестриктаз и, следовательно, представляют собой места стыковки фрагментов ДНК, используемых на первых этапах физического картирования. Гибридизацией по Саузерну, при проведении которой в качестве зондов используют фрагменты ДНК связующих клонов, определяют фрагменты ДНК физических карт, содержащие последовательности нуклеотидов окрестностей сайтов рестрикции крупнощепящих рестриктаз. Если два таких фрагмента найдены, то соответствующий связующий клон перекрывает оба этих фрагмента и является их частью. Связующие клоны, в свою очередь, отбирают из клонотек генов с помощью зондов, которые представляют собой последовательности нуклеотидов сайтов рестрикции крупнощепящих рестриктаз.
Оба метода имеют свои достоинства и недостатки - подход "сверху вниз" позволяет относительно легко и быстро построить карту протяженных областей генома, но получаемая карта отличается низким разрешением. Кроме того, для построения карт требуется наличие набора маркеров, перекрывающих исследуемую область генома. Другими проблемами в создании, карт методом "сверху вниз" являются, например, неслучайное распределение рестриктных сайтов , метилирование и так далее. Отсутствие клонированной ДНК затрудняет подробный анализ исследуемого участка генома.
Подход "снизу вверх" позволяет получать очень детальные карты и, в качестве промежуточного продукта, упорядоченные библиотеки клонов, дающие прекрасную основу для дальнейших исследований. Этот подход не требует предварительного подбора маркеров, а способен сам давать их. К его недостаткам относятся принципиальная трудность построения полных карт как из-за различий в клонируемости разных участков генома, так и из-за статистических проблем в получении полного покрытия исследуемого участка. По этим причинам можно ожидать, например, что карта контигов человеческой хромосомы среднего размера будет содержать от 200 до 1000 разрывов. Другим принципиальным недостатком карты контигов является необходимость поддержания большой коллекции клонов. При этом достаточно трудно интегрировать информацию, полученную при изучении разных библиотек.
По этим причинам в настоящее время оба подхода комбинируют. В гибридных картах данные рестриктного картирования и других методов прямого анализа неклонированной ДНК (цитогенетического анализа, анализа гибридов соматических клеток и так далее) используются для определения взаимного расположения контигов.
Очевидно, оба типа карт должны быть интегрированы друг с другом, что само по себе является достаточно сложной задачей. Однако, с развитием технологии PCR появилась возможность решить эту проблему.
В 1989 г. M. Olson, L. Hood, C. Cantor и D. Botstein предложили новый подход к созданию физических карт [ Olson M. e. a., 1989 ]. Суть этого подхода заключается в использовании коротких уникальных (т.е. встречающихся только один раз в исследуемом геноме) последовательностей ДНК в качестве маркеров, однозначно идентифицирующих данную область генома. Основой для этого подхода послужило изобретение метода PCR , позволяющего специфически амплифицировать фрагмент ДНК из сколь угодно сложной смеси. Таким образом, появляется возможность создания так называемых "гибридных" карт, т.е. карт, объединяющих достоинства обоих типов физических карт и лишенных их недостатков.
Предлагаемый подход, который авторы назвали "Общим языком для картирования генома человека", заключается в использовании так называемых STS .