МикроРНК (miRNA): методы определения кодирующих генов и их свойства


При попытках обнаружить гены малых РНК , аналогичных РНК lin-4 и let-7 и скрывающихся в геномах животных, встал вопрос, как же их определить? Поскольку эти гены не кодируют белков, традиционные системы поиска, настроенные на кодирующий потенциал, не обнаружат их, и они не будут представлены в обычных библиотеках кДНК , созданных на основе полиаденилированных мРНК. Однако ожидается, что они должны будут образовывать шпилечные транскрипты-предшественники длиной приблизительно в 70 нуклеотидов и зрелые РНК длиной приблизительно в 22 нуклеотида. Следовательно, гены, подобные lin-4 и let-7 , могут быть обнаружены с помощью структурного поиска некодирующих последовательностей и клонирования кДНК, специально ориентированного на очень маленькие транскрипты.

Известны методы клонирования кДНК, соответствующие 22 нуклеотидным (приблизительно) siRNA , образуемых в процессе РНК-интерференции ( Elbashir и др., 2001b ). Эти методы были адаптированы к получению кДНК, соответствующей РНК определенного размера (приблизительно 22 нуклеотида), экспрессирующейся в клетках нематод, а также мушиных и человеческих клетках ( Lee и Ambros, 2001 ; Lau и др., 2001 ; Lagos-Quintana и др., 2001 ). С помощью этих библиотек кДНК были идентифицированы десятки последовательностей, соответствующих транскриптам длиной приблизительно в 22 нуклеотида и названных " микроРНК ". Гены, производящие эти транскрипты, располагаются в экзонах белок-кодирующих генов или между ними.

Для многих из этих микроРНК было показано существование более длинных (приблизительно 70 нуклеотидов) предшественников; было также предсказано, что эти предшественники образуют шпильку, напоминающую шпилечную структуру предшественников lin-4 и let-7.

Характерная шпилечная форма предшественников микроРНК была взята за основу при информационном скрининге, проводимом параллельно с клонированием кДНК. Некодирующие последовательности генома, консервативные у C. elegans и родственной ей нематоды C. briggsae , были проверены с помощью компьютера для предсказанной вторичной структуры.

Несмотря на меньшую эффективность этого подхода по сравнению с клонированием кДНК (ввиду ограниченного числа доступных последовательностей C. briggsae), некоторые из идентифицированных микроРНК не были представлены среди последовательностей кДНК. Таким образом, компьютерный анализ является существенным дополнением к клонированию кДНК в отношении каталогизации генов микроРНК в секвенированных геномах.

Значительная часть генов микроРНК является, по-видимому, филогенетически консервативной. Это касается описанных 62 генов микроРНК C. elegans, девяти генов Drosophila и семи генов Homo sapiens.

Зрелые (приблизительно 22 нуклеотида) последовательности этих эволюционно родственных микроРНК высокогомологичны. Столь высокая степень консервативности отражает, по-видимому, комплементарность к многочисленным консервативным последовательностям-мишеням. В некоторых случаях микроРНК и их антисенс-мишени могут участвовать в сходных механизмах у различных эволюционных групп, как это, вероятно, происходит с регулятором развития let-7. Однако, пока не станет известно больше о биологии микроРНК, а именно, в каких взаимодействиях они участвуют, трудно предсказать все факторы, могущие влиять на эволюционный консерватизм или различие их последовательностей.

Сколько существует различных микроРНК? Пока преждевременно говорить об этом, но есть указания на то, что гены микроРНК весьма многочисленны. Более девяноста генов, описанных к настоящему времени у червей, мух и людей, не составляют полной картины, и, видимо, множество других подобных генов будет обнаружено у этих и других организмов.

Поскольку анализу подвергается все большее число организмов, может статься, что гены микроРНК окажутся одним из наиболее филогенетически многочисленным и разнообразным классом некодирующих генов.