Есть ли у нас альтернатива? Конечно, и она продемонстрирована на рисунке 10.1.
Рис. 10.1. Этот график демонстрирует, что сложность живых организмов в значительно большей степени определяется процентом генома, не участвующего в кодировании белков (черные колонки), нежели количеством пар оснований, кодирующих белки в геноме (белые колонки). Данные взяты из «Маттик, Дж. (2007),Эксп. Биол. 210: 1526-1547»
На одной границе шкалы у нас располагаются бактерии. У бактерий очень маленький и в высшей степени компактный геном. Их кодирующие белки гены насчитывают около 4 000 000 пар оснований, что составляет почти 90 процентов всего генома. Бактерии очень простые организмы и довольно инертные в плане контроля экспрессии генов, но ситуация меняется по мере того, как мы продвигаемся вверх по эволюционному древу.
Кодирующие белки гены С. elegans содержат почти 24 000 000 пар оснований, но это охватывает всего лишь около 25 процентов их генома. Остальные 75 процентов генов не кодируют белки. Анализируя те же показатели у человека, мы обнаруживаем, что кодирующие белки области составляют около 32 000 000 пар оснований, но это является лишь почти 2 процентами всего генома. Существуют различные способы подсчета кодирующих белки областей, но все они дают удивительно схожий конечный результат. Около 98 процентов генома человека не участвуют в кодировании белков. Весь наш геном, за исключением каких-то 2 процентов, является «бесполезным».
Другими словами, ни количество генов, ни их размеры не определяют сложность организма. Единственная отличительная особенность генома, которая увеличивается по мере того, как организмы становятся более сложными, это его область, не кодирующая белки.
Так чем же занимаются эти некодирующие области генома, и почему они так важны? Только начиная задумываться над этим, мы замечаем, насколько сильное влияние оказывает язык и терминология на мыслительную деятельность человека. Эти области называются некодирующими, но подразумеваем под этим мы лишь то, что они не кодируют белки, и это вовсе не значит, что они не кодируют вообще ничего.
В ученом мире бытует весьма интересная поговорка: отсутствие доказательства это не то же самое, что доказательство отсутствия. Например, как только в астрономии были изобретены телескопы, способные обнаруживать инфракрасное излучение, ученые смогли открыть тысячи звезд, остававшихся прежде «невидимыми». Эти звезды и раньше были там, но мы не могли быть абсолютно уверены в их существовании, пока не появились инструменты для получения доказательств. В качестве более часто встречающегося примера можно привести сигналы мобильных телефонов. Эти сигналы постоянно окружают нас, но убедиться в этом мы не сможем, если у нас нет мобильного телефона. Иначе говоря, то, что мы находим, в большой мере зависит от того, как мы ищем.
Ученые идентифицируют гены, которые экспрессируются в определенных типах клеток, с помощью анализа молекул РНК. Для этого вся РНК извлекается из клеток, а затем подвергается всестороннему анализу с использованием разнообразных техник, позволяющих создать базу данных всех имеющихся молекул РНК. Когда в 1980-х годах исследователи только начинали определять, какие гены экспрессируются в данных типах клеток, инструментарий, которым они располагали, был относительно нечувствительным. Их приборы были также предназначены для идентификации только молекул мРНК, поскольку именно они считались наиболее важными. Эти методики были хороши для определения активно экспрессирующихся мРНК, но оказывались довольно неэффективными при поиске последовательностей с менее бурной экспрессией. Еще одним недостатком было то, что программы, применявшиеся для анализа мРНК, были написаны таким образом, что игнорировали сигналы, поступавшие от повторяющейся, то есть «бесполезной» ДНК.