Определив, что мы будем секвенировать, теперь предстояло выбрать кого секвенировать, то есть чьи исследовать гены. Понятно, что выбирать нужно из мужчин, так как у них только одна Х-хромосома, а у женщин две — иными словами, задача сразу облегчается в два раза. Но из каких мужчин, вот ведь вопрос! Многие просто работали с наиболее доступным материалом. Например, множество исследований, особенно в медицине, выполнялись на выборках европейцев. Какой-нибудь наивный пользователь базы данных генетической изменчивости человека может утвердиться во мнении, что у европейцев генетическая вариабельность выше, чем у других групп населения. А на самом-то деле их высокая вариабельность отражает лишь относительно бедную представленность других групп.
Создать более разумную выборку мы могли тремя способами. Во-первых, можно отбирать мужчин пропорционально численности населения в разных частях света. Эту идею пришлось отставить, поскольку образцы в таком случае будут в основном из Китая и Индии, где население сильно выросло за 10 тысяч лет в результате, в частности, развития сельского хозяйства. Другими словами, согласившись на этот вариант, о генетическом разнообразии говорить не придется. Во-вторых, можно собирать образцы, ориентируясь на территорию, то есть, например, по одному образцу с каждых двух-трех квадратных километров. Но это, вдобавок к баснословным транспортным расходам, приведет к чрезмерно раздутой выборке из областей с низкой плотностью населения, например из северного Заполярья. По третьему сценарию, на котором мы в конце концов остановились, выборка производится в соответствии с основными лингвистическими группами. Мы считали, что лингвистические группы (индоевропейская, финно-угорская и т. д.) в общем приближении отражают культурное разнообразие древности, и оно старше, чем 10 тысяч лет. Так что, если мы будем отбирать образцы по лингвистическим группам, у нас увеличатся шансы сделать выборку из групп населения с независимой генетической историей. И мы, хочется верить, получим более полную картину генетической изменчивости.
К счастью, мы были не первыми: образцы ДНК по этому принципу уже собрал известный генетик из Стэнфорда, итальянец Лука Кавалли-Сфорца, и мы могли воспользоваться его коллекцией. Хенрик отобрал шестьдесят девять образцов — мужских представителей основных языковых групп. Для каждого образца отсеквенировал назначенные цепочки из десяти тысяч нуклеотидов. Сравнив затем последовательности ДНК в случайно выбранных парах, он подсчитал, что среднее число отличающихся нуклеотидов равно 3,7. Так же как и в случае с митохондриальной ДНК, Хенрик отметил большую вариабельность ядерной ДНК у пар из Африки, чем у неафриканцев. Чтобы понять смысл полученных результатов, он обратился к исследованию ближайших родственников человека — шимпанзе.
Рис. 8.1. Эволюционное дерево человека и человекообразных обезьян; показано примерное время расхождения эволюционных ветвей от общего предка (хотя датировки очень приблизительные). С изменениями из статьи: Henrik Kaessmann and Svante Pääbo. The genetical history of humans and the great apes. Journal of Internal Medicine 251: 1- 18 (2002)
Нам известны два вида шимпанзе, оба из Африки. “Обычные” шимпанзе обитают в экваториальных лесах и саваннах, распределяясь пятнами от Танзании на востоке до Гвинеи на западе. Бонобо, которых иногда называют карликовыми шимпанзе, живут только к югу от реки Конго, в Демократической Республике Конго. Наши эволюционные линии разошлись, как показывает сравнительный анализ ДНК этих видов, примерно 4–7 млн лет назад. А еще раньше, 7–8 млн лет назад, жил общий предок человека, шимпанзе и гориллы, другой африканской человекообразной обезьяны. И все они вместе с орангутанами с Борнео и Суматры произошли от общего предка, существовавшего 12–14 млн лет назад (рис. 8.1).
Хенрик выбрал тридцать самцов шимпанзе (обыкновенного, не бонобо), представляющих популяции Восточной, Центральной и Западной Африки, и секвенировал тот же участок Х-хромосомы, с которым работал на человеческом материале. Он повторил сравнение у случайно выбранных пар. Получилось среднее различие в 13,4 нуклеотида для пары особей. Невероятный результат! Население в семь миллиардов против каких-то двух сотен тысяч шимпанзе… Население, занявшее каждый свободный клочок земли, против кучки особей, уцелевших на африканском экваторе! А генетических различий у любых двух шимпанзе в 3–4 раза больше, чем у двух людей.