Выбрать главу

Эта анаконда по-английски записывается 1185 буквами[15], а по-русски – всего 1148 буквами.

Теперь, когда большинство из вас просто пробежали глазами приведенное название, возможно, восприняв только «ацетил» и «серин», давайте еще раз взглянем на это слово. Распределение букв в нем оказывается довольно интересным. Буква «е», самая распространенная в английском языке, встречается 65 раз, буква «у» – наименее распространенная – целых 183 раза. Всего на одну букву, «l», приходится 22 % слова (255 раз). Причем буквы «у» и «l» разбросаны не как попало, а зачастую встречаются рядом друг с другом – они образуют 166 пар, расположенных с интервалом около 7 букв. Все это неслучайно. Рассматриваемое нами длинное слово – это название белка, а белки построены на основе шестого, наиболее многофункционального элемента периодической системы – углерода.

В частности, атомы углерода образуют каркасы аминокислот, которые соединяются друг с другом как бусины, образуя белки. Белок вируса табачной мозаики состоит из 159 аминокислот. Поскольку биохимикам зачастую приходится подсчитывать множество аминокислот, они следуют простому лингвистическому принципу. Принято отсекать от названия аминокислоты суффикс «ин» – как в словах «серин» или «изолейцин» – и заменять на «ил», чтобы получался компонент «серил» или «изолейцил». Если расположить эти «илы» в правильном порядке, они точно описывают структуру белка. Мы с вами, не будучи лингвистами, легко понимаем значение составных слов. Так и биохимики в 1950-е годы и начале 1960-х годов давали молекулам официальные наименования вроде «ацетил…серин», чтобы можно было воссоздать формулу молекулы по ее названию. Это точная, хотя и сложная система. Тенденция к соединению корней и созданию составных слов исторически сложилась из-за того, что в развитии химии важнейшую роль сыграли немецкие ученые и немецкий язык, богатый сложными и длинными словами.

Но почему же аминокислоты связываются в первую очередь друг с другом? Дело в том, какое место углерод занимает в периодической системе. Для заполнения своего внешнего энергетического уровня атому углерода требуется восемь электронов – это универсальное правило называется «правилом октета». Напористость разных атомов и молекул в поиске пары у разных веществ отличается, и аминокислоты относятся к более-менее «цивилизованным» соединениям. На одном конце каждой молекулы аминокислоты находятся атомы кислорода, на другом – атомы азота, а в середине – ствол длиной в два атома углерода. Кроме того, в аминокислотах содержится водород, а от главного ствола могут отходить разные веточки, в результате чего могут образоваться 20 разных молекул, но нас это пока не интересует. И углероду, и азоту, и кислороду требуется по восемь электронов для заполнения внешнего энергетического уровня, но одним элементам легче набрать такие комплекты, чем другим. У кислорода, элемента № 8, всего восемь электронов. Два из них находятся на нижнем энергетическом уровне, который заполняется в первую очередь. На внешнем уровне остается шесть – итак, до полного комплекта атому кислорода не хватает двух электронов. Найти два электрона не так сложно, а агрессивный кислород может диктовать условия и обирать другие атомы. Но та же арифметика подсказывает, что бедный углерод, потратив два электрона на заполнение первой оболочки, остается всего при четырех электронах на втором уровне – и до октета ему недостает еще четырех. Сделать это не так просто, поэтому углерод не слишком привередлив при создании химических связей. Он готов соединяться практически с кем угодно.

Такая неприхотливость углерода – это огромное благо. В отличие от кислорода, углероду приходится образовывать связи с другими атомами во всех возможных направлениях. На самом деле, углерод может делиться своими электронами даже с четырьмя атомами одновременно. Таким образом, углерод способен образовывать длинные цепочки и даже объемные сети молекул. Поскольку углерод делится электронами, а не ворует их, углеродные связи получаются надежными и стабильными. Азоту также требуется создавать многочисленные связи для приобретения октета, но не в такой степени, как углероду. Белки, включая упомянутый выше белок табачной мозаики, используют эти простые правила. Атом углерода на конце одной аминокислоты делится электроном с атомом азота на конце другой аминокислоты. Образуются белки, в которых такие связи углерода и азота тянутся почти до бесконечности, как буквы в длинном-длинном слове.

На самом деле, сегодня ученые способны «декодировать» гораздо более длинные молекулы, чем «ацетил…серин». В настоящее время рекорд принадлежит гигантскому белку, название которого, записанное полностью, насчитывало бы 189 819 букв. Но в 1960-е годы, когда в распоряжении ученых появились инструменты для быстрого определения последовательностей аминокислот, биохимики осознали, что вскоре им придется иметь дело с названиями соединений, каждое из которых занимает целую книгу (проверка их правописания была бы адской пыткой). Итак, было решено отказаться от неуклюжей немецкой системы и оперировать более краткими и удобными названиями, даже в научной литературе. Например, вышеупомянутая молекула с названием из 189 819 букв сегодня именуется милосердным словом «титин»[16]. Сомневаюсь, что какое-нибудь печатное слово окажется длиннее полного названия белка табачной мозаики или даже приблизится к нему.

Правда, никто не запрещает лексикографам время от времени просматривать биохимические статьи. Медицина всегда была богатым источником уморительно длинных слов. Оказывается, самое длинное нетехническое слово, содержащееся в Оксфордском словаре английского языка, связано с ближайшим «родственником» углерода – кремнием. Считается, что этот элемент, расположенный в таблице Менделеева под номером 14, может быть альтернативным источником иной, неуглеродной жизни, которая может существовать где-нибудь в других галактиках.

Вспомним, как выглядит генеалогическое древо. На его верхушке находятся родители, а ниже – дети, похожие на них. Подобным образом, углерод имеет больше общих черт с кремнием, расположенным непосредственно под ним, чем со своими соседями слева и справа – бором и азотом. Мы уже знаем, чем это объясняется. Углерод – элемент № 6, кремний – элемент № 14. Их разделяет промежуток в восемь клеток (еще один октет), и это неслучайно. У кремния два электрона заполняют первый энергетический уровень, еще восемь – второй. Остается четыре электрона, поэтому кремний претерпевает те же неудобства, что и углерод. Конечно, в такой ситуации кремний приобретает и некоторую химическую гибкость, подобно углероду. Поскольку именно это свойство углерода непосредственно связано с тем, что из него строится живая материя, заметное химическое сходство кремния с углеродом дало любителям научной фантастики богатую пищу для воображения. Возможно ли, что кремний является основой альтернативных – то есть чужеродных – форм жизни, которая существует по иным, внеземным законам? Но генеалогия не определяет судьбу, и дети никогда не бывают полными копиями своих родителей. Действительно, между углеродом и кремнием очень много общего, но это разные элементы, которые образуют несхожие соединения. И, к сожалению для всех читателей фантастических романов, кремний просто неспособен на такое, на что способен углерод.

вернуться

15

Мнения о том, каково самое длинное слово, появившееся в Chemical Abstracts, разнятся. Многие специалисты считают, что это действительно название белка вируса табачной мозаики – химическая формула этого белка записывается как С785H1220N212O248S2, но другие отдают пальму первенства белку а фермента триптофансинтетазы. Этот белок напоминает вещество, которое, по ошибочному обывательскому мнению, вызывает сонливость, когда ешь индейку (это распространенное заблуждение). Триптофансинтетаза имеет формулу C1289H2051N343O375S8, а его название по-английски записывается 1913 буквами – это на 60 % длиннее, чем название белка вируса табачной мозаики. Во многих источниках – нескольких изданиях Книги рекордов Гиннеса, на сайте Urban Dictionary (www.urbandictionary.com), а также в «Словаре необычных, странных и нелепых слов миссис Бёрн» – самым длинным словом считается именно название триптофансинтетазы. Но я провел долгие часы, роясь в едва освещенных стеллажах Библиотеки Конгресса, и так и не нашел полного названия этой молекулы в Chemical Abstracts. Вероятно, ее просто ни разу не именовали полностью. Чтобы абсолютно в этом удостовериться, я отыскал академическую статью, в которой рассказано о расшифровке формулы триптофансинтетазы (в списках Chemical Abstracts ее не было), и даже там авторы решили сокращенно записать последовательность аминокислот. Итак, насколько я могу судить, полное название этого белка ни разу не появлялось в печати. Вероятно, именно поэтому составители Книги рекордов Гиннеса лишили его звания самого длинного слова.

Но мне удалось найти целых два случая, когда белок вируса табачной мозаики был назван полностью. Первый раз – на странице 967F коричневатого фолианта Chemical Abstracts Formula Index, Jan.-June 1964, а потом на странице 6717А в Chemical Abstracts 7th Coll. Formulas, С 23H 32-Z, 56–65, 1962–1966. Обе книги представляют собой реферативные справочники, в которых собираются данные обо всех научных химических статьях, опубликованных в указанный на обложке период. Таким образом, что бы ни писали в других источниках о самом длинном слове в мире (особенно в Интернете), полное название белка вируса табачной мозаики встречается лишь дважды – в 1964 и 1966 годах, но не в 1972-м, как иногда утверждают.

Более того: статья о триптофансинтетазе вышла в 1964 году, и в том издании Chemical Abstracts за 1962–1966 годы упоминается еще немало веществ, в молекулах которых содержится больше атомов С, H, N, О и S, чем в белке вируса табачной мозаики. Почему же их не записывали целиком? Дело в том, что большинство этих статей вышло после 1965 года, а именно в этом году компания Chemical Abstracts Service, расположенная в Огайо и собирающая все эти данные, пересмотрела свою систему номенклатуры новых соединений и отказалась от названий, которые просто невозможно охватить взглядом. Но почему же кто-то не поленился полностью записать название белка вируса табачной мозаики в справочнике от 1966 года? Его можно было сократить, но для него было сделано исключение. И последний нюанс: оригинал статьи о вирусе табачной мозаики от 1964 года был опубликован по-немецки. Но справочник Chemical Abstracts – это англоязычный документ, выдержанный в славных традициях компендиумов Сэмюэла Джонсона и Оксфордского словаря. Это название появилось в печати не ради рекорда, а с целью распространения знаний. Поэтому данное слово действительно может считаться самой длинной смысловой лексемой.

Уф.

Кстати, я выражаю признательность Эрику Шайвли из Crystal Poole Bradley и особенно Джиму Корнингу из Chemical Abstracts Service, которые очень помогли мне в сборе всей этой информации. Они были совершенно не обязаны отвечать на мои путаные вопросы вроде «Здравствуйте. Я тут ищу самое длинное английское слово, но не знаю, с чего начать», но тем не менее отвечали.

Так случилось, что вирус табачной мозаики оказался не только первым открытым вирусом, но и первым из подобных существ, чьи форма и структура были тщательно проанализированы. Некоторые выдающиеся работы в этой области принадлежат перу Розалинд Франклин – специалисту по кристаллографии, которая благородно, но простодушно поделилась результатами своих исследований с Уотсоном и Криком (подробнее об этом – в главе 8). А буква «а» из выражения «белок а триптофансинтетазы» относится к кругу вопросов, рассмотренных в работах Лайнуса Полинга и посвященных тому, как белки «узнают», какую форму им следует принять. Об этом – опять же в главе 8.

вернуться

16

Несколько химиков-подвижников не поленились и опубликовали в Интернете название полной последовательности аминокислот в молекуле титина: это слово занимает сорок семь страниц, набранных в программе Word с одинарным интервалом, шрифт Times New Roman, кегль 12. Белок состоит более чем из 34 000 аминокислот, в слове 43 781 раз встречается буква «l», 30 710 раз – буква «у», 27 120 – суффикс «yl» и всего лишь 9229 раз – буква «е».