Есть противоречия, которые необходимо понимать. Всегда существует компромисс между поощрением широкого использования данных и методов, с одной стороны, и коммерциализацией – с другой, и не в последнюю очередь это использование патентов для защиты идей и получения дохода. Более того, исследователи неохотно делятся своими новаторскими данными, если они рискуют стать не первыми, кто опубликует важные результаты и идеи, содержащиеся в этих данных. Не получив признания за понимание данных, которые они с таким трудом собирали, исследователи могут потерять деньги и признание, загнать в тупик свою карьеру и даже лишить себя Нобелевской премии.
Нам нужна открытость, чтобы данные свободно распространялись в хранилищах и банках данных, как государственных, так и коммерческих[71]. К счастью, существует множество ярких примеров обмена данными для публичного использования и общественного блага, например, US NCI Cancer Research Data Commons, Британский биобанк и инициатива GISAID по обмену данными обо всех вирусах гриппа и коронавирусе, вызывающем COVID-19. Хорошей новостью является то, что многие сейчас принимают так называемые принципы FAIR: данные должны быть находимыми (findable), доступными (accessible), совместимыми (interoperable) и воспроизводимыми (reproducible)[72].
Существует множество острых вопросов, связанных с данными. Как люди могут получить доступ к своим медицинским данным? Владеют ли они ими сами или же это собственность больниц, в которых они хранятся? Хотят ли люди получить к ним доступ и управлять ими? Будут ли службы здравоохранения готовы их предоставлять? А как насчет объединения этих данных с данными других людей для проведения клинических и других исследований? А что с кибербезопасностью? Нам нужны принципы высокого уровня, а также руководящий орган, чтобы формировать все способы управления данными и обеспечивать надежность и доверие к управлению и использованию наших данных[73].
От данных к мудрости
Первый шаг к созданию виртуального человека зависит от данных, но их одних недостаточно, чтобы понять связь между генетическим составом, окружающей средой и фенотипом человеческого тела. Нам необходимо понять сети, которые связывают все эти данные, прежде чем мы сможем начать замыкать цикл и превращать данные в прогностическую, количественную биологию. Прежде всего нам нужна теория.
Теории обладают объяснительной силой. Они придают смысл экспериментальным наблюдениям с точки зрения глубокого понимания того, как устроен мир. Они представляют работу природы экономичным образом, без объемных хранилищ необработанных и неинтерпретированных данных, и помогают нам раскрыть принципы и законы, которые объясняют, как и почему все обстоит именно так. Они также раскрывают эмерджентные свойства.
Такие законы и теории имеют математическую форму; поскольку это единственный способ, с помощью которого мы можем провести логически правильный анализ научных данных, которые сами по себе являются достоверными. Идея о том, что математика может отразить то, как устроен мир, и даже создать виртуального человека, восходит к Античности. Пифагор (570–495 гг. до н. э.) заявил, что «все есть число». Аристотель (384–322 гг. до н. э.) описал в своей «Метафизике», как пифагорейцы были настолько увлечены математикой, что «стали считать ее начала началами всего существующего».
Чем лучше мы понимаем ту или иную научную область и чем мощнее наши теории, тем меньше нам нужно полагаться на накопление массивов данных с той же усердностью, с какой филателист собирает коллекцию марок. Наши теории и модели, которые мы строим на их основе, представляют собой сжатый и гибкий способ представления нашего понимания природы. Окончательной проверкой наших теорий является не то, насколько хорошо они согласуются с экспериментами после их проведения, а то, насколько хорошо они могут предсказать результат до.
Это лучший научный метод, и некоторые из величайших теорий убедительно иллюстрируют, как превратить данные в идеи: среди них мы можем упомянуть открытие гравитационных волн, произошедшее через сто лет после того, как их предсказал Альберт Эйнштейн (1879–1955) – рябь в пространстве-времени, – которые генерируются жестокими космическими событиями, например столкновением двух черных дыр. Другим примером является открытие в 2012 г. бозона Хиггса, примерно через полвека после того, как теоретики Питер Хиггс, Роберт Браут и Франсуа Энглерт предположили, что эта фундаментальная частица связана с полем Хиггса – полем, которое придает массу другим фундаментальным частицам, таким как электроны.
72
Wilkinson, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Sci. Data 3, 160018 (2016).
73
Royal Society. Data management and use: Governance in the 21st century. Joint report by the British Academy and the Royal Society (June 2017). https://royalsociety.org/topics-policy/projects/data-governance/.