Когда дело доходит до создания виртуального двойника, существуют всевозможные структурированные наборы данных о пациентах, которые собираются регулярно в виде результатов замера температуры, анализов крови и мочи. Генетические данные становятся все более обширными, поскольку стоимость секвенирования нашей ДНК резко упала. На молекулярном уровне существует геометрическая информация о форме участков белков, где взаимодействуют другие молекулы, а также скалярные и векторные поля, используемые математиками и учеными для демонстрации изменяющихся величин – например, концентрации биохимического вещества в клетке. С помощью протеомики можно получить информацию о белках, а с помощью метаболомики – о метаболизме. Несколько рождественских праздников назад Роджер самоотверженно работал с командой Имперского колледжа Лондона над изучением метаболического воздействия похмелья[66]. Эти страдания, по-видимому, связаны с необычным профилем сахароподобных молекул и спиртов – полиолов, которые играют роль в обезвоживании[67].
Но теперь мы вступили в эпоху неструктурированных данных, поскольку Интернет с помощью микрочипа оцифровывает все и вся, от твитов и СМС до сообщений в социальных сетях и загрузок на видеохостингах. По всему миру данные вытекают из датчиков, мобильных телефонов, приложений и вообще всего, что только можно себе представить, поскольку чипы встраиваются в обычные предметы домашнего обихода, от принтеров до холодильников, образуя так называемый интернет вещей.
Смартфоны и другие беспроводные устройства все чаще будут использоваться для сбора данных о пациентах – например, о движении, характере активности, артериальном давлении, частоте сердечных сокращений, исходящих и входящих звонках, использовании клавиатуры и обработке естественного языка – для цифрового фенотипирования, которое, в свою очередь, может использоваться для мониторинга биполярного расстройства, выявления проблем с употреблением алкоголя или распознавания дистресса[68]. Хотя диагноз психического здоровья когда-то был чисто субъективным, сегодня его можно сделать объективным с помощью огромного количества личных данных об активности и манере речи, тоне и дыхании – от смеха до вздохов.
В долгосрочной перспективе, по словам нашей коллеги из UCL Андреа Таунсенд-Николсон, точные и структурированные данные медицинского сообщества будут откалиброваны таким образом, чтобы сравнивать разных людей, в то время как мы будем использовать неструктурированные данные и «журналы жизни» со смартфонов и других устройств для тонкой настройки внешнего вида и поведения виртуального тебя.
Рисунок 9. Подробная анатомическая модель высокого разрешения, созданная на основе данных магнитно-резонансной томографии (IT’IS Foundation)
Целостность данных
Когда цифровые двойники будут созданы, каждый из них станет символом симбиотических отношений между человеком и его виртуальным собой, питающих друг друга данными и идеями. Возникнут практические вопросы, многие из которых уже нам знакомы. Некоторые ученые приходятся данным ненадежными хранителями, хотя все больше им поклоняются. Исследования, появляющиеся в журналах, ограничиваются выводами или резюме ключевых результатов, или же в них преобладают экперименты, которые дали обнадеживающие результаты, а остальные спокойно игнорируются и остаются неопубликованными. Необработанные данные, включая отрицательные данные неудачных экспериментов, часто опускаются и теряются для научного сообщества, а также для будущих исследователей. К счастью, сейчас ситуация начинает меняться.
Некоторые опасаются, что данные будут потеряны для будущих поколений из-за использования эфемерных носителей записи, устройств хранения данных, которые скоро устареют, и программного обеспечения, разработанного компаниями, чьи бизнес-модели зависят от запланированного устаревания и обязательных обновлений. Рассматривается множество решений: от публичных архивов до использования носителя информации, существующего уже миллиарды лет: один грамм ДНК способен хранить 215 петабайт (215 миллионов гигабайт), поэтому контейнер весом и размером примерно с пару пикапов в теории мог бы хранить все данные, когда-либо записанные человечеством[69].
Действовать нужно последовательно, создавая уверенность, что разные ученые и инженеры в разных лабораториях смогут измерять одни и те же вещи, использовать один и тот же жаргон и сообщать о своих открытиях таким образом, чтобы их могли интерпретировать все, гарантируя воспроизводимость науки. Стоит попросить у исследователя материалы, и нередко с другой стороны ждут всевозможные проволочки, молчание или даже отказ. Иногда у них просто нет времени, денег, возможностей или желания (например, если необходимо менять форматы программного обеспечения). В каких-то случаях мешают эго, соперничество и эмоции – да, даже в научных дисциплинах, якобы основанных на объективности и разуме[70].
68
Huckvale, K., Venkatesh, S. & Christensen, H. Toward clinical digital phenotyping: A timely opportunity to consider purpose, quality, and safety. npj Digit. Med. (2019). https://doi.org/10.1038/s41746-019-0166-1.