Выбрать главу

Большие данные идут к вам

Легендой о точном попадании стала история про американскую школьницу, которой местная торговая сеть присылала скидочные купоны на детскую одежду и кроватки. Ее отец устроил скандал, но потом ему пришлось извиниться перед торговцами. Оказывается, он не знал о предстоящем пополнении семейства. Зато торговцы по перемене вкусов покупательницы могут предсказать не только беременность, но и примерные сроки рождения ребенка.

Не каждому хочется оказаться в прицеле таргетирования. Поэтому регулярно в общественном поле возникают скандалы с очередным нарушением приватности. И чаще всего в фокусе гнева оказываются интернет-компании, собирающие информацию о посещении сайтов при помощи специальных log-файлов — куков. «Куки имеют давнюю офлайновую предысторию. Только в России не особо вдумчивые торговые сети пытаются использовать карты лояльности именно для поддержания лояльности, рассчитывая, что скидки в пять процентов будет достаточно для удержания клиентов. Во всем остальном мире карточки постоянных покупателей появились как инструмент сбора информации и отслеживания поведения клиентов. Database marketing возник еще в 70–80-е годы прошлого века, когда интернета не было, для оптимизации работы крупных торговых сетей. Но весь анализ куков аналогичен математике, связанной с отслеживанием карт лояльности. Например, стиранию куков в браузере соответствует потеря карты в офлайновом мире. Именно из-за вытеснения конкурирующими методами по мере распространения оплаты банковскими картами и онлайн-торговли популярность карт лояльности как маркетингового инструмента снижается», — рассказывает Андрей Себрант.

Data science в ее нынешнем виде — лишь временный суррогат, результат технических ограничений. Пока приходится ограничиваться анализом отдельных сегментов и групп, сами методы еще весьма грубы: раз спросив в поисковике про летние шины, приходится наблюдать объявления о них до следующей зимы. Но идеал data science — тотальная слежка и анализ поведения каждого потребителя для манипуляции его выбором.

Наш мир и дальше будет покрываться сенсорами, оцифровывающими нашу жизнь. Вскоре каждый мобильник может оказаться оснащенным датчиками, фиксирующими параметры нашего здоровья: пульс, давление, кожные реакции. Когда это станет стандартом обеспечения здравоохранения и каждый из нас будет включен в постоянный мониторинг, скрыть имитацию оргазма уже не удастся никому. Но куда больше, чем физиология, человека индивидуализируют его тексты и мысли. Если с мыслями работать только учатся, то методы анализа любых по объему массивов текста уже отработаны. В потоке электронных писем пока фильтруют только спам и потенциальных террористов. Министерство внутренней безопасности США даже раскрывает длинный перечень ключевых слов, по которым осуществляется мониторинг интернета: от «Аль-Каиды» и «теракта» до «исламистов» и «свинины».

Скорее всего, культурные нормы, определяющие границы личного, и дальше будут постепенно размываться во благо торжества общества потребления, в котором удастся прогнозировать индивидуальное поведение каждого. Мы уже заплатили приватностью за безопасность и удобство: камеры слежения, мобильные телефоны, банковские карты. С большой вероятностью мы расстанемся и с ее остатками в обмен на здоровье и экономическое благополучие. Ведь тотальный контроль и прогнозирование не только ускорят рост ВВП, но и позволят практически свести на нет структурные кризисы. А самое главное, позволят окончательно выстроить совершенное общество потребления. Безусловно, статистические методы далеко не так совершенны с точки зрения качества прогнозирования, как понимание причинно-следственных связей. Но в чуть более отдаленной перспективе бурный рост нейронаук сможет компенсировать этот недостаток, даже если не удастся смоделировать работу мозга, — первые попытки читать мысли уже можно считать удачными.

В марте 2012 года администрация Барака Обамы объявила о программе поддержки исследований и разработок в области Big Data стоимостью более чем 200 млн долларов, приходящихся на Национальный научный фонд, Национальный институт здоровья, министерство обороны и энергетики, Геологическую службу США. В числе поддержанных — проект создания открытого доступа к 1000 расшифрованных геномов общим объемом 200 терабайт.   

График 1