Выбрать главу
Линда Бёртч, управляющий директор рекрутингового агентства Burtch Works Executive Recruiting

«Один из ключевых уроков, который мы выучили в Kaggle, состоит в том, что анализ больших данных – это не только создание продвинутых алгоритмов. Билл написал отличную книгу о том, что нужно знать и делать, чтобы успешно претворить операционную аналитику в жизнь».

Энтони Голдблум, основатель и генеральный директор компании Kaggle

Эта книга посвящается Стейси, Джесси и Даниэль

Предисловие к русскому изданию компании Teradata

Чем больше данных, тем «умнее» наш мир

Человечество умеет прогнозировать процессы и события, опираясь на накопленные знания, известные факты, процессы и связи. Но что, если опыт, полученный ранее, больше не помогает нам ориентироваться в современном мире? Как реагировать на взрывной рост объемов данных и новые экономические вводные, которые постоянно ставят руководителей в неизвестные им до этого условия? Интуиция, которая помогала раньше, подводит, и очевидные, казалось бы, действия приводят к неудачам. Жизнь руководителя сегодня – это принятие решений в максимально неопределенных условиях, при ежедневно нарастающем объеме информации и ее источников.

К 2020 году почти все взрослое население планеты, т. е. не менее пяти миллиардов людей, будет подключено к Интернету. К этому времени в мире будет насчитываться примерно 50 млрд подключенных устройств – источников данных, к ним будут относиться не только всевозможные стационарные, настольные и носимые с собой компьютеры, но и бытовая электроника, транспортные средства, торговое оборудование, медицинские приборы, промышленные системы, датчики ЖКХ и т. д. Возможно, к этому времени Big Data и Internet of Things окончательно перестанут быть предметом дискуссий визионеров и станут повседневной реальностью, которая нас окружает. Объем доступной информации будет колоссальным, и важнейшей задачей станет извлечение ценности из этой информации. Например, человек приехал в торговый центр – на какой машине? Куда он пошел – в кафе? В кино? В магазин? Что он купил? Что он в этот момент искал в Интернете? Заходил ли он в магазин детских товаров или товаров для животных? Как часто он сюда приезжает? Какие точки в этом торговом комплексе посещает в первую очередь, а до каких не добирается вовсе? Все эти данные – золотая жила для ритейлеров.

Но изучение покупательского поведения – только одна из множества областей применения больших данных. Уже в обозримом будущем аналитика поможет нам решать, без преувеличения, любые задачи. Например, возьмем оборудование нефтяных вышек. Как и любое оборудование, оно изнашивается и ломается, каждый день простоя обходится нефтяным компаниям в миллионы долларов. Постоянный мониторинг, сбор и анализ всех данных позволит заблаговременно выяснить, что происходит с этим оборудованием, и своевременно провести его недорогое плановое обслуживание, прежде чем возникнут серьезные неисправности. Каким рабочим нагрузкам оно подвергается? Каковы природные, климатические предпосылки поломок? Какие паттерны отказов можно выделить? Какая возможна профилактика простоев? Если же поломка произошла, как максимально сократить время простоя? Аналитика данных позволит узнать об этом оборудовании буквально все – как оно работает, как ведет себя в той или иной ситуации, когда оно дает сбои и как их предотвратить.

А теперь представьте на месте нефтяной вышки любой другой сложный технический объект. Обслуживание авиалайнера – проект еще более высокой сложности, чем ремонт нефтяной вышки, но аналитика позволит не только прогнозировать, какие узлы самолета стоит диагностировать заранее, не дожидаясь планового осмотра, но и запланировать доставку запчастей в определенный аэропорт – оперативно и экономно!

Обслуживание автомобиля – сравнительно простая задача, но что, если масштабировать ее на миллионы машин? Осознавая сложность подобного проекта, компания Volvo Cars, тем не менее, нашла его осуществимым. Проект сбора и анализа данных со всех датчиков всех автомобилей Volvo, начатый при поддержке Teradata, позволит успешно идентифицировать и предупреждать изначальные причины неисправностей и поломок автомобилей. Для потребителя это будет выглядеть так, будто автомобиль сам следит за собой и прогнозирует необходимость технического обслуживания. Чем больше будет накоплено данных для аналитики, тем «умнее» станут машины.