Выбрать главу

Все чаще и чаще возникал вопрос: а стоит ли вообще говорить о "зрении"? Что бы ни представляла собой эта новая способность - некое сочетание остроты зрения с энциклопедической глубиной знаний по всем мыслимым темам, - я начинал верить, что это нечто большее, чем машинный эквивалент человеческих глаз. Это было нечто совершенно новое: более глубокая, более тонко отполированная линза, способная раскрыть наш мир с такой стороны, о которой мы даже не подозревали.

 

Рассматривая наше растущее хранилище моделей автомобилей, кропотливо собранных из источников, разбросанных по всему интернету, я представлял, как трудно будет объяснить своему подростку, какое отношение все это имеет к науке. Детали работы, конечно, были несущественны; это было лишь последнее свидетельство главных ценностей лаборатории: глубокого уважения к сложности мира и жажды его изучения, чего бы это ни стоило. Мы чувствовали себя как любители искусства во время экскурсии по музею: каждый новый экспонат заставлял нас задуматься и в то же время вызывал благоговейный трепет перед безграничными деталями, окружавшими нас.

Мы не тратили время на беспокойство о том, окупится ли все это, как мы надеялись. Сам факт того, что мы противостояли этому - принимали мир таким, какой он есть, на его условиях, без компромиссов и дистилляции, - казался нам миссией, которой стоит посвятить свою жизнь. Будь то модели автомобилей, виды птиц или что-то совсем другое - возможно, наш следующий проект будет изучать варианты асфальтированных дорог, чешую рептилий или отделку скрипок, - каждый из них ощущался как маленький шаг к тому моменту, когда мы увидим реальность совершенно новыми глазами. Что бы мы ни нашли, я был уверен, что путешествие того стоит.

Тем временем нам предстояло преодолеть обычную батарею препятствий. Масштаб, конечно, был неизбежным вызовом. Но на этот раз мы были готовы. После ImageNet мы привыкли к головной боли, которую влечет за собой компиляция такого объема данных. Мы изучили такие сайты, как Craigslist, Cars.com, Edmunds и другие онлайн-площадки, чтобы получить обучающий набор изображений, охватывающий практически все уникальные разновидности автомобилей на дорогах в 2014 году - все 2 657 из них - и направили его в самые большие и точные классификаторы, которые когда-либо создавали. Мы также задействовали поток изображений Google Street View, заполнив наши серверы фотографиями проспектов, бульваров, углов, перекрестков и тупиков, пересекающих всю страну. В нашей лаборатории собирался еще один микрокосм мира, и уже скоро мы сможем заглянуть в него напрямую, открыв все секреты, которые он хранит.

Однако эти секреты не раскрылись бы без борьбы. Поскольку мы намеревались использовать автомобили в качестве косвенного инструмента для изучения более широких социально-экономических вопросов - соотнесения их с такими аспектами личности их владельцев, как доход, образование и род занятий, - нам пришлось столкнуться с тем, что резкие различия в денежной стоимости часто приводят лишь к незначительным различиям во внешнем облике. Поэтому, хотя мы без труда отличали седан Cadillac от пикапа Toyota, ранние эксперименты показали, что "наивно" обученный классификатор может с легкостью принять Cadillac за, скажем, Honda Accord, особенно если автомобили окрашены в похожие цвета - именно такой ошибки мы стремились избежать. Еще сложнее было отличить Cadillac ATS от CTS, не говоря уже о бесчисленных вариациях внутри каждого модельного ряда. Особенно сложной нам показалась концепция уровней отделки, поскольку пакеты опций на общую сумму в тысячи долларов, а иногда и больше, зачастую влекли за собой лишь незначительные изменения в стиле кузова и шильдике автомобиля.

"Прежде чем мы прервемся, у меня есть идея, которой я хочу поделиться".

Наше еженедельное совещание по проекту Street View подходило к концу, когда заговорил аспирант по имени Тимнит Гебру. Мы собрались в моем кабинете - маленьком, узком прямоугольнике на третьем этаже здания Gates Computer Science Building - помещении, соответствующем академическому стереотипу: тесная каморка, усугубленная грудами книг, бумаг и безделушек, которые сыплются с полок и ползут к центру комнаты. Уютно устроившись на ярко-красном диване в обрамлении беспорядка со всех сторон, наша команда студентов, состоящая теперь из трех человек.

"Итак, идея состоит в том, чтобы применить наши классификаторы изображений ко всем этим снимкам Street View, отследить все модели автомобилей, которые мы можем, и посмотреть, какие закономерности они выявляют, верно? Я тут покопался, и мне кажется, мы нашли идеальный способ сделать это".