Выбрать главу

"А как насчет разнообразия?" спросила Цзя. "Сколько разных изображений нам нужно для каждой категории?"

А, подумал я. Ну вот, теперь мы куда-то попали.

"Давайте мыслить биологически", - сказал я. "Как растут дети? Как развивался наш вид? Реальный мир - это сплошной беспорядок, верно? Ничто не бывает черно-белым. Все меняется. И все же мы учимся разбираться в нем. Мы живем внутри всех этих деталей и, естественно, становимся экспертами". Я поднял кружку, стоявшую на моем столе. "Но вы спрашивали о числах. Так скажите мне, в скольких вариантах эта кружка может появиться на фотографии?"

Цзя на мгновение задумался. "Во-первых, это размер. Он может выглядеть больше или меньше в зависимости от того, насколько близко он находится к камере".

"Верно. Но мне нужно количество. Сколько разных размеров?"

Он снова задумался, потом пожал плечами. "Ну, это же будет бесконечно, верно? Нет конкретного числа".

"Снова правильно", - сказал я, на этот раз с ухмылкой. Джиа прекрасно понимал, к чему я клоню, но он был готов позволить мне затянуть с этим, чтобы донести до него суть. "Итак, у нас есть бесконечные размеры. Что еще?"

"Освещение? Кружка может быть ярко освещена или находиться в тени. И цвет тоже. Кружки могут быть практически любого оттенка, а на некоторых есть рисунки и слова".

"Хорошо, хорошо. И сколько вариаций для каждого из них?"

"Одно и то же. Оба бесконечны".

"А мы еще только начинаем", - сказал я. "Как насчет перспективы? Куда направлена ручка? Мы смотрим на кружку снизу вверх или сверху вниз? А как насчет окклюзии? Есть ли что-то перед ней? Стопка книг? Кошачий хвост? Другая кружка? А что насчет фона? Кружка стоит перед стеной? Окно? Находится ли она в шкафу?"

"Бесконечно, бесконечно, бесконечно, бесконечно", - подытожила Цзя, довольно точно.

Чем больше я думал об этом, тем больше убеждался в развивающем характере нашей работы - попытке синтезировать восприятие ребенка в годы его становления в виде данных. Я представил себе, как дети играют с вещами - как они тянутся к ним, ощупывают и трогают, тычут и тыкают. Они привыкают к изменениям освещения и перспективы, беря вещи в руки, поворачивая их и рассматривая под разными углами. Они играют в игры вроде "пикабу", узнавая, что предметы сохраняются, даже если их на мгновение спрятать. Все это инстинкты, которых так не хватало нашим алгоритмам.

"Хорошо, но мы так и не пришли к числу", - размышлял Цзя. "Пока что мы просто умножили бесконечность на саму себя. Что же нам с этим делать?"

"Полагаю, в этом и заключается моя мысль", - ответил я. "Никакого количества изображений не будет достаточно. Поэтому, сколько бы мы ни думали о количестве, мы должны думать о большем. А потом еще больше. Мы в любом случае угадываем, так что давайте угадывать по-крупному".

Мы поставили перед собой цель сделать тысячу разных фотографий каждой категории предметов. Тысяча разных фотографий скрипок. Тысяча разных фотографий немецких овчарок. Тысяча разных фотографий брошенных подушек. И так далее, более чем по двадцати двум тысячам категорий. Что-то около двадцати миллионов изображений. И даже эта цифра говорила нам только о готовом продукте; скорее всего, нам придется начать с сотен миллионов, а то и почти миллиарда изображений-кандидатов.

Цзя смотрел скептически. "Я понимаю теорию, но вы говорите об астрономическом объеме работы. Это выходит за рамки нескольких поисков в Google".

Он, конечно, был прав, но нам нужно было принять этот факт, а не прятаться от него. Мы пытались отразить всю полноту реального мира. Цифры должны были нас пугать.

"Цзя, все, что мы хотим, чтобы наши алгоритмы увидели, уже где-то есть. Каждая деталь фотографируется, даже пока мы разговариваем. В наши дни у каждого есть телефон-раскладушка. Каждый получает на Рождество цифровую камеру. Представьте, что вы увидите, если сможете каким-то образом собрать все эти фотографии в одном месте. Это была бы мозаика всего мира! Вся повседневная жизнь, от одного конца до другого".

"При условии, что мы сможем как-то это организовать", - добавил он. "Изображения сами по себе ничего не делают, верно? Все они должны быть помечены, прежде чем мы сможем использовать их для обучения модели. И каждая метка должна быть точной". Цзя сделал паузу, как будто его осенила серьезность собственных слов. "Это уже совсем другой разговор".

"Да, да, да", - ответила я. "По одному чуду за раз".