"Эй, мне нужно с тобой кое о чем поговорить", - сказал я, когда фильм закончился. "Идея для исследовательского проекта. Она не дает мне покоя последние несколько недель".
"Значит, вы не обращали внимания на фильм, - сказал он со знающей улыбкой.
Я рассмеялся, но он был не совсем неправ.
"Мне кажется, я никогда не испытывал такой убежденности в чем-то".
"Ну, разве это не хорошо? В чем проблема?"
"Да, просто..." Я тяжело вздохнул. "Боже, это будет авантюра".
Сильвио оказался доверенным лицом, которому нет равных. Мы оба были молодыми доцентами на факультетах с высокой конкуренцией, и нам предстояли годы "опубликуй или погибни", когда мы пытались начать свою карьеру на . Мы оба были готовы к тому, что от нас потребуется безостановочно выдавать качественные и количественные результаты, зная, что в противном случае мы распрощаемся со своими профессорскими званиями вместе с нашими шансами на стабильное существование. Он знал о ставках лучше, чем кто-либо в моей жизни.
Я изложил все с самого начала, несмотря на годы, которые я уже потратил на то, чтобы прожужжать ему все уши об этом. Число Бидермана, WordNet, ImageNet и мечта, которая имела идеальный смысл, пока я не попытался представить себе, как это делается на самом деле.
"Ты потратил годы на то, чтобы попасть сюда, Фей-Фей. У тебя есть диплом, есть работа, и, похоже, у тебя есть вдохновение. И, кстати, ваш муж находится в шестистах милях отсюда, так что у вас точно будет время".
Я хихикнула, оценив его попытку сохранить легкость.
"Да, но тебе не кажется, что все это слишком... за гранью?" спросил я.
Он на мгновение задумался, прежде чем ответить.
"Разве "там" - это не та идея, которую вы искали?"
Что хорошего в наборе данных с десятками тысяч категорий? Большинство моделей все еще пытаются распознать одну или две!
Вы представляете, сколько времени потребуется, чтобы обучить модель на таком количестве изображений? Фей-Фей, ты говоришь о годах.
Как вообще кто-то сможет его скачать? Вы описываете коллекцию изображений размером больше, чем большинство жестких дисков.
У вас есть план, как все это организовать? Кто будет маркировать миллионы изображений? Сколько времени это займет? Как вы будете проверять точность всего этого?
Простите, но в этом нет никакого смысла.
Чем больше я обсуждал идею ImageNet со своими коллегами, тем более одиноким я себя чувствовал. Несмотря на ободряющие беседы Сильвио, почти единодушный отказ был плохим знаком в самом начале начинания, определяемого его огромными размерами; мне могла понадобиться целая армия соавторов, а я не мог найти ни одного. Хуже всего то, что независимо от того, соглашался я с ними или нет, я не мог отрицать обоснованность их критики.
В 2006 году алгоритмы были центром нашей вселенной, а данные не были особенно интересной темой. Если машинный интеллект был аналогом биологического, то алгоритмы были чем-то вроде синапсов, или хитроумных проводков, проложенных по всему мозгу. Что может быть важнее, чем сделать эту проводку лучше, быстрее и способнее? Я вспомнил о том внимании, которым пользовалась наша статья об одномоментном обучении, - о мгновенной способности нового блестящего алгоритма, богато украшенного причудливой математикой, завязать разговор. Данные жили в тени, считаясь не более чем инструментом для обучения, как игрушки, с которыми играет растущий ребенок.
Но именно поэтому я считал, что она заслуживает большего внимания. В конце концов, биологический интеллект не был создан так, как алгоритмы, - он эволюционировал. А что такое эволюция, если не влияние окружающей среды на организмы, живущие в ней? Даже сейчас наше познание несет на себе отпечаток мира, населенного бесчисленными поколениями предков, которые жили, умирали и со временем приспосабливались. Именно это делает выводы Торпа и Бидермана и даже нашей лаборатории в Калтехе столь поразительными: мы распознаем естественные образы почти мгновенно, потому что именно такие сенсорные стимулы - данные, другими словами, - сформировали нас. ImageNet - это шанс дать нашим алгоритмам тот же опыт: ту же широту, ту же глубину, ту же впечатляющую беспорядочность.
Наконец, после множества обескураживающих бесед, которых мне хватило бы на всю жизнь или две, я встретил своего первого сторонника. Профессор Кай Ли, ведущий специалист в области архитектуры микропроцессоров - искусства компоновки миллионов и миллионов транзисторов нанометрового размера в самые сложные устройства в мире, - понимал силу экспоненциального мышления лучше других. Он верил, что я что-то задумал, и, хотя он не мог внести свой вклад напрямую, поскольку наши области были лишь слабо связаны в рамках факультета информатики , он знал, что нам понадобится серьезная вычислительная мощность, чтобы начать работу. Не задумываясь, он пожертвовал нам начальный комплект рабочих станций. Это было именно то проявление поддержки, в котором я нуждался.