Выбрать главу

Иногда ошибки казались бессмысленными. В других случаях они были систематическими и отражали человеческий фактор. Артуро Бежар вспоминает, что в самом начале работы Facebook над классификатором для выявления порнографии система регулярно пыталась отсеять изображения кроватей. Вместо того чтобы научиться определять людей, занимающихся сексом, модель научилась распознавать мебель, на которой они чаще всего занимаются сексом.

Проблема легко решалась: инженерам нужно было просто обучить модель на большем количестве матрасных сцен с рейтингом PG. Это стало хорошей шуткой - если не принимать во внимание, что форма машинного обучения, которую только что испортили инженеры, была одной из самых простых, которые использовал Facebook. Подобные фундаментальные ошибки продолжали происходить, даже когда компания стала полагаться на гораздо более продвинутые методы ИИ для принятия гораздо более весомых и сложных решений, чем "порно или не порно". Компания полностью перешла на искусственный интеллект, как для определения того, что должны видеть люди, так и для решения любых проблем, которые могут возникнуть.

Несомненно, компьютерная наука была ослепительной, а достижения - конкретными. Но скорость, широта и масштабы внедрения машинного обучения в Facebook обошлись без понятности. Почему алгоритм Facebook "Страницы, которые вам могут понравиться" так сосредоточен на рекомендациях определенных тем? Как видеофрагмент из компьютерной анимации о зубных имплантатах оказался просмотренным сто миллионов раз? И почему некоторые новостные издательства добивались вирусности, просто переписывая материалы других изданий?

Отвечая на эти вопросы, специалисты по связям с общественностью Facebook отмечали, что системы компании реагируют на поведение людей и не учитывают вкусы. Эти доводы было трудно опровергнуть. Они также скрывали неудобный факт: Facebook добивалась своего роста не совсем понятными способами.

Через пять лет после объявления о начале использования машинного обучения для рекомендации контента и таргетирования рекламы системы Facebook будут настолько сильно зависеть от искусственного интеллекта, способного к самообучению, что без этой технологии, с гордостью заявил Янн ЛеКун, от продуктов компании останется лишь "пыль".

 

-

Как и большинство членов продуктовых команд Facebook, Хоакин Киньонеро обладал тем, что он называл "инженерным мышлением". Успех заключался в определении проблемы, а затем в создании чего-то эффективного, мощного и широко используемого для ее решения. "Я явно не ожидал непредвиденных последствий интеграции упрощенного машинного обучения в продукт", - говорит он.

Появление машинного обучения в ранжировании ленты было в то время большим событием, хотя мало кто в Facebook понимал, что компания переходит Рубикон. Facebook не просто менял порядок, в котором люди видели посты, - он менял всю динамику социальной жизни в Интернете.

До появления ранжированной ленты добавление в друзья означало занесение в очередь на просмотр всех его будущих сообщений - непривлекательная перспектива для случайного знакомого или гиперпостинга родственника. Как и в оффлайновой жизни, было только столько людей, с которыми вы могли поддерживать связь, только столько групп, в которые вы могли вступить.

Ранжирование устранило эту социальную нагрузку. Пользователи могли следить за сотнями аккаунтов и страниц, не перегружая свой аккаунт; удаленные связи в идеале появлялись только тогда, когда они публиковали что-то исключительно интересное. Это изменение сделало дружбу менее значимой, и пользователи перестали курировать группы друзей - это было большим изменением по сравнению с социальным миром офлайн. С разбуханием списков друзей платформа стала более публичной, побуждая людей создавать контент, который будет пользоваться популярностью у широкой аудитории, и избегать публикации более интимных вещей, которые они не хотели бы передавать случайным знакомым или даже людям, которых они на самом деле не знают.

По мере того как платформа становилась все более зрелой, а число ее пользователей росло и исчислялось миллиардами, Facebook пытался найти правильные показатели успеха. С самого начала высшее руководство компании больше всего ценило показатель Daily Average People, или DAP, - количество пользователей, зашедших на сайт в тот или иной день. Когда эта метрика стала неактуальной в попытках Facebook ускорить свой рост, компания обратилась к сессиям - совокупному количеству заходов на Facebook каждый день, а также к затраченному времени и метрикам производства и потребления определенных типов контента. Наконец, появилась обширная категория показателей вовлеченности, которые варьировались от фундаментальных (повторные публикации) до заумных (взаимодействие с уведомлениями о дне рождения).