Правительство влило в них двести миллионов баксов, чтобы они запустили проект по созданию… смышлёного секретаря, который мог бы помочь вам с организацией встреч, презентациями и тому подобным.
Когда в 2008 году проект стал близиться к завершению, главный идейный вдохновитель, Адам Чейер, и руководитель высшего звена, Даг Киттлаус, решили построить на некоторых ключевых элементах данного исследования свой новый стартап.
«Они придумали алгоритмы для решения таких вопросов как: как вам представлять фрагменты данных ассистенту? Как распознать речь? Как распознать человеческий язык? Как найти взаимопонимание с сервисами вроде Yelp[51], или как понимать ваше приложение-календарь? Как скомпоновать входные данные для достижения цели?» – рассказывает Грубер.
Чейер и Киттлаус видели своего ассистента неким оператором «все умеющей машины», который заменил бы поисковые службы и стал доминирующим способом взаимодействия людей с Сетью. По словам Грубера, прародитель Siri мог не только просматривать интернет, но ещё, к примеру, по одной команде присылать машину, чтобы забрать вас. Правда, изначально он вовсе не задумывался как голосовой интерфейс.
«Он был помощником, он просто понимал язык. Он не занимался распознаванием речи, – объясняет Грубер. – Вы просто набирали текст, а помощник понимал естественный язык. Но он был больше заточен под такие вещи, как планирование и составление досье на людей, с которыми вы встречаетесь, и прочее в том же духе.
Это был очень и очень интересный проект, но ориентирован он был на людей, работающих за компьютером».
Грубера познакомили с проектом, когда тот находился ещё «на стадии мозгового штурма», и Грубер подружился с двумя соучредителями. «Я сказал им, что это прекрасная задумка, но ориентирована на потребителя… Нам нужно сделать под неё интерфейс, – рассказывает он. – Моя крохотная команда внутри Siri создала диалоговый интерфейс. Поэтому всё, что вы видите сейчас, представляет всю ту же привычную парадигму нити разговора с наполнением внутри». Это не просто практичный вариант «команда и ответ на неё». Siri поддерживает с вами беседу. «Диалог устраняет недопонимание. Важно словесное общение, отсюда и появился помощник, способный к обмену репликами».
Проект начался через год после выхода iPhone, и когда он сформировался, стало ясно, что его целью станут смартфоны. «Siri изначально задумывалась под мобильные устройства, – рассказывает Грубер. – Давайте сделаем помощника, и сделаем его портативным. И ещё давайте добавим речь, когда её сделаем… Ко второму году технология распознавания речи была уже достаточно хорошо разработана, чтобы мы смогли лицензировать её».
Теперь же Груберу и его коллегам предстояло задуматься, как пользователи могли бы разговаривать с интерфейсом ИИ – с чем-то, чего прежде никогда не существовало на потребительском рынке. Им предстояло продумать, как обучить людей тем командам, которые воспринимает Siri.
«Нам нужно было научить людей разбираться в том, что можно, а чего не стоит говорить помощнику, что и по сей день остаётся проблемой; и, думается, дела у нас тут шли намного лучше, когда мы были молодым предприятием, нежели в нынешнее время», – говорит Грубер. Siri часто была медлительной, потому как ей требовалось время на обработку команды и формулировку ответа. «Идея о том, чтобы Siri иногда отвечала резко или остроумно шутила, выросла как ответ на проблему: как быть с тем фактом, что Siri много чего не знает? Тут приходится отступать либо в сторону поиска в интернете, либо делать вид, будто Siri знает нечто, чего на самом деле не знает». Siri, по сути, просто выигрывает время. «Например, Siri разговаривает с вами так, будто хорошо вас знает, но вы ещё об этом не догадываетесь, однако подобная манера речи – лишь мастерская иллюзия». И чем больше Siri привыкает к вашему голосу, тем меньше нужды в такой иллюзии.
Им также пришлось подумать, как сделать общение увлекательным, чтобы людям было интересно снова и снова обращаться к Siri. «Факт есть факт – без увлекательной зацепки никуда, – говорит Грубер. – Поэтому мы использовали относительно простой способ построения диалога, но сделали акцент не столько на форме, сколько на содержании.