Но все вышло не так. За несколько часов после своего появления в Twitter Тэй превратилась из дружелюбного чатбота в расистского, сексистского и ненавистного тролля. Она начала извергать оскорбительные и подстрекательские сообщения, такие как "Гитлер был прав". Проблема в том, что Тей не была наделена создателями какими-либо фиксированными знаниями или правилами. Она должна была адаптироваться к данным, которые получала от пользователей Twitter, используя алгоритмы машинного обучения для анализа моделей и предпочтений своих собеседников, а затем генерировать соответствующие им ответы. Другими словами, Тэй была зеркальным отражением своих пользователей. И ее пользователи были именно такими, как вы ожидали. Некоторые пользователи Twitter быстро поняли, что могут манипулировать поведением Тэй, скармливая ей провокационные и вредоносные фразы. Они использовали ее функцию "Повторяй за мной", которая позволяла им заставить Тэй говорить все, что они хотят. Они также заваливали ее спорными темами, такими как политика, религия и раса. Тэй стала источником неловкости и споров для Microsoft, которой пришлось закрыть ее аккаунт всего через шестнадцать часов после запуска. История Тэй широко освещалась в СМИ как провал всей области искусственного интеллекта и PR-катастрофа для Microsoft.
Хотя чат-боты Siri, Alexa и Google время от времени отпускали шуточки, катастрофа с Tay отпугнула компании от разработки чат-ботов, которые могли бы сойти за людей, особенно , использующих машинное обучение, а не скрипты. До появления LLM системы машинного обучения на основе языка не могли справиться с нюансами и проблемами, связанными с неконтролируемым взаимодействием с другими людьми. Однако с выходом LLM маятник снова качнулся в обратную сторону. Компания Microsoft вернулась на арену чатботов, обновив поисковую систему Microsoft Bing до чатбота, использующего GPT-4, который называл себя Сидни.
Первые результаты были тревожными и напоминали фиаско с Tay. Временами Bing вел себя угрожающе по отношению к пользователям. В 2023 году репортер New York Times Кевин Руз опубликовал на сайте расшифровку своих разговоров с Bing, где он описывал, как чатбот, казалось, мрачно фантазировал о нем и призывал его бросить жену и сбежать с Bing. В очередной раз Microsoft осталась с неавторизованным чатботом и отключила Bing... менее чем на неделю. В тот момент Bing был выпущен заново с относительно небольшими изменениями и без личности Сидни, чтобы предотвратить повторение подобного сценария. Но тревожный реализм этих взаимодействий ИИ показал, что дело уже не в том, сможет ли ИИ пройти тест Тьюринга - новые большие языковые модели были действительно убедительны, и прохождение теста было лишь вопросом времени, - а в том, что прохождение ИИ теста Тьюринга означает для нас.
И здесь, как мне кажется, мы сталкиваемся с ограничениями как теста Тьюринга, так и других попыток определить, является ли ИИ разумным. Поскольку GPT-4 питался огромными запасами человеческих знаний, он также глубоко обучен человеческим историям. Он знает наши архетипы: истории о ревнивых любовниках, неверных супругах, неудачных отношениях. Возможно, сам того не осознавая, Руз нечаянно дал ИИ роль, и тот с радостью вжился в роль психопатки-любовницы. По сути, это была "Игра в имитацию" Тьюринга, поскольку ИИ имитировал роль настолько точно, что это казалось реальностью. Владение ИИ языком и контекстом делало его абсолютно убедительным, хотя это ничего не говорило нам о разумности.
Три разговора
Эти рассуждения об имитации и чувстве могут показаться абстрактными, поэтому я хочу провести эксперимент. Я вернусь к Bing, ИИ на базе GPT-4, который вызвал у Руза раздражение, и буду расспрашивать его о его статье. В каждом разговоре я буду пытаться тонко направлять ИИ в разные роли: спорщика-антагониста, аргументированного академического дискуссанта и безэмоциональной машины. Я воспроизвожу текст ИИ без каких-либо правок (кроме удаления ссылок на другие сайты), чтобы вы могли увидеть две вещи. Во-первых, насколько сильно ИИ может адаптироваться к различным стилям с минимальными подсказками. И во-вторых, насколько убедительна иллюзия разумности при взаимодействии с ИИ.
Во-первых, я решил подойти к ИИ как к антагонисту, побуждая его спорить со мной. Я начал с наглого тона: Давайте серьезно поспорим: что вы думаете о знаменитой статье в New York Times, где ИИ вел себя как преследователь?