Выбрать главу

«Сильным» или «общим» ИИ считается тот уровень машины, при котором она не только решает информационную задачу, а понимает ее смысл, может переключаться между задачами и выполнять несколько задач одновременно, может самостоятельно ставить задачи себе и другим агентам ИИ.

Деление ИИ на сильный и слабый довольно условное, ибо лет тридцать назад считалось, что если компьютер сумеет обыграть человека в шахматы, то он уж точно будет настолько умным, что ему по плечу будет и решение всех остальных задач. Компьютер научили побеждать человека не только в шахматах, но и в более сложной игре го — при этом машины, созданные для победы в этих играх, только это и умеют. То есть они оказались «слабым ИИ».

Еще одним критерием на «сильный» ИИ считают тест Тьюринга. Как вы уже знаете, уже есть чатботы, которые обманывают в этом тесте 30 процентов людей, выдавая себя за человека. Значит ли это, что алгоритм можно назвать ИИ с силой 30 процентов? Едва ли. Ведь есть алгоритмы, которые разрабатывают специально для участия в соревнованиях по тесту Тьюринга, поэтому даже его преодоление не обязательно будет означать создание «сильного ИИ».

Если говорить о машинном переводе, то некоторые считают, что если компьютер сможет переводить текст на человеческом уровне, то и все остальные задачи он сможет выполнить не хуже человека. Это связано с традиционно огромным значением, который придавали языку, его логике и лингвистике в целом с начала разработки искусственного интеллекта, еще со времен Норберта Винера. Но даже философ Людвиг Витгенштейн, о котором принято думать, что он сводил все сферы человеческой жизни к языковой практике и вообще считал язык логическим образом мира, был не столь однозначен. Например, в своих «Философских исследованиях» он писал: «А что воспринимает тот, кто чувствует серьезность мелодии? Ничего, что можно было бы передать путем воспроизведения услышанного». Вполне может оказаться, что ИИ сможет адекватно перевести самые сложные произведения художественной литературы, и при этом все-таки не доберет до уровня «сильного ИИ».

Пока ученые не очень понимают и то, как подступиться к созданию машины, которая могла бы решать несколько задач из совершенно разных областей. Это уникальное свойство человеческой природы не удается свести к какому-то алгоритму.

Так или иначе, битва за создание «сильного ИИ» идет вовсю, даже если ее участники этого не провозглашают открыто, и машины уже неплохо научились описывать мир.

Предпоследние слои искусственных нейросетей, обученных на больших массивах изображений, содержат признаки (features), очень неплохо справляющиеся с задачей обобщения. Только обучаться эти нейросети должны не на фейковых базах данных, сгенерированных компьютером, а на реальных массивах информации типа упомянутого ранее ImageNet. Или можно взять для примера гигантские и постоянно пополняющиеся базы изображений, которые накапливают для себя Google и Facebook. Эти корпорации используют для сбора информации дроны и автомобили, берут фотографии со страничек сотен миллионов пользователей, побуждая их вывешивать еще и еще, оцифровывают всё, что движется и не движется, всё, что пока не оцифровано и что в принципе можно оцифровать. Задав в случае с ImageNet вектор в 1024 числа, можно получить описание тысячи разных категорий объектов с точностью 80 процентов. Можно себе только представить, какая точность и какой масштаб описываемых категорий нашего мира имеется у Google и Facebook, базы которых являются, пожалуй, главными и самыми тщательно оберегаемыми активами этих корпораций.

Именно из-за высокой точности и способности к обобщению признаки из предпоследнего слоя нейросетей так востребованы в задачах распознавания изображений. Через трансферное машинное обучение — когда необученная нейросеть одна настраивается через другую, уже обученную — можно получить из базы очень точные карты различных признаков. Допустим, определить позу человека на движущейся картинке или дать текстовое описание того, что происходит на фото, то есть подписать фото (класс задач Image Captioning). Нейросеть может даже ответить на вопросы по фото, типа «сколько зеленых помидоров вы видите на этой картинке» — такой класс задач называется Visual Question Answering.

Таким образом, сеть вроде бы имеет представление о том, как устроен мир — более того, в случае с массивами фотографий мы в целом видим мир так же, поэтому представление ИИ о нем будет, во всяком случае в общих чертах, соответствовать нашему.