Выбрать главу

По признанию Ян Фаня, руководителя отдела разработки SenseTime и бывшего сотрудника Microsoft, приложения «общественной безопасности» оказались прибыльным рынком.

«Существует высокий, конкурентный спрос, обусловленный системами „умного“ города и видеонаблюдения», – говорил он в интервью Forbes Asia.

Но программному обеспечению для распознавания лиц нужны были самые современные полупроводники. Откуда им было взяться?

SenseTime и другие китайские компании, занимающиеся вопросами искусственного интеллекта, обратились за полупроводниками к американским фирмам. Выяснилось, что их коллег из США интересовали китайские технологии создания программного обеспечения для мобильных приложений и правоохранительной системы. Американский телекоммуникационный оператор Qualcomm договорился с Megvii о сотрудничестве: в обмен на полупроводники Qualcomm получал право использовать программные средства систем ИИ Megvii в своих устройствах.

«В Китае наблюдается взрывной спрос», – отмечал Ли Сюй, соучредитель и генеральный директор SenseTime, на бизнес-конференции в июне 2016 года в ходе совместного выступления с Джеффом Хербстом, вице-президентом по вопросам развития подразделения венчурного инвестирования Nvidia.

Через семь-восемь лет после своего основания в 1993 году компания Nvidia стала ведущим производителем графических процессоров. Теперь она готовилась снимать сливки с надвигающегося бума в индустрии искусственного интеллекта.

В скором времени Nvidia начала заключать громкие сделки с китайскими фирмами, занимающимися технологией распознавания лиц. С помощью чипов, произведенных Nvidia и ее основным конкурентом Intel, в Центре облачных вычислений в Урумчи, открытом в 2016 году, были созданы одни из самых мощных в мире компьютеров, используемых для слежки. За день эти компьютеры просматривают больше записей с камер видеонаблюдения, чем человек за год.

«В Китае я вижу камеры на каждом фонарном столбе, – говорил Хербст. – Кажется, что просматривается просто все. Но проблема в том, что видео поступает в диспетчерскую, в которой сидит парень и ждет, когда что-нибудь произойдет. Разве это все не нужно автоматизировать?»

Ли Сюй признавал интерес китайского правительства к вопросам общественной безопасности, как и тот факт, что «существующая система наблюдения была серьезно ограничена отсутствием интеллектуального механизма управления, особенно в том, что касается обработки видео».

Он предложил пойти альтернативным путем.

Ли Сюй знал, что технология чипов Nvidia, заимствованная из сходных технологий обработки графики, играла «фундаментальную» роль в его работе и что для поддержания технологии распознавания лиц Nvidia задействует 14 тысяч таких чипов в серверах по всей Азии.

«Чувствую, нас с вами ждет долгое сотрудничество», – сказал ему Хербст из Nvidia во время бизнес-конференции. Возможно, Хербст этого и не хотел, но его слова прозвучали зловеще. К 2015 году все составляющие надзорной экосистемы встали на свои места: программное обеспечение научилось распознавать лица, сканировать текстовые сообщения и электронные письма, а также выявлять закономерности в письменной речи и взаимодействии людей.

Теперь инвесторы начали вкладывать свои деньги в следующий ключевой элемент: программное обеспечение, способное понимать и обрабатывать человеческий голос.

В конце 1990‐х годов молодой перспективный исследователь Лю Цинфэн отказался от стажировки в Microsoft Research Asia и посвятил карьеру своему собственному стартапу iFlyTek, поставив целью разработку передовой технологии распознавания голоса.

«Я сказал ему, что он талантливый молодой исследователь, но Китай слишком сильно отстает от американских гигантов индустрии распознавания речи, таких как Nuance, а еще в Китае будет меньше потребителей этой технологии, – писал Кай-Фу Ли. – Надо отдать Лю должное: он проигнорировал мой совет и с головой погрузился в работу над iFlyTek».

В 2010 году iFlyTek создала в Синьцзяне лабораторию, занявшуюся разработкой технологии распознавания речи для перевода уйгурского языка на мандаринский диалект китайского. Вскоре эту технологию начнут использовать для слежки и надзора за уйгурским населением. К 2016 году iFlyTek поставляла в Кашгар уже двадцать пять систем «голосовых отпечатков», создававших уникальные голосовые подписи, которые помогали идентифицировать и отслеживать людей.

«Все эти компании приходили в Синьцзян на моих глазах, – вспоминает Ирфан. – Я видел их аппаратуру, их программное обеспечение». Десятки уйгуров, сбежавших из Синьцзяна после 2014 года, вспоминали, что замечали логотипы этих компаний на оборудовании. Присутствие этих компаний в Синьцзяне отражено в правительственных тендерах, сохранившихся в интернете, в официальных корпоративных отчетах, докладах о положении с правами человека, американских санкционных документах, а также в сообщениях китайских государственных средств массовой информации. «Но многие не видели в этом ничего опасного. Настрой был следующий: „Мы просто боремся с преступностью“», – замечает Ирфан.

полную версию книги