Слайд Yotaphone

«Конкуренты, которые сотрудничают со спецслужбами, остаются в рамках локальных рынков, а мы хотим построить международную компанию»

Основатель компании, которая лучше других может распознавать лица, — о том, какими алгоритмами пользуются спецслужбы и соцсети, как будет развиваться интеллект роботов и как стартапу научиться жить «на свои».
Алексей
Нехаев
Сооснователь VisionLabs
Александр
Ханин
Сооснователь VisionLabs

— Как появилась компания VisionLabs? Какой первый продукт она создала?

— Компания VisionLabs появилась в 2012 году, когда во время учебы в Московской школе бизнес-управления «Сколково» я познакомился с группой молодых ученых из МГТУ им. Баумана. Мы организовали партнерство и разделили обязанности: в VisionLabs я отвечаю за бизнес, а Александр Ханин — за разработку. Во время запуска у нас была только маленькая коробочка, которую можно было подключать к видеокамерам, чтобы они распознавали автомобильные номера. Затем мы создали системы для распознавания лиц и подсчета движущихся объектов.

— Во многих презентациях утверждается, что у вас один из лучших в мире алгоритмов для распознавания лиц. Кто и как оценивает их точность?

— В конце 2013 года мы впервые участвовали в полномасштабном международном тестировании и сразу заняли первое место в мировом рейтинге распознавания лиц. К концу прошлого года нас подвинули на третье место, но сейчас готовимся выпустить новый релиз и подтвердить свою позицию.

Есть два независимых международных теста в области распознавания лиц, оба проводятся в США. Во время теста FERET используются фотографии высокого качества, снятые по определенным правилам. Мы в нем не участвуем, потому что не работаем с контентом, который произведен в таких идеальных условиях. Мы используем изображения с веб-камер и с обычных камер, которые не позволяют делать снимки высокого качества. Также существует тест Labeled Faces in the Wild, который проводит Университет Масcачусетса (UMass), — он проводит распознавание лиц на фотографиях, сделанных в обычных жизненных условиях, и как раз в нем мы принимаем участие. Этот тест также оценивает продукты Facebook, NEC и Aurora — известной компании, которая сотрудничает с MI-6.

— Вероятно, самая известная для неспециалистов система распознавания лиц — это алгоритм Facebook. Как ваш продукт отличается от него?

— Facebook не участвует в рейтинге Labeled Faces in the Wild для коммерческих движков, в котором мы занимаем третье место. Мы общались с командой Яна Лекуна, главой лаборатории искусственного интеллекта Facebook, и они действительно занимают лидирующую позицию во всем мире. Мы используем один и тот же метод распознавания — метод нейронных сетей. Он позволяет «узнавать» лицо лучше, чем это делает обычный человек.

— Собираетесь ли вы сотрудничать с государственными службами, как некоторые ваши конкуренты?

— Государственные системы — это здорово, но они накладывают ограничения на дальнейший рост и развитие. Мы видим, что конкуренты, которые сотрудничают со спецслужбами, остаются в рамках локальных рынков. В Америке таким компаниям везет больше, потому что рынок более развит, но для нас это рискованная стратегия. Мы хотим построить большую международную компанию с русскими корнями.

В Америке таким компаниям везет больше, потому что рынок более развит, но для нас это рискованная стратегия. Мы хотим построить большую международную компанию с русскими корнями

— Как алгоритмы, которые вы разрабатываете, превращаются в продукты, готовые для продажи?

— Из системы распознавания автомобильных номеров мы сделали систему автоматизации доступа на территорию различных объектов. Когда машина подъезжает к шлагбауму, оснащенному камерой, устройство анализирует номера, и если вы допущены на эту территорию, то шлагбаум открывается. Что касается распознавания лиц, то мы сделали продукт VisionLabs Luna для розничных банков. Этот алгоритм может использоваться для противодействия мошенничеству и для того, чтобы узнать постоянных клиентов и повысить качество взаимодействия с ними. Пока банки в основном нацелены на пресечение мошеннических схем и распознавание преступников. Мы предоставляем такой инструмент с помощью наших партнеров — компании SAS, которая является поставщиком бизнес-аналитики и получает от нас цифровую или бинарную информацию о лице заемщиков. Эта информация помогает во время принятия решения о выдаче кредита тому или иному лицу. Кроме того, мы сотрудничаем с крупнейшим бюро кредитных историй «Эквифакс». Вместе с ними мы создали биометрический межбанковский сервис для сравнения фотографий.

— Как VisionLabs будет развиваться в будущем?

— Наши задачи можно разделить на два типа — технологические и продуктовые. В этом году мы усовершенствуем алгоритмы распознавания человека. Еще одна наша цель — распознавать контекст. Мы хотим, чтобы камера понимала, что происходит и как человек взаимодействует с различными предметами. Распознавание объектов — это то самое «бутылочное горлышко», которое не позволяет сделать роботов автономными. Сейчас машины умеют практически все что угодно, но они либо управляются человеком, либо запрограммированы на те или иные действия. Для того чтобы они смогли стать полноправными членами общества, им нужно понимать, что происходит. Преодоление этой научной проблемы поможет взорвать рынок робототехники.

Что касается наших продуктов, то мы планируем продавать их не только банкам, но ритейл-сетям — нас интересуют рынки, которые позволят компании быстро расти и быть востребованной.

Кроме того, мы бы хотели заниматься программным обеспечением для роботов, которое будет агрегировать информацию со всех их сенсоров, датчиков и видеокамер и анализировать ее. Мы надеемся создать технологическую платформу для самых разных производителей роботов.

— Какова динамика продаж? Есть ли у вас инвесторы?

— Мы получили pre-seed-инвестиции от Фонда развития интернет-инициатив и, кроме того, первые полтора года существования компании вкладывали свои средства ($100 тыс.). Затем VisionLabs начала генерировать собственный положительный поток. К лету 2014 года мы отбили вложенные деньги и заработали около $500 тыс. В этом году выручка будет значительно больше. Мы получаем много предложений, так что сейчас у нас нет потребности во внешних деньгах.

— Многие ученые и предприниматели утверждают, что искусственный интеллект может быть опасен для человечества. Не боитесь ли вы автономного цифрового разума?

— Люди всегда боятся чего-то нового, пока не сталкиваются с этим явлением и не находят инструменты взаимодействия с ним. Так было и с грозой и молнией, которую мы научились превращать в огонь, так будет и с искусственным интеллектом. Я не боюсь искусственного интеллекта и знаю, что он появится. Для меня страховкой от возможных проблем является то, что я сам занимаюсь развитием этой области.

Каким будет общество с совершенными системами распознавания людей и объектов? Придется ли нам отказаться от приватности?

Общество уже отказалось от приватности, открыв ящик Пандоры и создав социальные сети. Это новая реальность, в которой нужно уметь жить. Технологии распознавания появились позже и просто используют накопленный объем информации в социальных сетях для обучения алгоритмов.