Одним из драйверов цифровой трансформации в области защиты окружающей среды…
Россия совершила прорыв от распознавания лиц к видеоаналитике — NtechLab
Проекты «умных городов» в последнее время развиваются семимильными шагами и, конечно, в них активно применяется видеоаналитика. Она помогает создавать комфортную и безопасную городскую среду. Подробно об этом рассказал директор по продажам B2G NtechLab Дмитрий Рогулин.
— Компания NtechLab — ведущий российский разработчик систем распознавания лиц. Как вы оцениваете современный этап развития этой технологии? Можно ли сказать, что она применяется повсеместно?
— Около двух миллиардов человек несколько раз в день разблокируют свои мобильные телефоны при помощи лица. В России по лицу можно оплатить проезд в общественном транспорте, пройти паспортный контроль в аэропорту, получить банковские услуги. Поэтому можно считать, что повсеместно.
Однако главным я считаю другое. Сегодня искусственный человек умеет намного больше, чем просто распознавать лица. Мы обсуждаем с 40 регионами России различные проекты, связанные с улучшением качества жизни граждан — от подсчета людей по силуэтам до контроля качества уборки мусора. Россия одной из первых в мире совершила прорыв от распознавания лиц для сценариев, связанных с безопасностью, до видеоаналитики, когда искусственный интеллект понимает сложные процессы, происходящие в кадре, действия, события и помогает делать городскую среду комфортной. Системы видеоаналитики становятся комплексным решением для региона, решающим сразу набор задач.
— Расскажите подробнее про проекты в сфере жилищно-коммунального хозяйства и благоустройства города. Это новое направление для компании?
— В течение последних нескольких лет мы много работали над развитием направлений по применению видеоаналитики для сценариев не связанных с безопасностью. В итоге мы определили несколько сценариев, которые, на наш взгляд, наиболее интересны городским властям и разработали совершенно новый продукт — платформу для умных городов «Нтех Сити». Что такое платформа видеоаналитики? Это программное обеспечение, которое состоит из большого количества модулей, которые решают определенные задачи. Каждый город может использовать только те модули, которые нужны ему.
Первый модуль уже готов и пилотируется примерно в 10 регионах России. Это система контроля качества уборки мусора. В видеопотоке в реальном времени или архиве искусственный интеллект может определить наполняемость мусорных контейнеров, соблюдение графика вывоза мусора, загрязненность площадки вокруг контейнеров и нахождение рядом с контейнерами постороннего транспортного средства, которое может помешать уборке.
В крупных городах использование системы позволит сократить расходы на сбор бытовых отходов на 10-40% в год за счет правильного планирования выезда мусоровозов и эффективного контроля за работой операторов, в том числе посредством штрафов за некачественную уборку.
Следующий модуль будет готов в текущем году. Это система контроля качества уборки снега. Пока раскрыть всех секретов не могу, но уверен, что это будет очень востребовано в России.
— А события?
— Искусственный интеллект по силуэту понимает, что на видео человек и помогает получить обезличенные данные о посещении общественных мест и мероприятий — подсчитать число посетителей и проанализировать маршруты их перемещения.
Силуэт распознается в видеопотоке с камер наблюдения, а полученные данные сохраняются в форме аналитических отчетов и удаляются.
Использование системы позволяет понять, что какие-то объекты, например, детские площадки, перегружены и нужно построить новые. Или, скажем, дети не катаются на каких-то аттракционах. Это означает, что на новых площадках такие аттракционы ставить не нужно. Таким образом использование видеоаналитики позволяет оценить удовлетворенность людей инфраструктурой общественных мест. Кроме того, при использовании информации с камер на автобусных остановках можно лучше спланировать маршруты и интервалы передвижения общественного транспорта.
— Вы затронули использование систем распознавания лиц в мире. Этот год проходит под знаком регулирования технологии распознавания лиц. Обсуждения доходят до предложений полного ее запрета в Европе. Что вы думаете об этом?
— Я очень сомневаюсь, что Интерпол, которому технология распознавания лиц с 2016 года помогла идентифицировать 1 500 террористов, беглых заключенных и т.д. перестанет ее использовать. А обсуждать запреты можно сколько угодно.
Наша проблема заключается в том, что мы воспринимаем искусственный интеллект, как нового человека, который вскоре восстанет против создателя. Искусственный интеллект — это инструмент, не более того. Что касается систем распознавания лиц, то сегодня сделать ее непредвзятой намного проще, чем сделать всех людей хорошими. Для систем распознавания лиц «Джон из Нигерии» и «Маша из Твери» — это набор цифр, который не представляет никакого интереса, пока они не совершил преступление. Где взять миллион таких же непредвзятых людей, которые должны обеспечивать безопасность городов-миллионника где-нибудь в США?
— А мы слышали, что искусственный интеллект намного хуже распознает «Джона из Нигерии», чем «Машу из Твери».
— Это миф, связанный с тем, что на первом этапе алгоритмы обучались на ограниченных наборах данных. Например, китайские системы хорошо распознавали китайцев и плохо распознавали европейцев. Это работает следующим образом: чтобы искусственный интеллект научился распознавать лица, ему нужно показать, допустим, 100 000 человек. Так вот, если 99 000 будут китайцами, а 1 000 — европейцами, возникнет проблема, это называется «предвзятость» или bias. Сегодня все крупные поставщики систем распознавания лиц научились хорошо распознавать практически все лица. Через год-два этой проблемы вообще не останется ни в каком виде.
К слову, этот миф пошел из конкретного исследования, написанного несколько лет назад, когда алгоритмы искусственного интеллекта только появились. С тех пор сто других исследований доказывали обратное. Более того, по меньшей мере несколько раз в год проводятся независимые международные тестирования, которые сравнивают качество работы систем распознавания лиц на разных группах людей.
Что касается «Маши из Твери», то развенчаю еще несколько мифов. Макияж на лице также практически не влияет на точность распознавания лиц. Не существует и одежды, ни за 50, ни за 500 долларов, которая поможет обмануть системы распознавания лиц. Чтобы свитер обманул систему распознавания лиц, его нужно надеть на голову.
— А возрастные изменения?
— Если у нас есть фотография человека в 20 лет, то система с большой вероятностью распознает его и в 40. Если есть фотография человека в 30 лет, то система с большой вероятностью распознает его в любом возрасте.
Один из последних интересных случаев — когда в Москве задержали женщину, причастную к убийству 30-летней давности в Иркутске. И это далеко не единственный такой случай.
— Правда, что у вас есть система, которая вот уже пятый год не дает спокойно спать магазинным воришкам?
— Да. И не только шоплифтерам из России, но и из Казахстана и Беларуси. Наш партнер — компания BIT — разработала систему «СТОП Шоплифтер» на основе алгоритма распознавания лиц NtechLab. Если покупатель забыл оплатить товар в магазине, и это заметила охрана, то его лицо добавляется в базу данных. Когда он приходит в магазин в следующий раз, система распознавания лиц оповещает об этом охрану.
Про эту систему много писали, не буду повторять.
Скажу только одно — воруют не бабушки, которым не на что жить, а молодые люди, многие из которых сделали это своей профессией. Они объединяются в группы, обносят до 10 магазинов в день и перемещаются между городами, а потом странами. В общей сложности система используется в магазинах более чем в 450 городах России.
Сейчас BIT разработала аналогичную систему «СТОП Фрод», которая направлена на предотвращение мошенничества в финансовой сфере и логистики. Как оказалось, многие шоплифтеры потом «переквалифицируются» в финансовых мошенников, а также крадут грузы, потому что это более прибыльно.