Предпосылки появления алгоритмов распознавания действий

История распознавания с помощью нейронных сетей началась во второй половине ХХ века, а уходит корнями в век XIX, когда учёный Сантьяго Рамон-и-Кахаль впервые описал строение нервных клеток, а его последователи попробовали эту структуру воспроизвести. Подробнее читайте в статье о технологиях в основе распознавания лиц.

По мере того, как развивалась технология, ей покорялись новые и новые задачи, которые можно описать как: распознавать больше (лиц в кадре), распознавать точнее, распознавать быстрее. К 2015 году общемировой уровень лицевой биометрии был достаточно высок. Россию в списке лидеров представила NtechLab, показав на международном конкурсе алгоритмов результаты лучше, чем у Google и других известных компаний.

Сейчас, когда результаты точности (до 99% ) и скорости (менее 0,5 секунды) распознавания лиц настолько высоки, будет уместно задать вопрос, куда дальше развивать технологию. Конкурентная борьба будет продолжаться за доли секунд и проценты точности, но достигнутые показатели уже сейчас позволяют решать сложнейшие задачи на миллиардных датасетах и закрывают запросы во всех сценариях применения, как для общественной безопасности, так и для бизнеса. Что же будет дальше?

Направления развития технологий распознавания

Наши инженеры несколько лет назад начали заниматься поиском ответа, что привело к созданию алгоритмов по распознаванию силуэтов. Трекинг по силуэту — тоже уникальному набору признаков человека — позволяет детектировать и моментально подсчитывать практически любое количество людей в зоне трекинга, даже стоящих спиной, а также выстраивать маршруты их передвижения по городу на основе данных с разных видеокамер.

В 2018 году решение FindFace попало в тройку победителей конкурса Amazon по детектированию пешеходов и велосипедистов. А вскоре после этого NtechLab принимает участие в международном соревновании по распознаванию действий, где распознаёт с высокой точностью 17 различных действий в видеопотоке, таких как разговор по телефону, набор текстового сообщения, выход из транспортного средства, перемещение тяжёлого объекта и другие, — и занимает II место.

В рамках конкурса от участников требовалось отследить начало и завершение действия в необработанном видеопотоке и отправить уведомление организаторам. По словам Артёма Кухаренко, архитектура разработанной инженерами свёрточной нейронной сети такова, что, после необходимого обучения, алгоритм способен распознавать практически любое действие в видеопотоке.

Как видно, стратеги NtechLab видят дальнейшее развитие алгоритмов идентификации с помощью нейронных сетей в возможности не только распознать человека, но и понять его маршруты передвижения, оценить действия с точки зрения общественной безопасности или других критериев, предвидеть опасные ситуации и устранять их.

Иными словами, огромную ценность представляет не только сам факт распознавания, но и видеоаналитика, с помощью которой можно решать различные задачи, полезные для бизнеса и государства, общества в целом.

Сценарии применения распознавания действий

Говоря о самых очевидных сценариях применения распознавания действий, стоит, в первую очередь, упомянуть предотвращение угроз общественной безопасности: отслеживание начинающихся конфликтных ситуаций. Не менее важно фиксировать случаи, когда человек оставляет предмет в общественном месте, и высылать мгновенное уведомление ответственным службам.

Далее идёт обеспечение общественного порядка. Применение технологии позволит успешно бороться с курением в общественных местах, использованием мобильного телефона во время управления автомобилем.

Распознавание действий это также эффективный метод контроля нежелательного контента, отсматривать который с помощью сотрудников гораздо дольше, сложнее, дороже и травматичнее для психики сотрудников.

Продолжить ряд контролирующих сценариев можем кейсом для медучреждений: алгоритм отследит выполнение правил ухода за пациентами, пришлёт моментальное уведомление, если пациент в больнице упал с кровати.

У распознавания действий огромные перспективы применения на промышленных предприятиях, опасных производствах и не только. Компания NtechLab уже обсуждает варианты внедрения решения с различными промышленными, энергетическими и нефтегазовыми компаниями.

Таким образом, распознавание действий действительно является высшей ступенью развития алгоритмов распознавания с помощью нейронных сетей. Это настоящий прорыв в отрасли: технология позволяет использовать камеры даже с низким разрешением и обнаруживать действия людей, чьи лица нельзя разглядеть.

На данный момент компания NtechLab — единственный отмеченный наградами разработчик распознавания действий в России. Мы будем держать вас в курсе последних разработок инженеров лаборатории.

Подписывайтесь на новые публикации в блоге, чтобы быть в курсе.